实际上爬虫一共就四个主要步骤: 1) 明确目标 (要知道你准备在哪个范围或者网站去搜索) 2) 爬 (将所有的网站的内容全部爬下来) 3) 取 (去掉对我们没用处的数据) 4) 处理数据(按照我们想要的方式存储和使用) 百度贴吧 http://tieba.baidu.com/f?kw=%E7%BB%9D%E5%9C%B0%E6%B1%82%E7%94%9F&ie=utf-8&pn=0 //下一页+50 http://tieba.baidu.com/f?kw=%E7%BB%9D%E5%9C%B0%E6%B1%82%E7%94%9F&ie=utf-8&pn=50 http://tieba.baidu.com/f?kw=%E7%BB%9D%E5%9C%B0%E6%B1%82%E7%94%9F&ie=utf-8&pn=100 网页规律: https://www.pengfu.com/xiaohua_1.html 下一页 +1 https://www.pengfu.com/xiaohua_2.html 主页面规律: