使用scrapy制作一个小说爬虫

梦魇

来自: 梦魇
2015-01-18 19:37:44

×
加入小组后即可参加投票
  • Swift

    Swift (我好傻逼a) 2015-04-01 19:54:12

    蛮好玩的,打算试试。你爬的是哪个网的~为何随便搜一个《重生2003》就不显示

  • 撒旦

    撒旦 2015-04-01 20:00:27

    你就不能挑个大网站写爬虫教程啊。。。小网站很容易吃不消很多人去试用你的爬虫的

  • 糖醋洋葱头

    糖醋洋葱头 2015-05-11 22:58:29

    感觉楼主写的爬虫功能很全面,很值得学习。但是上面的介绍对于我这种刚接触的小白看起来还是有些吃力的。 敢问楼主“多加一层Request,使用moves.urllib.parse.urljoin() 这样直接Request()就可以了 ”这个加一层的逻辑是怎样的?又是如何直接用moves.urllib.parse.urljoin()的?我在这上面遇到一点困难。

  • 秦奋勤奋

    秦奋勤奋 2018-01-29 13:42:53

    Scrapy分布式爬虫之ES搜索引擎网站 分享网盘地址——https://pan.baidu.com/s/1mj6r6Pi 密码: rd26 备用地址(腾讯微云):http://url.cn/51n4soD 密码:SyRADx 大数据时代到来,信息更新非常快速,各行各业如果不与时俱进,都将面临优胜劣汰,知识是不断更新的,只有拥有一技之长,才能立于不败之地。网络爬虫,即Web Spider,是一个很形象的名字。目前爬虫开发语言的主要是python,本课程结合几个小的爬虫案例,帮助学员更好的学习爬虫。 最新发布的全球数据库管理系统排名,Redis、Elasticsearch稳步上升,从近四年的增长趋势来看,MongoDB,PostgreSQL、Elasticsearch、Spkunk增速最快,本项目就是就是以Elasticsearch为搜索主题,进行一系列Scrapy数据获取、MongoDB数据存储、Django搭建网站等 2.内容简介 scrapy分布式爬虫打造搜索引擎 Data数据能完成的事情(都可以使用爬虫获取数据): 1)数据分析服务 2)互联网金融 3)数据建模 4)信息聚类 5)自然语言处理 6)医疗病例分析 然后通过Elasticsearch和Django搭建搜索引擎网站 通过本课程的学习可以让你学会获取想要的数据,以及深入认识网络知识和编程知识

  • python30

    python30 2019-03-12 22:33:20

    嗯。不错

你的回应

回应请先 , 或 注册

1522 人聚集在这个小组
↑回顶部