本篇主要提供精通Scrapy网络爬虫电子书的pdf版本下载,本电子书下载方式为百度网盘方式,点击以上按钮下单完成后即会通过邮件和网页的方式发货,有问题请联系邮箱ebook666@outlook.com
。。。
。。。
第1章 初识Scrapy
1.1 网络爬虫是什么
1.2 Scrapy简介及安装
1.3 编写**个Scrapy爬虫
1.3.1 项目需求
1.3.2 创建项目
1.3.3 分析页面
1.3.4 实现Spider
1.3.5 运行爬虫
1.4 本章小结
第2章 编写Spider
2.1 Scrapy框架结构及工作原理
2.2 Request和Response对象
2.2.1 Request对象
2.2.2 Response对象
2.3 Spider开发流程
2.3.1 继承scrapy.Spider
2.3.2 为Spider命名
2.3.3 设定起始爬取点
2.3.4 实现页面解析函数
2.4 本章小结
第3章 使用Selector提取数据
3.1 Selector对象
3.1.1 创建对象
3.1.2 选中数据
3.1.3 提取数据
3.2 Response内置Selector
3.3 XPath
3.3.1 基础语法
3.3.2 常用函数
3.4 CSS选择器
3.5 本章小结
第4章 使用Item封装数据
4.1 Item和Field
4.2 拓展Item子类
4.3 Field元数据
4.4 本章小结
第5章 使用Item Pipeline处理数据
5.1 Item Pipeline
5.1.1 实现Item Pipeline
5.1.2 启用Item Pipeline
5.2 *多例子
5.2.1 过滤重复数据
5.2.2 将数据存入
MongoDB
5.3 本章小结
第6章 使用LinkExtractor提取链接
6.1 使用LinkExtractor
6.2 描述提取规则
6.3 本章小结