精通Scrapy网络爬虫 pdf下载

出版社木垛图书旗舰店

出版年 2017-10

页数 390页

装帧精装

评分 9.1(豆瓣)

⏰ 限时特惠 00:00:00

活动结束后恢复原价

纸质书参考价 ¥23

电子版限时价 ¥5.99 省 18 元

选择版本

基础版

PDF文件

¥4

内容简介

本篇主要提供精通Scrapy网络爬虫电子书的pdf版本下载，本电子书下载方式为百度网盘方式，点击以上按钮下单完成后即会通过邮件和网页的方式发货，有问题请联系邮箱ebook666@outlook.com

基本信息

商品名称：精通Scrapy网络爬虫
作者：编者:刘硕
定价：59
出版社：清华大学
ISBN号：9787302484936

其他参考信息（以实物为准）

出版时间：2017-10-01
印刷时间：2017-10-01
版次：1
印次：1
开本：16开
包装：平装
页数：224
字数：325千字

内容提要

。。。

作者简介

。。。

第1章初识Scrapy
1.1 网络爬虫是什么
1.2 Scrapy简介及安装
1.3 编写**个Scrapy爬虫
1.3.1 项目需求
1.3.2 创建项目
1.3.3 分析页面
1.3.4 实现Spider
1.3.5 运行爬虫
1.4 本章小结
第2章编写Spider
2.1 Scrapy框架结构及工作原理
2.2 Request和Response对象
2.2.1 Request对象
2.2.2 Response对象
2.3 Spider开发流程
2.3.1 继承scrapy.Spider
2.3.2 为Spider命名
2.3.3 设定起始爬取点
2.3.4 实现页面解析函数
2.4 本章小结
第3章使用Selector提取数据
3.1 Selector对象
3.1.1 创建对象
3.1.2 选中数据
3.1.3 提取数据
3.2 Response内置Selector
3.3 XPath
3.3.1 基础语法
3.3.2 常用函数
3.4 CSS选择器
3.5 本章小结
第4章使用Item封装数据
4.1 Item和Field
4.2 拓展Item子类
4.3 Field元数据
4.4 本章小结
第5章使用Item Pipeline处理数据
5.1 Item Pipeline
5.1.1 实现Item Pipeline
5.1.2 启用Item Pipeline
5.2 *多例子
5.2.1 过滤重复数据
5.2.2 将数据存入
MongoDB
5.3 本章小结
第6章使用LinkExtractor提取链接
6.1 使用LinkExtractor
6.2 描述提取规则
6.3 本章小结