本站支持尊重有效期内的版权/著作权,所有的资源均来自于互联网网友分享或网盘资源,一旦发现资源涉及侵权,将立即删除。希望所有用户一同监督并反馈问题,如有侵权请联系站长或发送邮件到ebook666@outlook.com,本站将立马改正
商品基本信息,请以下列介绍为准 | |
商品名称: | Python网络爬虫与数据可视化应用实战 |
作者: | 陈允杰 |
定价: | 109.0 |
出版社: | 中国水利水电出版社 |
出版日期: | 2021-12-01 |
ISBN: | 9787517090540 |
印次: | 1 |
版次: | 1 |
装帧: | |
开本: | 16开 |
内容简介 | |
《Python网络爬虫与数据可视化应用实战》是一本介绍大数据时代用Pytho行数据获取、数据清洗和数据可视化分析的技术图书。全书共分两篇,其中第1篇主要介绍了数据获取的相关知识,具体内括HTML、JSON与网络爬虫基础,爬取静态网页,使用CSS选择器爬取数据,遍历HTML网页并获取数据,使用XPath表达式与Ixm创建爬虫程序,使用Selenium爬取动态网页,Scrapy爬虫框架的使用,数据存储等;第2篇主要介绍数据分析及可视化相关知识,具体内括数据可视化基础知识,Pandsa数据处理,使用Pandas、Matplotlib、Seaborn、Bokeh等工行数据分析和可视化等。每篇均设置章行了综合案例演练,提高综合。 《Python网络爬虫与数据可视化应用实战》一书内容丰富,涵盖面广,适合作为大中专院校相关专业的教材,也适合作为大数据分析相关专业的自学参考书。 |
目录 | |
篇 创建Python爬虫程序——从网页获取数据 CHAPTER 1 HTML、JSON与网络爬虫的基础 1-1 认识HTML 1-1-1 HTML的标签与属性 l-l-2 HTML网页结构 1-2 JSON的基础 1-2-1 认识JSON 1-2-2 JSON的语法 1-3 网络爬虫的概念 1-3-1 认识网络爬虫 1-3-2 为什么需要网络爬虫 1-3-3 网络爬虫的基本步骤 1-4 网络爬虫的相关技术 1-4-1 网络爬虫使用的相关技术 1-4-2 使用浏览器浏览网页的步骤 1-5 Python网络爬虫的相关函数库 1-6 Spyder集成开发环境的使用 CHAPTER 2 从网络获取数据 2-1 认识HTTP头部与httpbin.org服务 2-1-1 HTTP头部 2-1-2 用工具查看HTTP头部信息 2-1-3 认识httpbin.org服务 2-2 使用Requests发送HFTF,请求 2-2-1 发送GET请求 2-2-2 发送POST请求 2-3 获取HTTP响应内容及头部信息 2-3-1 获取HTTP响应内容 2-3-2 内置的响应状态码 2-3-3 获取响应的HTTP头部信息 2-4 发阶的HTTP请求 2-4-1 访问Cookie的HTTP请求 2-4-2 创建自定义HTTP头部的HTTP请求 2-4-3 发送RESTful API的HTTP请求 2-4-4 发送需要认证的HTTP请求 2-4-5 使用timeout参数指定请求时间 2-5 错误/异常处理与文件访问 2-5-1 Requests的异常处理 2-5-2 Pyt件访问 CHAPTER 3 爬取静态HTML网页数据 3-1 在HTML网页定位数据 3-1-1 网络爬虫的数据爬取工作 3-1-2 如何定位网页数据 3-2 使用BeautifulSoup解析HTML网页 3-2-1 创建BeautifulSoup对象 3-2-2 输出解析的HTML网页 3-2-3 BeautifulSoup的对象说明 …… 第二篇 Python数据可视化——大数据分析 |