《利用Python实现概率、统计及机器学习方法》[44M]百度网盘|pdf下载|亲测有效

利用Python实现概率、统计及机器学习方法 pdf下载

出版社机械工业出版社京东自营官方旗舰店

出版年 2023-02

页数 390页

装帧精装

评分 8.6(豆瓣)

⏰ 限时特惠 00:00:00

活动结束后恢复原价

纸质书参考价 ¥23

电子版限时价 ¥5.99 省 18 元

选择版本

基础版

PDF文件

¥4

内容简介

本篇主要提供利用Python实现概率、统计及机器学习方法电子书的pdf版本下载，本电子书下载方式为百度网盘方式，点击以上按钮下单完成后即会通过邮件和网页的方式发货，有问题请联系邮箱ebook666@outlook.com

产品特色

编辑推荐

适读人群：任何本科阶段接触过概率论、统计学或机器学习并掌握Python 编程基础知识的人

本书涵盖概率论、统计学和机器学习领域的关键思想，并使用Python模块演示了这些领域的应用。本书从最简单的概率论知识展开，逐步延伸到统计学和机器学习的关键思想，并通过Python及其强大的扩展功能来阐述概率论和统计学知识与机器学习的联系。本书各章都给出了大量的示例，以展示理论概念与具体实践的联系，并且书中所有的图形和数值结果都可以用Python重现。作者还提供了某些重要结果的详细证明。作者使用Pandas、Sympy、Scikit-learn、TensorFlow和Keras等流行的Python模块模拟和可视化了重要的机器学习概念（如偏差与方差之间的权衡、交叉验证和正则化），并通过数值方法展示了许多抽象的数学思想（如概率论中的收敛性）。

本书特色
●　全面阐释如何模拟、概念化和可视化随机统计过程以及应用机器学习方法。
●　覆盖关键的Python模块，如Numpy、Scikit-learn、Sympy、Matplotlib、Pandas、TensorFlow、Keras等，并说明了相应的编程技巧。
●　用直观的方法概述了概率、统计和机器学习的概念，并提供了相应的可视化代码。

内容简介

本书主要介绍概率、统计及机器学习相关概念及对应的Python实现，并讨论相关的Python编程技巧。全书共分为4章：第1章介绍Python的入门知识，主要包含Numpy、Matplotlib和Pandas三个基本库，以及Scipy与Sympy模块、编译库接口和集成开发环境等内容；第2章从几何角度来阐述概率论，将概率论与线性代数和几何中的常见概念联系起来；第3章引入Python强大的统计分析工具来介绍统计学知识；第4章利用前面介绍的概率论与统计学的知识探讨机器学习的关键思想。
新版更新了Fisher精确检验和Mann-Whitney-Wilcoxon检验，新增了生存分析以及广义线性模型，还新增了图像处理相关的深度学习内容，深入讨论支持所有深度学习算法的梯度下降方法。此外，本书提供了许多实用编程技巧，解释了科学编程和机器学习的有效Python模块和方法，有445个经过实际验证的可运行的代码块，并用158个图形（几乎都是用Python生成的）可视化地演示了代码和数学中使用的概念。
本书适合任何本科阶段接触过概率论、统计学或机器学习并掌握Python 编程基础知识的读者阅读。

作者简介

何塞·安平科
（José Unpingco）
他于1997年在加州大学圣地亚哥分校获得博士学位，此后担任工程师、顾问和讲师，从事各种高级数据处理和分析研究，在机器学习和统计学方面拥有丰富的经验。作为美国国防部大规模信号和图像处理的现场技术总监，他率先在美国国防部范围内采用科学Python。他还培训了600多名科学家和工程师，使他们能够有效地将Python应用于广泛的科学主题——从天气建模到天线分析。他是加利福尼亚州圣地亚哥一家非营利性医学研究组织的联合创始人兼数据科学高级总监。他还在加州大学圣地亚哥分校为工程专业本科生和研究生教授数据分析编程课程。他也是Python for Signal Processing（Springer，2014）的作者。

译者序
前言
第1版前言
符号说明
第1章科学Python入门1
1.1安装和设置2
1.2Numpy4
1.2.1Numpy数组和内存5
1.2.2Numpy矩阵8
1.2.3Numpy广播操作9
1.2.4Numpy掩码数组11
1.2.5浮点数11
1.2.6Numpy优化简介14
1.3Matplotlib15
1.3.1Matplotlib的替代方法16
1.3.2Matplotlib的扩展17
1.4IPython17
1.5Jupyter Notebook18
1.6Scipy20
1.7Pandas21
1.7.1Series21
1.7.2DataFrame23
1.8Sympy25
1.9编译库接口27
1.10集成开发环境28
1.11性能和并行编程快速指南28
1.12其他资源31
参考文献32
第2章概率33
2.1引言33
2.1.1概率密度34
2.1.2随机变量35
2.1.3连续随机变量39
2.1.4微积分以外的变量变换41
2.1.5独立随机变量42
2.1.6经典Broken Rod示例44
2.2投影法45
2.2.1加权距离47
2.3条件期望作为投影47
2.3.1附录51
2.4条件期望与均方误差52
2.5条件期望和均方误差优化
示例55
2.5.1示例155
2.5.2示例258
2.5.3示例360
2.5.4示例463
2.5.5示例564
2.5.6示例666
2.6有用的分布67
2.6.1正态分布67
2.6.2多项分布67
2.6.3卡方分布69
2.6.4泊松分布和指数分布71
2.6.5伽马分布72
2.6.6贝塔分布73
2.6.7狄利克雷多项分布74
X
XI
2.7信息熵76
2.7.1信息论的概念76
2.7.2信息熵的性质78
2.7.3KullbackLeibler散度79
2.7.4交叉熵作为大似然80
2.8矩母函数80
2.9蒙特卡罗采样方法83
2.9.1离散变量逆CDF法83
2.9.2连续变量逆CDF法85
2.9.3舍选法86
2.10采样重要性重采样90
2.11实用的不等式92
2.11.1马尔可夫不等式92
2.11.2切比雪夫不等式93
2.11.3霍夫丁不等式94
参考文献96
第3章统计97
3.1引言97
3.2用于统计的Python模块98
3.2.1Scipy统计模块98
3.2.2Sympy统计模块99
3.2.3其他用于统计的Python
模块99
3.3收敛类型100
3.3.1几乎必然收敛100
3.3.2依概率收敛102
3.3.3依分布收敛104
3.3.4极限定理104
3.4大似然估计105
3.4.1设置抛硬币试验107
3.4.2Delta方法115
3.5假设检验和p值117
3.5.1回到抛硬币的例子118
3.5.2ROC曲线120
3.5.3p值122
3.5.4检验统计量123
3.5.5多重假设检验129
3.5.6Fisher精确检验129
3.6置信区间131
3.7线性回归134
3.7.1扩展至多个协变量141
3.8大后验概率145
3.9鲁棒统计150
3.10自助法155
3.10.1参数化自助法159
3.11高斯马尔可夫模型160
3.12非参数方法162
3.12.1核密度估计162
3.12.2核平滑164
3.12.3非参数回归估计169
3.12.4近邻回归169
3.12.5核回归173
3.12.6维数灾难174
3.12.7非参数检验176
3.13生存分析181
参考文献187
第4章机器学习188
4.1引言188
4.2Python机器学习模块188
4.3学习理论192
4.3.1机器学习理论概述194
4.3.2泛化理论198
4.3.3泛化/近似复杂度示例199
4.3.4交叉验证204
4.3.5偏差和方差208
4.3.6学习噪声211
4.4决策树213
4.4.1随机森林219
4.4.2提升树220
4.5逻辑回归223
4.6广义线性模型231
4.7正则化236
4.7.1岭回归239
4.7.2套索回归243
4.8支持向量机244
4.9降维248
4.9.1独立成分分析252
4.10聚类256
4.11集成方法259
4.11.1装袋法259
4.11.2提升法261
4.12深度学习262
4.12.1TensorFlow概述270
4.12.2梯度下降275
4.12.3基于卷积神经网络的图像
处理286
参考文献301

查看全部↓

前言/序言

第2版是针对Python 36+版本更新的。此外，许多现有章节已经根据第1版的反馈进行了修订，因此更加清晰简洁。第2版在第1版的基础上增加了30%有关重要概率分布的内容，包括关键推导和用于演示说明的代码示例。第3章增加了重要的统计检验，包括Fisher精确检验和MannWhitneyWilcoxon检验，还新增了生存分析这一节内容。第4章最重要的补充内容是关于图像处理的深度学习一节，该节详细讨论了支持所有深度学习工作的梯度下降方法，第4章对广义线性模型也进行了讨论。与第1版一样，本书有许多编程技巧，说明了科学编程和机器学习的有效Python模块和方法；有445个经过实际验证的可运行的代码块，你可以尝试在自己的代码中加入这些代码块；158个图形（几乎都是用Python生成的）可视化地演示了代码和数学中使用的概念。本书还讨论并使用了关键的Python模块，如Numpy、Scikitlearn、Sympy、Scipy、lifelines、CVXPY、Theano、Matplotlib、Pandas、TensorFlow、Statsmodels和Keras。
与第1版一样，所有的关键概念都从数学上展开，并且在Python中复现，为读者提供了多个视角来理解关键概念。本书并非详尽无遗，只是反映了作者兼收并蓄的行业背景，重点仍然是以最有表现力的方式呈现日常使用Python工作时涉及的基本概念和原理。
致谢
感谢Jupyter Notebook两位创始人Brian Granger和Fernando Perez的帮助，感谢他们所做的伟大工作，同时还要感谢整个Python社区人员，是他们的贡献让本书成为可能。Hans Petter Langtangen是DocOnce（DocOnce标记语言见https://githubcom/hplgit/doconce）文档准备系统的作者，本书使用该系统编写。感谢Geoffrey Poore对Python TeX和LaTeX的研究，本书的排版采用了这两种关键技术。
José Unpingco
美国加利福尼亚州圣地亚哥
2019年2月

查看全部↓