本站支持尊重有效期内的版权/著作权,所有的资源均来自于互联网网友分享或网盘资源,一旦发现资源涉及侵权,将立即删除。希望所有用户一同监督并反馈问题,如有侵权请联系站长或发送邮件到ebook666@outlook.com,本站将立马改正
机器学习已经广泛地应用于各行各业,深度学习的兴起再次推动了人工智能的热潮。本书结合项目实践,首先讨论了主流机器学习平台的主要特点以及机器学习的实战难点。在此基础上,利用主流的机器学习开源平台TensorFlow、OpenVINO、PaddlePaddle等,通过17个实战案例,详细地分析了决策树、随机森林、支持向量机、逻辑回归、贝叶斯网络、聚类、卷积神经网络、循环神经网络、生成对抗网络等机器学习和深度学习算法在金融、零售、汽车、电力、交通、教育等典型领域的应用。
赵卫东,主要负责本科生和各类研究生机器学习、大数据核心技术和人工智能(机器学习)(商务数据分析)等课程的教学,2011年纽约大学访问学者。人工智能(机器学习)被评为上海市精品课程以及CMOOC联盟线上线下混合式教学改革项目,获得2013年高等教育上海市教学成果奖二等奖。目前主要研究方向包括机器学习应用和大数据分析等。主持国家自然科学基金2项、国家重点研发计划子课题、上海市浦江人才以及企业合作课题等30多项目。已在Kwledge and Information Systems ,Information Processing & Management,Information Systems Frontiers,Intelligent Data Analysis,Applied Intelligence等国内外刊物和学术会议发表论文100多篇。出版专著、教材《机器学习》《机器学习案例实战》《Python机器学习实战案例》等10多部。获得上海市2015年上海市科技进步二等奖。CDA三级认证数据科学家,腾讯云和百度云机器学习认证讲师。
1章 常用机器学习平台
1.1 常用机器学习工具
1.2 TI-ONE平台概述
1.3 PySpark介绍
1.4 TI-ONE机器学习平台主要的组件
1.4.1 数据源组件
1.4.2 机器学习组件
1.4.3 输出组件
1.4.4 模型评估组件
2章 银行信用卡风险的可视化分析
2.1 Tableau简介
2.2 客户信用等级影响因素
2.3 客户消费情况对信用等级的影响
2.4 客户拖欠情况对信用等级的影响
2.5 欺诈客户特征分析
3章 贷款违约行为预测
3.1 建立信用评估模型的必要性
3.2 数据准备与预处理
3.2.1 原始数据集
3.2.2 基础表数据预处理
3.2.3 多表合并
3.3 模型选择
3.3.1 带正则项的Logistic回归模型
3.3.2 朴素贝叶斯模型
3.3.3 随机森林模型
3.3.4 SVM模型
3.4 TI-ONE整体流程
3.4.1 登录TI-ONE
3.4.2 输入工作流名称
3.4.3 上传数据
3.4.4 数据预处理
3.4.5 拆分出验证集
3.4.6 拆分出测试集
3.4.7 模型训练和评估
3.5 客户细分
4章 保险风险预测
4.1 背景介绍
4.2 数据预处理
4.2.1 数据加载与预览
4.2.2 缺失值处理
4.2.3 属性值的合并与连接
4.2.4 数据转换
4.2.5 数据标准化和归一化
4.3 多维分析
4.4 基于神经网络模型预测保险风险
4.5 使用SVM预测保险风险
5章 银行客户流失预测
5.1 问题描述
5.2 数据预处理
5.2.1 非数值特征处理
5.2.2 数据离散化处理
5.2.3 数据筛选
5.2.4 数据分割
5.3 数据建模
5.3.1 决策树简介
5.3.2 构建决策树模型
5.4 模型校验评估
5.4.1 混淆矩阵评估
5.4.2 ROC曲线绘制
5.4.3 决策树参数优化
5.4.4 k折交验证
5.5 算法性能比较
6章 基于深度神经网络的股票预测
6.1 股票趋势预测的背景和分析思路
6.2 数据提取
6.3 数据预处理
6.3.1 数据归一化
6.3.2 加窗处理
6.3.3 分割数据集
6.3.4 标签独热编码转化
6.4 模型训练
6.5 算法评估
6.6 算法比较
7章 保险产品推荐
7.1 保险产品推荐的流程
7.2 数据提取
7.2.1 上传原始文件
7.2.2 读取训练集和检验集
7.3 数据预处理
7.3.1 去重和合并数据集
7.3.2 缺失值处理
7.3.3 特征选择
7.3.4 类型变量独热编码
7.3.5 数值变量规范化
7.3.6 生成训练集和检验集
7.4 构建保险预测模型
7.5 模型评估
8章 零售商品销售预测
8.1 问题分析
8.2 数据探索
8.2.1 上传原始数据
8.2.2 数据质量评估
8.3 数据预处理
8.3.1 填补缺失值
8.3.2 修正异常值
8.3.3 衍生字段
8.3.4 类型变量数值化和独热编码化
8.3.5 数据导出
8.4 建立销售量预测模型
8.4.1 线性回归模型
8.4.2 Ridge回归模型
8.4.3 Lasso回归模型
8.4.4 Elastic Net回归模型
8.4.5 决策树回归模型
8.4.6 梯度提升树回归模型
8.4.7 随机森林回归模型
8.5 模型评估
9章 汽车备件销售预测
9.1 数据理解
9.2 数据分析流程
9.2.1 设置数据源
9.2.2 数据预处理
9.2.3 建模分析与评估
9.3 聚类分析
10章 火力发电厂工业蒸汽量预测
10.1 确定业务问题
10.2 数据理解
10.3 工业蒸汽量的预测建模过程
10.3.1 设置数据源
10.3.2 数据预处理
10.3.3 建模分析与评估
11章 图片风格转化
11.1 CycleGAN原理
11.2 图片风格转化整体流程
11.2.1 设置数据源
11.2.2 数据预处理
11.2.3 模型训练
11.2.4 验证模型参数以及测试集
11.2.5 模型测试——转化图片风格
11.3 运行工作流
11.4 算法比较
11.4.1 CycleGAN与pi2pi模型
11.4.2 CycleGAN与DistanceGAN模型
11.5 使用TensorFlow实现图片风格转化
12章 人类活动识别
12.1 问题分析
12.2 数据探索
12.3 数据预处理
12.4 模型构建
12.5 模型评估
13章 GRU算法在基于Session的推荐系统的应用
13.1 问题分析
13.2 数据探索与预处理
13.2.1 数据变换
13.2.2 数据过滤
13.2.3 数据分割
13.2.4 格式转换
13.3 构建GRU模型
13.3.1 GRU概述
13.3.2 构建GRU推荐模型
13.4 模型评估
14章 人脸老化预测
14.1 问题分析与数据集简介
14.2 图片编码与GAN设计
14.3 模型实现
14.4 实验分析
15章 出租车轨迹数据分析
15.1 数据获取
15.2 数据预处理
15.3 数据分析
15.3.1 出租车区域推荐以及交通管理建议
15.3.2 城市规划建议
16章 城市声音分类
16.1 数据准备与探索
16.2 数据特征提取
16.3 构建城市声音分类模型
16.3.1 使用MLP训练声音分类模型
16.3.2 使用LSTM与GRU网络训练声音分类模型
16.3.3 使用CNN训练声音分类模型
16.4 声音分类模型评估
16.4.1 MLP网络性能评估
16.4.2 LSTM与GRU网络性能评估
16.4.3 CNN性能评估
参考文献