本站支持尊重有效期内的版权/著作权,所有的资源均来自于互联网网友分享或网盘资源,一旦发现资源涉及侵权,将立即删除。希望所有用户一同监督并反馈问题,如有侵权请联系站长或发送邮件到ebook666@outlook.com,本站将立马改正
图书基本信息 | |||
图书名称 | 大数据架构和算法实现之路:电商系统的技术实战 | 作者 | 黄申 |
定价 | 79.00元 | 出版社 | 机械工业出版社 |
ISBN | 9787111569695 | 出版日期 | 2017-06-01 |
字数 | 页码 | 424 | |
版次 | 装帧 | 平装 | |
开本 | 16开 | 商品重量 |
内容提要 | |
本书介绍了一些主流技术在商业项目中的应用,包括机器学习中的分类、聚类和线性回归,搜索引擎,推荐系统,用户行为跟踪,架构设计的基本理念及常用的消息和缓存机制。在这个过程中,我们有机会实践R、Mahout、Solr、Elasticsearch、Hadoop、HBase、Hive、Flume、Kafka、Storm等系统。本书大的特色就是,从商业需求出发演变到合理的技术方案和实现,因此根据不同的应用场景、不同的数据集合、不同的进阶难度,我们为读者提供了反复温习和加深印象的机会。 |
目录 | |
推荐序 前言 引子 篇支持高效的运营 章方案设计和技术选型:分类 1.1分类的基本概念 1.2分类任务的处理流程 1.3算法:朴素贝叶斯和K 近邻 1.4分类效果评估 1.5相关软件:R和Mahout 1.6案例实践 1.7更多的思考 第2章方案设计和技术选型:聚类 2.1聚类的基本概念 2.2算法:K均值和层次型聚类 2.3聚类的效果评估 2.4案例实践 第3章方案设计和技术选型:因变量连续的回归分析 3.1线性回归的基本概念 3.2案例实践 第二篇为顾客发现喜欢的商品:基础篇 第4章方案设计和技术选型:搜索 4.1搜索引擎的基本概念 4.2搜索引擎的评估 4.3为什么不是数据库 4.4系统框架 4.5常见的搜索引擎实现 4.6案例实践 第三篇为顾客发现喜欢的商品:高级篇 第5章方案设计和技术选型:NoSQL和搜索的整合 5.1问题分析 5.2HBase简介 5.3结合HBase和搜索引擎 5.4案例实践 第6章方案设计和技术选型:查询分类和搜索的整合 6.1问题分析 6.2结合分类器和搜索引擎 6.3案例实践 第7章方案设计和技术选型:个性化搜索 7.1问题分析 7.2结合用户画像和搜索引擎 7.3案例实践 第8章方案设计和技术选型:搜索分片 8.1问题分析 8.2利用搜索的分片机制 8.3案例实践 第9章方案设计和技术选型:搜索提示 9.1问题分析 9.2案例实践:基础方案 9.3改进方案 9.4案例实践:改进方案 0章方案设计和技术选型:推荐 10.1推荐系统的基本概念 10.2推荐的核心要素 10.3推荐系统的分类 10.4混合模型 10.5系统架构 10.6Mahout中的推荐算法 10.7电商常见的推荐系统方案 10.8案例实践 第四篇获取数据,跟踪效果 1章方案设计和技术选型:行为跟踪 11.1基本概念 11.2使用谷歌分析 11.3自行设计之Flume、HDFS和Hive的整合 11.4自行设计之Flume、Kafka和Storm的整合 11.5案例实践 11.6更多的思考 后记 |
作者介绍 | |
机器学习和大数据挖掘领域的技术专家和管理者。在上海交通大学获得计算机科学与工程博士学位,先后在微软亚洲研究院,eBay中国研发中心,1号店和飞牛网工作。“微软学者奖”获得者,IBM中国首届“ExtremeBlue天才孵化计划”成员。有超过10年的学术创新和实际研发的经验,成功孵化了10多项关键算法,发表了20多篇国际学术论文,拥有10多项国际专利及申请。目前是《计算机工程》杂志的特邀审稿专家,参与撰写的互联网图书《玩转电商》已经于2014年出版。 |
编辑推荐 | |
作者是IBM研究院资深科学家、微软学者、并获得了美国杰出人才称号。曾在eBay、沃尔玛1号店和飞牛网等多家电商公司摸爬滚打,本书集其10多年研发经验之大成。
|