作 者:詹盈
定 价:89.00
出 版 社:电子工业出版社
出版日期:2020-09-01
页 数:328
装 帧:平装
ISBN:9787121392887
章算与数据中台概述1
1.1中台的背景和意义1
1.2算与数据中台的功能价值3
1.3算与数据中台的技术体系4
1.4算与数据中台的实践场景6
1.5算与数据中台的应用前景7
1.6本章结8
第2章中台技术之基础设施10
2.1研发效率系统10
2.1.1代码组织和构建11
2.1.2代码审查和任务管理13
2.1.3持续集成15
2.1.4通用压测台17
2.2服务通信系统19
2.2.1跨程通信框架20
2.2.2服务注册与发现21
2.2.3服务治理24
2.3监控报警系统25
2.3.1通用系统架构25
2.3.2指标计算模型26
2.3.3开源解决方案27
2.4链路跟踪系统29
2.4.1应用场景与设计目标30
2.4.2系统架构30
2.5本章结32
第3章中台技术之在线算系统33
3.1物料检索系统34
3.1.1倒排检索35
3.1.2倒排索引实例37
3.1.3相似检索38
3.1.4相似检索实例40
3.1.5模型粗排40
3.2模型预估服务41
3.2.1整体架构42
3.2.2多框架支持43
3.2.3模型上线44
3.2.4在线预估45
3.2.5异构设备46
3.2.6性能优化47
3.2.7效果监控49
3.3策略机制引擎50
3.3.1整体架构50
3.3.2计算流解释器51
3.3.3lua解释器52
3.4集群管理台53
3.4.1多租户架构53
3.4.2集群动态管理54
3.4.3集群性能监控57
3.4.4配置动态分发59
3.5效果评估系统60
3.5.1背景介绍61
3.5.2设计模式61
3.5.3系统架构62
3.5.4指标计算64
3.6本章结65
第4章中台技术之机器学台66
4.1机器学台简介66
4.1.1机器学的研发流程67
4.1.2机器学的研发挑战69
4.1.3机器学的研发技术69
4.2传统机器学算73
4.2.1线性算73
4.2.2因子分解机算77
4.2.3决策树算81
4.3深度学算84
4.3.1发展简史85
4.3.2神经元模型86
4.3.3神经网络模型87
4.3.4神经网络的算88
4.4模型框架基本94
4.4.1分布式计算架构94
4.4.2并行计算的同步机制99
4.4.3梯度更新算102
4.5层结构的模型框架108
4.5.1caffe109
4.5.2distbelief110
4.5.3wblengine112
4.5.4小结116
4.6数据流结构的模型框架116
4.6.1tensorflow116
4.6.2pytorch122
4.6.3小结126
4.7复合结构的模型框架126
4.7.1场景特点126
4.7.2设计思路127
4.7.3架构与实现128
4.7.4性能优化131
4.7.5小结132
4.8机器学台简介132
4.8.1单业务线开发阶段132
4.8.2台化建设阶段133
4.8.3业界知名产品134
4.9新浪微博wbl机器学台135
4.9.1用户作界面136
4.9.2管理中心138
4.9.3数据中心140
4.9.4调度中心141
4.9.5智能中心144
4.9.6模型中心145
4.10本章结147
第5章中台技术之分布式数据库148
5.1分布式数据库概述148
5.1.1sql数据库148
5.1.2nosql数据库149
5.1.3newsql数据库150
5.2分布式数据库技术150
5.2.1acid理论151
5.2.2cap理论151
5.2.3base理论153
5.2.4数据分片策略154
5.2.5数据复制策略157
5.2.6gossip协议158
5.2.7分布式一致性协议160
5.2.8分布式事务协议167
5.3分布式数据库产品170
5.3.1redis170
5.3.2googlebigtable170
5.3.3googlespanner173
5.4laserdb分布式数据库177
5.4.1系统架构178
5.4.2数据模型179
5.4.3分片策略180
5.4.4批量加载181
5.4.5同步机制182
5.4.6高可用架构184
5.4.7高性能方案185
5.5laserdb应用案例分析188
5.5.1数据缓存188
5.5.2特征服务189
5.5.3向量存储190
5.5.4样本拼接190
5.6本章结191
第6章中台技术之大数据台192
6.1大数据台概述192
6.1.1大数据的特点192
6.1.2大数据台的技术栈193
6.2分布式协调系统194
6.2.1googlechubby195
6.2.2apachezookeeper196
6.2.3consul197
6.3集群管理系统199
6.3.1googlebor0
6.3.2kuberes202
6.3.3apacheyarn203
6.4分布式文件系统205
6.4.1googlegfs205
6.4.2apachehdfs207
6.4.3dropboxmagicpocket209
6.5消息管道系统210
6.5.1googlepubsub211
6.5.2apachekafka213
6.6分布式计算系统214
6.6.1mapreduce214
6.6.2apachespark216
6.6.3apacheflink218
6.6.4apachebeam220
6.7数据仓库与分布式查询系统221
6.7.1googlebigquery222
6.7.2apachehive223
6.7.3facebookpresto224
6.7.4facebookscuba226
6.8本章结227
第7章中台实践之系统228
7.1系统的背景简介228
7.1.1场景概况229
7.1.2整体架构230
7.1.3思路233
7.2系统的算模型235
7.2.1gbdt-lr融合模型235
7.2.2wide&deep模型237
7.2.3deepfm模型238
7.2.4双塔模型238
7.2.5多任务模型239
7.2.6算的发展趋势241
7.3系统的效果度量244
7.3.1体验指标244
7.3.2算指标245
7.4facebook信息流简介250
7.4.1数据分发系统251
7.4.2特征服务252
7.4.3索引系统254
7.4.4预估与排序服务255
7.4.5实时样本拼接服务256
7.4.6模型训练台257
7.5本章结258
第8章中台实践之数字广告259
8.1数字广告的背景简介259
8.1.1核心概念260
8.1.2合约广告261
8.1.3竞价广告262
8.1.4程序化交易广告263
8.2数字广告系统架构264
8.2.1业务台265
8.2.2算与数据中台265
8.3数字广告系统中的数据管理266
8.3.1站内数据267
8.3.2站外数据267
8.4数字广告系统中的受众定向268
8.4.1内容定向268
8.4.2用户标签定向269
8.4.3定制化标签定向269
8.4.4社交关系定向270
8.4.5智能定向270
8.5数字广告系统中的策略机制270
8.5.1流量预测271
8.5.2在线分配271
8.5.3频次控制272
8.5.4滑投放272
8.5.5探索策略273
8.5.6智能出价274
8.5.7广告竞价276
8.5.8反机制277
8.6本章结277
第9章中台实践之网约车台278
9.1业务简介279
9.1.1业务背景279
9.1.2运作流程281
9.1.3用户体验281
9.2技术架构282
9.2.1分层系统架构282
9.2.2业务中台283
9.2.3算与数据中台285
9.3打车定价场景286
9.3.1场景描述286
9.3.2价格动态下浮策略287
9.3.3价格动态上浮策略289
9.3.4小结290
9.4打车排队场景290
9.4.1场景描述290
9.4.2排队时间预估策略291
9.4.3小结292
9.5打车安全场景292
9.5.1场景描述292
9.5.2安全策略293
9.5.3小结294
9.6本章结294
参考文献295
内容简介
本书作者依据在google、facebook、新浪微博及滴滴出行等中美品质互联网公司的实际工作经历,对算技术、数据技术,以及围绕它们行的技术中台建设实践行了全面的探讨,并在此基础上对信息流、计算广告及智能出行等核心互联网业务行了案例剖析。本书具有广阔的技术视野,内容颇具深度,既适合互联网行业的技术从业者阅读,也适合计算机相关专业的高年级本科生、研究生阅读。通过阅读本书,读者能加深对机器学、深度学、大数据、分布式系统及技术中台等相关领域的认知与理解,并从中获得的启发和可借鉴的经验。
詹盈
"本书对较为通用的算技术、数据技术,以及中台建设行了详尽的介绍和结,具有广阔的技术视野,内容颇具深度,建议互联网行业及信息产业的相关从业人员阅读。
——新浪微博 cto 刘子正
本书对于智能数据中台着墨甚多,内容很好全面,更为难得的是,作者还介绍了在中美品质企业的亲身经历和成功实践,这些内容具有高度的可借鉴性,强烈建议互联网行业的广大从业人员阅读。
——shareit 合伙人、coo 王超
作者以其在优选知名互联网企业的亲身体验和深厚技术底蕴,展现了理论与实践的结合,本书是了解算和数据中台技术及其应用的佳作!
——太人寿 cio、谷歌及贝尔实验室前科学家 熊明
本书充分结合靠前外知名互联网企业的实践,围绕算技术和数据技术行了详尽探讨,为从业者提供了可借鉴的经验。
——商汤科技副裁 张少霆
本书翔实地介绍了中台建设的背景和意义,并对与算和数据相关的中台建设实践行了深入探讨,这些技术要点和实践经验颇具代表意义,相信读者能从中获得启发。
——快手副裁、短视频负责人 连乔
本书对数据技术和算技术,以及背后的中台建设经验和实践案例行了深入探讨和剖析,是一本颇具指导价值和内容稀缺性的佳作。
——前技术副裁、strava cto 刘彦东
本书系统化阐述了算、算台、数据库和大数据台,并且通过在业界靠前的广告等系统中的实践详细解释了中台的应用。相信这些典型系统会给读者带来启发,开启产品的智能之门。
——阿里巴巴研究员 蒋晓伟
强大的中台是互联网公司的核心竞争力。本书由浅入深,从基础架构到核心算,从理论到实践,再结合作者多年在google、facebook和新浪微博的工作经验,是难得的技术指南。
——facebook 信息流中台负责人 毛昀
本书系统介绍了与大数据和算中台技术相关的基础知识和系统,详细描述了其在不同场景下的实践。对于那些希望了解中台技术的在校学生和行业从业者,本书是很好难得的学材料!
——腾讯 ai lab 机器学中心监 黄俊洲
本书有别于市场上众多的数据中台类图书,是一本关于算与数据中台技术的“百科全书”。本书包罗万象,讲解深入浅出,是算与数据中台技术研发人员的参考指南。
——google doubleclick 视频广告技术中台负责人 朱祖韬
本书深入浅出地介绍了算和数据中台的核心基础,同时结合作者在靠前外一线互联网公司实际工作经验,系统性讲解了中台的搭建。从业者通读本书能够得到有益的启发和有针对性的经验。
——uber eats 技术负责人 吕飞"