《书籍Greenplum构建实时数据仓库实践王雪迎Greenplum初学者大数据分析系统设计与开发数据仓库系统设计与开发DBA架构师》[61M]百度网盘|pdf下载|亲测有效
《书籍Greenplum构建实时数据仓库实践王雪迎Greenplum初学者大数据分析系统设计与开发数据仓库系统设计与开发DBA架构师》[61M]百度网盘|pdf下载|亲测有效

书籍Greenplum构建实时数据仓库实践王雪迎Greenplum初学者大数据分析系统设计与开发数据仓库系统设计与开发DBA架构师 pdf下载

出版社 世纪书缘专营店
出版年 2022-08
页数 390页
装帧 精装
评分 8.9(豆瓣)
8.99¥ 10.99¥

内容简介

本篇主要提供书籍Greenplum构建实时数据仓库实践王雪迎Greenplum初学者大数据分析系统设计与开发数据仓库系统设计与开发DBA架构师电子书的pdf版本下载,本电子书下载方式为百度网盘方式,点击以上按钮下单完成后即会通过邮件和网页的方式发货,有问题请联系邮箱ebook666@outlook.com



商品参数

Greenplum构建实时数据仓库实践
定价 89.00
出版社 清华大学出版社
出版时间 2022年08月
开本
作者 王雪迎
页数
ISBN编码 9787302611653


内容介绍

Greenplum分布式数据库具有可选存储模式、事务支持、并行查询与数据装载、容错与故障转移、数据库统计、过程化语言扩展等方面的功能特性,因此Greenplum成为一款理想的分析型数据库产品。本书详解Greenplum数据仓库构建与数据分析技术,配套示例源码。 本书共分10章。内容包括数据仓库简介、数据仓库设计基础、Greenplum与数据仓库、Greenplum安装部署、实时数据同步、实时数据装载、维度表技术、事实表技术、Greenplum运维与监控、集成机器学习库MADlib。 本书适合Greenplum初学者、大数据分析系统设计与开发、数据仓库系统设计与开发、DBA、架构师等相关技术人员阅读,也适合高等院校大数据相关专业的师生作为实训教材。



作者介绍

王雪迎 ,毕业于中国地质大学计算机专业,高级工程师,20年数据库、数据仓库相关技术工作经验。先后供职于北京现代商业信息技术有限公司、北京在线九州信息技术服务有限公司、华北计算技术研究所、北京优贝在线网络科技有限公司,担任DBA、数据架构师等职位。著有图书《Greenplum构建实时数据仓库实践》《Hadoop构建数据仓库实践》《HAWQ数据仓库与数据挖掘实战》《SQL机器学习库MADlib技术解析》《MySQL高可用实践》。



目录

第1章  数据仓库简介 1

1.1  什么是数据仓库 1

1.1.1  数据仓库的定义 2

1.1.2  建立数据仓库的原因 3

1.2  操作型系统与分析型系统 5

1.2.1  操作型系统 5

1.2.2  分析型系统 7

1.2.3  操作型系统和分析型系统的对比 8

1.3  抽取—转换—装载 10

1.3.1  数据抽取 10

1.3.2  数据转换 12

1.3.3  数据装载 13

1.3.4  开发ETL系统的方法 13

1.4  数据仓库架构 14

1.4.1  基本架构 14

1.4.2  主要数据仓库架构 15

1.4.3  操作型数据存储 19

1.5  实时数据仓库 19

1.5.1  流式处理 20

1.5.2  实时计算 21

1.5.3  实时数据仓库解决方案 24

1.6  小结 26

第2章  数据仓库设计基础 27

2.1  关系数据模型 27

2.1.1  关系数据模型中的结构 27

2.1.2  关系完整性 30

2.1.3  关系数据库语言 31

2.1.4  规范化 32

2.1.5  关系数据模型与数据仓库 34

2.2  维度数据模型 36

2.2.1  维度数据模型建模过程 36

2.2.2  维度规范化 37

2.2.3  维度数据模型的特点 38

2.2.4  星型模式 39

2.2.5  雪花模式 41

2.3  Data Vault模型 43

2.3.1  Data Vault模型简介 43

2.3.2  Data Vault模型的...