基本信息
- 商品名:【京联□□】HBase□□指南乔治9787115318893
- ISBN:9787115318893
- 定价:89
- 出版社:人民邮电出版社
- 作者:[美]Lars George
参考信息(以实物为准)
- 出版时间:2013-10-01
- 印刷时间:2013-09-01
- 版次:1
- 印次:1
- 包装:平装
- 开本:16开
- 用纸:胶版纸
- 页数:476
- 字数:646000
编辑推荐
Apache HBase项目管理委员会主席Michael Stack作序推荐。
作者Lars George是HBase Committer,HBase文档的主要贡献者,Cloudera公司解决方案架构师,主要为Hadoop和HBase提供技术支持、咨询和培训工作。
这是一本介绍HBase内部机制的书,是HBase开发指南。
内容简介
本书探讨了如何通过使用与HBase高度集成的Hadoop将HBase的可伸缩性□得简单;把大型数据集分布到相对廉价的商业服务器集群中;使用本地Java客户端,或者通过提供了REST、Avro和Thrift应用编程接口的网关服务器来访问HBase;了解HBase架构的细节,包括存储格式、预写日志、后台进程等;在HBase中集成MapReduce框架;了解如何调节集群、设计模式、拷贝表、导入批量数据和删除节点等。
本书适合使用HBase进行数据库开发的高级数据库研发人员阅读。
目录
□□章 简介
1.1 海量数据的黎明
1.□ 关系数据库系统的问题
1.3 非关系型数据库系统Not-Only-SQL(简称NoSQL)
1.3.1 维度
1.3.□ 可扩展性
1.3.3 数据库的范式化和反范式化
1.4 结构
1.4.1 背景
1.4.□ 表、行、列和单元格
1.4.3 自动分区
1.4.4 存储API
1.4.5 实现
1.4.6 小结
1.5 HBase:Hadoop数据库
1.5.1 历史
1.5.□ 命名
1.5.3 小结
第□章 安装
□.1 快速启动指南
□.□ 必备条件
□.□.1 硬件
□.□.□ 软件
□.3 HBase使用的文件系统
□.3.1 本地模式
□.3.□ HDFS
□.3.3 S
□.3.4 其他文件系统
□.4 安装选项
□.4.1 Apache二进制发布包
□.4.□ 编译源码
□.5 运行模式
□.5.1 单机模式
□.5.□ 分布式模式
□.6 配置
□.6.1 hbase-site.xml与hbase-default.xml
□.6.□ hbase-env.sh
□.6.3 regionserver
□.6.4 log4j.propertie□<□r />□.6.5 配置示例
□.6.6 客户端配置
□.7 部署
□.7.1 基于脚本
□.7.□ Apache Whirr
□.7.3 Puppet与Chef
□.8 操作集群
□.8.1 确定安装运行
□.8.□ Web UI介绍
□.8.3 Shell介绍
□.8.4 关闭集群
第3章 客户端API:基础知识
3.1 概述
3.□ CRUD操作
3.□.1 put方法
3.□.□ get方法
3.□.3 删除方法
3.3 批量处理操作
3.4 行锁
3.5 扫描
3.5.1 介绍
3.5.□ ResultScanner类
3.5.3 缓存与批量处理
3.6 各种特性
3.6.1 HTable的实用方法
3.6.□ Bytes类
第4章 客户端API:高级特性
4.1 过滤器
4.1.1 过滤器简介
4.1.□ 比较过滤器
4.1.3 专用过滤器
4.1.4 附加过滤器
4.1.5 FilterList
4.1.6 自定义过滤器
4.1.7 过滤器总结
4.□ 计数器
4.□.1 计数器简介
4.□.□ 单计数器
4.□.3 多计数器
4.3 协处理器
4.3.1 协处理器简介
4.3.□ Coprocessor类
4.3.3 协处理器加载
4.3.4 RegionObserver类
4.3.5 MasterObserver类
4.3.6 endpoint
4.4 HTablePool
4.5 连接管理
第5章 客户端API:管理功能
5.1 模式定义
5.1.1 表
5.1.□ 表属性
5.1.3 列族
5.□ HBaseAdmin
5.□.1 基本操作
5.□.□ 表操作
5.□.3 模式操作
5.□.4 集群管理
5.□.5 集群状态信息
第6章 可用客户端
6.1 REST、Thrift和Avro的介绍
6.□ 交互客户端
6.□.1 原生Java
6.□.□ REST
6.□.3 Thrift
6.□.4 Avro
6.□.5 其他客户端
6.3 批处理客户端
6.3.1 MapReduce
6.3.□ Hive
6.3.3 Pig
6.3.4 Cascading
6.4 Shell
6.4.1 基础
6.4.□ 命令
6.4.3 脚本
6.5 基于Web的UI
6.5.1 master的UI
6.5.□ region服务器的UI
6.5.3 共享页面
第7章 与MapReduce集成
7.1 框架
7.1.1 MapReduce介绍
7.1.□ 类
7.1.3 支撑类
7.1.4 MapReduce的执行地点
7.1.5 表拆分
7.□ 在HBase之上的MapReduce
7.□.1 准备
7.□.□ 数据流向
7.□.3 数据源
7.□.4 数据源与数据流向
7.□.5 自定义处理
第8章 架构
8.1 数据查找和传输
8.1.1 B+树
8.1.□ LSM树
8.□ 存储
8.□.1 概览
8.□.□ 写路径
8.□.3 文件
8.□.4 HFile格式
8.□.5 KeyValue格式
8.3 WAL
8.3.1 概述
8.3.□ HLog类
8.3.3 HLogKey类
8.3.4 WALEdit类
8.3.5 LogSyncer类
8.3.6 LogRoller类
8.3.7 回放
8.3.8 持久性
8.4 读路径
8.5 region查找
8.6 region生命周期
8.7 ZooKeeper
8.8 □□
8.8.1 Log Edit的生命周期
8.8.□ 内部机制
第9章 高级用法
9.1 行键设计
9.1.1 概念
9.1.□ 高表与宽表
9.1.3 部分键扫描
9.1.4 分页
9.1.5 时间序列
9.1.6 时间顺序关系
9.□ 高级模式
9.3 辅助索引
9.4 搜索集成
9.5 事务
9.6 布隆过滤器
9.7 版本管理
9.7.1 隐式版本控制
9.7.□ 自定义版本控制
□□0章 集群监控
10.1 介绍
10.□ 监控框架
10.□.1 上下文、记录和监控指标
10.□.□ master监控指标
10.□.3 region服务器监控指标
10.□.4 RPC监控指标
10.□.5 JVM监控指标
10.□.6 info监控指标
10.3 Ganglia
10.3.1 安装
10.3.□ 用法
10.4 JMX
10.4.1 JConsole
10.4.□ JMX远程API
10.5 Nagio□<□r />
□□1章 性能优化
11.1 垃圾回收优化
11.□ 本地memstore分配缓冲区
11.3 压缩
11.3.1 可用的编解码器
11.3.□ 验证安装
11.3.3 启用压缩
11.4 优化拆分和合并
11.4.1 管理拆分
11.4.□ region热点
11.4.3 预拆分region
11.5 负载均衡
11.6 合并region
11.7 客户端API:□佳实践
11.8 配置
11.9 负载测试
11.9.1 性能评价
11.9.□ YCSB
□□□章 集群管理
1□.1 运维任务
1□.1.1 减少节点
1□.1.□ 滚动重启
1□.1.3 新增服务器
1□.□ 数据任务
1□.□.1 导入/导出
1□.□.□ CopyTable工具
1□.□.3 批量导入
1□.□.4 □□
1□.3 额外的任务
1□.3.1 集群共存
1□.3.□ 端口要求
1□.4 改□日志级别
1□.5 故障处理
1□.5.1 HBase Fsck
1□.5.□ 日志分析
1□.5.3 常见问题
附录A HBase配置属性
附录B 计划
附录C 版本升级
附录D 分支
附录E Hush SQL Schema
附录F 对比HBase和BigTable
作者简介
Lars George,HBase项目组成员,他是cloudera的解决方案架构师,提供了关于Hadoop和HBase的技术支持、咨询服务和培训工作。他曾经在多个不同的Hadoop用户组会议发言,并且在如布鲁塞尔的自由及开源软件开发者欧洲会议(FOSDEM)这样的大型会议中发言。
精彩书评
“分布式系统充其量只能说是经常‘多云’的。Lars George从那些主题的‘水蒸气’中提炼出了实际的项目,在此过程中,他为我们呈现了一本卓越的HBase指南。”
——Josh Patterson
Cloudera公司