作 者:(英)彭特里思(Nick Pentreath) 著
定 价:68
出 版 社:东南大学出版社
出版日期:2016年01月01日
页 数:319
装 帧:平装
ISBN:9787564160913
●Preface
●Chapter 1: Getting Up and Running with Spark
●Installing and setting up Spark locally
●Spark clusters
●The Spark programming model
●Spark Context and Spark Conf
●The Spark shell
●Resilient Distributed Datasets
●Creating RDDs
●Spark operations
●Caching RDDs
●Broadcast variables and accumulators
●The first step to a Spark program in Scala
●The first step to a Spark program in Java
●The first step to a Spark program in Python
●Getting Spark running on EC2
●Launching an EC2 Spark cluster
●Summary
●Chapter 2: Designing a Machine Learning System
●Introducing Movie Stream
●部分目录
你可以从书中学到使用Scala、Java和Python创建你的靠前个Spark程序;在你自己的计算机以及 EC2上建立、配置Spark开发环境;访问公共机器学习数据集,使用Spark载入、处理、清理、转换数据;使用Spark的机器学习库来实现能够利用各种熟知的机器学习模型的程序;等等。
(英)彭特里思(Nick Pentreath) 著
彭特里思,如果你是一名Scala、Java或Python开发人员,对机器学习和数据分析饶有兴趣,并热衷于学习如何使用spa rk框架将常见机器学习技术运用干大规模应用,那么这本书就是写给你的。如果对spark有基本的理解自然会有益处,但这并不是必需的。