SparkFastDataAnalysis icon indicating copy to clipboard operation
SparkFastDataAnalysis copied to clipboard

《Spark 快速大数据分析》学习笔记

Learning Spark Lightning-Fast Data Analysis.

《Spark 快速大数据分析》学习笔记

版权所有

Learning Spark Lightning-Fast Data Analysis.
By Holden Karau, Andy Konwinski, Patrick Wendell, Matei Zaharia. Git
Web Development with Node and Express by Ethan Brown(O’Reilly).
Copyright 2014 Ethan Brown, 978-1-491-94930-6.

版本说明

  • 基于 Scala-2.11.X 版本。
  • 基于 Spark-2.3.1 版本。
  • 基于 JDK-1.8.X 版本。
  • 基于 Python-3.6+ 版本。

程序实现

  • 第 1 章 Spark 数据分析导论
  • 第 2 章 Spark 下载与入门
  • 第 3 章 RDD 编程
  • 第 4 章 键值对操作
  • 第 5 章 数据读取与保存
  • 第 6 章 Spark 编程进阶
  • 第 7 章 在集群上运行 Spark
  • 第 8 章 Spark 调优与调试
  • 第 9 章 Spark SQL
  • 第10 章 Spark Streaming
  • 第11 章 基于 MLlib 的机器学习