bigdatatutorial
bigdatatutorial copied to clipboard
bigdatatutorial
小白学习大数据
关于这个系列的文章
我本人算是大数据的初学者,在学习大数据的过程中,经常遇到为什么用这个东西,为什么他能提高效率,为什么这个技术能更好的提高性能,这段代码会在哪些机子上执行这些问题。而搭建过程中也会遇到一些明明按照教程来的为什么就失败了。
我在学习过程中记录下这些细节,为了理清思路,让新手更容易学习和理解大数据,写了这个系列的文章。
Hadoop家族
- 1.Hadoop
- 2.Hive
- 3.Hbase
浅谈-----大数据分析的两大核心:存储构架和计算构架
Spark家族
- 1.SparkRDD
- 2.SparkIO
- 3.SparkSQL
- 4.SparkDataset
- 5.SparkStream
浅谈-----Spark计算为什么比Hadoop快
Postgresql家族
- 1.流式数据库pipelinedb
- 2.分布式关系型数据库GreenPlum
扩展阅读-----MPP和Hadoop的定位以及分别适合的场景
其他存储系统
- 1.Ignite
- 2 Ignite与Hadoop/Spark(还没写)
- 3.Redis
- 4.Mongodb
- 5.Cassandra
快速查询
- 1.Elasticsearch
- 2.Presto