ApacheSparkBook
ApacheSparkBook copied to clipboard
第七章《数据缓存机制》勘误与修改建议
第186页,表7.1,job2的stage5:Shuffle Read => reducedRDD(cached) => Shuffle Write 这里的“Shuffle Read =>”应该在上面划线划掉吧,cached前面的还用Shuffle Read 吗?
P182,“即在foreach()操作之前添加mappedRDD.cache()语句,去掉示例中的注释”,示例中本来就没有注释mappedRDD.cache()语句,这是一个小错误。