Resemble

Results 3 comments of Resemble

我是git clone下来的,你是wget下载的,不一样

这不是我的博文,好吧

> 我看CogroupRDD的实现,没看懂narrowdependency或shuffledependency对cogrouprdd中partition的影响... 不知道如果a.cogroup(b) , a分别是rangepartitioner和hashpartitioner的话,中间生成的cogrouprdd的分区数莫非和rdd a的一样多?因为cogroup这个算子不能指定numPartitons呀 > 我看您在JobLogicalPlan章节中对dependency分了4类(或者说两打类), 而且看cogroupRDD的对于依赖的处理,似乎并没有这么复杂,完全无视了所谓的N:1 NarrowDependency。 > > > override def compute(s: Partition, context: TaskContext): Iterator[(K, Array[Iterable[_]])] = { > > val sparkConf = SparkEnv.get.conf >...