CoolplaySpark 《2.1 JobScheduler, Job, JobSet 详解.md》讨论区

这里是《2.1 JobScheduler, Job, JobSet 详解.md》讨论区。

如需要贴代码，请复制以下内容并修改：

public static final thisIsJavaCode;

val thisIsScalaCode

谢谢！

Dec 05 '15 12:12 lw-lin

文中说：// 完整代码可见本文最后的附录在哪里看呢? 文中“能够同时在处理的 batch 有 10 / 2 = 5 个”，不理解为什么是5个。

Jul 16 '16 17:07 zhengzhou-spark

@zhengzhou-spark 因为有两个output，所以产生了两个job，每个job都要一个线程来运行，这样一来一个批次的数据需要两条线程来运行，所以10个线程可以并发处理5个批次的数据。

Jul 19 '16 00:07 TopSpoofer

你好，请问文中提到的：// 完整代码可见本文最后的附录在哪里看呢?

Aug 09 '16 07:08 JudeLmin

@zhengzhou-spark @JudeLmin

// 完整代码可见本文最后的附录

代码已经更新到原文附录，thanks!

Aug 10 '16 06:08 lw-lin

为什么说“在 Spark Streaming 程序在 ssc.start() 开始运行时，会生成一个 JobScheduler 的实例，并被 start() 运行起来”呢？我看到的2.10版本里StreamingContext中scheduler的定义是： private[streaming] val scheduler = new JobScheduler(this) 没有lazy，那么它应该是在streamingContext初始化的时候就生成了吧。