CoolplaySpark icon indicating copy to clipboard operation
CoolplaySpark copied to clipboard

《2.1 JobScheduler, Job, JobSet 详解.md》讨论区

Open lw-lin opened this issue 8 years ago • 11 comments

这里是 《2.1 JobScheduler, Job, JobSet 详解.md》 讨论区。

如需要贴代码,请复制以下内容并修改:

public static final thisIsJavaCode;
val thisIsScalaCode

谢谢!

lw-lin avatar Dec 05 '15 12:12 lw-lin

文中说:// 完整代码可见本文最后的附录 在哪里看呢? 文中“能够同时在处理的 batch 有 10 / 2 = 5 个”,不理解为什么是5个。

zhengzhou-spark avatar Jul 16 '16 17:07 zhengzhou-spark

@zhengzhou-spark 因为有两个output,所以产生了两个job, 每个job都要一个线程来运行,这样一来一个批次的数据需要两条线程来运行,所以10个线程可以并发处理5个批次的数据。

TopSpoofer avatar Jul 19 '16 00:07 TopSpoofer

你好,请问 文中提到的:// 完整代码可见本文最后的附录 在哪里看呢?

JudeLmin avatar Aug 09 '16 07:08 JudeLmin

@zhengzhou-spark @JudeLmin

// 完整代码可见本文最后的附录

代码已经更新到原文附录,thanks!

lw-lin avatar Aug 10 '16 06:08 lw-lin

为什么说“在 Spark Streaming 程序在 ssc.start() 开始运行时,会生成一个 JobScheduler 的实例,并被 start() 运行起来”呢?我看到的2.10版本里StreamingContext中scheduler的定义是: private[streaming] val scheduler = new JobScheduler(this) 没有lazy,那么它应该是在streamingContext初始化的时候就生成了吧。

AntikaSmith avatar Mar 25 '17 01:03 AntikaSmith

@AntikaSmith

确实之前的表述有问题,也确实是 没有lazy,那么它应该是在streamingContext初始化的时候就生成了吧 这样的。I'm fixing it -- thanks for pointing this out!

另外如果没加 Streaming 交流群的话,请加下?

lw-lin avatar Mar 27 '17 13:03 lw-lin

@lw-lin

嗯,入群了。

AntikaSmith avatar Mar 29 '17 01:03 AntikaSmith

job的产生和提交都是在driver端,计算任务是如何发布到worker的呢?

ghost avatar Jul 04 '17 09:07 ghost

请问文章中以下两种表述方式,应该使用哪种?

`RDD` DAG
`RDD DAG`

涉及 2.1 及 2.2

hangim avatar Sep 19 '18 08:09 hangim

@lw-lin 加了iRobot,没有等到入群邀请,大佬能否发一下!

allenlu1990 avatar Mar 12 '19 06:03 allenlu1990

@lw-lin 请问一下,spark.streaming.concurrentJobs参数没有在官网上找到,您知道在哪里吗? 目前我知道的相关路径:http://spark.apache.org/docs/2.3.0/configuration.html#spark-streaming

MrYuMing avatar Nov 01 '19 08:11 MrYuMing