ApacheSparkBook
ApacheSparkBook copied to clipboard
请问SparkSQL中先union再join,会比先join再union更高效吗?
假如有A、B、C三个表,下面两种操作 (A union B) join C 会比 (A join C) union (B join C) 更快吗?考虑到网络IO和Hash Join等操作的情况下。