问题就是加入我现在有两个 object array, 然后我要取两者公共的 object
https://forums.databricks.com/questions/1980/filtering-an-rdd-depending-upon-a-list-of-values-i.html
我在上面链接上找到一个解决方案,但是我觉得这个解决方案是不是效率不高
1
ufo22940268 OP 尴尬, 刚发完自己就研究出一种写法
https://gist.github.com/ufo22940268/9fb56db23942dae943527175cd05c3c6 这样子写的话,就算 a 中有相同的 key, 也最终能够做到 intersectionByKey |