比较scala中Dataframe的特定行

sqyvllje  于 2021-05-19  发布在  Spark
关注(0)|答案(0)|浏览(314)

我有两个scalaDataframe,我正在测试它们的相似性。我希望能够选择一个特定的行号,并在两个Dataframe之间比较该行的每个值。例如:

Dataframe 1: df1

+------+-----+-----------+
| Name | Age | Eye Color |
+------+-----+-----------+
| Bob  | 12  |   Blue    |
| Bil  | 17  |   Red     |
| Ron  | 13  |   Brown   |
+------+-----+-----------+

Dataframe 2: df2

+------+-----+-----------+
| Name | Age | Eye Color |
+------+-----+-----------+
| Bob  | 12  |   Blue    |
| Bil  | 14  |   Blue    |
| Ron  | 13  |   Brown   |
+------+-----+-----------+

输入:第2行,输出:年龄,眼睛颜色。
理想的情况是,输出也显示不同的值。我在这里考虑过这个选项,但问题是我的Dataframe非常大(超过200000行),所以这需要太长时间。有没有更简单的方法来选择scala中Dataframe的特定行值?

暂无答案!

目前还没有任何答案,快来回答吧!

相关问题