我有两个scalaDataframe,我正在测试它们的相似性。我希望能够选择一个特定的行号,并在两个Dataframe之间比较该行的每个值。例如:
Dataframe 1: df1
+------+-----+-----------+
| Name | Age | Eye Color |
+------+-----+-----------+
| Bob | 12 | Blue |
| Bil | 17 | Red |
| Ron | 13 | Brown |
+------+-----+-----------+
Dataframe 2: df2
+------+-----+-----------+
| Name | Age | Eye Color |
+------+-----+-----------+
| Bob | 12 | Blue |
| Bil | 14 | Blue |
| Ron | 13 | Brown |
+------+-----+-----------+
输入:第2行,输出:年龄,眼睛颜色。
理想的情况是,输出也显示不同的值。我在这里考虑过这个选项,但问题是我的Dataframe非常大(超过200000行),所以这需要太长时间。有没有更简单的方法来选择scala中Dataframe的特定行值?
暂无答案!
目前还没有任何答案,快来回答吧!