比较scala中Dataframe的特定行

sqyvllje 于 2021-05-19 发布在 Spark

关注(0)|答案(0)|浏览(314)

我有两个scalaDataframe，我正在测试它们的相似性。我希望能够选择一个特定的行号，并在两个Dataframe之间比较该行的每个值。例如：

Dataframe 1: df1

+------+-----+-----------+
| Name | Age | Eye Color |
+------+-----+-----------+
| Bob  | 12  |   Blue    |
| Bil  | 17  |   Red     |
| Ron  | 13  |   Brown   |
+------+-----+-----------+

Dataframe 2: df2

+------+-----+-----------+
| Name | Age | Eye Color |
+------+-----+-----------+
| Bob  | 12  |   Blue    |
| Bil  | 14  |   Blue    |
| Ron  | 13  |   Brown   |
+------+-----+-----------+

输入：第2行，输出：年龄，眼睛颜色。
理想的情况是，输出也显示不同的值。我在这里考虑过这个选项，但问题是我的Dataframe非常大（超过200000行），所以这需要太长时间。有没有更简单的方法来选择scala中Dataframe的特定行值？

scala DataFrame apache-spark collect

来源：https://stackoverflow.com/questions/64486438/compare-specific-rows-of-dataframes-in-scala

暂无答案！

目前还没有任何答案，快来回答吧！

我来回答

比较scala中Dataframe的特定行

暂无答案！

相关问题

热门标签

最新问答