我已经离开pyspark df:
+----------+----------+
|session_id|time |
+----------+----------+
|1 |10 |
|2 |20 |
|3 |30 |
右边:
+----------+----------+
|res_id |sess_id |
+----------+----------+
|1 |1 |
|2 |2 |
|1 |1 |
我需要接收:
+----------+---------+----------+
|res_id |sess_id | time |
+----------+---------+----------+
|1 |1 | 10 |
|2 |2 | 20 |
|1 |1 | 10 |
如何实现?左/内连接复制了我的res_id记录....
谢谢你,
1条答案
按热度按时间y1aodyip1#
左/内连接正在复制我的res_id记录....
也许你分享你的代码会有帮助?
这似乎做你需要的:
其输出:
这与上面所需的输出相同。