我使用的是spark和scala 2.4
我的salesperson数据框看起来是这样的:它总共有54salesperson,我只举了4列的例子
salesperson表的架构。
root
|-- col: struct (nullable = false)
| |-- salesperson_4: string (nullable = true)
| |-- salesperson_10: string (nullable = true)
| |-- salesperson_11: string (nullable = true)
| |-- salesperson_21: string (nullable = true)
销售人员表数据。
+--------------+--------------+--------------+--------------+
|salesperson_4 |salesperson_10|salesperson_11|salesperson_21|
+--------------+--------------+--------------+--------------+
| Customer_933 | Customer_1760| Customer_454 | Customer_127 |
|Customer_1297 |Customer_2411 |Customer_158 |Customer_2703 |
|Customer_861 |Customer_1550 |Customer_812 |Customer_2976 |
5条答案
按热度按时间ohfgkhjo1#
----+
j9per5c42#
----+
我的salestype数据框看起来像
salestype架构
salestype数据
我正在尝试检查salesperson表中的哪些客户在salestype表中可用。有两个
additional column, which shows customer belong to specific salesperson
以及salesplace表中的客户发生计数。基本上所有客户都来自salesperson表,它存在于salestype表中代码:
谢谢。。。。。。请分享你的建议
hfsqlsce3#
----+
k4ymrczo4#
----+
klr1opcd5#
它在spark 2.4.0+中工作,