我想从辅助Dataframe中删除主Dataframe中的字。
这是主数据框:
+----------+--------------------+
| event_dt| cust_text|
+----------+--------------------+
|2020-09-02|hi fine i want to go|
|2020-09-02|i need a line hold |
|2020-09-02|i have the 60 packs|
|2020-09-02|hello want you teach|
下面是单列辅助Dataframe。次数据框中的字需要从列中的主数据框中删除 cust_text
无论词语出现在哪里。例如, 'want'
将从显示在主Dataframe中的每一行中删除(在本例中,将从第1行和第4行中删除)。
+-------+
|column1|
+-------+
| want|
|because|
| need|
| hello|
| a|
| have|
| go|
+-------+
这个 event_dt
列将保持原样,每行将保持原样,只有辅助Dataframe字将从结果Dataframe的主Dataframe中删除,如下所示
+----------+--------------------+
| event_dt| cust_text|
+----------+--------------------+
|2020-09-02|hi fine i to |
|2020-09-02|i line hold |
|2020-09-02|i the 60 packs |
|2020-09-02|you teach |
+----------+--------------------+
感谢您的帮助!!
1条答案
按热度按时间41zrol4v1#
这应该是你使用的工作解决方案
array_except()
为了消除不需要的字符串,但是为了做到这一点,我们需要做一些准备。在此处创建Dataframe
将列设为数组以备将来使用
输出
现在,只需按lookup dataframe分组,并获取变量中的所有lookup值,如下所示
这就成功了