我有以下Pandasdfs:
print(df)
text_description
ROME AND MILAN ARE AMAZING CITIES
NEW YORK AND LONDON REPRESENT GLOBAL FINANCE MARKETS
I LOVE MADRID
BANGKOK IS AN AMAZING CITY
VAL D'ISERE IS A MAGIC PLACE
...
print(df_1)
City_List
PARIS
MILAN
ROME
NEW YORK
LONDON
MADRID
V. D'ISERE
我想过滤掉df[“text_description”]中的文本,只保留df_1[“City_List”]中包含的城市名称,从而获得两个单独的列:
print(final_df)
text_description_0 text_description_1
ROME MILAN
NEW YORK LONDON
MADRID na
VAL D'ISERE na
...
如何创建“final_df”?
1条答案
按热度按时间6pp0gazn1#
你不会得到瓦尔D'ISERE,因为它并不存在于城市列表中。它有一个缩写,但程序无法识别它。你必须找到一种方法来解释缩写。下面的代码只处理在两列中找到的精确单词: