我有一个类似于dataframe的 Dataframe
我试图从每条tweet中提取一个hashtags列表,并将其Map到DataFrame中一个名为“hashtags”的新列。然而,到目前为止,我尝试的代码只是返回tweet中hashtags之后的所有内容,而不是一个hashtags列表。
def extract_hashtags(df):
df['hashtags'] = [x if x.startswith('#') else 'NaN' for x in df.Tweets]
return df
1条答案
按热度按时间knsnq2tg1#
您可以使用're'模块查找以#开始的单词的所有示例,如下所示。