我有两个DataFrames,两个都有相同的列,但一个是历史数据,另一个是“新”数据。新数据有时可能包含历史数据中已经存在的信息。所以我想说,如果新数据中的'comment_id'的值已经存在于历史数据中,没有什么。否则,将该行添加到历史数据中。
我试着这么做:
historic_comments = [x for x in filtered_comments if filtered_comments['comment_id'] not in historic_comments['comment_id']]
但出现错误:
TypeError:不可哈希的类型:'系列'
2条答案
按热度按时间okxuctiv1#
使用布尔掩码和
isin
:输出:
wb1gzix02#
我认为这就是你可以做的假设
historic_df
是旧的df和new_df
是新的df