我想比较两个非常相似的 Dataframe ,一个从json文件加载并重新采样,第二个从csv文件加载,来自一些更复杂的用例。
这些是我们的第一个价值观 df1
:
page
logging_time
2021-07-04 18:14:47.000 748.0
2021-07-04 18:14:47.100 0.0
2021-07-04 18:14:47.200 0.0
2021-07-04 18:14:47.300 3.0
2021-07-04 18:14:47.400 4.0
[5 rows x 1 columns]
这些是第二个值 df2
:
@timestamp per 100 milliseconds Sum of page
0 2021-04-07 18:14:47.000 748.0
1 2021-04-07 18:14:47.100 0.0
2 2021-04-07 18:14:47.200 0.0
3 2021-04-07 18:14:47.300 3.0
4 2021-04-07 18:14:47.400 4.0
[5 rows x 2 columns]
我在拿它们和 pandas.testing.assert_frame_equal
,尝试对数据进行一些自定义以使其相等,希望获得相关帮助。应删除第一列,并忽略标签名称。
我想以最自然的方式做这件事,而不是只比较价值观。
任何帮助都将不胜感激
2条答案
按热度按时间t3psigkw1#
你可以使用
equals
函数来比较 Dataframe 。问题是列名必须匹配:输出:
True
zpgglvta2#
我使用的 Dataframe :
解决方案: