我有一个数据框,其中有一列字符串,我想使用'category'进行优化。我显然做错了什么,因为我认为内存使用量远远低于使用category而不是string。
In [28]: df1.memory_usage()
Out[28]:
Index 15218784
DATE_CALCUL 15218784
ABN_CONTRAT 15218784
MONTANT_HT 15218784
dtype: int64
In [29]: df1['ABN_CONTRAT'].astype('category').memory_usage()
Out[29]: 28190544
你知道为什么吗?
1条答案
按热度按时间njthzxwz1#
感谢AKX的评论,我回答了这个问题。使用分类确实可以保存内存使用: