我的表有几个有序的类别,并带有pandas的标签。我想知道哪些文件格式可用于从支持有序分类数据的pandas导出。例如,STATA表(.DTA)支持此数据类型。我知道我可以存储和整数,并存储一个额外的引用表,但将任何内容存储在一个文件中会使我的文件结构更清晰,更可靠。
nuypyhwy1#
我在这个链接中找到了解决方案:https://towardsdatascience.com/the-best-format-to-save-pandas-data-414dca023e0dHDF5、Feather、Parquet和STATA文件特别适合Feather。但是,Feather适合在项目内部使用。Parquet提供了与Feather几乎相同的性能,并且还允许部分地加载数据。
1条答案
按热度按时间nuypyhwy1#
我在这个链接中找到了解决方案:
https://towardsdatascience.com/the-best-format-to-save-pandas-data-414dca023e0d
HDF5、Feather、Parquet和STATA文件特别适合Feather。但是,Feather适合在项目内部使用。Parquet提供了与Feather几乎相同的性能,并且还允许部分地加载数据。