在pandas中,可以在赋值过程中设置列的dtype吗?什么工作是改变它之后,例如。
df["file"] = file
df["file"] = df["file"].astype("category")
然而,我有一些大型的嵌套框架,其中这个file
列几乎不适合内存,但作为categorical
dtype更容易适合。如果我在赋值的时候就把它们声明为无条件的,那会很方便。我想象的是
df.add_column(name="file", data=file, dtype="category")
这可能吗?
2条答案
按热度按时间ukxgm1gy1#
假设
file
是一个可迭代对象,你可以传递一个Series:如果
file
是一个字符串:数据类型:
在
concat
之前使用分类如果你的目标是
concat
,那么你必须使用一个同构的CategoricalDtype
:输出量:
nzk0hqpo2#
可以直接使用
pd.Categorical
:输出量:
如何处理Categorical Data