那么,pandas.read_csv,dtype的默认参数是None。这是做什么的,它与dtype=str有什么不同?它是否推断列类型?
6qfn3psc1#
dtype=None意味着pandas会尝试从你的列值中 * 推断 * 数据类型。对于更大的帧,这可能会变得非常慢,所以如果你确定所有的数据都是字符串,或者你还不想把它转换成合适的dtype,请指定dtype=object。关于documentation for read_csv:dtype:类型名称或列的dict-> type,默认值为None数据或列的数据类型。例如{'a': np.float64, 'b': np.int32}使用str或object来保留而不是解释dtype。
dtype=None
dtype=object
read_csv
dtype
None
{'a': np.float64, 'b': np.int32}
str
object
p8h8hvxi2#
当dtype=None时,pandas会根据内容自动推断列的数据类型。例如,如果一列只包含数字,pandas可能会将其解释为整数或浮点型。另一方面,dtype=str显式地告诉pandas将所有列都视为字符串,而不管它们的内容如何。
dtype=str
2条答案
按热度按时间6qfn3psc1#
dtype=None
意味着pandas会尝试从你的列值中 * 推断 * 数据类型。对于更大的帧,这可能会变得非常慢,所以如果你确定所有的数据都是字符串,或者你还不想把它转换成合适的dtype,请指定dtype=object
。关于documentation for
read_csv
:dtype
:类型名称或列的dict-> type,默认值为None
数据或列的数据类型。例如
{'a': np.float64, 'b': np.int32}
使用str
或object
来保留而不是解释dtype
。p8h8hvxi2#
当
dtype=None
时,pandas会根据内容自动推断列的数据类型。例如,如果一列只包含数字,pandas可能会将其解释为整数或浮点型。另一方面,
dtype=str
显式地告诉pandas将所有列都视为字符串,而不管它们的内容如何。