当我有一个带有字符串的 Dataframe 并执行describe()时,我得到了一个非常好的 Dataframe ,如下所示,在此您可以看到每列中唯一值的数量并根据它进行排序:
describe()
然而,当我有一个带有整数或浮点数的 Dataframe ,并执行describe()时,我得到了一个带有传统统计信息的 Dataframe ,如下所示。没有unique列。有没有办法检索唯一的列?
unique
fcwjkofz1#
如前所述使用numbers_df.nunique()。这将为您提供一个每列具有唯一值的Series。如果您仍然希望使用describe()函数,可以将DataFrame转换为object,这与仅包含数字的DataFrame的处理方式不同:
numbers_df.nunique()
object
import numpy as np import pandas as pd df = pd.DataFrame({'a': range(10), 'b': [2]*10, 'c': np.random.randint(10)}) df.astype('object').describe()
它将为您提供:
a b c count 10 10 10 unique 10 1 7 top 0 2 3 freq 1 10 2
juzqafwq2#
是否有办法检索唯一列?是的。使用nunique。
>>> import pandas as pd >>> df = pd.DataFrame({"x": [5, 6, 6, 7]}) >>> df.x.nunique() 3
2条答案
按热度按时间fcwjkofz1#
如前所述使用
numbers_df.nunique()
。这将为您提供一个每列具有唯一值的Series。如果您仍然希望使用
describe()
函数,可以将DataFrame转换为object
,这与仅包含数字的DataFrame的处理方式不同:它将为您提供:
juzqafwq2#
是否有办法检索唯一列?
是的。
使用nunique。