此问题已在此处有答案:
Count number of words per row(6个回答)
4年前关闭。
假设我们有一个简单的数据框架
df = pd.DataFrame([
'one apple',
'banana',
'box of oranges',
'pile of fruits outside',
'one banana',
'fruits'])
df.columns = ['fruits']
如何计算关键字的字数,类似于:
此问题已在此处有答案:
Count number of words per row(6个回答)
4年前关闭。
假设我们有一个简单的数据框架
df = pd.DataFrame([
'one apple',
'banana',
'box of oranges',
'pile of fruits outside',
'one banana',
'fruits'])
df.columns = ['fruits']
如何计算关键字的字数,类似于:
2条答案
按热度按时间8zzbczxx1#
IIUC,然后您可以执行以下操作:
这里我们使用向量化的
str.split
在空间上进行分割,然后使用apply
len
来获得元素数量的计数,然后我们可以调用value_counts
来聚合频率计数。然后我们重命名索引并对其进行排序以获得所需的输出
更新
这也可以使用
str.len
而不是apply
来完成,apply
应该可以更好地扩展:时间
对于6K df:
vatpfxk52#
您可以使用
str.count
和空格' '
作为分隔符。时间
str.count
稍微快一点小
中
大号