我有一个文本数据集,看起来像这样。
import pandas as pd
df = pd.DataFrame({'Sentence': ['Hello World',
'The quick brown fox jumps over the lazy dog.',
'Just some text to make third sentence!'
],
'label': ['greetings',
'dog,fox',
'some_class,someother_class'
]})
我想把这些数据转换成这样的东西。
对于多标签分类,是否有一种Python方法来进行这种转换?
1条答案
按热度按时间fgw7neuy1#
可以使用
pandas.Series.explode
分解label
列,然后使用pandas.crosstab
将其与sentences
列交叉。试试看:
#输出: