我有这个df
:
df = pd.DataFrame(
{'loss': [0.044, 0.044, 0.038, 0.037, 0.036],
'code': ["('ac',)", "('ac', 'be')", "('ab', 'ac', 'be')",
"('ab', 'ac', 'be', 'fi')", "('ab', 'ac', 'be', 'de', 'fi')"]}
)
df
loss code
0 0.044 ('ac',)
1 0.044 ('ac', 'be')
2 0.038 ('ab', 'ac', 'be')
3 0.037 ('ab', 'ac', 'be', 'fi')
4 0.036 ('ab', 'ac', 'be', 'de', 'fi')
现在我想添加一个新列added-code
,新值引入code
列。
预期成果:
loss code added-code
0 0.044 ('ac',) ac
1 0.044 ('ac', 'be') be
2 0.038 ('ab', 'ac', 'be') ab
3 0.037 ('ab', 'ac', 'be', 'fi') fi
4 0.036 ('ab', 'ac', 'be', 'de', 'fi') de
1条答案
按热度按时间8hhllhi21#
假设每行有一个新值,你可以转换成元组
explode
和drop_duplicates
:输出:
另一种方法,如注解中所建议的,使用
set
操作:输出: