下面是我的 Dataframe 示例:
df = pd.DataFrame([['Arsenal FC', '', ''],
['In', 'Age', 'Nat.'],
['Leandro Trossard', 28, 'Belgium'],
['Jakub Kiwior', 22, 'Poland'],
['Jorginho', 32, 'Italy'],
['Chelsea FC', '', ''],
['In', 'Age', 'Nat.'],
['Enzo Fernández ', 22, 'Argentina'],
['Mykhaylo Mudryk', 22, 'Ukraine'],
], columns=['Player', 'Age', 'Nat.'])
我想创建一个新的列"Club"
,它接受"Player"
中单元格的字符串值,并将其附加到下面的播放器。
棘手的部分是将正确的clubs
分配给正确的players
这是我想要的输出:
df = pd.DataFrame([['In', 'Age', 'Nat.'],
['Leandro Trossard', 28, 'Belgium', 'Arsenal FC'],
['Jakub Kiwior', 22, 'Poland', 'Arsenal FC'],
['Jorginho', 32, 'Italy', 'Arsenal FC'],
['In', 'Age', 'Nat.'],
['Enzo Fernández ', 22, 'Argentina', 'Chelsea FC'],
['Mykhaylo Mudryk', 22, 'Ukraine', 'Chelsea FC'],
], columns=['Player', 'Age', 'Nat.', 'Club'])
我找不到与这个问题相关的其他问题了。这在python中可能吗?
2条答案
按热度按时间atmip9wb1#
一个选项是将布尔掩码用于
mask
和ffill
:输出:
中间体:
保留In/Age/Nat行
输出:
vdzxcuhz2#
编辑:
输出:
编辑2:多个俱乐部名称