一个空df w特定的感兴趣列(col 1 -5)
dfw_columns = pd.DataFrame({
"col1": [],
"col2": [],
"col3": [],
"col4": [],
"col5": []
})
字符串
df w实际条目
df = pd.DataFrame({
"Name": ["abc", "abc", "abc", "def", "def", "ghi", "ghi"],
"colids": ["col1", "col33", np.nan, "col5", "col1", "col2", np.nan]
})
型
根据每个Name和Colid在df中的引用(1或0),将值放置在dfw_columns中。
所需输出(填充空dfw_columns后)
desireddf = pd.DataFrame({
"Name": ["abc", "def", "ghi"],
"col1": [1,1, 0],
"col2": [0,0, 1],
"col3": [0,0, 0],
"col4": [0,0, 0],
"col5": [0,1,0]
})
desireddf
型
2条答案
按热度按时间mbskvtky1#
IIUC,您可以
pd.crosstab
+.reindex
:字符串
图纸:
型
ruoxqz4g2#
使用
pivot
如下。字符串
结果如下(注意,df不包括col4)。
型