我有一个独特的数据框架有一个卖方名称列表。下面是样本。
DF_主卖方
| 卖家|
| --------------|
| 哈日|
| 奥姆|
| 猫|
| 垫|
| 约翰|
| 梅西|
| 约翰|
| 罗纳尔多|
| 香农|
| 凯蒂|
| 雷|
我有多个 Dataframe -
DF1
| 卖家|沃勒|日期|评级|
| --------------|--------------|--------------|--------------|
| 哈日|二|2002年1月|4.2|
| 奥姆|十二岁|2002年1月|3.4|
| 猫|0| 2002年1月|4.3|
| 垫|十四岁|2002年1月|4.3|
DF2
| 卖家|沃勒|日期|评级|
| --------------|--------------|--------------|--------------|
| 哈日|二百二十二|02年10月|四个|
| 奥姆|一百二十|02年10月|三|
| 猫|10个|02年10月|2.3|
| 垫|一百四十三|02年10月|二点五|
| 约翰|三十|02年10月|4.3|
DF3
| 卖家|沃勒|日期|评级|
| --------------|--------------|--------------|--------------|
| 雷|二十二|2002年2月|2.4|
| 杰伊|十二岁|2002年2月|二点五|
| 索汉|0| 2002年2月|2.2|
| 垫|一百四十四|2002年2月|五|
| 约翰|10个|2002年2月|3.4|
在DF_Master_seller中搜索每个 Dataframe ,为每个匹配项获取值并计算最后的总数。
最终DF
| 卖家|数值_2002年1月|数值_2002年2月|价值_2002年10月|
| --------------|--------------|--------------|--------------|
| 哈日|二||二百二十二|
| 奥姆|十二岁||一百二十|
| 猫|0||10个|
| 垫|十四岁|一百四十四|一百四十三|
| 约翰|||三十|
| 梅西||||
| 约翰||10个||
| 罗纳尔多||||
| 香农||||
| 凯蒂||||
| 雷||二十二||
|合计|28|176| 515号|
注-列应按日期排序
2条答案
按热度按时间xam8gpfp1#
与@Corralien的方法相同,但使用
margins
和排序列:输出:
bvjveswy2#
您可以使用
pd.concat
合并df1
,df2
和df3
,然后按主 Dataframe 的Seller
列重新索引(dfM
):输出: