我有4个不同的csv文件。
csv1:
ID Fruit
1001 Apple
1002 Banana
1003 Kiwi
csv2:
ID Color
1001 Green
1005 Red
1006 Orange
1007 Yellow
csv3:
ID Size
1001 Large
1008 Small
1009 Medium
1010 Large
csv4:
ID Price
1002 20
1009 40
1010 30
1011 50
这是一个我想创建的主csv文件:
Number ID Fruit Color Size Price
1 1001 Apple Green Large
2 1002 Banana 20
3 1003 Kiwi
4 1005 Red
5 1006 Orange
6 1007 Yellow
7 1008 Small
8 1009 Medium 40
9 1010 Large 30
10 1011 50
我想用*pandas*会更容易,但我不知道Python。
由于每个csv文件都有不同的列,我如何选择列并将它们粘贴到主csv文件中?如果没有信息,我想使其为NULL或N/A值。
你可以看到每个csv文件和主文件:Click here for image
我已经花了6个小时,但我不知道该怎么做。
先谢谢你。
4条答案
按热度按时间mklgxw1f1#
reduce
+combine_first
关键是将
'ID'
设置为索引,这样我们就可以在两个轴上获得正确的对齐。我假设所有的DataFrame都在内存中,但是如果没有,您可以将它们读入一个列表,或者在reduce
步骤中进行阅读。1u4esq0p2#
类似这样的东西应该可以工作:
axzmvihb3#
您可以使用merge:
lhcgjxsq4#