我有两个不同的CSV文件。它们每个都有两列。文件中的第一列总是相同的。我需要一个python或R代码将这些CVS文件合并为一个,而不复制第一列。所以,最终,合并的CSV文件应该有11列。
我想这样做:
我有这些文件:
file1.CSV,包含两列A和B
包含A和C两列的file2.CSV
最终输出:
file3.CSV,包含三列A、B和C
我想这样做:
File 1: Input
A B
2007-1 100
2007-1 4
2007-1 30
2007-1 22
2007-1 13
2007-1 12
File 2: Input
A B
2007-1 33
2007-1 56
2007-1 34
2007-1 3
2007-1 55
2007-1 68
Desire output
A B C
2007-1 33 100
2007-1 56 4
2007-1 34 30
2007-1 3 22
2007-1 55 13
2007-1 68 12
3条答案
按热度按时间iibxawm41#
也许我在R中有解决方案,使用tidyverse和data.table包。
要使代码正常工作,您需要创建一个仅包含.csv文件的文件夹。
希望能有所帮助!
tez616oj2#
在R中,类似下面的代码可以工作。未经测试,因为没有数据。
在阅读数据到一个data.frames列表中后,使用发布的数据
Reduce/merge
将给予以下data. frames的笛卡尔积。创建于2023-03-29带有reprex v2.0.2
merge
的另一个选项是首先创建一个id
列,将行名称分配给它,然后通过两列连接数据,新创建的一列和"A"
列。创建于2023-03-29带有reprex v2.0.2
编辑
也许所需的合并操作实际上是按列绑定,删除第2个 Dataframe 的第一列,等等,以便不重复列
"A"
。创建于2023-03-29带有reprex v2.0.2
afdcj2ne3#
一个简单的方法来实现这一点将是追加所有csv文件,然后删除重复(假设列名相同,例如:时间戳),同时保持第一列。
”