我有两个.tsv文件,第一个文件比另一个文件长很多。第二个文件作为与第一个文件中的标记相关联的值的索引。我如何将第二个文件中的信息填充到第一个文件中?我想我可以使用grep或awk,但我很难理解,因为我是一个初学者。任何帮助都是非常感谢的!
文件1
item_1
item_1
item_2
item_3
item_4
item_4
文件2
item_1 12 1002839 1231232
item_2 13 1006323 1621313
item_3 11 1052636 1931233
item_4 9 1024249 1631315
期望结果
item_1 12 1002839 1231232
item_1 12 1002839 1231232
item_2 13 1006323 1621313
item_3 11 1052636 1931233
item_4 9 1024249 1631315
item_4 9 1024249 1631315
3条答案
按热度按时间hxzsmxv21#
join
实用程序对指定的文件执行 * 相等联接 *,并将结果写入标准输出。kb5ga3dv2#
基于
awk
的解决方案,file-2
在整个产品线范围内执行重复数据消除|
它的行为有点类似于
SQL
x 1 m3n1x语句INNER JOIN
s,但不必完全相同::--返回
non-de-duped file1
与deduped-file2
的笛卡尔积("DD2"
),在两者的$1
上连接,即使$1
在DD2
中不是唯一的4ktjp1zp3#