“/D/data_DataAnalysis/Progrm/datset1/set2/genus/Huttenhower_LC8_genus_Righted.tsv”“/c/bioinfoTools/data/mock/test/truth/file_sets/genus/Huttenhower_LC8_TRUTH.txt”
我想“Huttenhower_LC8”从两个文件名使用R。
Python代码的Similer
fileName_temp = a_file.split("/")[-1]
filename = a_file.split("/")[-1][:-9]
for another_file in all_slim_files:
a_filename = another_file.split("/")[-1][:-18]
字符串
1条答案
按热度按时间0g0grzrc1#
我认为你可能已经解决了这个问题,因为它已经超过6年了,但我正在考虑提供解决方案。
解决方案
我们需要编写一个正则表达式来捕获这种模式,它看起来像“(Huttenhower_LC8).”,其中. 匹配任何字符(除了换行符)0次或更多次,然后使用sub或gsub来应用这种模式并提取所需的部分。
file_paths <- c(“/D/data_DataAnalysis/Progrm/datset1/set2/genus/Huttenhower_LC8_genus_TRUTH.tsv”,“/c/bioinfoTools/data/mock/test/truth/file_sets/genus/Huttenhower_LC8_TRUTH.txt”)
extracted_parts <- sub(“.*(Huttenhower_LC8).*",“\1”,basket(file_paths))print(extracted_parts)