pandas 如何从路径列中提取文件名[重复]

o7jaxewo  于 2023-04-19  发布在  其他
关注(0)|答案(1)|浏览(132)

此问题已在此处有答案

How to get the base file name from a column of paths(5个答案)
7天前关闭
我正在通过在数据框中添加一些列将.txt文件转换为labels.csv。如何从包含images/1/19997.jpg, images/1/19998.jpg images/1/19999.jpg/0的列中删除**images/0/**是文件夹名称,它随时间而变化

编码

import pandas as pd

# Read space-separated columns without header
data = pd.read_csv('/media/cvpr/CM_24/synthtiger/results/gt.txt', sep="\s+", header=None)

# Update columns
data.columns = ['filename', 'words']

# Save to required format
data.to_csv('labels.csv')
mgdq6dx1

mgdq6dx11#

可能有更有效的方法使用切片(假设文件名有固定的属性)。但是你可以使用os.path.basename。它会自动从路径中检索有效的文件名。

data['filename_clean'] = data['filename'].apply(os.path.basename)

相关问题