我试着把这个文件读入panda。这个文件的值用空格隔开,但我试过的空格数不同:
pd.read_csv('file.csv', delimiter=' ')
但它不起作用
mbzjlibv1#
添加delim_whitespace=True参数,它比正则表达式快。
delim_whitespace=True
kpbpu0082#
您可以使用regex作为分隔符:
pd.read_csv("whitespace.csv", header=None, delimiter=r"\s+")
ybzsozfc3#
如果你不能使用接受的答案来进行文本解析(例如,如果你的文本文件包含非统一的行),那么值得尝试Python的csv库--这里有一个使用用户定义的Dialect的例子:
import csv csv.register_dialect('skip_space', skipinitialspace=True) with open(my_file, 'r') as f: reader=csv.reader(f , delimiter=' ', dialect='skip_space') for item in reader: print(item)
fcy6dtqo4#
Pandas读书_fwf为赢:
import pandas as pd df = pd.read_fwf(file_path)
4条答案
按热度按时间mbzjlibv1#
添加
delim_whitespace=True
参数,它比正则表达式快。kpbpu0082#
您可以使用regex作为分隔符:
ybzsozfc3#
如果你不能使用接受的答案来进行文本解析(例如,如果你的文本文件包含非统一的行),那么值得尝试Python的csv库--这里有一个使用用户定义的Dialect的例子:
fcy6dtqo4#
Pandas读书_fwf为赢: