我的.csv文件看起来像这样:
"col1","col2"
"1","text1"
"2","This a "TEXT". However, I cannot parse it."
字符串
也就是说,它在一个值中包含逗号和引号。在read_csv()
函数中使用sep
参数会在每行的开头和结尾处加上引号:
import pandas as pd
df = pd.read_csv('test.csv', sep = '","', engine = 'python')
df
"col1 col2"
0 "1 text1"
1 "2 This a "TEXT". However, I cannot parse it."
型
如何正确读取我的文件?
2条答案
按热度按时间zzoitvuj1#
基于你有趣的想法,你也可以添加第一个和最后一个引号作为分隔符,然后删除不需要的列:
字符串
输出量:
型
优点是你可以直接得到正确的类型(如果需要的话):
型
regex demo
iszxjhcz2#
问题是CSV中的逗号或引号都没有转义。使用
","
作为delimeter是一种聪明的方法,但它在开始和结束处留下了引号。字符串
这里有另一种方法,如果不是查找
","
,而是对引号进行了前瞻和前瞻:型