我有一组计算机生成的通知保存在一个文本文件中-它看起来像这样:
- 我的公司有限责任公司:报表# 123456**,$10000.99,**2023年2月(FEB)
- 我的公司有限责任公司:报表# 123457为$100.01的月份2022 09(SEP)
- 我的公司有限责任公司:报表# 123458-$51.00为2022年10月(OCT)
- 理想输出-作为DataFrame*
声明 | 金额 | 月 |
---|---|---|
一二三四五六 | 10000.99 | 2023年02月(FEB) |
一二三四五七 | 一百零一 | 2022年9月 |
一二三四五八 | -51 | 2022年10月(10月) |
我知道我可以在Python之外将其转换为CSV,然后用pandas导入。
但是,我可以将文本文件按原样加载到Python中,并将其转换为DataFrame吗?
一个“提示”--在本例中,for可以用作列分隔符。它可以可靠地将每行拆分为我想要的字段。这有点运气。
3条答案
按热度按时间ff29svar1#
您期望的 Dataframe 格式 * 不清楚 *,但这里有一个
extract
选项:输出:
vktxenjb2#
输入文件:
使用
readlines()
读入文本文件,并将生成的行列表加载到 Dataframe 中:输出:
如果需要从 Dataframe 中删除
for
字符串:输出:
qnakjoqk3#
' for '
* 作为 * 分隔符。str.replace()
删除无关项。