我需要检索文本的每一部分。这些部分是可以识别的,因为它们以单词“first”、“second”、“third”等开头。然后我需要在excel中的不同列中插入每个部分。例如,文本内容如下:
首先,等等。然后是布拉布拉。最后的废话。
第二个废话。然后是布拉布拉。最后的废话。
第三个废话。还有布拉布拉。第四个bla。
我知道这个代码是完全错误的,但这是我迄今为止尝试过的:
with open("adress","r", encoding="utf8") as f:
lines = f.readlines()
for i in lines:
words= i.split('\n\n')
print(words)
for i in words:
print(i,i=='First')
1条答案
按热度按时间k3fezbri1#
此代码将正确拆分文本:
以前按换行符拆分字符串时,不能按两个换行符拆分字符串。