该代码将遍历一组名为0001.html
、0002.html
等的HTML文件。该代码将打开文件并进行废弃,但如果该文件不存在,则我想声明,如果文件示例0010.html不存在,则跳过它,因此该语句将位于with open()
之后。
c = 1
while c <= n:
path1=os.path.join(path,"Chapter " + str(c))
os.mkdir(path1)
if c<10:
z='0000'+str(c)
elif c>=10:
z='000'+str(c)
elif c>=1000:
z='00'+str(c)
print(z)
with open(z + '.html','r') as fp:
contents =fp.read()
soup= BeautifulSoup(contents,'lxml')
title = soup.find('h1')
link = soup.find_all('p')
chapter=path1+"\\chapter"+str(c)+ ".txt"
with open(chapter,'w') as f:
# add statement here
我能像那样尝试和例外地做吗
try:
the scrape code
exception:
continue:
1条答案
按热度按时间6pp0gazn1#
你完全正确。你只需要用一个tryexcept代码块来 Package 你的打开文件代码块。类似于:-