当找不到标记或无法提取内容时,如何重新加载页面?

ifmq2ha2  于 2021-08-25  发布在  Java
关注(0)|答案(1)|浏览(389)

我想修改下面的代码,以便在类“xy”或“href”不可用时刷新相应的url。代码是webcrawler的一部分,有时会遇到验证码或错误。目前,我的代码只是跳转到下一页,但如果第一次尝试时无法显示,我需要首先刷新页面。

url_pull = url.find('a',class_ = 'xy')
                partial_url = url_pull.get('href')
                pageURL = 'http://xxx'+partial_url
                Url_list.append(pageURL)
amrnrhlw

amrnrhlw1#

你可以使用 While True 状况,以及 break 如果你发现了结果。
比如说:

while True:
    url_pull = url.find('a', class_='xy')
    partial_url = url_pull.get('href')
    if url_pull or partial_url is not None:
        break
    sleep(5)

相关问题