javascript Python Selenium -如何获取页面上的所有url,而这些url只在点击div后加载链接?

siotufzp  于 2022-11-20  发布在  Java
关注(0)|答案(1)|浏览(125)

我尝试使用Selenium从这个页面https://www.zapimoveis.com.br/aluguel/apartamentos/sp+sao-paulo+zona-sul+itaim-bibi/中删除结果,但是我在获取每个结果的url时遇到了麻烦。可以肯定地说,每个卡片的url都没有存储在<a>元素中,显然也没有存储在每个div的内部html的任何位置。
获取地址的唯一方法是单击div,这会打开一个新的选项卡。目前,我使用selenium来单击每个div,复制地址,然后关闭选项卡,但这不仅是一个更复杂和耗时的过程,而且可能会通过向网站发出这么多请求来触发一些验证码。
有没有办法在没有点击的情况下获得这个页面上所有报价的网址?我试着在chrome上使用inspect工具,但无法找出这个行为的js或wtv resposible是什么。
谢谢你!

wh6knrhe

wh6knrhe1#

我检查了网站,看起来每个卡片容器都有一个数据ID,可以用来访问列表。

<div data-id="2593637292" class="card-container js-listing-card">{THE HTML FOR THAT CARD}</div>

应该是https://www.zapimoveis.com.br/imovel/2593637292

相关问题