如何在Python中使用Selenium抓取动态内容?

sdnqo3pr  于 2022-12-18  发布在  Python
关注(0)|答案(1)|浏览(113)

我试着刮下一页:https://www.heo.co.uk/uk/en/product/FRYU40156
我知道这是一个动态的网站,所以使用经典的请求和美丽的汤组合可能不起作用。我尝试使用 selenium ,我确实得到了更多的信息,我似乎不能得到以下:image of the bit I'm trying to get
我试过使用By.TAG_NAME和'h1',但不起作用。
你知道我怎么拿到标题吗?
谢谢!

ncgqoxb0

ncgqoxb01#

如果您转到网络选项卡,您将获得以下API

https://www.heo.co.uk/api/article
使用API获取头值

  1. import requests
  2. payload={
  3. "articleNumber": "FRYU40156",
  4. "language": "en"
  5. }
  6. r=requests.post("https://www.heo.co.uk/api/article",data=payload).json()
  7. print(r['article']['localization']['deName'])

输出:

  1. Jujutsu Kaisen 0: The Movie Hikkake PVC Statue Satoru Gojo 10 cm
展开查看全部

相关问题