使用python和bs4进行刮取后的数据不同

dxxyhpgq  于 2022-12-01  发布在  Python
关注(0)|答案(1)|浏览(180)

我试着得到亚马逊上的评论数量。但是,当我把数据和网站上的不一样。(131是在刮擦后和655从亚马逊)我附上页面截图和刮擦后的一个。
131 reviews
655 reviews
From inspect element

import bs4
import requests
import time

url3 = "https://www.amazon.it/dp/B076S8NSCD"

headers = {"User-Agent" : 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_6) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/13.0.5 Safari/605.1.15'}

res = requests.get(url3, headers = headers)

soup = bs4.BeautifulSoup(res.text, "html.parser")

reviews = soup.find(id = "acrCustomerReviewText").get_text()
print(reviews)
kx7yvsdv

kx7yvsdv1#

如果你没有使用高级rotating residential proxies来抓取亚马逊评论,那么很有可能这是一种伪装措施,你的IP被标记为发送了太多的请求。

相关问题