selenium 尝试刮facebook的帖子和评论与beautifulsoap

envsm3lx 于 2023-01-05 发布在其他

关注(0)|答案(1)|浏览(161)

我试着从Facebook上抓取帖子和评论，我在用Beautifulsoup。
我得到了这个角色：

url = 'https://www.facebook.com/ameedcoffee'
 response=requests.get(url)
 soup = BeautifulSoup(response.text,'html.parser')

但是当我尝试捕捉任何div标签时，我得到len = 0，就好像这些div标签不存在一样

cards= soup.find_all('div','kvgmc6g5 cxmmr5t8 oygrvhab hcukyx3x c1et5uql ii04i59q')
 len(cards)

我不熟悉 selenium ，这只是我的第二份工作刮。你能帮我了解我做错了什么吗？如果我使用 selenium ，如何开始的代码？

1条答案

Facebook使用了一个名为（ReactJS）的框架，它可以生成动态类名，如“xzx_sdsd-sds”，并且每次发布新版本时都会更改。
如果你想放弃的话，你可能不得不抓取廉价手机上的Facebook纯HTML版本。它曾经在https://m.facebook.com上提供，但情况可能已经改变了