selenium 尝试刮facebook的帖子和评论与beautifulsoap

envsm3lx  于 2023-01-05  发布在  其他
关注(0)|答案(1)|浏览(161)

我试着从Facebook上抓取帖子和评论,我在用Beautifulsoup。
我得到了这个角色:

url = 'https://www.facebook.com/ameedcoffee'
 response=requests.get(url)
 soup = BeautifulSoup(response.text,'html.parser')

但是当我尝试捕捉任何div标签时,我得到len = 0,就好像这些div标签不存在一样

cards= soup.find_all('div','kvgmc6g5 cxmmr5t8 oygrvhab hcukyx3x c1et5uql ii04i59q')
 len(cards)

我不熟悉 selenium ,这只是我的第二份工作刮。你能帮我了解我做错了什么吗?如果我使用 selenium ,如何开始的代码?

wn9m85ua

wn9m85ua1#

Facebook使用了一个名为(ReactJS)的框架,它可以生成动态类名,如“xzx_sdsd-sds”,并且每次发布新版本时都会更改。
如果你想放弃的话,你可能不得不抓取廉价手机上的Facebook纯HTML版本。它曾经在https://m.facebook.com上提供,但情况可能已经改变了

相关问题