我试着从Facebook上抓取帖子和评论,我在用Beautifulsoup。
我得到了这个角色:
url = 'https://www.facebook.com/ameedcoffee'
response=requests.get(url)
soup = BeautifulSoup(response.text,'html.parser')
但是当我尝试捕捉任何div标签时,我得到len = 0,就好像这些div标签不存在一样
cards= soup.find_all('div','kvgmc6g5 cxmmr5t8 oygrvhab hcukyx3x c1et5uql ii04i59q')
len(cards)
我不熟悉 selenium ,这只是我的第二份工作刮。你能帮我了解我做错了什么吗?如果我使用 selenium ,如何开始的代码?
1条答案
按热度按时间wn9m85ua1#
Facebook使用了一个名为(ReactJS)的框架,它可以生成动态类名,如“xzx_sdsd-sds”,并且每次发布新版本时都会更改。
如果你想放弃的话,你可能不得不抓取廉价手机上的Facebook纯HTML版本。它曾经在https://m.facebook.com上提供,但情况可能已经改变了