我试图使用Python从这个网站中提取所有壁画链接:https://streetartcities.com/cities/losangeles/artworks。但我的代码不能正常工作,并给我一个空输出。我不知道网站是否包含JavaScript或其他编程语言。有谁能简单地解释一下这个问题并帮助我调试代码吗?谢谢你,谢谢
from requests_html import HTMLSession
import warnings
warnings.filterwarnings("ignore", category=DeprecationWarning) ## ignore the Deprecation warning message
s = HTMLSession()
def get_mural_links():
url = 'https://streetartcities.com/cities/losangeles/artworks'
links = []
r = s.get(url)
grid = r.html.find('div.p-5 div.grid.mt-4.grid-cols-2.md\:grid-cols-3.gap-3')
for item in grid:
links.append(item.find('a', first=True).attrs['href'])
return links
print(get_mural_links())
字符串
1条答案
按热度按时间pkbketx91#
您尝试查找的元素稍后会使用JavaScript延迟添加到站点。这就是说,你需要Selenium。Selenium以比
requests
更人性化的方式浏览页面。字符串
试试看:
型