我在webscraping新,我想从谷歌页面上只得到一个文本(基本上是足球比赛的日期),但汤没有得到所有的html(IM gessing beacause of request),所以我找不到它,我知道它可以beacause谷歌使用javascript,我应该使用 selenium chromedriver,但问题是,我需要的代码是在另一台计算机上使用,所以它不能真正使用它。
下面是代码:
import pandas as pd
from bs4 import BeautifulSoup
import requests
a = "Newcastle"
url ="https://www.google.com/search?q=" + a + "+next+match"
response = requests.get(url)
soup = BeautifulSoup(response.text,"html.parser")
print(soup)
for a in soup.findAll('div') :
print(soup.get_text())
我想找的是
"<span class="imso_mh__lr-dt-ds">17/12, 13:30</span>"
它具有
"//*[@id="sports-app"]/div/div[3]/div[1]/div/div/div/div/div[1]/div/div[1]/div/span[2]"
作为xpath
这可能吗?
1条答案
按热度按时间jdzmm42g1#
从Google请求页面时尝试设置
User-Agent
标题:印刷品: