python-3.x 为什么Beautiful Soup返回NONE而不是div数据?

4szc88ey  于 2023-10-21  发布在  Python
关注(0)|答案(1)|浏览(127)
response = requests.get(url="https://www.cbf.com.br/futebol-brasileiro/jogosdehoje/index")

soup = BeautifulSoup(response.text, 'html.parser')

data = soup.find('div', 'class="col-md-12"')

print(data)

当使用find_all时也是如此,当使用extract时,它只显示所有的html而不仅仅是div

4dbbbstv

4dbbbstv1#

您需要为请求给予一个标题,如下所示:

import requests
from bs4 import BeautifulSoup as bs

pd.set_option('display.max_columns', None)
pd.set_option('display.max_colwidth', None)

headers = {
'User-Agent': 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/104.0.5112.79 Safari/537.36'
}

r = requests.get(url="https://www.cbf.com.br/futebol-brasileiro/jogosdehoje/index", headers=headers)
soup = bs(r.text, 'html.parser')
data = soup.select_one('div[class="col-md-12"]')
print(data.get_text(strip=True, separator=' '))

终端结果:

Copa do Brasil de Futebol Sub-20 2023 Seg, 09/10/2023 17:30
            - GRUPO 30 |  Jogo: 44 CRU Cruzeiro Saf - MG 17:30 FLU Fluminense - RJ Arena do Jacaré - Sete Lagoas - MG Detalhes do jogo Campeonato Brasileiro de Futebol - Série B 2023 Seg, 09/10/2023 20:00
            -  Jogo: 306 SPO Sport - PE 20:00 PON Ponte Preta - SP Ilha do Retiro - Recife - PE Detalhes do jogo

请求的相关文档可以在hereBeautifulSoup中找到。

相关问题