如何使用beautiful soup找到< img src>嵌套在< div>中?

dgtucam1  于 2021-07-13  发布在  Java
关注(0)|答案(1)|浏览(312)

新的Python和美丽的汤。我正在收集 src 一个 img 插入电子商务网站上可折叠的部分。包含图像的可折叠部分具有 accordion__contents ,但是 <img> 插入到可折叠部分没有特定的 class . 不是每一页都包含一个图像;有些包含多个。
我正试图提取 srcimg 随机嵌套在 <div> . 在下面的html示例中,我希望的输出是: <[https://example.com/image1.png]> ```

ie3xauqp

ie3xauqp1#

您可以使用css选择器 ".accordion__contents img" :

import requests
from bs4 import BeautifulSoup

url = "https://gtfoitsvegan.com/product/hony-mustard-dressing-by-daiya/?v=7516fd43adaa"
soup = BeautifulSoup(requests.get(url).content, "html.parser")

all_imgs = [img["src"] for img in soup.select(".accordion__contents img")]
print(all_imgs)

印刷品:

['https://gtfoitsvegan.com/wp-content/uploads/2021/04/Daiya-Honey-Mustard-Nutrition-Facts-162x300.png']

相关问题