尝试了解在python中循环非表格式数据的最佳方式(tr/td)
示例数据:https://www.nhlpa.com/the-pa/certified-agents?range=A-Z
尝试创建一个表的名称,头像URL,公司,地址,教育。
到目前为止,正在尝试执行以下操作,但似乎无法理解如何进入内容组件的div:
r=requests.get(url)
soup=BeautifulSoup(r.text, 'html5lib')
table = soup.find_all('div', attrs = {'class':'col-lg-6 agent'})
for a in table:
if a.find('div', attrs = {'headshot'}):
headshot_url=a.find('div', attrs = {'headshot'}).img```
1条答案
按热度按时间5sxhfpxr1#
希望这对〈3有帮助