我在使用URL。我有一个URL列表,我正在从一个抓取活动。但是,我需要选择一个包含“决策者”的网址。
编码:
src = driver.page_source
# Now using beautiful soup
soup = BeautifulSoup(src, 'lxml')
for a in soup.find_all('a', href=True):
print(a['href'])
字符串
代码的输出:
https://www.linkedin.com/mynetwork/?
https://www.linkedin.com/jobs/?decidion-makers
https://www.linkedin.com/messaging/?
https://www.linkedin.com/notifications/?
/company/infosys/
型
预期的输出:
https://www.linkedin.com/jobs/?decidion-makers
型
请帮帮忙
谢啦,谢啦
2条答案
按热度按时间yi0zb3m41#
字符串
ojsjcaue2#
如果需要,可以使用pandas和regex模块:
字符串
输出量:
型