import re
from selenium import webdriver
driver = webdriver.Chrome()
driver.get("url_goes_here")
p_id = driver.find_elements_by_tag_name("script")
for script in p_id:
innerHTML=script.get_property('innerHTML')
task=re.search('var task = (.*);',innerHTML)
if task is not None:
print(task.group(1))
4条答案
按热度按时间kb5ga3dv1#
正则表达式模块
re
可以帮助您做到这一点:这样做的目的是浏览每个脚本的innerHTML,并从定义的搜索模式(
'var task = (.*);'
)中捕获匹配的字符串组((.*)
),如果找到匹配,则打印该组。drkbr07n2#
您可以通过
.text
或.getText()
访问tag
的值或html的任何element
mfpqipee3#
因为你使用的是
find_elements_by_tag_name
(),它返回元素列表。迭代该列表并检查元素。text包含task
,然后print text
该元素。ocebsuys4#
改用Xpath:
从 selenium 导入webdriver
驱动程序= Web驱动程序. Chrome()
获取("url_goes_here")
p_id =驱动程序. find_element(通过. XPATH,"ADDXPATH")
p_id.获取属性("外部HTML")