仅检索Scrapy中的XML标记名

fnatzsnv 于 2022-11-23 发布在其他

关注(0)|答案(1)|浏览(135)

短篇小说

如何在Scrapy中使用.xpath（）只检索标记名称？

长时间

我目前正在使用一个Scrapy.Spider，并在parse()函数中使用response.selector.remove_namespaces()来保持简单。
我试着做这样的事情，但与Scrapy：
Iterate on XML tags and get elements' xpath in Python
然而，我似乎不知道如何只检索标签的名称。.xpath()命令是什么，只获取标签名称？

scrapy

来源：https://stackoverflow.com/questions/73930695/retrieving-only-xml-tag-names-in-scrapy

1条答案

按热度按时间

pgky5nke1#

至少据我所知，没有一种内置的方法可以从scrapy.selector类中只提取标记名。
也就是说，您可以使用任何选择器的re方法，并使用正则表达式模式来提取标记名。
例如：

for selector in response.xpath("//*"):
    print(selector.re(r'<(\w+)\s'))

赞(0）回复(0）举报 2022-11-23

我来回答

仅检索Scrapy中的XML标记名

1条答案

相关问题

热门标签

最新问答