我正试图从这个网站只拉日期值http://www.nflweather.com/
我相信我有代码,但我需要清理的结果一点点
response.xpath('//div[@class="fw-bold text-wrap"]/text()').extract()
字符串
我的结果返回\n\t
'\n\t\t\t12/28/23 08:15 PM EST\n\t\t'
型
我期待只是得到一个很好的清洁日期和时间。我看到一些其他版本在这里做的脚本,我希望能够有它从Scrapy shell 完成。
我正试图从这个网站只拉日期值http://www.nflweather.com/
我相信我有代码,但我需要清理的结果一点点
response.xpath('//div[@class="fw-bold text-wrap"]/text()').extract()
字符串
我的结果返回\n\t
'\n\t\t\t12/28/23 08:15 PM EST\n\t\t'
型
我期待只是得到一个很好的清洁日期和时间。我看到一些其他版本在这里做的脚本,我希望能够有它从Scrapy shell 完成。
1条答案
按热度按时间3qpi33ja1#
你可以使用
Selector.re
方法将正则表达式应用于组中的每个匹配选择器。如果你只需要日期,那么你可以像(?:\d{2}/?){3}
一样使用正则表达式模式。例如使用scrappy shell:
字符串
编辑:
如果你也想保持时间,那么我简单地建议在选择器查询的结果上调用
strip()
:型