我正在尝试从一个带有scrapy和xpath的网站中提取属性:
response.xpath('//section[@id="attributes"]/div/table/tbody/tr/td/text()').extract()
这些属性以下列方式嵌套:
<section id="attributes">
<h5>Attributes</h5>
<div>
<table>
<tbody>
<tr>
<td>Attribute 1</td>
<td>Value 1</td>
</tr>
<tr>
<td>Attriburte 2</td>
<td>Value 2</td>
</tr>
与此相关的问题有两个:
1.获取td元素的内容(XPath命令将返回[])
1.一旦检索到td
,我需要以某种方式获得配对。例如:“属性1”=“值1”
我是新来的phyton和scrapy,任何帮助都是非常感谢。
2条答案
按热度按时间wswtfjt71#
首先,您应该尝试从XPath中删除
tbody
标记,因为它通常不在页面源代码中。您可以按如下方式更新代码:
您将获得属性-值对的列表:
或
去拿字典
eanckbw92#
请尝试: