Scrapy - xpath查询返回< li>list，但仅第一个元素重复

yftpprvb 于 2023-08-05 发布在其他

关注(0)|答案(1)|浏览(175)

我尝试使用以下命令获取ul标记中的所有li/a元素：

def parse(self, response):
    newItem = Item()
    list = response.xpath('//ul[@id="ad-list"]/li//a[@data-ds-component="DS-Link"]')

字符串
当我循环遍历列表时，只有我抓取的每个页面的第一个元素在列表中重复：

for item in list: 
        print(type(offer))
        newItem["product_id"] = item.xpath('//@data-lurker_list_id').get()
        newItem["url"] = item.xpath('//@href').get()
        newItem["title"] = item.xpath('//@title').get()

型
我已经检查过了，我在ul中得到了正确的li数作为列表变量中的响应，但是只出现了第一个li项。
为了在响应后验证它，我尝试打印以下内容：

print("INFO:")
    print(len(offerList))
    print(list(map(lambda x: x.xpath('//@data-lurker_list_id').get(), offerList)))

型
我得到这个输出：

INFO:
50
['1204352301', '1204352301', '1204352301', '1204352301', '1204352301', '1204352301', '1204352301', '1204352301', '1204352301', '1204352301', '1204352301', '1204352301', '1204352301', '1204352301', '1204352301', '1204352301', '1204352301', '1204352301', '1204352301', '1204352301', '1204352301', '1204352301', '1204352301', '1204352301', '1204352301', '1204352301', '1204352301', '1204352301', '1204352301', '1204352301', '1204352301', '1204352301', '1204352301', '1204352301', '1204352301', '1204352301', '1204352301', '1204352301', '1204352301', '1204352301', '1204352301', '1204352301', '1204352301', '1204352301', '1204352301', '1204352301', '1204352301', '1204352301', '1204352301', '1204352301']

型
你知道我错过了什么吗？

scrapy

来源：https://stackoverflow.com/questions/76699737/scrapy-xpath-query-returns-li-list-but-only-with-first-element-repeated

1条答案

按热度按时间

qf9go6mv1#

我刚发现问题。基本上应该只得到ul，得到我想要的li列表。

list = response.xpath('//ul[@id="ad-list"]')

字符串

赞(0）回复(0）举报 2023-08-05

我来回答

Scrapy - xpath查询返回< li>list，但仅第一个元素重复

1条答案

相关问题

热门标签

最新问答