scrapy Python临时值错误(f“< form>在{response}中未找到元素”)

6gpjuf90 于 2022-11-09 发布在 Python

关注(0)|答案(1)|浏览(129)

我想从所有页面中删除数据，但在删除第一页后，它显示错误
我写的代码如下：

import scrapy
from scrapy.http import FormRequest
from ..items import PracticeItem

class Practice(scrapy.Spider):
    name = 'quotes'
    start_urls = ['https://quotes.toscrape.com/login']
    def parse(self, response):
        token = response.css('form input::attr(value)').extract_first()
        return FormRequest.from_response(response, formdata={
            'csrf': token,
            'username': 'demo',
            'password': 'demo'
        }, callback=self.start_scraping)

    def start_scraping(self, response):
        items = PracticeItem()
        all_tags = response.css('div.quote')
        for x in all_tags:
            quote = x.css('span.text::text').extract()
            title = x.css('.author::text').extract()
            tag = x.css('.tag::text').extract()
            items["quote"] = quote
            items["title"] = title
            items["tag"] = tag
            yield items
        next_page = response.css('li.next a::attr(href)').get()
        if next_page is not None:
            yield response.follow(next_page, callback=self.parse)

然而我得到这个：

这是我爬第一页后得到的。

2022-04-06 00:04:21 [scrapy.core.engine] DEBUG: Crawled (200) <GET http://quotes.toscrape.com/page/2/> (referer: http://quotes.toscrape.com/)
2022-04-06 00:04:21 [scrapy.core.scraper] ERROR: Spider error processing <GET http://quotes.toscrape.com/page/2/> (referer: http://quotes.toscrape.com/)
Traceback (most recent call last):
  File "f:\bse\data science\python\pythonproject\venv\lib\site-packages\twisted\internet\defer.py", line 857, in _runCallbacks
    current.result = callback(  # type: ignore[misc]
  File "F:\BSE\Data Science\Python\pythonProject\practice\practice\spiders\pra.py", line 16, in parse
    return FormRequest.from_response(response, formdata={
  File "f:\bse\data science\python\pythonproject\venv\lib\site-packages\scrapy\http\request\form.py", line 64, in from_response
    form = _get_form(response, formname, formid, formnumber, formxpath)
  File "f:\bse\data science\python\pythonproject\venv\lib\site-packages\scrapy\http\request\form.py", line 104, in _get_form
    raise ValueError(f"No <form> element found in {response}")
ValueError: No <form> element found in <200 http://quotes.toscrape.com/page/2/>
2022-04-06 00:04:21 [scrapy.core.engine] INFO: Closing spider (finished)

scrapy

来源：https://stackoverflow.com/questions/71757336/python-scrapy-valueerrorfno-form-element-found-in-response

1条答案

按热度按时间

lmyy7pcs1#

在这一行：

yield response.follow(next_page, callback=self.parse)

您正在告诉Scrapy使用self.parse回调（登录到该站点）处理NEXT页面。但您需要使用self.start_scraping回调来处理它：

yield response.follow(next_page, callback=self.start_scraping)

我还认为，您需要在for循环中移动items = PracticeItem() ...

赞(0）回复(0）举报 2022-11-09

我来回答

scrapy Python临时值错误(f“< form>在{response}中未找到元素”)

然而我得到这个：

1条答案

相关问题

热门标签

最新问答