**已关闭。**此问题需要debugging details。当前不接受答案。
编辑问题以包含desired behavior, a specific problem or error, and the shortest code necessary to reproduce the problem。这将有助于其他人回答问题。
2天前关闭。
Improve this question
我正在使用scrappy framework来抓取一个网站,但是我通过检查页面看到的html和scrappy代码实际读取的html是非常不同的。
请帮助我卡住了
我尝试并得到这些结果
1条答案
按热度按时间uyto3xhc1#
但是我通过检查页面看到的html和实际上由scrappy代码读取的html是非常不同的。
屏幕截图中的“elements”标签显示的是所谓的DOM,而不是源代码HTML。DOM是浏览器内部对页面的表示,经过解析和任何JavaScriopt代码的操作。
另一方面,Scrappy发出HTTP请求以从一个Web地址获取HTML响应,它不执行任何JavaScript。
因此,Scrappy看到的HTML不一定与您在“elements”选项卡中看到的DOM相同。
要查看原始HTML,请在浏览器窗口中右键单击该页面,然后选择查看页面源代码。您可以根据scrappy下载的HTML和元素选项卡检查这一点。您要在此页面源代码中查找的内容是吗?如果不是,您需要找到其他方法来获取它。