- 已关闭**。此问题需要details or clarity。当前不接受答案。
- 想要改进此问题?**添加详细信息并通过editing this post阐明问题。
19小时前关门了。
Improve this question
我有一个小的webapp,它使用nodejs和Pupeteer来抓取动态网页。webapp向节点服务发送请求,然后节点服务抓取内容并返回。
webapp -- http --> Nodejs + Pupeteer -- fetch -> html
| |
|<- - - response - - |
但是这个过程有点太长了!
那么有没有比Pupeteer更好的解决方案呢?
1条答案
按热度按时间sczxawaw1#
如果只想返回远程页面的“纯”HTML内容,可以在爬行器中使用node-fetch。
Puppeteer使用了无头Chrome,这使得它运行速度更慢,需要更多内存,但另一方面也使得它更容易使用cookie\脚本等。