我确实为亚马逊产品标题做了Scraping,但亚马逊验证码捕获了我的scraper。我试了10次- go run main.go(8次捕获了我- 2次我刮了产品标题)
我研究了这个问题,但我没有找到任何解决方案的golang(只有python)有没有任何解决方案给我?
package main
import (
"fmt"
"strings"0
"github.com/gocolly/colly"
)
func main() {
// Create a Collector specifically for Shopify
c := colly.NewCollector(
colly.AllowedDomains("www.amazon.com", "amazon.com"),
)
c.OnHTML("div", func(h *colly.HTMLElement) {
capctha := h.Text
title := h.ChildText("span#productTitle")
fmt.Println(strings.TrimSpace(title))
fmt.Println(strings.TrimSpace(capctha))
})
// Start the collector
c.Visit("https://www.amazon.com/Bluetooth-Over-Ear-Headphones-Foldable-Prolonged/dp/B07K5214NZ")
}
字符串
输出量:
请输入您在下面看到的字符抱歉,我们只需要确保您不是机器人。为了获得最佳效果,请确保您的浏览器接受cookie。
1条答案
按热度按时间9jyewag01#
如果你不介意一个不同的包,我写了一个包来搜索HTML(本质上是围绕
github.com/tdewolff/parse
的薄 Package ):字符串
测试结果:
型
https://github.com/89z/parse