特别是,这是与网站amazon.com具体。我收到了一个503错误,为他们的域,但我可以成功地解析其他域。我在用电话
Document doc = Jsoup.connect(url).timeout(30000).get();
以连接到URL。
qltillow1#
您必须设置 * 用户代理 *:
Document doc = Jsoup.connect(url).timeout(30000).userAgent("Mozilla/17.0").get();
否则你会被挡住的。另请参阅:select(div [class = rslt prod])在不应该返回null时返回null
mpgws1up2#
你可以试试
val ret=Jsoup.connect(url) .userAgent("Mozilla/5.0 Chrome/26.0.1410.64 Safari/537.31") .timeout(2*1000) .followRedirects(true) .maxBodySize(1024*1024*3) //3Mb Max //.ignoreContentType(true) //for download xml, json, etc .get()
它可能会工作,可能www.example.com需要将followRedirects设置为true。amazon.com need followRedirects set to true.
2条答案
按热度按时间qltillow1#
您必须设置 * 用户代理 *:
否则你会被挡住的。
另请参阅:select(div [class = rslt prod])在不应该返回null时返回null
mpgws1up2#
你可以试试
它可能会工作,可能www.example.com需要将followRedirects设置为true。amazon.com need followRedirects set to true.