java JSOUP在Eclipse中抛出url状态503,但URL在浏览器中工作正常

cld4siwp  于 2023-02-28  发布在  Java
关注(0)|答案(2)|浏览(123)

特别是,这是与网站amazon.com具体。我收到了一个503错误,为他们的域,但我可以成功地解析其他域。
我在用电话

Document doc = Jsoup.connect(url).timeout(30000).get();

以连接到URL。

qltillow

qltillow1#

您必须设置 * 用户代理 *:

Document doc = Jsoup.connect(url).timeout(30000).userAgent("Mozilla/17.0").get();
  • (或其他;最好选择浏览器用户代理)*

否则你会被挡住的。
另请参阅:select(div [class = rslt prod])在不应该返回null时返回null

mpgws1up

mpgws1up2#

你可以试试

val ret=Jsoup.connect(url)
  .userAgent("Mozilla/5.0 Chrome/26.0.1410.64 Safari/537.31")
  .timeout(2*1000)
  .followRedirects(true)
  .maxBodySize(1024*1024*3)    //3Mb Max
  //.ignoreContentType(true) //for download xml, json, etc
  .get()

它可能会工作,可能www.example.com需要将followRedirects设置为true。amazon.com need followRedirects set to true.

相关问题