jsoup-无法获取特定网站

mwkjh3gx  于 2021-07-06  发布在  Java
关注(0)|答案(2)|浏览(964)

我正在最新的eclipseide中使用最新的jsoup(1.13.1),用于java开发人员(包括孵化组件)版本:2020-09(4.17.0)build id:20200910-1200。
我试图分析一个非常具体的网站,但没有成功。执行这些行之后:doc=jsoup.connect(“http://pokehb.pw/%d7%a2%d7%95%d7%a0%d7%94/21/%d7%a4%d7%a8%d7%a7/43“”。get();doc.select(“title”).foreach(system.out::println);
什么也没印出来。不仅仅是,页面的任何元素或属性都不可用。
是的,网址是奇怪的,但这是一个我需要的,我可以浏览它罚款在铬。我也知道这是由于现在的网站希伯来语,因为其他希伯来语网站的作品好。
例如,使用此url似乎很好:https://context.reverso.net/translation/hebrew-english/%d7%9c%d7%9b%d7%aa%d7%95%d7%91%d7%aa+url
有什么可以做的吗?

9jyewag0

9jyewag01#

我最后做的是使用以下命令:doc=jsoup.parse(driver.getpagesource());
它把页面的所有源代码都带到了文档中。在那里,它是getelementsbyclass和getelementsbytag的简单用法。
希望这有助于某人,并感谢罗伯试图回答。

hs1ihplo

hs1ihplo2#

我能告诉你的是,饼干里有一个“拉拉维尔会议”。这意味着您将需要比jsoup更强大的技术。试试看,它可能会起作用。

相关问题