我想检查一个特定页面上pdf文件的上次修改时间。pdf链接是http://www.nfib.com/portals/0/pdf/sbet/sbet201402.pdf
我试着这样做:
Connection.Response rs2 = Jsoup.connect("http://www.nfib.com/Portals/0/PDF/sbet/sbet201402.pdf").execute();
System.out.println("Header = " + rs2.header("Last-Modified"));
我得到这个错误
UnsupportedMimeTypeException
1条答案
按热度按时间rseugnpd1#
如果不一定要用jsoup完成,那么可以使用标准url和urlconnection类,比如
您需要记住,jsoup是为解析html/xml而设计的,因此默认情况下它需要
text/*, application/xml, or application/xhtml+xml
不是application/pdf
.如果你看一下处理它的代码
但是
!req.ignoreContentType()
测试提示我们可以转换需求或纯xml/html类型的输入。为此,您可以添加连接设置,比如
您应该能够读取返回的标题
输出: