pdf文件和javascript:如何检查pdf是本机文件还是扫描文件

9gm1akwq  于 2021-09-23  发布在  Java
关注(0)|答案(1)|浏览(533)

关闭。这个问题需要详细或明确。它目前不接受答案。
**想改进这个问题吗?**编辑这篇文章,添加细节并澄清问题。

4小时前关门了。
改进这个问题
我正在使用javascript/html/css开发一个前端应用程序。此应用程序允许用户上载pdf文件。我正在寻找一种方法,使用javascript来区分pdf文件是本机文件还是扫描文件。
原生pdf是“天生数字”文档的pdf,因为pdf是从文档的电子版本创建的,而不是从打印版本创建的。
相比之下,扫描的pdf是打印文档的pdf,例如,当您扫描打印日志中的页面,然后将此文件另存为pdf时。请仅提交本机PDF。
在本机pdf的情况下,我不想允许上传,而在另一种情况下,我想允许上传。我找到了这个javascript库:https://pdfjs.express/ 也许这就是我需要的,但我不知道从哪里开始。在stackoverflow中,我找到了一些关于它的信息,但对javascript代码一无所知。

ssm49v7z

ssm49v7z1#

“本机pdf”通常包含/font对象。
“扫描pdf”可能不会。
这应该适用于绝大多数情况:

fetch(url)
  .then(response => response.blob())
  .then(data => data.text())
  .then(data => {
    if (/\/Font/.test(data)) {
      console.log('Probably native');
    } else {
      console.log('Probably scanned');
    }
  })

相关问题