pdf文件和javascript:如何检查pdf是本机文件还是扫描文件

9gm1akwq  于 2021-09-23  发布在  Java
关注(0)|答案(1)|浏览(613)

关闭。这个问题需要详细或明确。它目前不接受答案。
**想改进这个问题吗?**编辑这篇文章,添加细节并澄清问题。

4小时前关门了。
改进这个问题
我正在使用javascript/html/css开发一个前端应用程序。此应用程序允许用户上载pdf文件。我正在寻找一种方法,使用javascript来区分pdf文件是本机文件还是扫描文件。
原生pdf是“天生数字”文档的pdf,因为pdf是从文档的电子版本创建的,而不是从打印版本创建的。
相比之下,扫描的pdf是打印文档的pdf,例如,当您扫描打印日志中的页面,然后将此文件另存为pdf时。请仅提交本机PDF。
在本机pdf的情况下,我不想允许上传,而在另一种情况下,我想允许上传。我找到了这个javascript库:https://pdfjs.express/ 也许这就是我需要的,但我不知道从哪里开始。在stackoverflow中,我找到了一些关于它的信息,但对javascript代码一无所知。

ssm49v7z

ssm49v7z1#

“本机pdf”通常包含/font对象。
“扫描pdf”可能不会。
这应该适用于绝大多数情况:

  1. fetch(url)
  2. .then(response => response.blob())
  3. .then(data => data.text())
  4. .then(data => {
  5. if (/\/Font/.test(data)) {
  6. console.log('Probably native');
  7. } else {
  8. console.log('Probably scanned');
  9. }
  10. })

相关问题