这个链接 https://mp.weixin.qq.com/s?src=11×tamp=1592836784&ver=2416&signature=twPx*M3463d4-VSqClYYO5XF5gbF6u4xITOzMSde2WxwahX1vHbayJBPRbCdSpXhrhSvuZdZpjNQfDNedeedkK0dLPbSsh8tVxLQDh7jjGMyrhyqqom8qUCXi8tOux77&new=1 表示项目可以实现"键值对检测(用于提取特定的基于表单的条目)"。
9nvpjoqh1#
你好,@jingmouren
解析管道包含键值模块,文档编号为here。也许这个closed issue能帮助你...
谢谢!
laawzig22#
该文档配置使用冒号分隔,因此提取适用于re匹配的情况?因此不能同时应用于身份证和火车票的案例提取吗?
rmbxnbpk3#
请允许我举一个例子,说明它(默认配置)执行了什么样的提取操作。假设有一个如下形式的文档:ID number; 2756102988Phone Number- 7896172First Name: JohnSecond Name: DoeNationality; AustralianPlanet :Earth在这种情况下,Parsr将提取以下键值对:
1. Key: "ID number", Value: "2756102988" 2. Key: "First Name", Value: "John" 3. Key: "Second Name", Value: "Doe" 4. Key: "Nationality", Value: "Australian"
需要注意的是:
;
:
-
如果这回答了您的问题,请告诉我。
u3r8eeie4#
我知道如何使用配对提取。此外,除了pdf之外的图像可以直接提供给API吗?
ffvjumwh5#
你好,@jingmourendocs 的第一行内容是:Parsr 是一个最小占用空间的文档(图片、pdf、docx、eml)清理、解析和提取工具链感谢
翻译结果为:你好,@jingmouren。docs 的第一行内容是:“Parsr”是一个用于清理、解析和提取各种文档(如图片、PDF、DOCX、EML等)的最小占用空间的工具链。感谢您。
jpfvwuh46#
当然,我看到了那一行。但是我在某个地方找到了一个例子,说输入带有字段指出类型的,当我将类型从/pdf更改为/jpg时,它没有正确运行。
6条答案
按热度按时间9nvpjoqh1#
你好,@jingmouren
解析管道包含键值模块,文档编号为here。也许这个closed issue能帮助你...
谢谢!
laawzig22#
该文档配置使用冒号分隔,因此提取适用于re匹配的情况?
因此不能同时应用于身份证和火车票的案例提取吗?
rmbxnbpk3#
请允许我举一个例子,说明它(默认配置)执行了什么样的提取操作。假设有一个如下形式的文档:
ID number; 2756102988
Phone Number- 7896172
First Name: John
Second Name: Doe
Nationality; Australian
Planet :
Earth
在这种情况下,Parsr将提取以下键值对:
需要注意的是:
;
和:
字符的容差 - 它们是默认配置的分隔符。-
没有在配置的分隔符列表中。如果这回答了您的问题,请告诉我。
u3r8eeie4#
我知道如何使用配对提取。
此外,除了pdf之外的图像可以直接提供给API吗?
ffvjumwh5#
你好,@jingmouren
docs 的第一行内容是:
Parsr 是一个最小占用空间的文档(图片、pdf、docx、eml)清理、解析和提取工具链
感谢
翻译结果为:你好,@jingmouren。docs 的第一行内容是:“Parsr”是一个用于清理、解析和提取各种文档(如图片、PDF、DOCX、EML等)的最小占用空间的工具链。感谢您。
jpfvwuh46#
当然,我看到了那一行。但是我在某个地方找到了一个例子,说输入带有字段指出类型的,当我将类型从/pdf更改为/jpg时,它没有正确运行。