Parsr 是否有示例展示如何进行键值对提取?

olqngx59  于 1个月前  发布在  其他
关注(0)|答案(6)|浏览(47)
9nvpjoqh

9nvpjoqh1#

你好,@jingmouren

解析管道包含键值模块,文档编号为here。也许这个closed issue能帮助你...

谢谢!

laawzig2

laawzig22#

该文档配置使用冒号分隔,因此提取适用于re匹配的情况?
因此不能同时应用于身份证和火车票的案例提取吗?

rmbxnbpk

rmbxnbpk3#

请允许我举一个例子,说明它(默认配置)执行了什么样的提取操作。假设有一个如下形式的文档:
ID number; 2756102988
Phone Number- 7896172
First Name: John
Second Name: Doe
Nationality; Australian
Planet :
Earth
在这种情况下,Parsr将提取以下键值对:

1. Key: "ID number", Value: "2756102988"
2. Key: "First Name", Value: "John"
3. Key: "Second Name", Value: "Doe"
4. Key: "Nationality", Value: "Australian"

需要注意的是:

  • 注意 ;: 字符的容差 - 它们是默认配置的分隔符。
  • 电话号码没有被提取为键值对,因为分隔符 - 没有在配置的分隔符列表中。
  • 行星名称没有被提取,因为键和值不在同一行。

如果这回答了您的问题,请告诉我。

u3r8eeie

u3r8eeie4#

我知道如何使用配对提取。
此外,除了pdf之外的图像可以直接提供给API吗?

ffvjumwh

ffvjumwh5#

你好,@jingmouren
docs 的第一行内容是:
Parsr 是一个最小占用空间的文档(图片、pdf、docx、eml)清理、解析和提取工具链
感谢

翻译结果为:你好,@jingmouren。docs 的第一行内容是:“Parsr”是一个用于清理、解析和提取各种文档(如图片、PDF、DOCX、EML等)的最小占用空间的工具链。感谢您。

jpfvwuh4

jpfvwuh46#

当然,我看到了那一行。但是我在某个地方找到了一个例子,说输入带有字段指出类型的,当我将类型从/pdf更改为/jpg时,它没有正确运行。

相关问题