unstructured bug/partition_text 移除负号

rqenqsqc  于 2个月前  发布在  其他
关注(0)|答案(3)|浏览(40)

描述bug

函数partition_text移除负号。

重现问题

from unstructured.partition.text import partition_text

text = '''
net amount
-4,391,082,054.12

rate is -10%
'''

print(text)

data = partition_text(text=text)

for d in data:
    print(d.text)
    print('-' * 10)

预期行为

net amount
-4,391,082,054.12

rate is -10%

net amount
----------
-4,391,082,054.12
----------
rate is
----------
-10%
----------

截图

lc8prwob

lc8prwob1#

这似乎是因为该符号被识别为无序列表中的项目符号。

b5lpy0ml

b5lpy0ml2#

我们会尽快修复这个问题。

nzkunb0c

nzkunb0c3#

有人在修复这个问题吗?

相关问题