unilm Multiple pages documents for LayoutLM

1sbrub3j  于 2个月前  发布在  其他
关注(0)|答案(6)|浏览(48)

我的问题是关于LayoutLM的。我想将类似于收据理解任务应用于多页文档,应该如何处理?是否有这样的方法?

cclgggtu

cclgggtu1#

@victor-ab 简单的方法是将多页文档拆分成一组块,然后将这些块输入到LayoutLM模型中。

vtwuwzda

vtwuwzda2#

你所说的"一组块"是什么意思?我没有理解。
我的想法是将所有页面垂直连接起来。但我想这可能不是最好的解决方案,因为文本会比只有一页时更加密集。

y4ekin9u

y4ekin9u3#

你好,@victor-ab!问候!
你找到了一种更接近于实现多页文档预期准确率的方法吗?

vvppvyoh

vvppvyoh4#

你好,khushbu-mulani!还没有。请告诉我你有什么想法......
2020年10月5日星期一,11:26 khushbu-mulani,***@***.***>写道:嗨,victor-ab < https://github.com/victor-ab >,你好!你找到了一种更接近实现多页文档预期准确率的方法吗?——你收到这封邮件是因为有人提到了你。直接回复这封邮件,在GitHub上查看<#232 (comment)>,或者取消订阅< https://github.com/notifications/unsubscribe-auth/AGKYMCQWHY5HUOP26ENURSLSJHJRLANCNFSM4QQ2R7PA >。

3gtaxfhh

3gtaxfhh5#

你好,@wolfshow,

你能建议我们如何处理多页文档的训练和推理吗?
对于训练,我们可以分别获取每页的hocr,或者将文档的所有页面合并并获取单个hocr文件。但在推理时,这是如何工作的呢?

提前感谢!

cld4siwp

cld4siwp6#

大家好。有人弄明白这个了吗?

相关问题