我的问题是关于LayoutLM的。我想将类似于收据理解任务应用于多页文档,应该如何处理?是否有这样的方法?
cclgggtu1#
@victor-ab 简单的方法是将多页文档拆分成一组块,然后将这些块输入到LayoutLM模型中。
vtwuwzda2#
你所说的"一组块"是什么意思?我没有理解。我的想法是将所有页面垂直连接起来。但我想这可能不是最好的解决方案,因为文本会比只有一页时更加密集。
y4ekin9u3#
你好,@victor-ab!问候!你找到了一种更接近于实现多页文档预期准确率的方法吗?
vvppvyoh4#
你好,khushbu-mulani!还没有。请告诉我你有什么想法......2020年10月5日星期一,11:26 khushbu-mulani,***@***.***>写道:嗨,victor-ab < https://github.com/victor-ab >,你好!你找到了一种更接近实现多页文档预期准确率的方法吗?——你收到这封邮件是因为有人提到了你。直接回复这封邮件,在GitHub上查看<#232 (comment)>,或者取消订阅< https://github.com/notifications/unsubscribe-auth/AGKYMCQWHY5HUOP26ENURSLSJHJRLANCNFSM4QQ2R7PA >。
3gtaxfhh5#
你好,@wolfshow,
你能建议我们如何处理多页文档的训练和推理吗?对于训练,我们可以分别获取每页的hocr,或者将文档的所有页面合并并获取单个hocr文件。但在推理时,这是如何工作的呢?
提前感谢!
cld4siwp6#
大家好。有人弄明白这个了吗?
6条答案
按热度按时间cclgggtu1#
@victor-ab 简单的方法是将多页文档拆分成一组块,然后将这些块输入到LayoutLM模型中。
vtwuwzda2#
你所说的"一组块"是什么意思?我没有理解。
我的想法是将所有页面垂直连接起来。但我想这可能不是最好的解决方案,因为文本会比只有一页时更加密集。
y4ekin9u3#
你好,@victor-ab!问候!
你找到了一种更接近于实现多页文档预期准确率的方法吗?
vvppvyoh4#
你好,khushbu-mulani!还没有。请告诉我你有什么想法......
2020年10月5日星期一,11:26 khushbu-mulani,***@***.***>写道:嗨,victor-ab < https://github.com/victor-ab >,你好!你找到了一种更接近实现多页文档预期准确率的方法吗?——你收到这封邮件是因为有人提到了你。直接回复这封邮件,在GitHub上查看<#232 (comment)>,或者取消订阅< https://github.com/notifications/unsubscribe-auth/AGKYMCQWHY5HUOP26ENURSLSJHJRLANCNFSM4QQ2R7PA >。
3gtaxfhh5#
你好,@wolfshow,
你能建议我们如何处理多页文档的训练和推理吗?
对于训练,我们可以分别获取每页的hocr,或者将文档的所有页面合并并获取单个hocr文件。但在推理时,这是如何工作的呢?
提前感谢!
cld4siwp6#
大家好。有人弄明白这个了吗?