unilm # epochs for finetuning LayoutLMv2 on DocVQA

mhd8tkvw 于 5个月前发布在其他

关注(0)|答案(4)|浏览(55)

我正在尝试重现LayoutLMv2 paper, Table 6, row 7中报告的结果。根据this example,我已经使用DocVQA训练集对基础模型进行了20个epoch的微调。与论文中报告的结果相比，结果模型表现不佳(大约有40%的答案默认为[CLS])。在继续调试代码的过程中，我想知道原始工作中用于微调模型的epoch数量是多少。

来源：https://github.com/microsoft/unilm/issues/501

4条答案

按热度按时间

你使用哪个OCR工具进行DocVQA?

赞(0）回复(0）举报 5个月前

我使用了Tesseract,按照合作笔记本的步骤(我意识到这与您使用的不完全相同)。如果我切换到MS Read,我是否能得到相同的结果？或者，如果有一个在DocVQA上预训练并微调过的LayoutLMv2版本，您能否提供它？

赞(0）回复(0）举报 5个月前

我遇到了相同的问题，并使用了Tesseract和DocTR。如果能发布预训练模型，如Layoutlm模型，将不胜感激。

赞(0）回复(0）举报 5个月前

如果这对某人有帮助，我将提到的合作改编成一个完整的数据集训练脚本。它可以在Tesseract OCR或数据集OCR上进行训练。它明确地用于使用Tesseract评估LayoutLMv2在DocVQA上的性能，以展示较差的表现。它肯定没有优化，但应该相当不错。

赞(0）回复(0）举报 5个月前

相关问题

热门标签

Java query python Node 开发语言 request Util 数据库 Table 后端算法 Logger Message Element Parser

最新问答

xxl-job 安全组扫描到执行器端口服务存在信息泄露漏洞
回答(1) 发布于 4个月前
xxl-job 不能和nacos兼容？
回答(3) 发布于 4个月前
xxl-job 任务执行完后无法结束，日志一直转圈
回答(3) 发布于 4个月前
xxl-job-admin页面上查看调度日志样式问题
回答(1) 发布于 4个月前
xxl-job 参数512字符限制能否去掉
回答(1) 发布于 4个月前