unilm 在单个模型中添加多个分类头进行训练

nwsw7zdq 于 2个月前发布在其他

关注(0)|答案(6)|浏览(44)

我想基于相同的架构训练一个模型，但是有两个不同的分类头。其中一个用于检测文档的布局，如表格、文本、标题、图形等；另一个用于检测表格内的单元格。目前我已经根据相同的架构为布局和表格内的单元格创建了两个不同的模型。
由于我已经为这两个不同的用例使用了相同的架构，我该如何使用这个单一模型来同时训练布局和表格内的单元格？
注意：我已经使用了表格内文本的OCR坐标，但结果并不理想，所以不想再使用它。

来源：https://github.com/microsoft/unilm/issues/766

6条答案

按热度按时间

@Atul997 第一个问题，两种不同模型的准确性如何？它们是否足够好？

赞(0）回复(0）举报 2个月前

@wolfshow 是的，这两个模型的准确性都足够好。

赞(0）回复(0）举报 2个月前

这两个模型的 Backbone 网络是什么？

赞(0）回复(0）举报 2个月前

在publaynet和icdar配置中给定的两个模型的VIT Backbone 网络。

赞(0）回复(0）举报 2个月前

我认为这两个模型之间存在一些不兼容性，因为用于公共网络的DiT旨在检测大对象，而另一个用于表格单元格的模型则试图定位小对象。您也可以尝试使用LayoutLM从文本侧获取头部。

赞(0）回复(0）举报 2个月前

我可以尝试，但我不想在训练中包含文本，只想仅使用图像。如果可能的话，我可以根据性能选择任何一种配置。

赞(0）回复(0）举报 2个月前

相关问题

热门标签

Java query python Node 开发语言 request Util 数据库 Table 后端算法 Logger Message Element Parser

最新问答

xxl-job 安全组扫描到执行器端口服务存在信息泄露漏洞
回答(1) 发布于 21天前
xxl-job 不能和nacos兼容？
回答(3) 发布于 21天前
xxl-job 任务执行完后无法结束，日志一直转圈
回答(3) 发布于 21天前
xxl-job-admin页面上查看调度日志样式问题
回答(1) 发布于 21天前
xxl-job 参数512字符限制能否去掉
回答(1) 发布于 21天前