unilm DiT for Text Detection

3z6pesqy  于 2个月前  发布在  其他
关注(0)|答案(3)|浏览(41)

模型是否可以理解弯曲的文本?如果可以,是如何实现的?在文档和已发表的论文中没有对此进行解释。有人尝试使用预训练模型来预测场景文本数据集吗?

km0tfn4u

km0tfn4u1#

@senthil-r-10,我们没有在DiT训练中使用曲线文本,所以目前不支持。但是你可以继续训练这个模型以支持曲线文本检测。对于场景文本,你所说的场景文本文档是什么意思?你能举一些例子吗?

9vw9lbht

9vw9lbht2#

我的意思是,我只打算使用曲线文本检测方法,用于OCR文本检测,例如收据和发票。你能更新帮助文档中的数据准备链接吗?
https://mmocr.readthedocs.io/en/v0.6.0/datasets/det.html#funsd

o4hqfura

o4hqfura3#

@wolfshow :我之前使用合成数据训练了一个 DONUT 模型来适应新的语言。你认为在 DiT 文本检测中,是否可能采用相同的策略?
其次,无法访问 /dit/text_detection 中列出的模型检查点或权重。所有链接都出现 PublicAccessNotPermitted 错误。

相关问题