unilm DiT for Text Detection

3z6pesqy 于 2个月前发布在其他

关注(0)|答案(3)|浏览(41)

模型是否可以理解弯曲的文本？如果可以，是如何实现的？在文档和已发表的论文中没有对此进行解释。有人尝试使用预训练模型来预测场景文本数据集吗？

3条答案

@senthil-r-10,我们没有在DiT训练中使用曲线文本，所以目前不支持。但是你可以继续训练这个模型以支持曲线文本检测。对于场景文本，你所说的场景文本文档是什么意思？你能举一些例子吗？

我的意思是，我只打算使用曲线文本检测方法，用于OCR文本检测，例如收据和发票。你能更新帮助文档中的数据准备链接吗？
https://mmocr.readthedocs.io/en/v0.6.0/datasets/det.html#funsd

@wolfshow :我之前使用合成数据训练了一个 DONUT 模型来适应新的语言。你认为在 DiT 文本检测中，是否可能采用相同的策略？
其次，无法访问 /dit/text_detection 中列出的模型检查点或权重。所有链接都出现 PublicAccessNotPermitted 错误。