unilm Beit3培训批次流程

ruoxqz4g 于 6个月前发布在其他

关注(0)|答案(3)|浏览(76)

在对不同模态的批次进行训练beit3时，我想知道你是为每种数据类型(图像、文本、图像-文本)的每次迭代执行3次前向传播，还是将它们全部批量到一次前向传播中？
从我的理解来看，进行3次独立的前向传播，然后计算损失具有以下优势：可以减少所需的填充，这可能有助于提高准确性和速度。然而，只进行一次前向传播也可能更快，因为你只需要进行一次前向传播，而不是3次。

来源：https://github.com/microsoft/unilm/issues/879

3条答案

按热度按时间

你好，@PeterDykas,
感谢你的提问。对于不同模态数据的不同最大长度，我们进行了三次前向传递，分别处理图像、文本和图像-文本对。

赞(0）回复(0）举报 6个月前

亲爱的，@wenhui0924
我想知道当这三个数据长度不等时，你是如何混合它们的。
谢谢！

赞(0）回复(0）举报 6个月前

BEiT-3的代码和预训练模型可以在aka.ms/beit3找到。

赞(0）回复(0）举报 6个月前

相关问题

热门标签

Java query python Node 开发语言 request Util 数据库 Table 后端算法 Logger Message Element Parser

最新问答

xxl-job 安全组扫描到执行器端口服务存在信息泄露漏洞
回答(1) 发布于 5个月前
xxl-job 不能和nacos兼容？
回答(3) 发布于 5个月前
xxl-job 任务执行完后无法结束，日志一直转圈
回答(3) 发布于 5个月前
xxl-job-admin页面上查看调度日志样式问题
回答(1) 发布于 5个月前
xxl-job 参数512字符限制能否去掉
回答(1) 发布于 5个月前