pytorch 在元学习过程中，什么时候除以MAML的 meta_batch_size？

yjghlzjz 于 2022-11-09 发布在其他

关注(0)|答案(1)|浏览(211)

我在高等图书馆看过maml的例子，但在我看来，他们忘记了除以meta_batch_size，他们有：

qry_loss.backward()

他们应该

meta_batch_size = qry_loss.size(0)
(qry_loss/meta_batch_size).backward()

这是否正确？是否应该除以meta_batch_size？
参考文献：

使用omniglot完整代码示例：https://github.com/facebookresearch/higher/blob/master/examples/maml-omniglot.py
交叉过帐：https://github.com/facebookresearch/higher/issues/104
交叉：https://discuss.pytorch.org/t/when-does-one-divide-by-the-meta-batch-size-for-maml-during-meta-learning/114625

如果您没有填充grads字段，请查看以下内容：https://github.com/facebookresearch/higher/issues/129

来源：https://stackoverflow.com/questions/66606540/when-does-one-divide-by-the-meta-batch-size-for-maml-during-meta-learning

1条答案

按热度按时间

如果选择了正确的步长，则它们是“等效的”。
第一个具有此更新规则：

w := w - eta1 (E[l] +- std[l]/sqr{B})

第二名：

w := w - eta2 (B E[l] +- sqrt{B} std[l])

如果eta2 = eta1/B，它们是相同的。假设你可以用mean +- std或多或少地替换梯度（不完全是，但那很好，这是为了得到一种感觉，如果它们或多或少地分布相同，足够相似）。

赞(0）回复(0）举报 2022-11-09

相关问题

热门标签

Java query python Node 开发语言 request Util 数据库 Table 后端算法 Logger Message Element Parser

最新问答

xxl-job 安全组扫描到执行器端口服务存在信息泄露漏洞
回答(1) 发布于 4个月前
xxl-job 不能和nacos兼容？
回答(3) 发布于 4个月前
xxl-job 任务执行完后无法结束，日志一直转圈
回答(3) 发布于 4个月前
xxl-job-admin页面上查看调度日志样式问题
回答(1) 发布于 4个月前
xxl-job 参数512字符限制能否去掉
回答(1) 发布于 4个月前