Pytorch梯度下降法不断给我发送NaNs均方误差

hmtdttj4 于 2022-11-23 发布在其他

关注(0)|答案(1)|浏览(152)

我试图在课程的框架内应用梯度下降法来估计线性模型。我的代码如下：

model = torch.nn.Linear(1,1)
myModel = model(X)
ds = torch.utils.data.TensorDataset(X, Y)
dl = torch.utils.data.DataLoader(ds)
optimiser = torch.optim.SGD(model.parameters(), lr=0.01)
loss = torch.nn.functional.mse_loss
for epoch in range(100):
    for (Xb, yb) in dl:
        yb_pred = model(Xb)
        c_loss = loss(yb_pred, yb)
        print(c_loss)
        optimiser.zero_grad()
        c_loss.backward()
        optimiser.step()

但是它一直打印NaNs，我不明白。我在实现中是否犯了错误？我有以下输出（x多次）：
Tensor（nan，grad_fn=）

来源：https://stackoverflow.com/questions/74476864/pytorch-gradient-descent-keeps-sending-me-nans-mean-squared-errors

1条答案

按热度按时间

您的代码没有问题，但是Nan值可以通过梯度爆炸来解释，梯度爆炸取决于数据X和Y。您可以尝试使用较低的学习率（1 e-3或1 e-4）。
例如，如果你用这个玩具线性例子进行测试：

X = torch.randn(100, 1)
Y = X * 2 + 3

损失将很快收敛到0。

赞(0）回复(0）举报 2022-11-23

相关问题

热门标签

Java query python Node 开发语言 request Util 数据库 Table 后端算法 Logger Message Element Parser

最新问答

xxl-job 安全组扫描到执行器端口服务存在信息泄露漏洞
回答(1) 发布于 9个月前
xxl-job 不能和nacos兼容？
回答(3) 发布于 9个月前
xxl-job 任务执行完后无法结束，日志一直转圈
回答(3) 发布于 9个月前
xxl-job-admin页面上查看调度日志样式问题
回答(1) 发布于 9个月前
xxl-job 参数512字符限制能否去掉
回答(1) 发布于 9个月前