我有一个类似yolo的网络架构,在输出层上,我想用x、y、宽度、高度等坐标来预测边界框。当我使用线性激活函数时,一切都很好,但我的模型有时会预测负值,这在我的情况下没有意义,因为所有要预测的值都在x的0和1之间。y和宽度和高度是3或5。我想我可以用一个ReLU激活来代替我的输出,但如果我这样做,我的网络就会被NaN作为一个损失值卡住。你知道为什么吗?
gab6jxml1#
如果你不给我们更多的数据,这很难说。但是,这似乎是一个常见的问题,在输入数据没有正确规范化的情况下。这里有一些链接,也许看看。如果它没有帮助,你可能会给予更多的信息,有人给一个有用的答案https://discuss.tensorflow.org/t/getting-nan-for-loss/4826NaN loss when training regression network
1条答案
按热度按时间gab6jxml1#
如果你不给我们更多的数据,这很难说。但是,这似乎是一个常见的问题,在输入数据没有正确规范化的情况下。
这里有一些链接,也许看看。如果它没有帮助,你可能会给予更多的信息,有人给一个有用的答案
https://discuss.tensorflow.org/t/getting-nan-for-loss/4826
NaN loss when training regression network