https://www.tensorflow.org/api_docs/python/tf/nn/nce_loss这里写的是calculate the full sigmoid loss for evaluation or inference
,谁能解释一下在推理期如何预测标签的一些细节?
据我所知,模型的最后一层输出是形状(batch,num_class),在训练时直接进入nce损失,作为二进制分类问题处理,在推理时,我直接在最后一层的输出上取S形,并得到对应的条目i
来表示类i
的概率,这对吗?或者我可以像使用softmax一样直接把最大的条目当作类标签?
我不是很明白,也没有找到任何实际的例子与此相关的网上。任何帮助是赞赏!谢谢这么多提前!
1条答案
按热度按时间anauzrmj1#
当考虑序列输入时,NCE_loss可能是噪声对比估计,它通过选择候选采样器来改变输入以创建输出。
参考0:https://www.tensorflow.org/api_docs/python/tf/nn/nce_loss
参考1:https://github.com/yl-1993/tensorflow/blob/master/tensorflow/examples/tutorials/mnist/mnist_deep.py
参考2:https://www.programcreek.com/python/example/90447/tensorflow.nce_loss