我正在努力理解如何“客观地”评估GAN(也就是说,不仅仅是看它生成的东西说“这看起来好/坏”)。
我的理解是,鉴频器应该领先一步,理论上,鉴频器损耗和发电机损耗都应该收敛到0. 5--在这一点上,两者都同样“好”。
我目前正在训练一个模型,我得到的鉴别器损失从0.7开始,但很快收敛到0.25,而发生器损失从50开始,并收敛到0.35(进一步训练可能会更少)。
这完全没有道理。怎么可能两者都好于0.5?我的损失函数不正确,还是我遗漏了什么?应该如何衡量绩效?
我正在努力理解如何“客观地”评估GAN(也就是说,不仅仅是看它生成的东西说“这看起来好/坏”)。
我的理解是,鉴频器应该领先一步,理论上,鉴频器损耗和发电机损耗都应该收敛到0. 5--在这一点上,两者都同样“好”。
我目前正在训练一个模型,我得到的鉴别器损失从0.7开始,但很快收敛到0.25,而发生器损失从50开始,并收敛到0.35(进一步训练可能会更少)。
这完全没有道理。怎么可能两者都好于0.5?我的损失函数不正确,还是我遗漏了什么?应该如何衡量绩效?
1条答案
按热度按时间dtcbnfnu1#
在GAN设置中,损失较好是正常的,因为您一次只训练其中一个网络(从而击败其他网络)。
您可以使用 PSNR、SSIM、FID、L2、Lpips、VGG 或类似指标(取决于您的特定任务)来评估生成的输出。这仍然是一个关于如何客观评估图像的研究领域,通常在某些任务中用作损失目标。
我建议查看图像质量指标的分析和评估
我建议你观察一下生成器的指标,看看它是否有所改善,当然也可以通过视觉来确认。你可以使用日志记录来查看指标的变化,或者使用一些可视化工具,tensorboard,或者wandb。