MockingBird 使用中文readme中的第三个模型,同样的input音频文件和文字内容,得到的结果音频有杂音且每次效果不同

wtlkbnrh  于 5个月前  发布在  其他
关注(0)|答案(4)|浏览(45)

使用中文readme中的第三个模型,同样的input音频文件和文字内容,得到的结果音频有电流音且每次效果不同。

这是哪里的设置会影响到结果生成吗?求告知!
输入输出音频.zip

bq8i3lrv

bq8i3lrv2#

看截图,大概率是你的vocoder模型不够好,用一下hifigan

hsvhsicv

hsvhsicv3#

看截图,大概率是你的vocoder模型不够好,用一下hifigan
在GUI工具里面,Vocoder选择g_hifigan有电音,反而wavernn_pretrained效果比g_hifigan要好点,这是啥原因呢

tvmytwxo

tvmytwxo4#

你们知道如何训练vocoder吗,现在我不能保存训练的vocoder模型,只有log文件,怎么办

相关问题