就是图中画红框的5个参数
2w2cym1i1#
我克隆的语音,在pretrained-11-7-21_75k基础上,训练到120k步。最后的确是有80%相似,但有几个问题:1.电流音还是有一些,我拿超纯净的人声去训练也消不掉2.合成的声音语速太快,本来语气就有一点机械感,语速过快后,机械感更甚3.长句子中,有些字直接跳过不发音了。尤其是在句子开头,经常模糊掉一两个字
3yhwsihp2#
#435
qfe3c7zg3#
同问
7fyelxc54#
同问同问
4xy9mtcn5#
有答案了没?
5条答案
按热度按时间2w2cym1i1#
我克隆的语音,在pretrained-11-7-21_75k基础上,训练到120k步。
最后的确是有80%相似,但有几个问题:
1.电流音还是有一些,我拿超纯净的人声去训练也消不掉
2.合成的声音语速太快,本来语气就有一点机械感,语速过快后,机械感更甚
3.长句子中,有些字直接跳过不发音了。尤其是在句子开头,经常模糊掉一两个字
3yhwsihp2#
#435
qfe3c7zg3#
同问
7fyelxc54#
同问同问
4xy9mtcn5#
有答案了没?