各位大神好!
十分感谢各位的付出,我使用MockingBird有一段时间了,感觉十分有帮助。但是还是偶尔会遇到个别句子合成出来效果不理想,看到各位大佬提到训练合成器非常辛苦,我就有了一个大胆的想法:
目前阿里云不是TTS效果蛮好的嘛,能否接入阿里云(或其他同类API),调用成熟的TTS来生成基础语音呢?这样的话,理论上就可以获取更流畅的结果,岂不爽哉?
如果此路不通的话,还烦请各位大佬批评指正。
各位大神好!
十分感谢各位的付出,我使用MockingBird有一段时间了,感觉十分有帮助。但是还是偶尔会遇到个别句子合成出来效果不理想,看到各位大佬提到训练合成器非常辛苦,我就有了一个大胆的想法:
目前阿里云不是TTS效果蛮好的嘛,能否接入阿里云(或其他同类API),调用成熟的TTS来生成基础语音呢?这样的话,理论上就可以获取更流畅的结果,岂不爽哉?
如果此路不通的话,还烦请各位大佬批评指正。
9条答案
按热度按时间vmpqdwk31#
可以的 我试过了了 我是用公司的TTS引擎生成的语料拿去训练 最后的效果比真人录音语料好很多 没有噪音 也更逼真
gpnt7bae2#
这样子,这个项目要不了多久就要被封了
a14dhokn3#
可以的 我试过了了 我是用公司的TTS引擎生成的语料拿去训练 最后的效果比真人录音语料好很多 没有噪音 也更逼真
@luobingit 哇,难道是xunfei的大佬嘛!!!
ubof19bj4#
这样子,这个项目要不了多久就要被封了
额,作为作者居然不知道,能有什么办法不让被封吗?把效果改坏?
pinkon5k5#
这样子,这个项目要不了多久就要被封了
额,作为作者居然不知道,能有什么办法不让被封吗?把效果改坏?
就是,哪有说推动技术发展还要瞻前顾后的,支持作者!顺便问一下,这个思路能行得通吗
nr9pn0ug6#
这样子,这个项目要不了多久就要被封了
额,作为作者居然不知道,能有什么办法不让被封吗?把效果改坏?
就是,哪有说推动技术发展还要瞻前顾后的,支持作者!顺便问一下,这个思路能行得通吗
上次跟一个网友讨论了一个小时 确认可行 你可以百度一下 这里放个图
7ajki6be7#
o2rvlv0m8#
真是个天才般的想法,用其他tts产生基础数据集先把注意力训练出来并扩充词汇库,再用特定的数据集来专项特化,应该能作出很好的单人tts
j8yoct9x9#
这个项目大有可为