MockingBird 中英模型怎么训练

k4aesqcs  于 5个月前  发布在  其他
关注(0)|答案(4)|浏览(60)

想要同时支持中文和英文的播报,怎么训练模型啊?

ff29svar

ff29svar1#

最近开发精力不太够,只能提供个思路,目前字幕都处理成拼音了,所以只支持中文,最好是可转成ipa等音素格式,然后属于中英夹杂的语料

huwehgph

huwehgph2#

是把中文训练集的拼音转成ipa的格式吗?能提供一个简单的中英混合的训练数据格式看看吗?后面需要训练的数据自己整理。

0s0u357o

0s0u357o3#

最近开发精力不太够,只能提供个思路,目前字幕都处理成拼音了,所以只支持中文,最好是可转成ipa等音素格式,然后属于中英夹杂的语料

大佬,我尝试用了aishell3的中文数据和train-clean-100的英文数据混合训练了,能播报中英文混合的,但是有漏读、合成的最后会多出来一点杂音,大佬能指点一下,怎么消除杂音么?下面是我加载的模型

hfyxw5xn

hfyxw5xn4#

也想了解如何中英文数据混合训练?

相关问题