想要同时支持中文和英文的播报,怎么训练模型啊?
ff29svar1#
最近开发精力不太够,只能提供个思路,目前字幕都处理成拼音了,所以只支持中文,最好是可转成ipa等音素格式,然后属于中英夹杂的语料
huwehgph2#
是把中文训练集的拼音转成ipa的格式吗?能提供一个简单的中英混合的训练数据格式看看吗?后面需要训练的数据自己整理。
0s0u357o3#
大佬,我尝试用了aishell3的中文数据和train-clean-100的英文数据混合训练了,能播报中英文混合的,但是有漏读、合成的最后会多出来一点杂音,大佬能指点一下,怎么消除杂音么?下面是我加载的模型
hfyxw5xn4#
也想了解如何中英文数据混合训练?
4条答案
按热度按时间ff29svar1#
最近开发精力不太够,只能提供个思路,目前字幕都处理成拼音了,所以只支持中文,最好是可转成ipa等音素格式,然后属于中英夹杂的语料
huwehgph2#
是把中文训练集的拼音转成ipa的格式吗?能提供一个简单的中英混合的训练数据格式看看吗?后面需要训练的数据自己整理。
0s0u357o3#
最近开发精力不太够,只能提供个思路,目前字幕都处理成拼音了,所以只支持中文,最好是可转成ipa等音素格式,然后属于中英夹杂的语料
大佬,我尝试用了aishell3的中文数据和train-clean-100的英文数据混合训练了,能播报中英文混合的,但是有漏读、合成的最后会多出来一点杂音,大佬能指点一下,怎么消除杂音么?下面是我加载的模型
hfyxw5xn4#
也想了解如何中英文数据混合训练?