你好,
我非常喜欢使用这个库,并感谢你的辛勤工作。我注意到你已经添加了Whisper,这很好。但我一直在使用其他模型,如wav2vec2、MMS和XLS-R,它们表现得非常好。
它们的优点在于,它们需要很少的微调就能很好地工作,尤其是在谈论WER时。我发现Whisper在这方面需要更多的微调,尤其是对于资源较少的语言。
我在想,你是否计划将这些模型(wav2vec2、MMS和XLS-R)的支持添加到库中?如果没有,你能指导我如何添加它们吗?
以下是关于这些模型的更多信息的一些有用链接:
我认为添加这些模型会使库变得更好,尤其是对于那些使用不常见语言的人来说。
非常感谢!
1条答案
按热度按时间6tr1vspr1#
是的,我也希望ctranslate2支持MMS模型(包括ASR和TTS)。