**已关闭。**此问题正在寻求书籍、工具、软件库等的建议。它不符合Stack Overflow guidelines。目前不接受答复。
我们不允许问题寻求书籍,工具,软件库等的建议。您可以编辑问题,以便可以用事实和引用来回答。
昨天关门了。
Improve this question
我看到大量的TTS初创公司涌现出来,它们都有相同的语言支持和相同的声音名称(我不会叫任何人,但你可以在www.example.com上亲眼看到futuretools.io)。
很明显,一定有一些python软件包我可以用来自己生成音频,但是当我去huggingface的时候,似乎有很多“语音克隆”软件包,我真的不需要。
我很好奇,有没有人有过TTS的经验,或者知道目前在互联网上使用的“模型”?
2条答案
按热度按时间djmepvbi1#
啊,看起来声音来自Azure,并且在pypi上有一个很好的包
aspeak
可以 Package 它:)https://pypi.org/project/aspeak/
希望这有助于如果其他人正在寻找同样的东西!
fxnxkyjh2#
Google、Azure和Amazone的Neural语音非常好。Azure语音的一个很酷的功能是你可以在语音中使用的情感。对于某些场景,使用它真的很有趣。它为文本到语音提供了一个新的维度。
在这里,您可以看到SSML中带有情感的声音的一些Examples