Speaking
音频处理
Speaking

AI 声音克隆

speaking.ai/ elevenlabs/ resemble.ai/ Microsoft Azure AI/ XTTS

1. Azure AI,虽然微软博客更新了,但我目前在Azure没有看到

“提供一分钟语音样本,快速复制用户声音”的personal TTS,就是上传audio克隆声音的模型。只有text-to-speech,而且azure的页面操作起来很复杂,虽然大而全,但教程和客服都很难用,这也是IAAS的通病吧。

2. speaking.ai的声音克隆,相较elevenlabs和resemble ai,它提供一次免费的克隆。我克隆了毒师Walter White的声线,只需要上传1分钟的老白人声,然后输入想让老白念的词,效果还不错,排队到生成十分钟

3. 个人认为目前语音克隆的最佳方案, XTTS:

https://huggingface.co/spaces/coqui/xtts

相关导航

发表回复