AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


ChatTTS - 用于日常对话的生成语音模型
发布日期:2024-06-05 02:38:28 浏览次数: 1887


之前分享过很多TTS方案:微软Azure TTSOpenAI Whisper

今天我们来看看最近开源的一个新项目ChatTTS,是一个用于日常对话的生成语音模型。:https://huggingface.co/2Noise/ChatTTS。

短短一周时间,Star数就飙升到了18k。

先来听听Demo:

英文男声

英文女声
中文男声
中文女声


ChatTTS 是一个专为对话场景(如大语言模型助手)设计的文本转语音模型。它支持中英文两种语言。模型经过超过10万小时的中英文语音训练。开源版本在 HuggingFace 上,是一个经过4万小时预训练但未进行微调(SFT)的模型。

项目亮点

  1. 对话式TTS:ChatTTS 经过优化,专用于对话任务,能够生成自然且富有表现力的语音合成。它支持多说话人,有助于实现互动对话。
  2. 细粒度控制:该模型能够预测并控制细粒度的韵律特征,包括笑声、停顿和感叹词等。
  3. 更好的韵律:在韵律方面,ChatTTS 超过了大多数开源的TTS模型。ChatTTS提供预训练模型,以支持进一步的研究和开发。

可以在 Google Colab 上运行 demo:https://colab.research.google.com/drive/1fJGsNoKxUD62no-Y2mb5onAkhIXbsrI5


生成过程还是有点慢的,耐心等待~这个是我最后跑的效果:


53AI,企业落地应用大模型首选服务商

产品:大模型应用平台+智能体定制开发+落地咨询服务

承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询