支持私有化部署
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


ChatTTS - 用于日常对话的生成语音模型

发布日期:2024-06-05 02:38:28 浏览次数: 2363 作者:Renee 创业随笔


短短一周时间,Star数就飙升到了18k。

先来听听Demo:

英文男声

英文女声
中文男声
中文女声


ChatTTS 是一个专为对话场景(如大语言模型助手)设计的文本转语音模型。它支持中英文两种语言。模型经过超过10万小时的中英文语音训练。开源版本在 HuggingFace 上,是一个经过4万小时预训练但未进行微调(SFT)的模型。

项目亮点

  1. 对话式TTS:ChatTTS 经过优化,专用于对话任务,能够生成自然且富有表现力的语音合成。它支持多说话人,有助于实现互动对话。
  2. 细粒度控制:该模型能够预测并控制细粒度的韵律特征,包括笑声、停顿和感叹词等。
  3. 更好的韵律:在韵律方面,ChatTTS 超过了大多数开源的TTS模型。ChatTTS提供预训练模型,以支持进一步的研究和开发。

生成过程还是有点慢的,耐心等待~这个是我最后跑的效果:


53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询