AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


【12/100个AI应用体验】ChatTTS-ui 初体验,顺祝儿童节快乐!
发布日期:2024-06-21 08:12:55 浏览次数: 1894


"Dream big and dare to fail."

大胆梦想,并勇于面对失败。

by Norman Vaughan


┃AI应用介绍

ChatTTS是一个开源的文本转语音(TTS)项目,在Github上线4天斩获1.19万颗星的超级新秀。它能够将文本转换成语音,并且支持中文和英文两种语言。

这次体验的ChatTTS-ui是开源社区的贡献者 jianchang512为 ChatTTS 创建了 Web 界面和 API 接口,使得用户可以通过网页直接使用 ChatTTS 的合成语音功能,并且支持 Windows、Linux、macOS 系统部署。Windows 用户甚至可以下载一个安装包,实现一键安装和开箱即用 。

但我这次是基于ChatTTS-ui源码安装,这样在运行过程中能看到过程数据,更能了解一些机理,也能体会些折腾的快乐。

需要注意的是,ChatTTS还存在不少问题,音色生成不稳定,长文本处理不连贯自然,我在加入一些参数时,还会报一些异常错误。


#AI应用-012 ChatTTS-ui合成语音功能的开源项目

初步体验效果如下:
文本↓

即便过了四十岁的年纪
你还记得曾经一位少年说的话
你想做一个有趣的人
儿童节快乐
成年人

合成后的音频↓

下面介绍我的部署过程,供参考

┃部署环境

OS: Windows 11

Python版本:3.9~3.11(不要用3.12,会报错,含泪亲测)

GPU:

部署方式:使用conda创建一个纯净python3.11环境,通过源码部署(windows有直接的安装包,想直接体验的可以到项目地址上找到安装包地址下载体验)

Github项目地址:https://github.com/jianchang512/ChatTTS-ui


┃我的部署过程

1.创建一个独享的python环境,使用

conda create -n ChatTTSui python=3.11

2.激活python 环境

conda activate ChatTTSui

3.下载项目仓库到本地(需要爬梯)

git clone https://github.com/jianchang512/chatTTS-ui.git

4.进入已经下载下来的本地项目仓库(文件夹)

cd chatTTS-ui

5.创建虚拟环境

python -m venv venv

6.激活虚拟环境

.\venv\scripts\activate

7.安装依赖库

pip install -r requirements.txt

8.安装CUDA加速组件(如果不需要,则执行 pip install torch torchaudio)

pip install torch torchaudio --index-url https://download.pytorch.org/whl/cu118

9.安装CUDA11.8+ ToolKit(自行搜索下载)、

10.启动程序

python app.py

将自动打开浏览器窗口,默认地址 http://127.0.0.1:9966启动成功。

11.源码部署启动后,会先从 modelscope下载模型,但modelscope缺少spk_stat.pt,会报错,请点击链接 https://huggingface.co/2Noise/ChatTTS/blob/main/asset/spk_stat.pt 下载 spk_stat.pt,将该文件复制到 项目目录/models/pzc163/chatTTS/asset/ 文件夹内

12.关闭程序,重复步骤10,重新启动程序。启动成功后,自动跳转到浏览器打开本地网页

后台成功启动后状态↓:

初始页面↓:

#花絮

因为我的本地环境python版本是3.12,直接部署后启动一直报错:

`INFO:ChatTTS.core:Load from local: D:/tools/100AIGC/chatTTS-ui/models\pzc163\chatTTSWARNING:ChatTTS.utils.gpu_utils:No GPU found, use CPU insteadINFO:ChatTTS.core:use cpuINFO:ChatTTS.core:vocos loaded.INFO:ChatTTS.core:dvae loaded.Traceback (most recent call last):File "D:\tools\100AIGC\chatTTS-ui\app.py", line 45, inchat.load_models(source="local",local_path=CHATTTS_DIR)File "D:\tools\100AIGC\chatTTS-ui\ChatTTS\core.py", line 61, in load_modelsself._load(**{k: os.path.join(download_path, v) for k, v in OmegaConf.load(os.path.join(download_path, 'config', 'path.yaml')).items()}, **kwargs)File "D:\tools\100AIGC\chatTTS-ui\ChatTTS\core.py", line 102, in loadgpt.gpt.forward = torch.compile(gpt.gpt.forward, backend='inductor', dynamic=True)^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^File "D:\tools\100AIGC\chatTTS-ui\venv\Lib\site-packages\torch_init.py", line 1866, in compileraise RuntimeError("Dynamo is not supported on Python 3.12+")RuntimeError: Dynamo is not supported on Python 3.12+

我没做过编程,英语又不好,直接把错误丢给iflycode排查问题:)

同时在github该项目上传了错误信息,没想到很快得到了作者的回复,随后规规矩矩用python3.11版本重新安装一遍,这才有了上述步骤。

Done!

祝各位大朋友们,儿童节快乐!


53AI,企业落地应用大模型首选服务商

产品:大模型应用平台+智能体定制开发+落地咨询服务

承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询