我要投稿

【12/100个AI应用体验】ChatTTS-ui 初体验，顺祝儿童节快乐！

发布日期：2024-06-21 08:12:55 浏览次数： 2349 作者：河东小郢

"Dream big and dare to fail."

大胆梦想，并勇于面对失败。

by Norman Vaughan

┃AI应用介绍

ChatTTS是一个开源的文本转语音（TTS）项目，在Github上线4天斩获1.19万颗星的超级新秀。它能够将文本转换成语音，并且支持中文和英文两种语言。

这次体验的ChatTTS-ui是开源社区的贡献者 jianchang512为 ChatTTS 创建了 Web 界面和 API 接口，使得用户可以通过网页直接使用 ChatTTS 的合成语音功能，并且支持 Windows、Linux、macOS 系统部署。Windows 用户甚至可以下载一个安装包，实现一键安装和开箱即用。

但我这次是基于ChatTTS-ui源码安装，这样在运行过程中能看到过程数据，更能了解一些机理，也能体会些折腾的快乐。

需要注意的是，ChatTTS还存在不少问题，音色生成不稳定，长文本处理不连贯自然，我在加入一些参数时，还会报一些异常错误。

#AI应用-012 ChatTTS-ui：合成语音功能的开源项目

初步体验效果如下：

文本↓

即便过了四十岁的年纪
你还记得曾经一位少年说的话
你想做一个有趣的人
儿童节快乐
成年人

合成后的音频↓

下面介绍我的部署过程，供参考

┃部署环境

OS: Windows 11

Python版本：3.9~3.11（不要用3.12，会报错，含泪亲测）

GPU：有

部署方式：使用conda创建一个纯净python3.11环境，通过源码部署（windows有直接的安装包，想直接体验的可以到项目地址上找到安装包地址下载体验）

Github项目地址：https://github.com/jianchang512/ChatTTS-ui

┃我的部署过程

1.创建一个独享的python环境，使用

conda create -n ChatTTSui python=3.11

2.激活python 环境

conda activate ChatTTSui

3.下载项目仓库到本地（需要爬梯）

git clone https://github.com/jianchang512/chatTTS-ui.git

4.进入已经下载下来的本地项目仓库（文件夹）

cd chatTTS-ui

5.创建虚拟环境

python -m venv venv

6.激活虚拟环境

.\venv\scripts\activate

7.安装依赖库

pip install -r requirements.txt

8.安装CUDA加速组件（如果不需要，则执行 pip install torch torchaudio）

pip install torch torchaudio --index-url https://download.pytorch.org/whl/cu118

9.安装CUDA11.8+ ToolKit（自行搜索下载）、

10.启动程序

python app.py

将自动打开浏览器窗口，默认地址 http://127.0.0.1:9966启动成功。

11.源码部署启动后，会先从 modelscope下载模型，但modelscope缺少spk_stat.pt，会报错，请点击链接 https://huggingface.co/2Noise/ChatTTS/blob/main/asset/spk_stat.pt 下载 spk_stat.pt，将该文件复制到项目目录/models/pzc163/chatTTS/asset/ 文件夹内

12.关闭程序，重复步骤10，重新启动程序。启动成功后，自动跳转到浏览器打开本地网页

后台成功启动后状态↓：

初始页面↓：

#花絮

因为我的本地环境python版本是3.12，直接部署后启动一直报错：

`INFO:ChatTTS.core:Load from local: D:/tools/100AIGC/chatTTS-ui/models\pzc163\chatTTSWARNING:ChatTTS.utils.gpu_utils:No GPU found, use CPU insteadINFO:ChatTTS.core:use cpuINFO:ChatTTS.core:vocos loaded.INFO:ChatTTS.core:dvae loaded.Traceback (most recent call last):File "D:\tools\100AIGC\chatTTS-ui\app.py", line 45, inchat.load_models(source="local",local_path=CHATTTS_DIR)File "D:\tools\100AIGC\chatTTS-ui\ChatTTS\core.py", line 61, in load_modelsself._load(**{k: os.path.join(download_path, v) for k, v in OmegaConf.load(os.path.join(download_path, 'config', 'path.yaml')).items()}, **kwargs)File "D:\tools\100AIGC\chatTTS-ui\ChatTTS\core.py", line 102, in loadgpt.gpt.forward = torch.compile(gpt.gpt.forward, backend='inductor', dynamic=True)^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^File "D:\tools\100AIGC\chatTTS-ui\venv\Lib\site-packages\torch_init.py", line 1866, in compileraise RuntimeError("Dynamo is not supported on Python 3.12+")RuntimeError: Dynamo is not supported on Python 3.12+

我没做过编程，英语又不好，直接把错误丢给iflycode排查问题:)