微信扫码
与创始人交个朋友
我要投稿
大胆梦想,并勇于面对失败。
by Norman Vaughan
┃AI应用介绍
ChatTTS是一个开源的文本转语音(TTS)项目,在Github上线4天斩获1.19万颗星的超级新秀。它能够将文本转换成语音,并且支持中文和英文两种语言。
这次体验的ChatTTS-ui是开源社区的贡献者 jianchang512为 ChatTTS 创建了 Web 界面和 API 接口,使得用户可以通过网页直接使用 ChatTTS 的合成语音功能,并且支持 Windows、Linux、macOS 系统部署。Windows 用户甚至可以下载一个安装包,实现一键安装和开箱即用 。
但我这次是基于ChatTTS-ui源码安装,这样在运行过程中能看到过程数据,更能了解一些机理,也能体会些折腾的快乐。
需要注意的是,ChatTTS还存在不少问题,音色生成不稳定,长文本处理不连贯自然,我在加入一些参数时,还会报一些异常错误。
#AI应用-012 ChatTTS-ui:合成语音功能的开源项目
即便过了四十岁的年纪
你还记得曾经一位少年说的话
你想做一个有趣的人
儿童节快乐
成年人
合成后的音频↓
下面介绍我的部署过程,供参考
┃部署环境
OS: Windows 11
Python版本:3.9~3.11(不要用3.12,会报错,含泪亲测)
GPU:有
部署方式:使用conda创建一个纯净python3.11环境,通过源码部署(windows有直接的安装包,想直接体验的可以到项目地址上找到安装包地址下载体验)
Github项目地址:https://github.com/jianchang512/ChatTTS-ui
┃我的部署过程
1.创建一个独享的python环境,使用
conda create -n ChatTTSui python=3.11
2.激活python 环境
conda activate ChatTTSui
3.下载项目仓库到本地(需要爬梯)
git clone https://github.com/jianchang512/chatTTS-ui.git
4.进入已经下载下来的本地项目仓库(文件夹)
cd chatTTS-ui
5.创建虚拟环境
python -m venv venv
6.激活虚拟环境
.\venv\scripts\activate
7.安装依赖库
pip install -r requirements.txt
8.安装CUDA加速组件(如果不需要,则执行 pip install torch torchaudio)
pip install torch torchaudio --index-url https://download.pytorch.org/whl/cu118
9.安装CUDA11.8+ ToolKit(自行搜索下载)、
10.启动程序
python app.py
将自动打开浏览器窗口,默认地址 http://127.0.0.1:9966启动成功。
11.源码部署启动后,会先从 modelscope下载模型,但modelscope缺少spk_stat.pt,会报错,请点击链接 https://huggingface.co/2Noise/ChatTTS/blob/main/asset/spk_stat.pt 下载 spk_stat.pt,将该文件复制到 项目目录/models/pzc163/chatTTS/asset/ 文件夹内
12.关闭程序,重复步骤10,重新启动程序。启动成功后,自动跳转到浏览器打开本地网页
后台成功启动后状态↓:
初始页面↓:
#花絮
因为我的本地环境python版本是3.12,直接部署后启动一直报错:
`INFO:ChatTTS.core:Load from local: D:/tools/100AIGC/chatTTS-ui/models\pzc163\chatTTSWARNING:ChatTTS.utils.gpu_utils:No GPU found, use CPU insteadINFO:ChatTTS.core:use cpuINFO:ChatTTS.core:vocos loaded.INFO:ChatTTS.core:dvae loaded.Traceback (most recent call last):File "D:\tools\100AIGC\chatTTS-ui\app.py", line 45, inchat.load_models(source="local",local_path=CHATTTS_DIR)File "D:\tools\100AIGC\chatTTS-ui\ChatTTS\core.py", line 61, in load_modelsself._load(**{k: os.path.join(download_path, v) for k, v in OmegaConf.load(os.path.join(download_path, 'config', 'path.yaml')).items()}, **kwargs)File "D:\tools\100AIGC\chatTTS-ui\ChatTTS\core.py", line 102, in loadgpt.gpt.forward = torch.compile(gpt.gpt.forward, backend='inductor', dynamic=True)^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^File "D:\tools\100AIGC\chatTTS-ui\venv\Lib\site-packages\torch_init.py", line 1866, in compileraise RuntimeError("Dynamo is not supported on Python 3.12+")RuntimeError: Dynamo is not supported on Python 3.12+
我没做过编程,英语又不好,直接把错误丢给iflycode排查问题:)
同时在github该项目上传了错误信息,没想到很快得到了作者的回复,随后规规矩矩用python3.11版本重新安装一遍,这才有了上述步骤。
Done!
祝各位大朋友们,儿童节快乐!
53AI,企业落地应用大模型首选服务商
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-12-23
2025年AI大模型的趋势与洞察
2024-12-23
阶跃星辰完成数亿美元 B 轮融资,发力「超级模型」+「超级应用」
2024-12-23
百川智能发布全链路领域增强金融大模型Baichuan4-Finance,金融能力领先GPT-4o近20%
2024-12-22
AI“落地”系列——Agent
2024-12-22
LAMBO:AI大模型赋能边缘智能
2024-12-22
如何从头建立一个通用AI智能体应用?
2024-12-22
不是炒作GenAI!终于有 BERT 的替代品了
2024-12-21
Anthropic最新:AI Agents 2024年度总结!
2024-05-28
2024-04-26
2024-08-13
2024-08-21
2024-07-09
2024-08-04
2024-06-13
2024-04-11
2024-07-18
2024-07-01