我要投稿

在pyVideoTrans软件中使用

发布日期：2024-06-04 12:10:05 浏览次数： 1908

一个简单的本地网页界面，直接在网页使用 ChatTTS^[1] 将文字合成为语音，支持中英文、数字混杂，并提供API接口。

Releases中可下载Windows整合包^[2]。

界面预览

试听合成语音效果

中英数字混杂效果

Windows预打包版

1.从 Releases^[3]中下载压缩包，解压后双击 app.exe 即可使用

Linux 下容器部署

安装

1.拉取项目仓库

在任意路径下克隆项目，例如：

git clone https://github.com/jianchang512/ChatTTS-ui.git chat-tts-ui

2.启动 Runner

进入到项目目录：

cd chat-tts-ui

启动容器并查看初始化日志：

docker compose up -ddocker compose logs -f --no-log-prefix

3.访问 ChatTTS WebUI

启动:['0.0.0.0', '9966']，也即，访问部署设备的IP:9966即可，例如：

●本机：http://127.0.0.1:9966

●服务器: http://192.168.1.100:9966

更新

1.Get the latest code from the main branch:

git checkout maingit pull origin main

2.Go to the next step and update to the latest image:

docker compose downdocker compose up -d --builddocker compose logs -f --no-log-prefix

Linux 下源码部署

1.配置好 python3.9+环境

2.创建空目录 /data/chattts执行命令 cd /data/chattts && git clone https://github.com/jianchang512/chatTTS-ui.

3.创建虚拟环境 python3 -m venv venv

4.激活虚拟环境 source ./venv/bin/activate

5.安装依赖 pip3 install -r requirements.txt

6.如果不需要CUDA加速，执行 pip3 install torch torchaudio

如果需要CUDA加速，执行

pip install torch torchaudio --index-url https://download.pytorch.org/whl/cu118
pip install nvidia-cublas-cu11 nvidia-cudnn-cu11

另需安装 CUDA11.8+ ToolKit，请自行搜索安装方法或参考 https://juejin.cn/post/7318704408727519270

除CUDA外，也可以使用AMD GPU进行加速，这需要安装ROCm和PyTorch_ROCm版本。AMG GPU借助ROCm，在PyTorch开箱即用，无需额外修改代码。

i. 请参考https://rocm.docs.amd.com/projects/install-on-linux/en/latest/tutorial/quick-start.html 来安装AMD GPU Driver及ROCm.

ii. 再通过https://pytorch.org/ 安装PyTorch_ROCm版本。

     pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/rocm6.0

 安装完成后，可以通过rocm-smi命令来查看系统中的AMD GPU。也可以用以下Torch代码(query_gpu.py)来查询当前AMD GPU Device.

import torch
print(torch.__version__)
if torch.cuda.is_available():    device = torch.device("cuda")          # a CUDA device object    print('Using GPU:', torch.cuda.get_device_name(0))else:    device = torch.device("cpu")    print('Using CPU')
torch.cuda.get_device_properties(0)

使用以上代码，以AMD Radeon Pro W7900为例，查询设备如下。

$ python ~/query_gpu.py
2.4.0.dev20240401+rocm6.0
Using GPU: AMD Radeon PRO W7900

7.执行 python3 app.py启动，将自动打开浏览器窗口，默认地址 http://127.0.0.1:9966 (注意：默认从 modelscope 魔塔下载模型，不可使用代理下载，请关闭代理)

MacOS 下源码部署

1.配置好 python3.9+环境,安装git ，执行命令 brew install libsndfile git python@3.10继续执行

export PATH="/usr/local/opt/python@3.10/bin:$PATH"source ~/.bash_profile source ~/.zshrc

2.创建空目录 /data/chattts执行命令cd /data/chattts && git clone https://github.com/jianchang512/chatTTS-ui .3.创建虚拟环境 python3 -m venv venv4.激活虚拟环境 source ./venv/bin/activate5.安装依赖 pip3 install -r requirements.txt6.安装torch pip3 install torch torchaudio7.执行 python3 app.py 启动，将自动打开浏览器窗口，默认地址 http://127.0.0.1:9966 (注意：默认从 modelscope 魔塔下载模型，不可使用代理下载，请关闭代理)

Windows源码部署

1.下载python3.9+，安装时注意选中Add Python to environment variables2.下载并安装git，https://github.com/git-for-windows/git/releases/download/v2.45.1.windows.1/Git-2.45.1-64-bit.exe3.创建空文件夹 D:/chattts并进入，地址栏输入 cmd回车，在弹出的cmd窗口中执行命令 git clone https://github.com/jianchang512/chatTTS-ui .4.创建虚拟环境，执行命令 python -m venv venv5.激活虚拟环境，执行 .\venv\scripts\activate6.安装依赖,执行 pip install -r requirements.txt7.如果不需要CUDA加速，执行pip install torch torchaudio

如果需要CUDA加速，执行

pip install torch torchaudio --index-url https://download.pytorch.org/whl/cu118

另需安装 CUDA11.8+ ToolKit，请自行搜索安装方法或参考 https://juejin.cn/post/7318704408727519270

8.执行 python app.py 启动，将自动打开浏览器窗口，默认地址 http://127.0.0.1:9966(注意：默认从 modelscope 魔塔下载模型，不可使用代理下载，请关闭代理)

源码部署注意

1.源码部署启动后，会先从 modelscope下载模型，但modelscope缺少spk_stat.pt，会报错，请点击链接 https://huggingface.co/2Noise/ChatTTS/blob/main/asset/spk_stat.pt 下载 spk_stat.pt，将该文件复制到 项目目录/models/pzc163/chatTTS/asset/文件夹内`2.注意 modelscope 仅允许中国大陆ip下载模型，如果遇到 proxy 类错误，请关闭代理。如果你希望从 huggingface.co 下载模型，请打开 app.py 查看大约第50行-60行的注释。3.如果需要GPU加速，必须是英伟达显卡，并且安装 cuda版本的torch。pip install torch torchaudio --index-url https://download.pytorch.org/whl/cu118

# 默认从 modelscope 下载模型,如果想从huggingface下载模型，请将以下3行注释掉CHATTTS_DIR = snapshot_download('pzc163/chatTTS',cache_dir=MODEL_DIR)chat = ChatTTS.Chat()chat.load_models(source="local",local_path=CHATTTS_DIR)
# 如果希望从 huggingface.co下载模型，将以下注释删掉。将上方3行内容注释掉#os.environ['HF_HUB_CACHE']=MODEL_DIR#os.environ['HF_ASSETS_CACHE']=MODEL_DIR#chat = ChatTTS.Chat()#chat.load_models()

常见问题与报错解决方法

修改http地址

默认地址是http://127.0.0.1:9966,如果想修改，可打开目录下的 .env文件，将 WEB_ADDRESS=127.0.0.1:9966改为合适的ip和端口，比如修改为WEB_ADDRESS=192.168.0.10:9966以便局域网可访问

使用API请求 v0.5+

请求方法: POST

请求地址: http://127.0.0.1:9966/tts

请求参数:

text: str| 必须，要合成语音的文字

voice: int| 可选，默认 2222, 决定音色的数字， 2222 | 7869 | 6653 | 4099 | 5099，可选其一，或者任意传入将随机使用音色

prompt: str| 可选，默认空，设定笑声、停顿，例如 [oral_2][laugh_0][break_6]

temperature: float| 可选，默认 0.3

top_p: float| 可选，默认 0.7

top_k: int| 可选，默认 20

skip_refine: int| 可选，默认0， 1=跳过 refine text，0=不跳过

custom_voice: int| 可选，默认0，自定义获取音色值时的种子值，需要大于0的整数，如果设置了则以此为准，将忽略voice

返回:json数据

成功返回: {code:0,msg:ok,audio_files:[dict1,dict2]}

其中 audio_files 是字典数组，每个元素dict为 {filename:wav文件绝对路径，url:可下载的wav网址}

失败返回:

{code:1,msg:错误原因}

#API调用代码
import requests
res = requests.post('http://127.0.0.1:9966/tts', data={  "text": "若不懂无需填写",  "prompt": "",  "voice": "3333",  "temperature": 0.3,  "top_p": 0.7,  "top_k": 20,  "skip_refine": 0,  "custom_voice": 0})print(res.json())
#ok{code:0, msg:'ok', audio_files:[{filename: E:/python/chattts/static/wavs/20240601-22_12_12-c7456293f7b5e4dfd3ff83bbd884a23e.wav, url: http://127.0.0.1:9966/static/wavs/20240601-22_12_12-c7456293f7b5e4dfd3ff83bbd884a23e.wav}]}
#error{code:1, msg:"error"}

在pyVideoTrans软件中使用

升级 pyVideoTrans 到 1.82+ https://github.com/jianchang512/pyvideotrans

1.点击菜单-设置-ChatTTS，填写请求地址，默认应该填写 http://127.0.0.1:99662.测试无问题后，在主界面中选择ChatTTS

References

[1] ChatTTS: https://github.com/2noise/chattts
[2] Releases中可下载Windows整合包: https://github.com/jianchang512/ChatTTS-ui/releases
[3] Releases: https://github.com/jianchang512/chatTTS-ui/releases

53AI，企业落地应用大模型首选服务商

产品：大模型应用平台+智能体定制开发+落地咨询服务

承诺：先做场景POC验证，看到效果再签署服务协议。零风险落地应用大模型，已交付160+中大型企业

160+中大型企业正在使用53AI

立即咨询预约演示

百度智能云邀53AI：共创AI新纪元，启航智能新时代

2024-05-27

钉钉恒星计划：53AI与百余位企业家及钉钉生态伙伴，共议“AI 浪潮下的新机遇”

2024-05-22

热点资讯

最强 GPT 免费使用！GPT4O 开启多模态新时代！

2024-05-14

全民AI时代：手把手教你用Ollama & AnythingLLM搭建AI知识库，无需编程，跟着做就行！

2024-04-26

【开源看AI】4.9K star！Khoj：完美融合本地文档和在线网页的AI第二大脑

2024-05-22

OLLama详细的 api 介绍不完全指南 python 直接调用 OLLama api 翻译助手演示

2024-04-12

GraphRAG+Ollama 本地部署，保姆教程，踩坑无数，闭坑大法

2024-07-18

万字长文解析：大模型需要怎样的硬件算力

2024-03-30

微调神器LLaMA-Factory官方保姆级教程来了，从环境搭建到模型训练评估全覆盖

2024-05-10

开源项目Composio：突破 AI 智能体开发的边界

2024-08-13

更改ollama模型存储路径

2024-04-25

全面对比dify、coze、streamlit、chainlit

2024-04-26

大家都在问

疯狂星期四Qwen2.5开源，通义成了最Open的AI?

2024-09-20

在长上下文LLM的时代，RAG是否仍然必要？

2024-09-20

【AI赋能】揭秘大模型微调：如何让机器智能跃升一个台阶？

2024-09-19

从案例分析到客户沟通：AI提示词如何优化律师工作流程？

2024-09-19

o1 能带我们走进 AGI 吗？

2024-09-19

如何微调（Fine-tuning）大语言模型？

2024-09-18

AI软件必须用GPU么？

2024-09-18

ChatGPT有三个快捷指令和三个模式，你知道吗？

2024-09-17

开箱即用的企业大模型应用平台

工作+AI

业务+AI

AIx业务

大模型咨询

大模型定制

Windows预打包版

Linux 下容器部署

安装

更新

Linux 下源码部署

MacOS 下源码部署

Windows源码部署

源码部署注意

常见问题与报错解决方法

修改http地址

使用API请求 v0.5+

请求方法: POST

请求地址: http://127.0.0.1:9966/tts

请求参数:

返回:json数据

在pyVideoTrans软件中使用

升级 pyVideoTrans 到 1.82+ https://github.com/jianchang512/pyvideotrans

References

相关资讯

160+中大型企业正在使用53AI

百度智能云邀53AI：共创AI新纪元，启航智能新时代

钉钉恒星计划：53AI与百余位企业家及钉钉生态伙伴，共议“AI 浪潮下的新机遇”

热点资讯

最强 GPT 免费使用！GPT4O 开启多模态新时代！

全民AI时代：手把手教你用Ollama & AnythingLLM搭建AI知识库，无需编程，跟着做就行！

【开源看AI】4.9K star！Khoj：完美融合本地文档和在线网页的AI第二大脑

OLLama详细的 api 介绍 不完全指南 python 直接调用 OLLama api 翻译助手演示

GraphRAG+Ollama 本地部署，保姆教程，踩坑无数，闭坑大法

万字长文解析：大模型需要怎样的硬件算力

微调神器LLaMA-Factory官方保姆级教程来了，从环境搭建到模型训练评估全覆盖

开源项目Composio：突破 AI 智能体开发的边界

更改ollama模型存储路径

全面对比dify、coze、streamlit、chainlit

大家都在问

疯狂星期四Qwen2.5开源，通义成了最Open的AI?

在长上下文LLM的时代，RAG是否仍然必要？

【AI赋能】揭秘大模型微调：如何让机器智能跃升一个台阶？

从案例分析到客户沟通：AI提示词如何优化律师工作流程？

o1 能带我们走进 AGI 吗？

如何微调（Fine-tuning）大语言模型？

AI软件必须用GPU么？

ChatGPT有三个快捷指令和三个模式，你知道吗？

热门标签

OLLama详细的 api 介绍不完全指南 python 直接调用 OLLama api 翻译助手演示