我要投稿

在pyVideoTrans软件中使用

发布日期：2024-06-02 08:48:46 浏览次数： 1719

一个简单的本地网页界面，直接使用ChatTTS将文字合成为语音，同时支持对外提供API接口。

Github：https://github.com/jianchang512/ChatTTS-ui

亲爱的读者朋友们，你们好。书接上回啊，前天介绍了ChatTTS ，今天介绍它的本地化安装方式以及API调用，有API真的是帮大忙了，就可以随心操作了，往期文章在这里，话不多说，今天这个ChatTTS-ui也是一个开源项目

6k Star！ChatTTS：开源领域最强的文本到语音转换（TTS）模型！

2024-05-30

‍‍

除此以外，第3个项目是：Ollama ChatTTS 是与 ChatTTS & ChatTTS WebUI & API 项目绑定的扩展项目，通过调用 ChatTTS API 接口功能，使用 Streamlit 作为 Web 界面的前端库。

https://github.com/hkgood/Ollama_ChatTTS‍‍

ChatTTS Web界面与API

这是一个能让你在网页上直接使用ChatTTS进行语音合成的项目，还提供API接口供你调用，项目地址在GitHub。

试听合成语音效果

Windows预打包版

1. 从Releases页面下载压缩包。
2. 解压后双击 app.exe 就能用了。

Linux下源码部署

1. 配置 python3.9+ 环境。
2. 创建空目录 /data/chattts，执行命令 cd /data/chattts && git clone https://github.com/jianchang512/chatTTS-ui .。
3. 创建虚拟环境 python3 -m venv venv。
4. 激活虚拟环境 source ./venv/bin/activate。
5. 安装依赖 pip3 install -r requirements.txt。
6. 如果不需要CUDA加速，执行 pip3 install torch torchaudio。如果需要CUDA加速，执行：

pip install torch torchaudio --index-url https://download.pytorch.org/whl/cu118
pip install nvidia-cublas-cu11 nvidia-cudnn-cu11

另需安装 CUDA11.8+ ToolKit，请自行搜索安装方法或参考 https://juejin.cn/post/7318704408727519270。

7. 执行 python3 app.py 启动，将自动打开浏览器窗口，默认地址 http://127.0.0.1:9966。

MacOS下源码部署

1. 安装python3.9+和git。
2. 创建目录 /data/chattts，运行 git clone https://github.com/jianchang512/chatTTS-ui .。
3. 创建并激活虚拟环境 python3 -m venv venv 和 source ./venv/bin/activate。
4. 安装依赖 pip3 install -r requirements.txt 和 pip3 install torch torchaudio。
5. 启动程序 python3 app.py，浏览器会自动打开 http://127.0.0.1:9966。
6. 如果遇到问题，可以查看常见问题与报错解决方法。

Windows源码部署

1. 安装python3.9+和git。
2. 创建目录 D:/chattts，在该目录下运行 git clone https://github.com/jianchang512/chatTTS-ui .。
3. 创建并激活虚拟环境 python -m venv venv 和 .\venv\scripts\activate。
4. 安装依赖 pip install -r requirements.txt。
5. 启动程序 python app.py，浏览器会自动打开 http://127.0.0.1:9966。

源码部署注意事项

1. 部署后需下载 spk_stat.pt 并放入 项目目录/models/pzc163/chatTTS/asset/ 文件夹内。
2. 如果遇到proxy错误，关闭代理。想从huggingface.co下载模型，可修改 app.py 中相应的注释。

常见问题与报错解决方法

修改HTTP地址

默认地址是 http://127.0.0.1:9966，可通过修改 .env 文件中的 WEB_ADDRESS 来更改。

使用API请求

请求方法: POST
请求地址: http://127.0.0.1:9966/tts
请求参数:

• text: str 必须，要合成语音的文字
• voice: int 可选，默认 2222, 决定音色的数字
• prompt: str 可选，设定笑声、停顿
• temperature: float 可选，默认 0.3
• top_p: float 可选，默认 0.7
• top_k: int 可选，默认 20
• skip_refine: int 可选，默认0
• custom_voice: int 可选，默认0，自定义音色种子值

返回: json数据

• code=0 成功，返回文件名和可下载网址
• code=1 失败，返回错误原因

示例代码：

import requests

res = requests.post('http://127.0.0.1:9966/tts', data={"text": "你好啊亲爱的朋友。[laugh]", "voice": 2222, "prompt": '[oral_2][laugh_0][break_6]'})
print(res.json())

# 成功
{code: 0, msg: 'ok', filename: '1.wav', url: 'http://${location.host}/static/wavs/1.wav'}

# 错误
{code: 1, msg: "error"}

在pyVideoTrans软件中使用

1. 升级 pyVideoTrans 至 1.82+，点击菜单-设置-ChatTTS，填写请求地址 http://127.0.0.1:9966。
2. 测试无问题后，在主界面中选择 ChatTTS。

53AI，企业落地应用大模型首选服务商

产品：大模型应用平台+智能体定制开发+落地咨询服务

承诺：先做场景POC验证，看到效果再签署服务协议。零风险落地应用大模型，已交付160+中大型企业

160+中大型企业正在使用53AI

立即咨询预约演示

百度智能云邀53AI：共创AI新纪元，启航智能新时代

2024-05-27

钉钉恒星计划：53AI与百余位企业家及钉钉生态伙伴，共议“AI 浪潮下的新机遇”

2024-05-22

热点资讯

最强 GPT 免费使用！GPT4O 开启多模态新时代！

2024-05-14

全民AI时代：手把手教你用Ollama & AnythingLLM搭建AI知识库，无需编程，跟着做就行！

2024-04-26

【开源看AI】4.9K star！Khoj：完美融合本地文档和在线网页的AI第二大脑

2024-05-22

OLLama详细的 api 介绍不完全指南 python 直接调用 OLLama api 翻译助手演示

2024-04-12

GraphRAG+Ollama 本地部署，保姆教程，踩坑无数，闭坑大法

2024-07-18

万字长文解析：大模型需要怎样的硬件算力

2024-03-30

微调神器LLaMA-Factory官方保姆级教程来了，从环境搭建到模型训练评估全覆盖

2024-05-10

开源项目Composio：突破 AI 智能体开发的边界

2024-08-13

更改ollama模型存储路径

2024-04-25

全面对比dify、coze、streamlit、chainlit

2024-04-26

大家都在问

疯狂星期四Qwen2.5开源，通义成了最Open的AI?

2024-09-20

在长上下文LLM的时代，RAG是否仍然必要？

2024-09-20

【AI赋能】揭秘大模型微调：如何让机器智能跃升一个台阶？

2024-09-19

从案例分析到客户沟通：AI提示词如何优化律师工作流程？

2024-09-19

o1 能带我们走进 AGI 吗？

2024-09-19

如何微调（Fine-tuning）大语言模型？

2024-09-18

AI软件必须用GPU么？

2024-09-18

ChatGPT有三个快捷指令和三个模式，你知道吗？

2024-09-17

开箱即用的企业大模型应用平台

工作+AI

业务+AI

AIx业务

大模型咨询

大模型定制

https://github.com/hkgood/Ollama_ChatTTS‍‍

ChatTTS Web界面与API

Windows预打包版

Linux下源码部署

MacOS下源码部署

Windows源码部署

源码部署注意事项

常见问题与报错解决方法

修改HTTP地址

使用API请求

在pyVideoTrans软件中使用

相关资讯

160+中大型企业正在使用53AI

百度智能云邀53AI：共创AI新纪元，启航智能新时代

钉钉恒星计划：53AI与百余位企业家及钉钉生态伙伴，共议“AI 浪潮下的新机遇”

热点资讯

最强 GPT 免费使用！GPT4O 开启多模态新时代！

全民AI时代：手把手教你用Ollama & AnythingLLM搭建AI知识库，无需编程，跟着做就行！

【开源看AI】4.9K star！Khoj：完美融合本地文档和在线网页的AI第二大脑

OLLama详细的 api 介绍 不完全指南 python 直接调用 OLLama api 翻译助手演示

GraphRAG+Ollama 本地部署，保姆教程，踩坑无数，闭坑大法

万字长文解析：大模型需要怎样的硬件算力

微调神器LLaMA-Factory官方保姆级教程来了，从环境搭建到模型训练评估全覆盖

开源项目Composio：突破 AI 智能体开发的边界

更改ollama模型存储路径

全面对比dify、coze、streamlit、chainlit

大家都在问

疯狂星期四Qwen2.5开源，通义成了最Open的AI?

在长上下文LLM的时代，RAG是否仍然必要？

【AI赋能】揭秘大模型微调：如何让机器智能跃升一个台阶？

从案例分析到客户沟通：AI提示词如何优化律师工作流程？

o1 能带我们走进 AGI 吗？

如何微调（Fine-tuning）大语言模型？

AI软件必须用GPU么？

ChatGPT有三个快捷指令和三个模式，你知道吗？

热门标签

OLLama详细的 api 介绍不完全指南 python 直接调用 OLLama api 翻译助手演示