微信扫码
与创始人交个朋友
我要投稿
在AI热出现后,语音合成类型的软件也变得多了起来,用来实时变声的,进行声音克隆的等等,用来做视频和网络内容时能轻松很多。
网络也出现了很多免费开源的项目,有人又在开源的基础上制作出“一键整合包”,现在想要使用一些AI相关的功能,下载解压节能用,在安装阶段能节省不少时间。
今天体验的这款“EmotiVoice 易魔声 文本生成语音”就是一款开箱即用,可以进行多角色文本配音的工具,音色也非常多(有几千个)。
那么代价是什么呢?代价就是它的体积很大,把近6个G的文件下载解压后,就能看到它包含一个“一键启动.bat”的脚本,直接点开。
会弹出一个命令框,不用理会内容直接回车,它会自己打开一个本地使用界面。
简单说一下使用方法,单句合成就是平常使用的普通音频合成,把需要合成的内容放进文本框,选择说话的AI就行,里面每个角色都标注了性别(有的可能是错的,需要自己听一下),光是筛选出自己喜欢的声音,都需要花上一点时间。
因为它的角色很多,来看看这望不到头的滚动列表。
除了声音种类多,它还可以进行7种情绪变化,弄出的来效果会更丰富。
生成一段音频后,可以直接在页面上试听和下载,由于速度还挺快,觉得效果不好反复尝试也不会太麻烦。
有了情绪变化和多发音人,就可以进行故事剧本的配音了。下面还有一个不同的文本内容输入框,在上方按照格式「角色:内容」编辑好之后,会自动分解角色和台词列表。
下方的分解列表是自动生成的,不需要自己手动填写,在上方内容修改之后,按下“Ctrl + 回车”就会同步内容,你需要做的是手动更改每句话的情绪。
在编辑好之后,可以给角色分配一个发言的音色,点击合成就能输出指定的音频了。
使用起来很简单,这个工具完全免费,它本身是基于网易的开源TTS引擎项目EmotiVoice易魔声,项目介绍里说的是:支持中英文双语,包含2000多种不同的音色,以及特色的情感合成功能,支持合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音。
感觉还不错,比网页工具的适用面更广一些,没有网也能用,算是为开源工具增添了一些功能,有需要的小伙伴,又可以喜提一份“大粽子”了。
53AI,企业落地应用大模型首选服务商
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-11-14
手把手教你开发Agent:聊聊DB-GPT Agent的架构设计、源码解读和实战开发
2024-11-14
Alibaba开源UReader:通用免OCR文档理解
2024-11-13
这家小公司的700 亿参数模型竟然比Open o1还强?
2024-11-13
通义牛逼!!比肩Chatgpt-4o 还自带 Artifact
2024-11-13
Ollama 更新!本地跑 LLama3.2,轻量级+视觉能力,能媲美GPT-4o?
2024-11-13
开源版SearchGPT来了,两张3090就可复现,超越Perplexity付费版
2024-11-12
字节跳动AI社区新动作:炉米Lumi,一站式模型共创平台揭秘
2024-11-12
我们是这样做大模型应用的(文末有惊喜)
2024-05-06
2024-08-13
2024-07-25
2024-06-12
2024-06-16
2024-07-11
2024-07-20
2024-06-15
2024-07-25
2024-07-25
2024-11-13
2024-11-13
2024-10-07
2024-09-22
2024-09-20
2024-09-14
2024-09-14
2024-09-12