AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


我们一只脚已经踏入 AI 了
发布日期:2024-07-29 20:37:21 浏览次数: 1809 来源:MacTalk


用微信交流,如果你稍加留意的话,会发现这样一条规律:说话比打字快,看比听快。走在路上,给朋友发消息最快的方式是发一条语音。而此刻朋友正在上班,一看 60 秒的音频,很有压力.....他最快了解这条语音的方式是转文字,因为听音频需要 60 秒,而看完只需要 5 秒。

稍微延伸下,在内容生产领域也是如此——说总比写快很多、方便很多。有时候在路上,突然有个点子冒了出来,这时候,我会习惯于用语音的方式先记录下来。然后等到安静的时候再整理、修改为可读的文字。这就是语音的优势。

但这种方法最大的问题是从语音转为文字,还需要花一些时间。毕竟我们不是董宇辉,无法出口成章,说话时,总免不了口头禅和乱七八糟的口误。那借助 AI 的能力,我们能否把一段音频整理为可读的文字呢?

答案是可以的。

墨问上周正式发布了 AI 语音笔记特性。虽然当下类似的应用已经不少,但我们的功能在交互和整理方面会给大家焕然一新的感觉。

比如,墨问的 AI 语音笔记,可以支持单次 10 分钟的长度,你对着麦克风或者手机一直说,讲 10 分钟,在讲的过程中,文字会实时转换成语音的原文。当你按停止按钮时,AI 就会对文字进行润色和转写,比如去掉一些语气词,根据整体语义进行分段,并且修改错别字。
另外,墨问的 AI 语音笔记是支持流式输出的。比如你讲了 5 分钟,讲完后如果要等一分钟才能看到结果,这是非常不友好的交互。
我们的做法是,当你完成语音输入后,按下停止键,立刻就会得到 AI 润色的流式输出,你可以看到自己刚才讲的话,AI 写得对不对。如果不对,后续还可以进行修改。
很多人说自己不擅长文字,但能滔滔不绝地说。这种情况或许可以试试墨问的 AI 笔记功能,只要你能讲出来,那 AI 就一定能帮你整理出来。在 AI 初稿的基础上,你可以修改部分表达,最后形成一个完整的内容。
之前我在卖桃者说里写了一篇文章,叫做《AI 帮助我们跨越鸿沟》。我现在拍照,发现照片里有一些多余的元素,由于各种原因——自己技术上的或者当时场景不允许——没有剔除掉,我现在用 Lightroom 里的生成式 AI,就可以很容易地把这些不需要的元素去除掉。之前需要设计师花很长时间做这样的事情,现在我可以自己做。
在视频领域也是如此,我们有 AI 的工具,AI 的多模态能力帮助视频创作者去做更好的创作。
墨问就是创作者工具,我们专注的领域是文字、音频、图片。未来 AI 在这三个方面,应该能给我们更大的帮助,让我们有机会做出更多帮助用户提高创作效率,有效知识管理、分类,包括回顾和多次学习的种种功能。这是 AI 时代给我们的机会,墨问正好在做创作领域的工具,这是个非常好的契机。

特别说明:这篇文章的初稿,也是用墨问 AI 语音笔记生成的。欢迎体验,欢迎给我们反馈,目前这个功能是免费的。

进入首页后,长按“+”号按钮,选择语音模式,即可体验 AI 语音笔记。



53AI,企业落地应用大模型首选服务商

产品:大模型应用平台+智能体定制开发+落地咨询服务

承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询