我要投稿

我们一只脚已经踏入 AI 了

发布日期：2024-07-29 20:37:21 浏览次数： 2135

作者：MacTalk

微信搜一搜，关注“MacTalk”

用微信交流，如果你稍加留意的话，会发现这样一条规律：说话比打字快，看比听快。走在路上，给朋友发消息最快的方式是发一条语音。而此刻朋友正在上班，一看 60 秒的音频，很有压力.....他最快了解这条语音的方式是转文字，因为听音频需要 60 秒，而看完只需要 5 秒。

稍微延伸下，在内容生产领域也是如此——说总比写快很多、方便很多。有时候在路上，突然有个点子冒了出来，这时候，我会习惯于用语音的方式先记录下来。然后等到安静的时候再整理、修改为可读的文字。这就是语音的优势。

但这种方法最大的问题是从语音转为文字，还需要花一些时间。毕竟我们不是董宇辉，无法出口成章，说话时，总免不了口头禅和乱七八糟的口误。那借助 AI 的能力，我们能否把一段音频整理为可读的文字呢？

答案是可以的。

墨问上周正式发布了 AI 语音笔记特性。虽然当下类似的应用已经不少，但我们的功能在交互和整理方面会给大家焕然一新的感觉。

比如，墨问的 AI 语音笔记，可以支持单次 10 分钟的长度，你对着麦克风或者手机一直说，讲 10 分钟，在讲的过程中，文字会实时转换成语音的原文。当你按停止按钮时，AI 就会对文字进行润色和转写，比如去掉一些语气词，根据整体语义进行分段，并且修改错别字。

另外，墨问的 AI 语音笔记是支持流式输出的。比如你讲了 5 分钟，讲完后如果要等一分钟才能看到结果，这是非常不友好的交互。

我们的做法是，当你完成语音输入后，按下停止键，立刻就会得到 AI 润色的流式输出，你可以看到自己刚才讲的话，AI 写得对不对。如果不对，后续还可以进行修改。

很多人说自己不擅长文字，但能滔滔不绝地说。这种情况或许可以试试墨问的 AI 笔记功能，只要你能讲出来，那 AI 就一定能帮你整理出来。在 AI 初稿的基础上，你可以修改部分表达，最后形成一个完整的内容。

之前我在卖桃者说里写了一篇文章，叫做《AI 帮助我们跨越鸿沟》。我现在拍照，发现照片里有一些多余的元素，由于各种原因——自己技术上的或者当时场景不允许——没有剔除掉，我现在用 Lightroom 里的生成式 AI，就可以很容易地把这些不需要的元素去除掉。之前需要设计师花很长时间做这样的事情，现在我可以自己做。

在视频领域也是如此，我们有 AI 的工具，AI 的多模态能力帮助视频创作者去做更好的创作。

墨问就是创作者工具，我们专注的领域是文字、音频、图片。未来 AI 在这三个方面，应该能给我们更大的帮助，让我们有机会做出更多帮助用户提高创作效率，有效知识管理、分类，包括回顾和多次学习的种种功能。这是 AI 时代给我们的机会，墨问正好在做创作领域的工具，这是个非常好的契机。

特别说明：这篇文章的初稿，也是用墨问 AI 语音笔记生成的。欢迎体验，欢迎给我们反馈，目前这个功能是免费的。

进入首页后，长按“+”号按钮，选择语音模式，即可体验 AI 语音笔记。