AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


为了上手ChatGPT的全新交互形态Canvas,我深挖出了6个使用技巧
发布日期:2024-10-17 19:02:50 浏览次数: 1845 来源:卡尔的AI沃茨


 自两年前ChatGPT推出以来,我们首次从根本上改变了人类与ChatGPT合作的方式。 

这是 ChatGPT Canvas 项目负责人 Karina Nguyen 的原话。

Canvas!这个明摆着针对 Claude Artifacts ,摆脱了现有 GPTs 的交互方式,在原有对话界面上外置了一个独立的工作区。精细化是我对它的第一印象。

Canvas 跟 Artifacts 之间存在一个很大的区别:GPT 的侧边栏中的内容可以自由编辑,你甚至可以创建一个空的Canvas,将内容复制进去。

独立性更强,加上目前 Canvas 是通过你的输入来自行判断是否启动。在、使用上存在一定学习成本,所以我花了一天时间来深挖了6个 Canvas 的上手技巧。

  • 如何主动触发 Canvas ?
  • 用Canvas生成文本时,如何切换全局重写和局部更改 ?
  • 来回多次编辑后,如何用 Canvas 还原 ?
  • 如何解决 Canvas 的长度限制 ?
  • 在手机版上使用Canvas存在那些限制?语音模式兼容了吗 ?
  • 如何共享OpenAI、Cursor、Claude Artifacts的使用习惯 ?

我们先来快速回顾一下Canvas的功能:

Canvas 的发布绝对算是一个关键节点,光是这周 OpenAI 就上了三次“热搜”:

  • OpenAI 融资创纪录66亿美元,估值1570亿美元,但苹果拒绝投资。
  • OpenAI DevDay 2024上,竹筒倒豆子似的推出了一系列更新:实时语音 Realtime API、提示缓存、模型蒸馏、视觉模型微调等。
  • 最意外的是,Sora 团队负责人 Tim Brooks 跑路了,还加入了竞争对手谷歌 DeepMind。

这个节骨眼上,OpenAI决定放出Canvas(后面我们也会称之为画布),

还隐约放出了终极 AGI 的设计图:

 我心目中的终极 AGI 界面是一张空白画布。它会随着人类的偏好不断演变,自我变形,并创造出与人类互动的新颖方式,重新定义我们与 AI 技术及整个互联网的关系。 

看得出来 OpenAI 并不想仅仅成为平台或者服务提供商,它要把上下游都握在手里。

目前,ChatGPT Plus 和 Team 用户可以直接使用 Canvas。企业和教育版用户将在下周获得访问权限。测试结束后,我们计划向所有 ChatGPT 免费用户推出 Canvas。Canvas 不像 GPTs,它将直接跳过漫长的付费需求,直接开放给所有人。

Canvas目前定位是新的写作、编程协作工具

写作功能包括:文本编辑建议、调整文章长度、更改阅读级别(从幼儿园到研究生院调整阅读级别)、润色(检查语法、清晰度和一致性)、添加表情符号。

编程功能包括:审查代码、添加日志、添加注释、修复错误、移植到其他语言。

那么多好用的功能就该多用嘛!可惜目前 Canvas 不是百分百触发,OpenAI 使用 o1-preview 生成大量合成数据,模拟许多不同的潜在用户与 Canvas 的交互,进而让 4o 自己决定何时触发画布。

这就很尴尬了,除非你要求 GPT 写一篇博文,不然 Canvas 不会响应你。


所以我们第一个技巧就是如何主动触发 Canvas,

谜底就在谜面上,只需输入“Use canvas to…”或类似的提示即可...

你可以直接编辑画布内容。不再需要将 ChatGPT 生成的内容复制粘贴到另一个平台中进行更改。

这时候编辑文本通常分两种情况,全局重写 or 局部更改

按照之前的使用习惯,我将直接向GPT发消息视为全局重写,右下角Canvas自带的所有功能看作是局部更改的入口。实际上想要局部更新,是要通过划词方式进行,且目前不能一次性选择多段文本后应用某一功能。

你甚至可以让 OpenAI 生成一个新信息的说明,就拿今天 Meta 发布的类Sora期货 Meta Movie Gen来说,

预览收集到的信息同时,你还能选中部分点击询问ChatGPT进行追问,问答过程会显示在左侧的聊天窗口,且不会修改原文。你可以将所有注意力都集中在原文,而不是在来回问答的途中,因为模型长度限制导致内容缺失,有效避免了阅读过程的中断。

顺带一提,前天的图片无法上传的Bug已经被修复了。

小遗憾的是,跟Claude Artifact相比,我们目前无法在 GPT 里直接运行代码,并在 Canvas 中预览。不过这点我挺看好的,Canvas 很明显是留了预览的口子,可能会在几个月内就会迎来更新。

因为目前 Canvas 会直接覆盖原文,但我进行文本编程过程经常会甲方附体。尤其是模型会越改越傻,我就会往回翻对话记录来找到之前修改的版本。

所以我尝试了几种方法来复原

复原操作只会在局部修改的时候生效,你需要选择上一次修改的文本,并向GPT提需求,最多可以还原前3次左右的修改。(次数仅供参考,大概率还是跟模型上下文长度挂钩)。

当我玩的起劲的时候,碰到 Canvas 开始自我删除

上面在生成,下面在删减?,以为生成的文章越来越长,实际原地踏步

这个问题也有解决方法!

主动要求 GPT 创建多个 Canvas 文件就可以了。不过这个方法并不是每次都能稳定复现的。

大家应该也有留意到我用到了NoteBookLM作为案例,

所以我好奇,GPT的语音模型能不能跟 Canvas 联动,做一个平替版出来,

虽然目前手机端还不能主动选择 Canvas 来新建对话,但我们可以通过进入历史对话来间接使用。



不过目前手机端的 Canvas 只会显示最新版本的内容,在打开以编写代码为主的 Canvas时,还会出现加载失败。

更扯的是,语音模型可以打开,但是无法读取 Canvas 里的内容。

这点我蹲一波后续的更新,并且现在手机端因为页面要反复打开关闭,体现不出来 Canvas 作为外置工作区的优势。

最后,我想回到一个简单的问题:

 Canvas 是不是真的改变了我的 AI 使用习惯? 

这个视频里横向对比了 OpenAI Canvas、Cursor、Claude Artifacts 的文本编辑功能,

我可以直接给出结论,它们的使用经验是可以被共享的,你会从主流的 AI 工具们感受到从单一对话形式的转变。

不同于 Cursor 给用户一个二次确认的按钮,也区别于 Artifacts 的大部分情况下给你全部重写了,Canvas很讨好的取了个中间值。它默认給你都改好了,你可以通过我上面说的技巧们,来复原、来问答等等。

OpenAI 终于开始用心做交互了。


写在最后

几周前,OpenAI 用 o1 超越了 Claude Sonnet。

现在,Canvas 试图击败 Artifacts。

或许下一步开始,

我们就不需要软件了,在 Canvas 中完成文字和代码、在代码解释器里实现电子表格和数据分析、图像生成就交给 DALL-E。

GPT 将脱下对话机器人这层壳,成为新的操作系统。

我想,

我准备好重新订阅 GPT 了!


53AI,企业落地应用大模型首选服务商

产品:大模型应用平台+智能体定制开发+落地咨询服务

承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询