AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


(一)Notion CEO:为什么RAG会彻底改变知识型工作?
发布日期:2024-03-15 16:44:27 浏览次数: 1669 来源:海外独角兽

01.


AI 是 Notion 的机会


 Sarah Guo :你会怎么定义 Notion?


Ivan Zhao:Notion 很难被定义,因为它可以被用来做很多事情,但我们本身也希望打造一个全能的工具,用户可以用它来完成日常生活中的大部分任务,比如个人用户可以用 Notion 来记笔记、做旅行规划、婚礼统筹等,企业用户也可以只通过 Notion 这一个工具就完成文档管理、任务追踪以及内部知识库的构建等。我们之所以想做这件事是因为现在市面上有大量的 SaaS 软件工具、市场相当分散,但也许对于用户来说如果一个产品能让他们 all-in-one 地完成大部分工作是一件好事。


Notion 实现这个目标的方式并不是把很多功能塞进一个具体的产品里,而是去构建更底层的 block,用户可以像搭建乐高积木一样,用这些 blocks 来创造性地做出各种各样完美符合个人或团队需求的用例。


其实 Notion 在做的这件事并不新,因为在上世纪 80 年代、甚至 70 年代人们就讨论过用 block 逻辑来构建软件这件事。到了今天,我们只不过是在云和 AI 的支持下去实现这件事、打破过去以具体功能导向的软件的限制。


 Sarah Guo :确实在过去 20 年我们一直处于过度分散的 SaaS 世界中,理论上,做一个通用的工具应该是自然而然的趋势,但为什么没有人来做这件事?


Ivan Zhao:其实人们已经从很多角度进行过尝试。比如最近很流行的 No-code 就是从个人开发者角度来想这件事,No-code 让每个人都能修改他们日常使用的软件工具。Language model 提供了另外一个角度,就是底层知识和数据的管理需要被统一起来。宏观也是一个视角,因为如果考虑预算的话,和支付 5 个 SaaS 软件的费用相比,只给一个供应商付费显然要更能节省开支。


我认为 Notion 更多是从计算、内容或者说文本相关角度出发来想这件事。比如我们所有人都会阅读和写作,但对于绝大多数人而言,电脑只是一台打字机或者看 YouTube 的工具,本身并不具有创造力。如果更多的人能够更具创造性地使用他们的软件,可能情况就会不一样。创造软件的人和用软件的人提供的价值是完全不同的,这也是旧金山房租如此昂贵的重要原因。


计算机领域的先驱们在很早之前已经讨论过这件事,他们认为操控计算机有一天会像识字一样普及,不过他们当时可能完全没想到 AI 会成为一个有趣的变量,language model 不仅可以创造软件,还可以帮人们完成大量思考相关的工作。接下来的发展会相当有趣。


图片


 Sarah Guo :你经常提到 Notion 不仅是一个生产力工具,更是一个应用构建平台。你是如何想到这个观点的?为什么你认为人们想要去搭建更多的应用?


Ivan Zhao:我并不认为人们想搭建更多的应用。


Notion 的诞生源于我在大学时读过的一篇论文, Douglas Engelbart 的 Augmenting Human Intellect: A Conceptual Framework。今天人们使用软件通常情况下都是具体一款产品对应一类具体任务,但在计算机刚出现的时候,比如 60、70、80 年代,人们使用电脑的方式要更加灵活,我们可以进入到系统层面进行调整,甚至是在操作系统正在运行的时候,实时地对其进行修改或调整。这件事对我的启发很大。


今天,人们在使用电脑、和软件交互的方式有时候会显得很死板,那么我们能不能创造一种全新的软件,让人们可以去灵活调整和定制?这就是我们创立 Notion 的初衷,我们其实在重新审视计算机领域的先驱们当年讨论过的议题。


你刚刚也提到,大多数人并不想创建软件,更多的是完成老板分配的任务即可。所以,我们在创立 Notion 过程中学到的经验以及由此带来的一个转变是,相较于提供一个构建软件的工具,更好的方式是提供给用户各种各样的 blocks 构建的模板,让用户上手即用。


图片


 Elad Gil :AI 对这个目标带来了什么样的影响?


Ivan Zhao:我认为 Notion 还是很幸运的,我们其实没有特别专注于某个具体用例的搭建,我们的重点一直是放在构建这些用例的乐高积木块上面,这些“积木”中既有文档编辑这类最基础层的“积木”,很我们还推出了关系型数据库(Relational database),表格、评论以及不同的访问权限等等也是很重要的“积木块”。过去 5 年时间我们一直在构建这些积木。


AI 更像是一个以新的方式来组合、驱动这些积木块的新引擎,也正因为我们一直在构建、完善这些积木块,我们才可以迅速把 AI 和已有功能结合起来。我们之所以是市面上大规模推出 AI 协作的软件之一,是因为我们已经在文本编辑器上花了很多年时间,也因为我们已经做了关系型数据库,所以我们可以把 AI 和数据库结合起来,我们能够快速推出 Notion Q&A 也是因为我们在知识库产品上的投入。我们能把 RAG 应用到 Notion 的产品中也是因为我们做了各种各样的“乐高积木块”,AI 对于 Notion 是一个特别好的机会,而我们正好抓住了这个机会。


 Elad Gil :Notion 已经构建了很多核心模板和用例,比如项目管理工具、知识库等等,在它们之中,你认为有哪些功能受 AI 的影响最大?

Ivan Zhao:我认为 RAG 会彻底改变知识管理的方式,让人们摆脱繁琐的信息组织工作。Notion 最受人喜爱的功能之一是侧边栏,人们会用它整理知识库和个人 workspace。但以后我们可能不再需要这样的工具来组织知识库了。用户只要简单地将信息丢到 Notion 中,就可以通过各种方式进行检索。这就是知识管理的未来。


图片


 Sarah Guo :在 PC 时代发展早期,当时人们会讨论 30 或 40 年后,PC 带来的最大变化会是什么?今天你对 AI 未来的发展有什么期待?


Ivan Zhao:对于 AGI 来说,时间尺度放在 30 或者 40 年可能有点太久了,甚至不用等到下一个 10 年,在未来 1-2 年内 AI 就会有明显突破。这之中我认为一个被低估的领域是 RAG。


今天 language model 已经能够很好地理解人们输入到计算机中的内容了,这意味着我们不需要再自己去做信息的组织来方便未来对信息的检索,AI 在这件事上做得比任何人类都要好。


在 language model 之前,我们要在知识库搜索一些内容通常需要很精确的关键词,甚至有些时候还要询问同事是否记得某个序列、某个信息存放的数据库是哪个。但现在可以直接询问 Notion AI 想要搜寻的问题,很快 AI 就会给到答案,这是我个人很兴奋的一个应用场景,不少人也在讨论。另外一个我认为很值得期待的是 Work Agent,这个领域也已经开始有很多人关注到了。




02.


Notion AI 的诞生


 Sarah Guo :Notion AI 的进展相当快,尤其和很多还不知道如何运用 AI 的产品比。这个过程中你们是如何做决策以及进行资源分配的?


Ivan Zhao:我和 Simon 对 AI 都有足够强的 conviction,我们早些年去 OpenAI 的办公室时,根本不理解这家公司在做的事情是什么,但当时我们已经见过很早期的 GPT 的 demo。


必须承认的是,GPT-3 刚出现的时候我是轻视了这件事的。虽然 GPT-3 已经可以帮助人们进行市场营销策划、完成初稿写作,但我并不认为这能有多大用处,直到我看到 GPT-4 的能力我的想法才发生了转变,我发现 GPT-4 已经可以思考、推理,可以完成各种各样的事情,可以更加实际地优化工作流。GPT-4 对我影响很大,它给了我很多信心,我也因此觉得这会是一个巨大的转折点。


什么是知识型工作?人们为什么需要软件?从根本上说,软件就是我们所有人的信息处理活动,就像一张纸传到面前,人类改变几个字,然后推送给另一个人。在某种程度上,language model 已经可以帮助我们完成这种信息处理。所以,我相信这将完全改变我们与计算机的交互模式。


在那之后,我们团队基本上就全身心投入到 AI 项目中了。我们已经搭建好了很多积木,接下来就是弄清楚哪些积木可以与 AI 相结合,以及公司内部谁对这项技术有深入了解。虽然我们有搜索团队,但我们的 ML 团队并不大,所以,我们还需要招聘更多的人才,与此同时还要让公司内部的人对这项技术有共同的信念,这样我们才能朝着同一个方向前进。我们就像面临小行星撞击地球的恐龙一样,需要为即将到来的巨变做准备。


 Elad Gil :为了让 Notion 成为一个 AI-first 的产品,你们在团队层面做了哪些工作?


Ivan Zhao:Notion AI 早期主要还是靠“大力出奇迹”,我的 co-founder Simon Last 在这件事上做了很多贡献,他快速学习了很多 AI 相关的东西。


Notion 团队里有很多对 interface 和设计感兴趣的人,前后端也分别有很多全栈型人才,我们内部也有一部分专门在做搜索,但 ML 相关的人才并不多,甚至可以说是没有。过去一年的时间中,我们一直在学习怎么做 AI。


我们在 AI 上的各种尝试很像做烘焙的过程:准备好一切原材料、把这些原材料放进烤箱、按下按钮之后就只剩下等待,没有人能够预知成品是什么样的,所以这要求我们有足够的耐心,同时还要做大量的调整和准备。


图片


 Elad Gil :有一些人把这个过程总结为概率工程,这会让人觉得我们进入到了一个充满随机性的领域当中,至少是部分随机的。


Ivan Zhao:是的,这一类工作很像是在做园林培育,我自己并不会这类工作,所以我很需要这样一类人帮我做这件事。


Notion 需要的另外一类人是富有好奇心以及快速学习能力的人。Language model 让每个人可以实时地调用 AI 能力来完成自己的任务,但如何用好模型能力其实有很多技巧,以及如何将 LLM 和用户交互做结合也是很重要的问题。这类人一般被称为 AI 工程师,Notion 的 AI 工程师们都很年轻,很多甚至还不到 21 岁。


这两类 AI 人才的工作能力都很强。Notion 目前还没有很多 AI researchers,这类人才在我看来也相当重要。不过 Notion 毕竟处于应用层,所以我们很多时间是花在研究如何用模型上。


 Elad Gil :从 GPT-3 到今天,我们看到 GPT 能力提升特别快,并且每一代模型都会带来新的商业模式,你认为要充分利用 GPT 的能力还需要做哪些工作?


Ivan Zhao:技术的本质是做 trade off 。Language model 带来了一种全新特性,这是过往被设定为具体功能的软件所不具备的,但我们还不太了解它完整的工作原理,所以人们一直在 Twitter 上讨论要怎么才能更好地使用模型的能力。对于企业和创业者来说,面对新技术也要做出一些权衡,他们要时刻了解市场对于各种新模型能力的评价。这个行业目前正在快速发展、不断变化。


技术层面,模型现在能够处理更广泛的上下文信息,具备更强的推理能力,运行速度更快,同时占用的资源更少。这对于 Notion 来说非常重要,因为我们需要的就是像 GPT-4 这样既智能又高效的云服务。我们需要 AI 来帮助我们进行复杂的推理任务或者快速地总结文本内容,并且最好成本够低,速度够快。这就是技术层面上我们需要关注的方向。


除了技术因素,我个人还会关注很多人类行为习惯角度的改变,比如个人用户的行为惯性、公司的风险承受能力等,这些也都在慢慢演变。就像 Steve Jobs 常说“你不能做出太新的东西,你必须在保持大部分相同的基础上,改变一两个关键点。”Off White 创始人 Virgil Abloh 的理念是,只需要改变 3%,但足以推动边界,让人们接受新事物。


3% 理念(3 Percent Approach)是时尚品牌 Off White 创始人及设计师 Virgil Abloh 的设计哲学,这个理念的核心思想是,在现有设计的基础上只做出不超过 3% 的改变,从而使产品看起来既熟悉又新颖。这种方法允许设计师在尊重原有设计的同时,通过细微的调整来创造新的作品,这些改变可能包括颜色、材料、结构或其他设计元素的轻微变动。



Language model 能力的提升,以及把 language model 和 SaaS 软件相结合这两件事应该是同步进行的,因为如果一下子改变太大,人们可能会不太适应,RAG 的好处也在于它在现有交互习惯基础上给到了更好的输出。


 Elad Gil :你提到了要在推理质量、速度以及成本之间做平衡,Notion 是如何用模型的?只使用了 Llama 还是会在不同场景中调用不同模型?


Ivan Zhao:不同的公司、产品的目标不一样,选择的模型自然也不一样。Notion 会尝试各种模型,尤其当下水平最领先的开源模型,但因为 Notion 很看重推理能力,所以我们一般会调用高水平的模型。



53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询