AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


(二)Notion CEO:为什么RAG会彻底改变知识型工作?
发布日期:2024-03-18 14:47:41 浏览次数: 1605 来源:海外独角兽


03.


RAG:知识管理的未来


 Sarah Guo :Notion Q&A 还没开放给所有人,可以给还没体验过的人讲讲 Notion 的 AI Q&A 是什么吗?


Ivan Zhao:本质上 Notion 会帮助用户记忆他们输入到 Notion 中的所有内容,不只是 Notion 能这样做,绝大多数给予 RAG 的系统都能做这件事。


Language model 和 RAG 出现之前,人们之所以需要计算机是因为需要一个地方来存储信息,并且可以随时检索、调用这些信息,但检索主要依赖于关键词,并且这个词要相当精确,因此有的时候还会要求用户具备一些优化关键词的技巧。但有了 RAG 之后,language model 能够理解你输入的内容。所以,我们不需要在 Notion 中专门做信息的组织管理,因为无论我们输入了什么,我们都能顺畅地搜索出来。无论对个人还是团队公司来说,RAG 都提供了很完美的记忆能力这对于个人、公司或团队来说,相当于拥有了完美的记忆。


在此之上,如果我们把产品设计得足够好,还能够实现将合适的信息在合适的时间推送给对应的成员,不仅如此,如果我们设计得当,还可以将正确的信息在正确的时间推送给正确的人。可能 50% 以上的知识性工作都是这类任务。


Notion 可能是市场上比较早去大规模提供 RAG 相关功能的公司,但大范围提供 RAG 服务的难度比较大,Notion Q&A 还处于 waiting list 的状态,我们还在完善。


有了 RAG 之后,团队搜索的体验会完全不一样。我自己就已经改变了使用 Notion 的方式。比如我会提问 “公司什么时候搬到新办公室?”,如果团队中有人在某个文档中记录过这件事,Notion 就会回复我对应信息,我不需要再像之前那样去问其他人。


团队中的所有人,无论是设计师、工程师还是运营,每天也会在 slack 和邮件问到类似问题。要回答这些问题可能要花 10 分钟来写邮件,在此之前还要耗费 20 分钟来找到对应答案,如果算上各种等待时间,可能需要耗费半个小时以上的时间,但有了 Noton Q&A,这类问题只需要几秒钟就可以解决。RAG 已经帮我们提高了工作效率,而这还只是开始。


图片


 Elad Gil :最近一段时间关于 Agent 的讨论越来越多了,但客观来说因为某些能力还不能实现,所以 Agent 或者自动化相关的应用价值还没真正体现出来。Notion 最近也推出了 Calendar 应用,我很好奇你怎么看 AI 和日程管理之间的结合?


Ivan Zhao:我自己会去这么看 AI 的能力,首先, RAG、信息 retrieval 是一类,属于知识类相关。另外一类则是 workflow 相关,我们选择用 agent 来定义这件事。人们之所以需要会议、日程这些东西是因为我们需要完成彼此大脑之间的“比特传输”,那么我可以借助一个 language model 来完成这件事吗?也许是可以实现的。最基本的环节就是,人们在敲定会议时间的那一刻,日程安排上也做出了对应变化。我们做的很多事情都涉及到了时间这个纬度,language model 可以帮我们来调整时间安排吗?我认为是可以的。


 Elad Gil :听起来 retrievable 也是整个过程中很关键的部分。如果我们的日历可以自动补齐我们需要了解的关于会议、参会人员或其他相关事项的所有信息,对于用户来说相当有价值。你认为 Notion Calendar 还能在哪些环节创造价值?


Ivan Zhao:它可以简化我们的工作流程,这是一个重大的突破,可以让 Agent 帮助我们完成知识类工作。


我们之所以需要沟通是因为有些工作不能由软件自动完成,需要我们进行实时处理。这也许这是一个值得思考的问题,随着 language model 的发展,我们未来的沟通会更多还是更少?我猜是更少。因为 Agent 基本上依赖于 language model,这就是沟通的未来。

 Sarah Guo :你提到 Notion 可以像大脑那样帮助用户进行信息的组织和管理,如果一个人的大脑本身就很混乱、缺乏体系,这会影响他在 Notion 或者类似系统中的信息交互方式吗?用户需要先结构化地构建一个自己的知识库,还是只需要把所有信息以信息流的方式输入就可以?


Ivan Zhao:我们可能逐渐就不再需要信息结构化或者类似概念,我们之所以需要把组织和整理信息是因为只有做好这些工作才可以检索,我们需要 index 也是因为 index 就好像文件夹上的各种标签,能够帮我们快速找到各类文件,但因为 embedding 和 RAG ,我们只需要把所有信息放进这个“文件袋”,然后就可以根据需要以任意方式搜索、找到你想要的信息。信息的自由度会大大提升。


我们还可以想象这样一个场景,当我有新的 idea 时,只需要拍张照片、或者写下来一些东西,然后把它放进 Notion,Notion 就会帮我们组织、管理这些信息,如果未来我们需要用到这些知识的时候,作为一个完美的记忆助手,Notion 就会帮我们调取它们。这是 Notion 的长期愿景,我个人觉得这件事很令人兴奋。




04.


AI 让 SaaS 进入新一轮 Bundling


 Sarah Guo :你是怎么思考 Notion 的 AI 战略的?这些战略是否也受到了哪些计算机技术发展历史中的启发?


Ivan Zhao:我的很多直觉其实都基于一些对历史的理解,历史不是简单地重复,但总有一些相似规律。我个人认为,我们目前还处于 bundling 的阶段。《三国演义》的第一回就提到“久分必合,久合必分”,我觉得商业的运作也是如此。在 bundling 阶段之前,SaaS 行业其实已经经历过一个 unbundling 和服务分散的阶段。


Unbundling 的趋势从 2000 年代中就开始了,在这之前整个信息领域相关的产品都需要基于 Microsoft 来完成,是 典型的 building 的阶段。


PC 时代早期其实有很多各种各样的应用,比如《星际争霸》的早期版本,还有各种文本编辑器、dBase数据库软件以及其他不同的数据库软件。到了 90 年代,因为 Microsoft 提供了一个底层的操作系统,我们也随之进入了一个 bundling 阶段。随后,随着网络技术的发展,软件开始可以在 Web 上运行,这就带来了过去 10 到 15 年前的解绑和碎片化阶段,与此同时,资金成本降低带来创业门槛降低,也因此导致了信息领域的过度碎片化。


到今天,随着 AI、language model 的出现和发展,我们似乎又回到了 bundling 阶段。因为模型本质上要求将信息集中在一个地方去实现更高效的信息处理。


所以,我们今天正处于 bundling 阶段,这既是因为宏观经济的趋势,也因为 language model 的内在需求就是将信息和功能整合在一起。


 Sarah Guo :如果我们仔细看Oracle 这类过去 15 年一直占据主导地位的公司,会发现它们有一个共同策略:收购同领域中排名第二的产品。因为对于客户来说单独去部署这些产品是很困难的,或者说他们更倾向于将所有东西都整合到一个单一的数据库中。我认为这与你提到的 language model 有某种相似之处。


Ivan Zhao:是的,Oracel 的这个例子很好。我认为既有分发层面的 bundling,也有信息层面的 bundling,前面提到的 Oracle 更偏向于销售角度的 bundling,language model 需要的是数据和信息的 bundling。


 Sarah Guo :Notion 刚起步时,最先使用 Notion 来构建知识库的是那些初创公司。今天,在 Notion 规模得到增长的同时,我们所处的宏观环境也发生了变化,初创公司的预算比以前更加紧张。你如何看待帮助企业采用 AI 进行知识管理这件事?


Ivan Zhao:我们还相当早期,也还没完全实现用户的规模化。我认为,bundling 有很多好处。首先,这很方便,用户不需要在不同的界面之间来回切换就能完成任务。其次,这有助于节省成本,有了 Notion,用户就不必购买其他项目管理和 issue 跟踪的工具,从而减少了大量开支。这一点对于企业来说非常重要,尤其是在当前的经济环境下,CFO 也想降低成本。所以,bundling 确实带来了许多优势。除了方便信息管理,还能节省大量资金。


图片


 Sarah Guo :在 Notion 之外,你认为还会有哪些 SaaS 软件公司会在 AI 时代产生很大影响?


Ivan Zhao:在某种程度上,SaaS 公司做 AI 可能像是一场竞赛。Notion 主要是做 bundling 和 front office 业务。


我是这么定义 “Front office” 的:可以先假设如果我们身处在 1960 年代的一间办公室里会看到哪些东西?人们桌子上会有一个用来记东西的记事本,可能还会有一台打印机,左右两旁还堆着很多文件夹,对应到 Notion,记事本相当于用户文档和笔记,文件夹则类似于 Wiki,人们身后的文件柜则可以对应到 Notion 中的关系数据库,文件柜中还会有各种小纸片来帮助整理信息。


相对应的,还会存在“Back Office”,类似于图书管理员工作的地方,back office 对应的是今天 Snowflake、过去 IBM 在做的事情。Notion 不会去碰“back office”相关的部分,我们还是聚焦我们的优势领域,就是我刚刚提到了软件界面,UI、UX 这些。


Back office 的场景和 front office 相比要更加垂直,比如专注于医疗健康领域、特定的工作流等等,并且通常还需要一个专门的地方来存储相关信息并在垂直场景中进行整合,这些场景也是可以被 AI 改造的。在法律等高度专业化的领域里,large language model 已经开始代替人类处理一些复杂任务了。


Front office 对应的任务是开放性的,back office 的则更偏特定、具体的任务,所以我认为二者之间会存在某种竞赛,但与此同时市场也很大,不一定是零和游戏。


 Sarah Guo :你很看重设计,Notion 的设计也一直被外界称赞,你认为 Notion 是一个设计驱动的公司吗?你是如何在整个团队中保证设计一致性的?


Ivan Zhao:我认为这个取决于我们要怎么定义设计,至少对于我来说,设计不仅仅是外观,更重要的是一个系统是如何协同工作的。在这种情况下,我们需要做出一些 tradeoff,是选择把设计集中还是分散到每个板块?有些公司或业务产品适合把设计工作下放到不同板块,尤其是那些很重运营的公司。


Notion 的价值在于提供一个统一的信息空间、一个让人们可以集中完成各种不同的任务的 workspace 。因此,这些功能需要协同高效地工作。这有点像是在构建一个操作系统或编程语言,没有人会把设计编程语言的任务分散给 50 个人来做,通常这些工作都是由一个人来完成的。


所以 Notion 的设计相当集中,有点类似于苹果公司,Apple 软硬件紧密集成开发 OS 的方式在今天很少见。在这种情况下,为了实现好的产品和良好的用户体验,我们就需要更横向、全面的思考,也因此我们的设计决策是相对集中的,更偏 Apple 的风格而不是 Amazon。


此外,我认为我们不能局限于某一种思维模式,因为很多界限其实是人为设定。Notion 80% 的设计师都会编程,他们既是设计师也是工程师,也因此在设计中可以做出很好的平衡。技术的本质是 tradeoff,好的tradeoff 能够激励用户来尝试使用新产品、引导他们形成习惯,这是最核心的。我们会的事情更多,相对于其他设计上就更能在设计上做出好的平衡,再比如设计师知道如何编程,他们就会知道如何调整设计,使其更容易实现;如果你会设计也是同理,就像在挤压空气泡泡时,找到最容易挤压的方向。


因此,我认为这种多样化的能力对我们的帮助很大,Notion 中的每一个人都在努力变得“全能”,这也使我们的团队小而精悍。相对于我们的业务规模,我们的团队人数很少,但团队中的每个人都能把自己的能力发挥到极致。我们没有固定的角色,也不需要做重复性的工作,大家都很享受这种工作方式。不过,尽管这样做有很多好处,但找到具备这样能力的人确实更难。



53AI,企业落地应用大模型首选服务商

产品:大模型应用平台+智能体定制开发+落地咨询服务

承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询