支持私有云部署
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


万字采访 | Perplexity CEO:我们最大的障碍不是 Google,而是人们天生不擅长提问(下)

发布日期:2024-08-04 21:02:09 浏览次数: 2607 作者:AI就是这样

在 Lex 的最新一期播客中,Perplexity AI 的 CEO Aravind Srinivas 与知名播客主持人 Lex Fridman 深入探讨了人工智能的未来,特别是 Perplexity 作为一个知识发现引擎的创新之处。Aravind 解释了 Perplexity 如何通过结合搜索引擎和大语言模型(LLM),为用户提供准确且有来源支持的答案,类似于学术写作中的引用。他们讨论了 Perplexity 与传统搜索引擎的不同之处,以及它如何通过提供更深入的答案来激发人们的好奇心和探索精神。Aravind 还分享了他对创业、AI 发展以及如何利用 AI 技术促进人类知识增长的见解。

在对话中,Aravind 强调了 Perplexity 的使命不仅仅是提供答案,而是引导用户发现新知识和深入理解复杂问题。他们讨论了如何通过技术进步,比如检索增强生成(RAG)和大语言模型,来提高搜索和答案的质量。同时,Aravind 也提到了 AI 在提高用户界面和体验方面的作用,以及如何通过智能系统来满足用户的需求。此外,他们还探讨了 AI 的伦理问题,包括如何确保 AI 系统提供的信息是准确和可靠的。

Aravind Srinivas 的核心观点包括:

  • Perplexity AI 与谷歌不同,谷歌的弱点是为了广告收益而牺牲用户的搜索体验,而 Perplexity 专注于改进搜索体验,不受广告影响。

  • Perplexity AI 的存在是为了满足好奇心,它提供带有引用的内容,类似于维基百科的模式。

  • Perplexity AI 的商业模式主要依赖订阅制,而不是广告收入,用户可以通过付费获得更高级的功能和模型支持。

  • Perplexity AI 的未来展望是继续坚持以用户为中心。Aravind 认为,无论用户输入什么,你都应该提供高质量的答案。即使用户懒惰,或是有拼写错误,或是语音转录有误,用户仍然应该能得到答案,并喜欢这个产品。

  • Perplexity AI 的搜索引擎通过大语言模型驱动,提供直接答案,并附带完整的来源和引用,避免了传统搜索引擎的 SEO 垃圾信息和赞助链接。

  • Aravind 认为,如果我们能够找到一个合适的数据集组合,为小语言模型提供良好的推理能力,这将是一个突破。这将颠覆整个基础模型领域,因为不再需要庞大的训练集群。

  • 关于 AI 的发展,Aravind 认为我们不必担心 AI 失控而接管世界,问题在于计算资源的获取。这意味着权力将更加集中在少数人手中,因为并非每个人都能负担得起大量计算资源来解决最难的问题。

以下是本期播客内容的完整翻译,我们作了不改变原意的删减。本篇为下半部分,上半部分可见 万字采访 | Perplexity CEO:我们最大的障碍不是 Google,而是人们天生不擅长提问(上)。

世界上最以知识为中心的公司

莱克斯·弗里德曼(Lex Fridman)
我很喜欢我们讨论的所有相关话题,但让我们回到最初的问题。Perplexity 的根源是什么?
阿拉温德·斯里尼瓦斯(Aravind Srinivas)
我和我的联合创始人 Dennis 和 Johnny 聚在一起,只想用 LMS(学习管理系统)构建一些很酷的产品。当时我们还不确定价值会在哪里产生,是在模型中还是在产品中?但有一点是明确的,这些生成模型已经从单纯的研究项目转变为实际的用户应用程序。Github Copilot 被广泛使用,我和我周围的很多人都在用,人们甚至愿意为此付费。这是一个前所未有的时刻。以前,人们创办 AI 公司时,只是不断收集大量数据,但这只是整个过程的一小部分。而这次,AI 本身就是核心。这就是我的看法。
莱克斯·弗里德曼(Lex Fridman)
这是一种灵感,将其转化为产品。对于不了解的人来说,Github Copilot 是一个编程助手,它可以为你生成代码。
阿拉温德·斯里尼瓦斯(Aravind Srinivas)
我的意思是,你可以称它为高级自动补全。是的,但它实际上在更深层次上起作用。我创办公司时希望具备的一个特性是它必须具备 AI 完备性。这是我从 Larry Page 那里学到的:你需要找到一个问题,如果你解决了它,你将从 AI 的进步中受益。产品会变得更好,因为产品变得更好,更多人会使用它。因此,这帮助你创造更多数据,使 AI 变得更好。这就形成了一个良性循环。
大多数公司很难具备这个特性,这就是为什么他们都在努力寻找可以应用 AI 的地方。我认为有两个产品真正做到了这一点。一个是 Google 搜索,任何在 AI、语义理解、自然语言处理方面的改进都会提升产品。更多的数据使嵌入更好,诸如此类。另一个是自动驾驶汽车,更多的人驾驶意味着你会获得更多数据,这使模型更好,视觉系统更好,行为克隆更好。
我一直希望我的起点也是如此。它并不是专门为消费者设计的搜索引擎。我们最初的想法是向第一个决定资助我们的投资者 Elad Gill 提出的。我们告诉他,我们很想颠覆 Google,但不知道该怎么做。不过我一直在想,如果人们不再在搜索栏中输入文字,而是通过眼镜看到的任何东西来提问,会怎么样?我一直喜欢 Google Glass 的概念,它非常酷。然后你说,专注,你知道,没有大量资金和人员是做不到的。现在找到一个切入点,创造一些东西,然后你可以朝着宏大的愿景努力,这是非常好的建议。
于是我们决定,好吧,如果我们颠覆或创造以前无法搜索的搜索体验,会是什么样子。然后你说,表格、关系数据库,以前你无法搜索它们,但现在你可以,因为你可以有一个模型,它会分析你的问题并将其翻译成一些 SQL 查询,运行这些查询对数据库进行查询,并不断抓取数据以保持数据库的更新。是的,然后你执行查询,提取记录并给出答案。
莱克斯·弗里德曼(Lex Fridman)
所以,确认一下,你之前无法查询到它,对吗?
阿拉温德·斯里尼瓦斯(Aravind Srinivas)
无法提问“Lex Friedman 和 Elon Musk 共同关注了哪些人”这个问题。
莱克斯·弗里德曼(Lex Fridman)
所以,这就是 Twitter 背后的关系数据库。没错。因此,你不能对一个表格进行自然语言查询。你听说过,我必须编写复杂的 SQL 查询。
阿拉温德·斯里尼瓦斯(Aravind Srinivas)
最近有一条推文同时得到了埃隆·马斯克和杰夫·贝索斯的点赞。以前,你无法提出这样的查询,因为需要一个 AI 来理解这些查询,将其转换为结构化查询语言(SQL),在数据库中执行查询,提取记录并展示结果,对吧?但随着 GitHub Copilot 等技术的进步,这一切突然变得可能了。现在我们有了优秀的代码语言模型。因此,我们决定利用这一点,进行搜索,抓取大量数据,并将其整理到表格中。
莱克斯·弗里德曼(Lex Fridman)
生成正确的 SQL 查询来提问。
阿拉温德·斯里尼瓦斯(Aravind Srinivas)
我们选择 SQL 的原因是认为它的复杂度较低,结构化程度高,只需使用少量的 SELECT 语句和 COUNT 函数。因此,它的复杂度不会像通用的 Python 代码那样高。然而,值得一提的是,这个观点后来被证明是错误的。
在 Github 和一些国家的语言环境中,你可以把它看作是在内存非常有限的计算机上编程。是的,我们会进行大量的手动编码。例如,我和我的联合创始人会亲自编写许多处理查询的模板。这些模板是 SQL 查询,我们自学了 SQL。这也是为什么我们构建了这个通用问答机器人,因为我们自己并不太懂 SQL。
然后我们会使用 RAG(检索增强生成)方法,根据查询提取出类似的模板查询。系统会识别这些模板,构建一个动态的简短提示。接着,为你提出的查询编写一个新的查询语句,并在数据库中执行。很多事情仍然会出错,比如有时 SQL 会出错,你必须捕捉错误并重试。因此,我们将这一切构建成一个良好的搜索体验,并应用在 Twitter 上。
在 Elon 接管 Twitter 之前,我们用学术账户抓取了数据。当时,Twitter 允许创建学术 API 账户。我们生成了很多这样的账户,使用生成的电话号码,编写研究提案,并使用 GPT 等工具。我将我的项目命名为 brinrank 等,然后创建这些虚假的学术账户,收集大量推文。
Twitter 是一个巨大的社交图谱,但我们决定专注于有趣的个人,因为图谱的价值仍然相对稀疏和集中。然后我们构建了这个演示,你可以问各种问题,比如关于 AI 的推文。如果我想与某人建立联系,我会识别一个共同关注者。我们向很多人展示了这个演示,比如 Yang LeCun、Jeff Dean、Andrej。他们都很喜欢,因为人们喜欢搜索关于自己或感兴趣的人的信息,这是基本的人类好奇心。这最终帮助我们招募了优秀的人才。虽然没有人真正认真对待我或我的联合创始人,但因为我们得到了有趣的个人的支持,至少他们愿意听我们的招聘宣传。
莱克斯·弗里德曼(Lex Fridman)
从这个观点中你得到了什么启示?也就是说,最初在 Twitter 上的搜索是打开这些投资者和支持者大门的关键。
阿拉温德·斯里尼瓦斯(Aravind Srinivas)
我认为展示一些以前无法实现的事物具有强大的吸引力,尤其是当它们非常实用时。这种魔力激发了人们对世界上正在发生的事情、社会、人际关系和社交网络的好奇心。我相信每个人对自己也充满了好奇。我曾与 Instagram 的创始人 Mike Krieger 交谈过。他告诉我,尽管你可以通过点击 Instagram 上的个人资料图标进入自己的个人资料,但人们最常搜索的还是自己。
莱克斯·弗里德曼(Lex Fridman)
那既黑暗又美丽。
阿拉温德·斯里尼瓦斯(Aravind Srinivas)
这很有趣,对吧?我们第一次发布 Perplexity 事件功能的原因是因为人们会在 Perplexity 搜索栏中输入他们的社交媒体账户。实际上,这真的很有意思。我们分别发布了 Twitter 搜索和常规 Perplexity 搜索,相隔一周。显然,我们无法索引整个 Twitter,因为我们是以一种非常临时的方式抓取的。所以我们实现了一个反向查询,如果你的 Twitter 账户不在我们的 Twitter 索引中,你可以使用我们的常规搜索,提取一些你的推文,并给你一个社交媒体简介的总结,我们会得出一些非常搞笑的结果。
因为那时候我们有点“幻觉效应”现象。所以人们很喜欢它。他们要么被吓到,说“哦,这个 AI 知道我这么多”,要么觉得很有趣,说“看看这个 AI 说了我这么多”。他们会分享这些查询的截屏。这就像是“这是什么 AI?或者这个叫 Perplexity 的东西是什么?”然后你去输入你的账户,它会给你这些结果。然后人们开始在 Discord 论坛和其他地方分享这些截屏。这就是我们最初增长的原因,从完全无关到至少有一些相关性。
但我们知道这只是一次性的事情,不是每次都能重复的查询,但至少这给了我们信心,证明提取链接并总结它们是有意义的。我们决定专注于这一点。显然,我们知道 Twitter 搜索对我们来说是不可扩展或不可行的,因为埃隆·马斯克(Elon Musk)正在接管,他非常明确地表示要关闭很多 API 访问。所以我们更专注于常规搜索是有道理的。
莱克斯·弗里德曼(Lex Fridman)
这是网络搜索领域的一项重要举措。初期步骤是什么?在网络搜索领域采取行动需要哪些条件?
阿拉温德·斯里尼瓦斯(Aravind Srinivas)
老实说,当时我们的想法是发布这个产品,因为我们没有什么可失去的。这是一个全新的体验,人们会喜欢它。也许一些企业会联系我们,要求为他们的内部数据开发类似的产品,我们可以借此建立业务。这就是我们的全部野心。大多数公司从未预料到最终会做什么,几乎都是偶然的。
对我们来说,事情的发展是这样的:我们发布了这个产品,很多人开始使用它。我以为这只是暂时的,使用量会减少。但在 2022 年 12 月 7 日发布后,甚至在圣诞假期期间,人们也在使用它。我认为这是一个非常强烈的信号,因为在假期期间,人们通常与家人团聚、放松,不会使用一个完全不知名的初创公司开发的产品。所以我认为这里有一些信号。
最初,我们没有对话功能,只能进行单次查询。用户输入一个问题,得到一个带有摘要和引用的答案。如果想开始另一个查询,必须重新输入问题,没有对话或建议问题的功能。新年后一周,我们推出了带有建议问题的对话版本,用户量开始呈指数级增长。更重要的是,很多人也在点击相关问题。所以我们制定了这个愿景。
很多人问我,公司愿景是什么?使命是什么?当时我们什么都没有,只是探索一些很酷的搜索产品。但在我的联合创始人的帮助下,我们制定了这个使命:这不仅仅是关于搜索或回答问题,而是关于知识,帮助人们发现新事物并引导他们,不一定是给他们正确的答案,而是引导他们。
所以我们说我们想成为世界上最以知识为中心的公司。这实际上是受到了 Amazon 想成为地球上最以客户为中心的公司的启发。我们想要专注于知识和好奇心。我们觉得这个使命比与 Google 竞争更大。你永远不要把你的使命或目标建立在别人身上,因为如果你这样做,可能瞄得太低了。你要把你的使命或目标建立在比你和与你一起工作的人更大的事情上。这样你在工作时会有完全不同的思维方式。索尼的使命是让日本在世界上有一席之地,而不是让索尼在世界上有一席之地。
莱克斯·弗里德曼(Lex Fridman)
谷歌最初的愿景是让所有人都能访问其信息。
阿拉温德·斯里尼瓦斯(Aravind Srinivas)
将信息组织起来,使大学变得易于访问和有用,这看似简单。然而,现在要完成这个使命已经不再容易了。而且,任何人都可以加入这个使命,重新思考它,对吧?维基百科在某种意义上也在做同样的事情,它以不同的方式组织全球信息,使其易于访问和有用。Reflexie 也在以不同的方式进行这项工作,我相信在我们之后还会有另一家公司做得更好,这对世界是有益的。

检索增强生成(RAG)与大语言模型

莱克斯·弗里德曼(Lex Fridman)
能否详细谈谈 Perplexity 指标(perplexity)的技术细节?你提到了 RAG、Triv 和增强生成。这些不同的组件分别是什么?搜索过程是如何进行的?首先,什么是 RAG?大语言模型(LM)在高层次上是如何运作的?这个系统是如何工作的?
阿拉温德·斯里尼瓦斯(Aravind Srinivas)
RAG 是一种检索增强生成的简单框架。给定一个查询,它总是先检索相关文档,从每个文档中挑选相关段落,然后使用这些文档和段落来撰写该查询的答案。其原则和挑战在于,你不应该说出任何你没有检索到的信息。相比之下,我们的方法比 RAG 更强大,因为 RAG 只是允许使用额外的上下文来写答案,而我们的方法则强调不要使用超出检索到的信息。这样可以确保答案的事实依据。如果从检索到的文档中没有足够的信息,就说明我们没有足够的搜索结果来给出一个好的答案。
莱克斯·弗里德曼(Lex Fridman)
总体来说,RAG(检索增强生成)通过查询来获取信息,从而增加额外的上下文,这样可以生成更优质的答案。你希望坚持引用由人类在互联网上撰写的文本所代表的事实,对吗?
阿拉温德·斯里尼瓦斯(Aravind Srinivas)
这样会更可控。否则,你可能还是会说出无意义的话,或者在使用文档信息时添加一些自己的内容,对吧?尽管如此,这些情况仍然可能发生。我并不是说这种方法万无一失。
莱克斯·弗里德曼(Lex Fridman)
条件生成网络(CPN)中可能在哪些地方出现幻觉呢?
阿拉温德·斯里尼瓦斯(Aravind Srinivas)
这种情况有多种可能。一种是你已经拥有查询所需的所有信息,但模型不够智能,无法在深层语义层面理解查询和段落,只能提取相关信息并给出答案。这是模型技能的问题,但随着模型的改进,这个问题可以得到解决,而且模型确实在不断改进。
另一种可能是你的片段质量不佳,比如索引不够好。虽然你检索到了正确的文档,但其中的信息可能不够最新或不够详细,导致模型因信息不足或来自多个来源的冲突信息而感到困惑。
第三种情况是你给模型提供了过多的细节。比如索引非常详细,片段也是如此,你使用了页面的完整版本并将所有内容都提供给模型,要求它得出答案,但模型无法清晰地辨别所需信息,结果提供了大量无关内容,最终导致错误答案。
第四种情况是你检索到了完全相关的文档,但如果模型足够智能,它应该说“我没有足够的信息”。因此,有多个维度可以改进这样的产品以减少幻觉,比如改进检索、提高索引质量、页面和索引的新鲜度,以及片段的详细程度。你还可以提高模型处理所有这些文档的能力。如果能做好这些事情,就可以不断改进产品。
莱克斯·弗里德曼(Lex Fridman)
尽管模型在某些情况下没有考虑到视频编辑的存在,但索引过程非常有趣。你能谈谈索引过程中的一些有趣之处吗?
阿拉温德·斯里尼瓦斯(Aravind Srinivas)
是的,索引由多个部分组成。首先,你需要构建一个爬虫,就像 Google 有 Googlebot,我们有 Perplexity bot、Bingbot 和 GPTbot。网络上有很多类似的爬虫。
莱克斯·弗里德曼(Lex Fridman)
Perplexity 机器人能运作吗?它就像一个美丽的小生物,在网络上爬行。它究竟在做什么呢?
阿拉温德·斯里尼瓦斯(Aravind Srinivas)
有很多事情需要考虑,比如决定将哪些内容放入队列,哪些页面和域名需要抓取,以及每个域名的抓取频率。这不仅仅是知道哪些 URL,而是决定抓取哪些 URL 以及如何抓取它们。你基本上需要进行渲染,包括无头渲染。现在的网站更加现代化,不仅仅是 HTML,还有大量的 JavaScript 渲染。你需要决定从页面中真正需要的内容是什么。
显然,人们有 robots.txt 文件,这是一个礼貌政策,你应该尊重抓取延迟时间,以免过度加载他们的服务,持续抓取它们。还有一些内容他们声明不应该被抓取,以及一些允许被抓取的内容,你必须尊重这些规定。机器人需要了解所有这些事情,并适当地进行抓取。
莱克斯·弗里德曼(Lex Fridman)
我猜,大多数关于页面工作原理的细节,尤其是涉及到 Javascript 的部分,并没有提供给机器人解析。
阿拉温德·斯里尼瓦斯(Aravind Srinivas)
这取决于一些出版商是否允许这样做,因为他们认为这会对他们的排名更有利。一些出版商不允许这样做。你需要跟踪所有这些域名和子域名的情况,这非常复杂。然后你还需要决定更新的频率,并根据超链接决定要添加到这个队列中的新页面。这就是爬取的过程。接下来是从每个 URL 获取内容的部分。一旦通过无头渲染完成了这一过程,你就需要实际构建索引。你需要重新处理和后处理所有获取的内容,这些内容是原始数据,需要转换成适合排名系统使用的格式。这需要一些机器学习和文本提取。Google 有一个完整的系统,现在可以提取每个原始 URL 内容中的相关元数据和相关内容。
莱克斯·弗里德曼(Lex Fridman)
这是一个完整的机器学习系统,就像嵌入到某个向量空间中一样。
阿拉温德·斯里尼瓦斯(Aravind Srinivas)
这并不是一个纯粹的向量空间。并不是说一旦获取了内容,就有某种模型在所有内容上运行,并将其放入一个巨大的向量数据库中以供检索。事实并非如此,因为将一个网页的所有知识打包成一个向量表示是非常困难的。首先,向量嵌入并不能对文本起到魔法般的作用。理解某个特定查询的相关文档是非常复杂的。它应该是关于查询中的个体,还是关于查询中的特定事件?或者它应该在更深层次上关于查询的意义,以至于同样的意义应用于不同的个体也应该被检索到?
你可以不断争论,什么样的表示应该真正捕捉到什么信息。而且,很难让这些向量嵌入在捕捉不同语义时的不同维度上彼此独立。因此,通常的检索过程包括排序部分和索引部分,假设你有每个 URL 的后处理版本。然后是排序部分,根据查询确定哪些是索引中的相关文档,并给出评分。当你在索引中有数十亿个页面时,你只想要前 K 个结果,这时你必须依赖近似算法来获取这些结果。
莱克斯·弗里德曼(Lex Fridman)
那么,这就是排名。不过,你知道,我的意思是,把一个页面转换成可以存储在向量数据库中的内容,这看起来确实很难。
阿拉温德·斯里尼瓦斯(Aravind Srinivas)
并不总是需要完全依赖向量数据库。你可以使用其他数据结构。当然,还有其他传统的检索方法可供选择。有一种算法叫做 BM25,它是 TFIDF(词频-逆文档频率)的改进版本。TFIDF 是一种非常传统的信息检索系统,即使在今天也表现良好。而 BM25 作为其改进版本,在排名上仍然优于大多数嵌入模型。
OpenAI 发布嵌入模型时曾引起一些争议,因为在许多检索基准测试中,它甚至没有超过 BM25。这并不是因为他们的模型不好,而是因为 BM25 实在太优秀了。因此,仅仅依靠纯嵌入和向量空间是无法解决搜索问题的。你需要结合传统的基于术语的检索和某种基于地面的检索方法。
你需要将所有这些方法结合起来,形成一个综合体系。同时,还需要考虑语义或其他非词汇排名信号。这就像页面排名一样,比如评分域名的权威性和时效性信号。
莱克斯·弗里德曼(Lex Fridman)
是的,你需要在资源上增加一些额外的权重,但不要让它显得过于突出。
阿拉温德·斯里尼瓦斯(Aravind Srinivas)
实际上,这取决于查询的类别。这也是为什么搜索是一个需要大量领域知识的难题。正因为如此,我们才选择研究这个问题。大家都在讨论说唱歌手、竞争模型等,你需要大量的领域知识来处理这些问题。此外,建立一个具有高质量排名和多种信号的优秀索引也需要花费大量时间。
莱克斯·弗里德曼(Lex Fridman)
搜索引擎优化中有多少是科学?又有多少是艺术?
阿拉温德·斯里尼瓦斯(Aravind Srinivas)
这不仅包含了大量的科学知识,还融入了许多以用户为导向的思考。
莱克斯·弗里德曼(Lex Fridman)
假设你遇到了一组特定的文档和用户提出的特定类型的问题,而系统对此的处理效果不佳。你可能会想,我们该如何让它正常工作呢?
阿拉温德·斯里尼瓦斯(Aravind Srinivas)
这并不是针对每个查询都适用,对吧?在规模较小时,你可以这样做来满足用户需求,但这种方法并不具备可扩展性。显然,随着你处理的查询数量从每天 1 万次增加到 10 万次,再到 100 万次,甚至 1000 万次,问题会越来越多。因此,你需要找到能够在更大规模上解决问题的方法。
莱克斯·弗里德曼(Lex Fridman)
你是想找到一些具有代表性的错误案例,对吗?那么,在查询阶段呢?假设我输入了一些结构混乱的内容,或者输入了一条结构很差的查询语句。可以进行什么样的处理使其可用?这是大语言模型(LLM)类型的问题吗?
阿拉温德·斯里尼瓦斯(Aravind Srinivas)
我认为大语言模型(LLM)在这方面确实有帮助。即使你的初始检索结果并不是一组非常出色的文档,虽然召回率很高,但精确度不高,LLM 仍然可以找到有用的信息,而传统搜索则不能。因为传统搜索同时关注精确度和召回率。
比如在 Google 上,即使我们称之为“10 个蓝色链接”,如果前几个链接中没有正确的,你会感到烦恼。LLM 非常注重准确性。即使你在第九或第十个链接中找到了正确的链接,输入到模型中后,它仍然可以知道那个链接比第一个更相关。这种灵活性使你可以重新思考如何分配资源,是继续改进模型,还是改进检索阶段。这是一种权衡。而计算机科学最终就是在做权衡,对吧。
莱克斯·弗里德曼(Lex Fridman)
我们需要提到的一点是,这个模型,即预训练的大语言模型(LLM),可以在不同的应用中进行替换。它可以是 GPT-4,也可以是 Claude 3,或者是基于 LLaMA 的模型。
阿拉温德·斯里尼瓦斯(Aravind Srinivas)
这是我们自主训练的模型。我们采用了 LLaMA 3,并对其进行了微调,使其在摘要、引用文献、保持上下文一致性以及支持更长时间对话等技能上表现出色。因此,这个模型被称为 Sonar。
莱克斯·弗里德曼(Lex Fridman)
我们可以使用 AI 模型。如果你像我一样订阅了 Pro 版,可以选择 GPT-4、GPT-4 Turbo、Claude 3、Sonnet Claude 3、Optimus 等等,还有我们的 32K 大模型。这个模型是基于 LLaMA 3 训练的,由 Perplexity AI 训练,拥有 700 亿参数,是一个高级模型。我喜欢你用“高级模型”这个说法,听起来更复杂。我喜欢这个说法。所以这是一个大模型。很酷,你可以试试。那么,这里需要权衡的是延迟问题吗?
阿拉温德·斯里尼瓦斯(Aravind Srinivas)
由于我们在优化云模型方面表现出色,其运行速度比预期更快。例如,我们托管了该模型,并提供了一个先进的 API。我认为在一些需要更多推理的复杂查询上,它仍然落后于 GPT-4。但这些问题可以通过进一步的后期训练和人类反馈强化学习(RLHF)来解决。我们正在积极努力改进这些方面。
莱克斯·弗里德曼(Lex Fridman)
因此,你希望在未来你的模型能够成为主流。
阿拉温德·斯里尼瓦斯(Aravind Srinivas)
我们不在乎,你也不在乎。这并不意味着我们不会为之努力,但这正是模型无关观点的价值所在。比如,用户是否关心 Perplexity (perplexity)这一主要模型指标?不关心。用户是否关心得到一个好的答案?关心。所以,无论是哪个模型为我们提供了最好的答案,无论是我们从别人的基础模型上微调的,还是我们自己托管的模型,都可以。
我们并没有直接使用现成的模型,而是为产品定制了模型。至于我们是否拥有这些模型的权重,这是另一个问题,对吧?因此,我认为设计产品使其能够与任何模型良好配合也是一种能力。如果某些模型的特性发生变化,不应该影响产品的表现。
莱克斯·弗里德曼(Lex Fridman)
因此,它的响应速度非常快。你是如何将延迟降到如此低的?你又是如何进一步减少延迟的?
阿拉温德·斯里尼瓦斯(Aravind Srinivas)
从 Google 的研究中获得灵感,有一个叫做尾部延迟的概念。这是 Jeff Dean 和另一位作者在一篇论文中提到的,指出仅仅测试几个查询并看到速度快就得出产品快的结论是不够的。你需要跟踪 P90 和 P99 的延迟,即第 90 百分位和第 99 百分位的延迟。因为如果一个系统在很多服务器上有 10% 的查询失败,可能会有一些查询在尾部更频繁地失败,而你甚至没有意识到。这可能会让一些用户感到沮丧,尤其是在查询量突然激增时。因此,跟踪尾部延迟非常重要。
我们在系统的每个组件上都进行跟踪,无论是搜索层、语言模型(LM)层还是专辑层。最重要的是吞吐量和时间。我们通常称第一个令牌的生成时间为 TTFT(Time to First Token),以及决定你能多快流式传输内容的吞吐量。两者都非常重要。当然,对于我们无法控制的模型服务,比如 OpenAI 和流量,我们依赖他们建立的良好基础设施。他们有动力为自己和客户改进这些基础设施,所以这些服务会不断改进。
而对于我们自己提供的模型,比如基于 Llama 的模型,我们可以通过在内核级别进行优化来改进。为此,我们与 Nvidia 密切合作,Nvidia 是我们的投资者之一,我们在一个叫做 TensorRT-LLM 的框架上进行合作。如果需要,我们会编写新的内核,在不牺牲延迟的情况下确保高吞吐量。
莱克斯·弗里德曼(Lex Fridman)
与保持低延迟和提供所有这些服务相关的复杂性是否存在有趣之处?当用户数量增加时,首次令牌时间(TTFT)会如何变化?越来越多的用户对这个话题感兴趣,有些人在听了这个播客后,想要尝试应对这些真正的复杂性。他们会出现。那么计算的扩展性如何?我从一个初创公司 CEO 的角度来看这个问题。
阿拉温德·斯里尼瓦斯(Aravind Srinivas)
我们需要决定:是多花 1000 万或 2000 万购买更多的 GPU,还是多花 500 万到 1000 万使用其他模型提供商的计算能力?
莱克斯·弗里德曼(Lex Fridman)
本地部署和云端部署有哪些区别?
阿拉温德·斯里尼瓦斯(Aravind Srinivas)
它的动态不断变化。顺便提一下,所有的搜索和服务都在云端进行。我们提供的模型也托管在某个云服务提供商上。显然,在我们目前的阶段,自建数据中心是非常低效的。我认为随着我们规模的扩大,这将变得更加重要。不过,像 Netflix 这样的公司仍然使用 AWS,这证明我们仍然可以利用他人的云解决方案进行扩展。
莱克斯·弗里德曼(Lex Fridman)
因此,Netflix 在泰国使用了 AWS 服务。
阿拉温德·斯里尼瓦斯(Aravind Srinivas)
一般来说是这样的。这是我的理解。如果有误,请专家指正。
莱克斯·弗里德曼(Lex Fridman)
你是不是有点困惑,Netflix 是否使用 AWS?是的,Netflix 几乎所有的计算和存储需求都依赖于 Amazon Web Services(AWS)。Netflix 在 AWS 上运行了超过十万个服务器实例,并在云端建立了一个虚拟工作室,方便全球的艺术家和合作伙伴进行协作。Netflix 选择 AWS 是因为其服务的规模和广度。相关问题包括:Netflix 使用了 AWS 的哪些具体服务?Netflix 如何确保数据安全?Netflix 使用 AWS 的主要好处是什么?如果是我一个人,我现在就会陷入这些问题的深渊。我也是,并且会问为什么它不转向 Google Cloud?这可能会引发更多问题。
阿拉温德·斯里尼瓦斯(Aravind Srinivas)
竞争并不太明显,对吧?虽然 YouTube 和 Prime Video 是竞争对手,但这有点像 Shopify 使用 Google Cloud,Snapchat 使用 Google Cloud,Walmart 使用 Azure。因此,一些优秀的互联网企业不一定有自己的数据中心。Facebook 有自己的数据中心,这没问题。他们从一开始就决定自己建造。甚至在 Elon 接管 Twitter 之前,我认为他们曾经使用过 AWS 和 Google 进行部署。
莱克斯·弗里德曼(Lex Fridman)
虽然他们很有名,但正如埃隆所说,他们似乎使用了一种不同的数据中心组合。
阿拉温德·斯里尼瓦斯(Aravind Srinivas)
我认为他有一种心态,觉得所有事情都必须在内部完成。然而,当你扩展初创公司时,这种心态可以帮助你避免不必要的问题。此外,AWS(Amazon Web Services)的基础设施非常出色,不仅质量上佳,还能帮助你轻松招聘工程师。因为使用 AWS 的工程师通常已经接受过相关培训,所以他们上手速度非常快。
莱克斯·弗里德曼(Lex Fridman)
因此,问题在于 AWS。你需要明确购买多少实例,以及其他相关事项。
阿拉温德·斯里尼瓦斯(Aravind Srinivas)
你需要解决各种问题,例如早晨处理任务或决定是否需要进行大量监控。这就是为什么它被称为具有弹性的原因。有些事情可以非常优雅地扩展,但其他事情则不太适合,比如 GPU 或模型,你仍然需要根据具体情况做出决策。
莱克斯·弗里德曼(Lex Fridman)
有人在推特上发起了一次投票,询问谁最有可能建造第一个拥有 100 万个 H100 GPU 的数据中心,选项包括谷歌、Meta 和 XAI。你怎么看?你认为会是谷歌、Meta 还是 XAI?
阿拉温德·斯里尼瓦斯(Aravind Srinivas)
值得一提的是,正如许多人所说,这不仅仅是 OpenAI 的问题,还有 Microsoft 的责任。这是一个合理的观点。例如,具体是什么问题呢?
莱克斯·弗里德曼(Lex Fridman)
你提供的选项是 OpenAI 吗?我认为是的。
阿拉温德·斯里尼瓦斯(Aravind Srinivas)
显然,像 Google、OpenAI、Meta 和 X 都在开放平台上,Microsoft 也是如此。此外,创作者不允许进行超过四个选项的投票。因此,理想情况下,你应该在其中加入 Anthropic 或 Amazon。百万只是一个目标数字。
莱克斯·弗里德曼(Lex Fridman)
埃隆·马斯克宣布了一些震撼人心的消息。
阿拉温德·斯里尼瓦斯(Aravind Srinivas)
是的,Elon 曾说过,这不仅仅是关于核心计算能力的问题。他明确指出的重点是等效的计算能力。因此,不一定需要百万级的计算能力,而是可以通过下一代数量更少的 GPU,在更低功耗下实现百万级的计算能力。不管是 1 千兆瓦还是 10 千兆瓦,我不确定。这确实需要大量的计算能力。我认为,我们讨论的推理计算对于未来高性能 AI 系统或探索诸如模型自我推理、自我推断等研究方向非常重要,这都需要大量的 GPU。
莱克斯·弗里德曼(Lex Fridman)
关于乔治·霍特(George Hott)的获胜方式,标签“赢”主要指的是计算能力。谁拥有最强的计算能力,谁就能获胜。
阿拉温德·斯里尼瓦斯(Aravind Srinivas)
目前看来,AGI(通用人工智能)竞赛中的真正竞争者正朝着前沿模型的方向发展。但任何突破都可能改变这种局面,例如,如果你能基于事实进行推理,并最终开发出能够很好推理的小模型,你就不需要一个拥有百万个 H100 等效集群的系统。
莱克斯·弗里德曼(Lex Fridman)
那是一种极其美妙的表达方式,能够区分推测和事实。
阿拉温德·斯里尼瓦斯(Aravind Srinivas)
如何以更高效、更抽象的方式表达知识,使推理过程更加迭代,并实现参数解耦?

创业者的挑战与机遇

莱克斯·弗里德曼(Lex Fridman)
从你的个人经验来讲,你有什么建议给到创业者吗?
阿拉温德·斯里尼瓦斯(Aravind Srinivas)
我认为所有传统智慧都是有用的。我不会说这些都不重要,比如坚持不懈、勇气、自信以及对他人的信任。这些品质当然重要。如果你没有这些特质,我认为创业确实很难。但你决定创业,尽管面临这些困难,显然意味着你拥有这些特质,或者你认为你拥有这些特质。不管怎样,你可以坚持下去直到拥有这些特质。
我认为大多数人在决定创业后犯的错误是,做他们认为市场需要的事情。比如,对某个想法不感兴趣,但认为,好吧,这能让我吸引风险投资,这能让我获得收入或客户资源。如果你以这种心态出发,我认为你最终会放弃,因为很难为一些对你来说并不真正重要的事情努力。所以你真的在乎吗?
我们专注于搜索领域。我真的对搜索很痴迷。在创办 Perplexity 之前,我的联合创始人 Dennis 的第一份工作是在 Bing。然后我的联合创始人 Dennis 和 Johnny 一起在 Core 工作,他们创建了 Core Digest(核心文摘),基本上是根据你的浏览活动每天提供有趣的知识线程。所以我们都已经对知识和搜索很痴迷。因此,我们可以很容易地在没有任何即时的多巴胺刺激的情况下工作,因为我们从看到搜索质量的提高中获得了多巴胺。如果你不是那种从中获得多巴胺的人,而只是从赚钱中获得多巴胺,那么很难解决难题。所以你需要知道你的多巴胺奖励系统是什么。你从哪里获得多巴胺?真正了解自己。这就是让你成为创始人市场或创始人产品的原因。
莱克斯·弗里德曼(Lex Fridman)
保持健康,这会给你力量坚持实现目标,对吗?
阿拉温德·斯里尼瓦斯(Aravind Srinivas)
从你热爱的一个想法出发。确保这是一个你自己会使用并测试的产品。市场会通过资本主义的压力引导你将其变成一个有利可图的生意。但不要反过来,从一个你认为市场喜欢的想法开始,然后试图让自己喜欢它。因为最终你会放弃,或者会被那些对这个东西真正有热情的人取代。
莱克斯·弗里德曼(Lex Fridman)
在成本、牺牲和痛苦方面呢?根据你的经验,作为创始人是一种怎样的感受?
阿拉温德·斯里尼瓦斯(Aravind Srinivas)
要应对这些挑战,你需要找到自己的方法,并建立自己的支持系统,否则完成这项任务将非常困难。我的支持系统主要来自我的家人。我的妻子在这段旅程中给予了我极大的支持。她几乎和我一样关心这个项目,甚至比我使用这个产品还要多,给了我很多反馈和建议,帮助我发现潜在的盲点。我认为这真的很有帮助。
任何伟大的事情都需要付出和奉献。你可以称之为“Jensen 带来的痛苦”,我则称之为承诺和奉献。你做这件事不仅仅是为了赚钱,而是因为你真的认为它很重要。你要意识到,能够通过你的产品每天服务数百万人是一种幸运。并不是很多人能做到这一点。所以要意识到这是幸运,并努力维持和不断成长。
莱克斯·弗里德曼(Lex Fridman)
在创业初期,招募人才确实很困难,因为像你这样聪明的人有很多选择。你可以留在学术界,也可以在公司担任高职,参与非常有趣的项目。
阿拉温德·斯里尼瓦斯(Aravind Srinivas)
我指的是,这就是为什么所有创始人在一开始都会经历股权稀释。就像在模型驱动的强化学习(RLHF)中,如果你真的模拟各种场景,大多数情况下,你会得出失败的结论。在《复仇者联盟》电影中有一个场景,奇异博士说,在一百万种可能性中,我找到了一个我们可以生存的方法。创业公司也是如此。
莱克斯·弗里德曼(Lex Fridman)
到现在,我仍然对自己的人生轨迹感到遗憾。我没有做太多实际的建设。我希望能多做一些实际的建设,而不仅仅是谈论。
阿拉温德·斯里尼瓦斯(Aravind Srinivas)
我记得曾听过你和埃里克·施密特(Eric Schmidt)早期的播客。当时我还是加州大学伯克利分校的博士生,你总是深入探讨各种问题。播客的最后,你问道:“告诉我,创办下一个 Google 需要什么?”我当时心想,哦,这个人问的问题和我想的一样。
莱克斯·弗里德曼(Lex Fridman)
感谢你记得这件事。这是一个美好的时刻,因为你还记得。当然,我也记得当时的心情。你一直是我的灵感来源,直到今天,我仍然想创办一家初创公司。就像你痴迷于搜索一样,我一生都痴迷于人机交互,也就是机器人。
阿拉温德·斯里尼瓦斯(Aravind Srinivas)
有趣的是,Larry Page 的专业背景是人机交互,这使他在搜索领域拥有独特的见解,而那些仅专注于自然语言处理(NLP)的人则不同。因此,我意识到,能够提出新见解并建立新联系的人,更有可能成为优秀的创始人。
莱克斯·弗里德曼(Lex Fridman)
确实如此,对某件事的热情与新视角的结合需要付出代价,虽然会伴随痛苦,但这是值得的。
阿拉温德·斯里尼瓦斯(Aravind Srinivas)
贝索斯的最小遗憾框架告诉我们,在你临终时,你会因为曾经尝试过而无憾。
莱克斯·弗里德曼(Lex Fridman)
从这个角度来看,你一直是我的灵感之源。感谢你为我们年轻人和其他听众所做的一切。你提到了年轻时努力工作的价值。能谈谈这个话题吗?你会给年轻人什么关于工作与生活平衡的建议呢?
阿拉温德·斯里尼瓦斯(Aravind Srinivas)
此外,这还涉及到你真正想要的是什么,对吗?有些人不想努力工作,我并不是说不努力工作的人生没有意义,也不认为这是错误的。但是,如果有一个想法一直占据你的心思,那么至少在你十几岁到二十几岁的时候,值得围绕这个想法生活。因为那是你可以在某件事上投入十年或一万个小时练习的时期,这些经验以后可以转化为其他成果。这真的很值得去做。
莱克斯·弗里德曼(Lex Fridman)
此外,还有身体和心理方面的因素。就像你说的,你可以连续熬夜。我也能做到,早晨会睡在地板上,或者在桌子下面睡着。是的,年轻时确实更容易做到这些。
阿拉温德·斯里尼瓦斯(Aravind Srinivas)
你可以非常努力地工作。如果说我对早年的自己有什么遗憾,那就是有几周时间我只是看了 YouTube 视频,什么都没做。
莱克斯·弗里德曼(Lex Fridman)
是的,年轻时要明智地利用时间,因为它就像一颗宝贵的种子,早期种下便能成长为伟大的成就。那段时间确实非常重要,尤其是在早期教育阶段,你可以尽情探索和学习。这种自由确实无与伦比。
阿拉温德·斯里尼瓦斯(Aravind Srinivas)
与那些能激励并引导你变得更好的人交往,而不是那些总是质疑你努力意义的人。
莱克斯·弗里德曼(Lex Fridman)
哦,对了,我指的是那些没有同情心,但对某事极度热情的人。我的意思是我自己。
阿拉温德·斯里尼瓦斯(Aravind Srinivas)
当我告诉别人我要攻读博士学位时,大多数人都认为这是在浪费时间。他们说,如果你本科毕业后直接去 Google 工作,起薪可能会达到十万美元左右。四五年后,你可能会晋升到高级或资深级别,收入也会大幅增加。而如果你完成博士学位后再加入 Google,你只能从入门级薪水开始,五年后才能达到相应的级别。这有什么意义呢?但他们忽略了一个重要事实:你并不是在用接近零的折现因子来优化生活,而是用接近一的折现因子。

AI 使人更渴望追求真理

莱克斯·弗里德曼(Lex Fridman)
如果展望未来,你认为搜索引擎会是什么样子?我们可以更大胆地问一个更大的问题:互联网和万维网的未来将如何演变?在未来的网页浏览器中,我们将如何与互联网互动?
阿拉温德·斯里尼瓦斯(Aravind Srinivas)
从宏观角度来看,在互联网出现之前,知识的传递一直是核心。知识的传递比搜索更为重要,搜索只是其中的一种方式。互联网作为一个工具,可以更快地传播知识,并通过主题分类的方式组织信息,例如雅虎的分类目录,随后是更好的链接组织。谷歌也通过知识面板等方式提供即时答案。即使在 2000 年,谷歌每天处理约 30 亿次查询,其中三分之一的查询通过谷歌知识图谱提供即时答案,这些答案主要来自 Freebase 和 Wiki 数据的内容。因此,很明显,至少 30%到 40%的搜索流量只是为了获取答案。即使是剩下的查询,也可以说是为了获取更深入的答案,就像我们现在提供的那样。
然而,随着获取更深入答案和进行研究的新能力的出现,人们能够提出以前无法提出的问题。例如,你能问 AWS 是否完全在 Netflix 上运行而不需要答案框吗?这很难,或者很难清楚地解释搜索引擎和答案引擎之间的区别。因此,这将促使人们提出新的问题和探索新的知识传播方式。我相信我们正在努力的方向既不是搜索引擎也不是答案引擎,而是知识发现。这是一个更大的使命,可以通过聊天机器人、答案机器人、语音助手等来实现。但更重要的是引导人们去发现事物。我认为这就是我们在 Perplexity Q 所要努力的方向,满足人类的基本好奇心和探索需求。
莱克斯·弗里德曼(Lex Fridman)
因此,人类的集体智慧总是基于已有知识不断扩展。而你正在为这种扩展提供更快速的工具,对吗?你认为人类的知识量会迅速增加吗?
阿拉温德·斯里尼瓦斯(Aravind Srinivas)
更重要的是,如果我们能够让每个人都因为拥有能力和工具而更加追求真相,我认为这将带来更多的知识。这样会有更多的人对事实核查和揭示真相感兴趣,而不是仅仅依赖他人和他们听到的信息,这些信息总是可能被政治化或带有意识形态的。因此,我认为这种影响会非常积极。
我希望通过正在进行的页面项目,能创造一个这样的互联网环境,让人们在不需要太多人工努力的情况下创建新文章。我希望这能激发你的浏览兴趣,使你在 Perplexity 上提出的问题不仅对你有用。
Jensen 说,我做这些事情是为了达到目的,我在其他人面前给一个人反馈,不是为了贬低或抬高任何人,而是因为我们都可以从彼此的经验中学习。为什么只有你能从你的错误中学习?其他人也可以学习,或者你和另一个人也可以从另一个人的成功中学习。这是其中的一个启示。
为什么你不能将你在 Perplexity 上的一次问答会话中学到的东西传播给全世界?所以我希望有更多这样的事情。这只是一个开始,人们可以创建研究文章、博客文章,甚至可能是关于某个主题的小书。如果我对搜索一无所知,比如说,我想创办一家搜索公司,那么有这样一个工具让我可以直接去问,机器人是如何工作的?爬虫是如何工作的?什么是排名?什么是 BM25?在一个小时的浏览会话中,我获得了相当于一个月与专家交谈的知识。对我来说,比搜索或互联网更重要的是知识。
莱克斯·弗里德曼(Lex Fridman)
是的,Perplexity Pages 确实很有趣。它提供了一个自然的问答界面,你可以直接提问并得到答案。这种方式有点像一种更私密且有趣的体验。如果你想把这些内容以更有组织的方式展示给世界,你可以选择分享这些内容。我确实也分享过一些内容,但如果你希望以更好的方式组织这些信息,可以创建一个类似维基百科风格的页面,使用 Perplexity Pages。两者之间的区别虽然微妙,但在实际展示效果上却有很大的不同。
在一些 Perplexity 会话中,我提出了非常好的问题,并发现了非常有趣的内容。这种体验本身就很有价值,如果与他人分享,他们也能看到我发现的深刻见解。看到这种体验在大规模应用中的效果也很有趣。我很想看到其他人的探索历程,因为我自己的历程非常美妙。你会发现很多东西,有很多“啊哈”时刻。这确实鼓励了好奇心的探索。
阿拉温德·斯里尼瓦斯(Aravind Srinivas)
正因为如此,我们在探索标签页上为你构建了一条知识时间线。今天的内容经过精心策划,希望能个性化地满足你的需求。每天都有有趣的内容呈现。我们设想一个未来,提问的方式不再仅仅局限于搜索栏。你可以在听或读一个页面时,对其中某个内容产生好奇,然后提出进一步的问题。这就是为什么理解我们的使命非常重要。我们的使命不是改变搜索,而是让人们变得更聪明并传递知识。实现这一目标的方式可以从任何地方开始,无论是阅读一个页面还是听一段文章。
莱克斯·弗里德曼(Lex Fridman)
宇宙中有多少外星人和文明?这是一个我将继续探索的问题。顺便说一下,观看专业搜索操作时,我能感受到背后有很多思考,真是太酷了。谢谢你。
根据搜索结果,宇宙中外星人数量的确切答案尚未明确。接下来我们来看德雷克方程。最近的估计显示,可能存在二十个文明。很好。基于对宇宙大小和宜居行星数量的研究,德雷克方程的主要因素是什么?我们如何设计方法来确定一颗行星是否宜居?是的,这真的很有趣。最近让我感到心碎的一件事是,我越来越多地了解到人类偏见是如何渗透到维基百科中的。
编辑注:德雷克方程(Drake Equation)是由美国天文学家弗兰克·德雷克(Frank Drake)在 1961 年提出的一个数学方程,用于估算银河系内可能存在的能够与地球进行通讯的外星文明数量。
阿拉温德·斯里尼瓦斯(Aravind Srinivas)
因此,维基百科并不是我们唯一使用的来源,这就是原因所在。
莱克斯·弗里德曼(Lex Fridman)
在我看来,维基百科是有史以来最伟大的网站之一。它确实令人惊叹,众包竟然能达到如此宏大的规模。
阿拉温德·斯里尼瓦斯(Aravind Srinivas)
要取得进展,真正的人类控制是必要的,但你需要将其规模化。这就是为什么 Perplexity 是合理的。
一个原因是这样的。是的,Twitter 很棒。它提供了丰富的内容,包括戏剧性事件、新闻和知识获取。但有些人只想要知识,有些人只想要没有戏剧性的新闻。许多人尝试创建其他社交网络来满足这些需求。然而,解决方案可能并不是创建另一个像 Threads 这样的社交应用,试图打造一个“没有戏剧性的 Twitter”。真正的答案是尽可能地迎合人类的好奇心,而不是人类的戏剧性。
莱克斯·弗里德曼(Lex Fridman)
是的,但这部分涉及的是商业模式的问题,所以这是正确的。如果是广告模式,那么情况就会有所不同。
阿拉温德·斯里尼瓦斯(Aravind Srinivas)
其实,要开始这些事情并不复杂,不需要所有现有的资源。确实,吸引力对于社交应用非常重要,因为它能驱动用户参与。广告商需要你展示用户的参与时间。
莱克斯·弗里德曼(Lex Fridman)
因此,这确实是一个挑战。随着复杂性的增加,你会越来越多地面临如何正确解决问题的困扰。如何避免戏剧化和追求最大化参与度的诱惑,以及广告驱动的那些因素。对我个人来说,即使只是主持一个小播客,我也非常谨慎,不去关注浏览量和点击量,这样你就不会最大化错误的东西,而是最大化核心。实际上,我尽量去最大化的是我的好奇心,这也是罗根给我的灵感。在这次对话中,我主要尝试最大化我的好奇心,而不是追求点击量。这正是我在努力做的。
阿拉温德·斯里尼瓦斯(Aravind Srinivas)
我并不是在说这个,最终的解决方案只是一个起点。
莱克斯·弗里德曼(Lex Fridman)
顺便提一下,在选择播客嘉宾时,我也会寻找一些出人意料的人选。这可能会在更大胆的方向上有所帮助,对吧?因为这与当前话题相关。
阿拉温德·斯里尼瓦斯(Aravind Srinivas)
确实,这是个好主意。这就相当于强化学习中的 epsilon-greedy。
莱克斯·弗里德曼(Lex Fridman)
如果你真的能控制那个参数,那就太棒了。我的意思是,你可以根据需要调整复杂度。也许你可以变得非常复杂,而且非常迅速。我在关于 Perplexity 的文章中读到,如果你想了解核裂变,并且你有数学博士学位,它可以被详细解释。如果你是中学生,它也可以被简明解释。那么这是如何实现的?你如何控制解释的深度和复杂度?这是可能的吗?
阿拉温德·斯里尼瓦斯(Aravind Srinivas)
是的,我们正在尝试通过页面实现这一目标,用户可以选择自己的类型,比如专家或初学者,以满足他们的需求。
莱克斯·弗里德曼(Lex Fridman)
这是人类创作者的问题,还是大语言模型的问题?
阿拉温德·斯里尼瓦斯(Aravind Srinivas)
人类创作者会选择目标受众,然后算法尝试实现这一点。你已经可以通过搜索字符串来实现,比如搜索“Ellie 文件”。对我来说,通过添加这个选项帮助很大,尤其是在我完全不懂治理或金融时,我可以学习新知识。我根本不理解简单的投资术语,但我不想在投资者面前显得像个新手。所以,我甚至不知道 MoU 或 LoI 这些缩写词的意思,也不知道 Y Combinator 提出的 SAFE(未来股权简单协议)是什么。我需要这些工具来解答我的问题。
同时,当我试图学习关于大语言模型(LLM)的最新内容时,比如重要论文的内容,我非常注重细节。我实际上需要方程式,所以我会要求解释,给我方程式,给我详细的研究,这样我才能理解。这就是我们在关于页面中提到的传统搜索无法实现的功能。你不能自定义用户界面,也不能自定义答案的呈现方式。这就像一个一刀切的解决方案。这就是为什么即使在我们的营销视频中,我们也会说,我们不是一刀切的解决方案,你也不是。我们的系统在某些主题上会更详细和彻底,但在其他主题上则不会。
莱克斯·弗里德曼(Lex Fridman)
是的,我希望大多数人都具备领导才能,但我也会接受现实。
阿拉温德·斯里尼瓦斯(Aravind Srinivas)
热爱产品应该是这样的:你只需提问,比如,给我一个答案,就像费曼那样解释。或者,爱因斯坦有一句名言,对吧?我不确定这是不是他的名言,但如果这是一个好名言,那就是:只有当你能向你的奶奶解释清楚时,你才真正理解某件事。
莱克斯·弗里德曼(Lex Fridman)
要简洁,但不过于简洁。这就是理念。
阿拉温德·斯里尼瓦斯(Aravind Srinivas)
是的,有时候确实有点过头了。例如,它会用这样的比喻:想象你有一个小摊位,卖柠檬。我不需要如此详细的比喻。
莱克斯·弗里德曼(Lex Fridman)
并不是所有事情都可以简单地比喻。你怎么看待上下文窗口大小不断增加的问题?当你开始处理像 10 万、100 万、1000 万、甚至 1 亿个 token 时,这是否会带来新的可能性?我不确定这种方法能走多远。它是否会从根本上改变所有的可能性?
阿拉温德·斯里尼瓦斯(Aravind Srinivas)
在某些方面,它确实有影响。在其他方面,我认为它可以让你在回答问题时获取更多细节。但需要注意的是,增加上下文大小和指令跟随能力之间存在权衡。大多数人在宣传新的上下文窗口增加时,更多地谈论如何在复杂的评估指标中找到目标,而较少提及指令跟随性能是否有所下降。因此,你需要确保向模型提供更多信息不会让它更加困惑。因为它现在需要处理更多的信息量,可能会导致性能下降。所以我认为这是一个重要的问题。
至于它的新功能,我觉得它在内部搜索方面会表现得更好。这是一个没有人真正解决的领域,比如在自己的文件中搜索,像在 Google Drive 或 Dropbox 中搜索。没有人解决这个问题的原因是,为此构建的索引与网页索引的性质非常不同。相反,如果你能将整个内容放入提示中并要求找到某些东西,它可能会更有能力。而且,考虑到现有解决方案已经如此糟糕,即使它有问题,这也会感觉好得多。

另一个可能实现的功能是记忆,但不是人们所想的那种“我会把所有数据都给它,它会记住我做的一切”。更多的是它让你感觉不必不断提醒它关于你自己的事情。也许它会有用,也许不像宣传的那样有用,但这是一个在计划中的功能。但当你真正拥有像 AGI(通用人工智能)这样的系统时,我认为记忆成为一个基本组件,它知道何时将信息放入单独的数据库或数据结构中,知道何时将其保留在提示中。我喜欢更高效的系统。所以我认为那些知道何时将信息放入提示并在需要时检索的系统,比不断增加上下文窗口更高效。至少目前是这样。

希望 AI 使人类减少偏见

莱克斯·弗里德曼(Lex Fridman)
在 AGI(通用人工智能)领域, Perplexity 目前基本上是一种用于评估模型性能的工具。
阿拉温德·斯里尼瓦斯(Aravind Srinivas)
是的,我喜欢人类,我想你也是。因此,我认为好奇心使人类与众不同,而我们希望满足这种好奇心。这是公司的使命,我们利用所有这些前沿的 AI 模型来实现这一目标。我相信,即使我们拥有更强大的尖端 AI,人类的好奇心也不会消失。这将使人类更加特别,随着他们感受到的额外力量,他们会变得更加有能力、更加好奇、更加渴望追求真理。这将引领我们走向无限的未来。
莱克斯·弗里德曼(Lex Fridman)
是的,我的意思是,这是一个非常鼓舞人心的未来。但你认为还会有其他类型的 AI 和 AGI 系统与人类形成深厚的联系吗?你认为人类和机器人之间会产生浪漫关系吗?
阿拉温德·斯里尼瓦斯(Aravind Srinivas)
确实有这种可能性。已经有类似的应用程序,比如 Replica 和 Character.AI,最近 OpenAI 还展示了类似电影《她》中的 Samantha 的语音演示,让人感觉真的在和它对话。这是因为它更聪明,还是因为它很会调情?这并不清楚。Karpati 甚至发了一条推文,说真正的“杀手级应用”是卡拉·约翰逊,而不是代码机器人。这是一种玩笑,我不认为他是认真的。但这种未来也是可能的。
孤独是一个主要问题,很多人都面临这个问题。尽管如此,我不希望这成为人类寻求关系和联系的主要解决方案。我确实看到一个未来,在那里我们花更多时间与 AI 对话,而不是与其他人类,至少在工作时间里。比如,不打扰同事而是直接问工具会更容易。但我希望这能给我们更多时间来建立彼此之间的关系和联系。
莱克斯·弗里德曼(Lex Fridman)
是的,我认为在工作之外,你可以经常与 AI 交流,就像朋友一样。深厚的友谊能够增强和改善你与他人的关系。你可以把这看作是一种疗愈,同时也是伟大友谊的本质。你们可以建立联系,彼此坦诚相待。
阿拉温德·斯里尼瓦斯(Aravind Srinivas)
是的,但我希望在一个工作不再像工作的世界里,我们能够在 AI 的帮助下,专注于真正让我们感兴趣的事情。这样做的成本不高,而且我们的生活会更加充实。如此一来,我们将有更多时间去做其他事情,并将精力投入到建立真正的联系中。
莱克斯·弗里德曼(Lex Fridman)
人性不仅仅关乎好奇心。人类心灵中存在黑暗面,有些人自负。人性的黑暗面需要被正视。年轻人也有阴影,好奇心未必能解决这些问题。我的意思是,你需要直面这些问题。
阿拉温德·斯里尼瓦斯(Aravind Srinivas)
我们在讨论马斯洛的需求层次理论,对吧?是的,食物、住所和安全是基本需求,但最高层次是自我实现和满足。我认为,这可以通过追求兴趣来实现。让工作变得像玩耍,建立与他人的真正联系,并对地球的未来保持乐观态度。丰富的风险和智慧是好事,知识的丰富也是如此。我认为,当你觉得不再有真正的稀缺时,大多数零和心态就会消失。
莱克斯·弗里德曼(Lex Fridman)
我们正在快速发展。
阿拉温德·斯里尼瓦斯(Aravind Srinivas)
这是我的愿望,对吧?不过你提到的一些事情也可能发生,比如人们与他们的 AI 聊天机器人或 AI 男友女友建立更深的情感联系。这种情况是可能的。但我们公司并不致力于这类产品。我的意思是,从一开始,我就不想做那种东西。至于这是否会发生,实际上,有些投资者甚至告诉我,你们关注的是幻觉。你们的产品中,幻觉是一个错误。AI 都是关于幻觉的,为什么你们要解决这个问题并从中赚钱?幻觉在哪种产品中是一个特性?比如说,AI 男友或 AI 女友。所以去做那个吧,比如各种幻想小说中的机器人。我说不,我不在乎。也许这很难,但我想走更困难的道路。
莱克斯·弗里德曼(Lex Fridman)
是的,这是一条艰难的道路。我想说,人类与 AI 的连接也是一条艰难的道路,要实现人类的繁荣并不容易。但这是一个完全不同的问题。
阿拉温德·斯里尼瓦斯(Aravind Srinivas)
这对我来说感觉很危险,因为你可能会从某人表面上的关心中获得短暂的多巴胺刺激。
莱克斯·弗里德曼(Lex Fridman)
当然。Perplex 试图解决的问题也显得非常危险,因为它试图呈现真相,而随着权力的增加,真相可能会被操纵,对吧?因此,要以公正的方式进行知识和真相的发现,并不断扩展我们对他人和世界智慧的理解。这确实非常困难。
阿拉温德·斯里尼瓦斯(Aravind Srinivas)
至少我们对它有一定的科学理解。比如,什么是真理?至少在某种程度上,我们知道,通过我们的学术背景,真理需要有科学依据,需要经过同行评审,并且需要得到广泛认可。当然,我不是说它没有缺陷,也有很多争议。但在这里,我认为你可以表现得好像有真正的情感联系,但实际上并没有。我们今天有真正代表我们利益的个人 AI 吗?没有,对吧?
莱克斯·弗里德曼(Lex Fridman)
那只是因为目前还没有能够关心并与人类进行长期幸福交流的优秀 AI。这并不意味着人类能够做到这一点。
阿拉温德·斯里尼瓦斯(Aravind Srinivas)
我个人希望希望与我们合作的人能够理解我们真正想要的生活方式,并引导我们实现这一愿景。我认为这更像是教练的角色,而不是像 Samantha 那样的角色。
莱克斯·弗里德曼(Lex Fridman)
这正是 Samantha 想要做的。一个伟大的朋友之所以伟大,不是因为你们一起喝了很多啤酒,整晚狂欢,而是因为你们可能会做这些事情,但同时也在这个过程中成为更好的人。终生的友谊意味着你们在互相帮助中共同成长。
阿拉温德·斯里尼瓦斯(Aravind Srinivas)
我认为我们还没有一个可以真正与之对话的 AI 教练。顺便说一下,这与拥有 AI 代理不同,AI 代理可能会提供一些帮助,就像与顶级专家进行了一次很棒的咨询,但效果却是最差的。我指的是一个能够不断倾听你、你尊重其存在的 AI,它几乎像是你的表现教练。我认为这将会非常出色。这也不同于 AI 导师的概念。因此,不同的应用程序会有不同的用途。我对哪些应用程序真的有用有自己的见解,同时也接受别人对此有不同意见。
莱克斯·弗里德曼(Lex Fridman)
最终,最重要的是为了人类,对的。
阿拉温德·斯里尼瓦斯(Aravind Srinivas)
着眼于长远未来,而非短期。
莱克斯·弗里德曼(Lex Fridman)
通往反乌托邦社会的道路有很多。这台电脑正走在其中一条道路上,就像《美丽新世界》一样。有许多看似愉快、表面幸福的方式,但最终实际上以一种违背直觉的方式削弱了人类的意识、智慧和繁荣。这有点像一个看似乌托邦但最终却变成反乌托邦的未来的意外后果。是什么让你对未来仍然充满希望?
阿拉温德·斯里尼瓦斯(Aravind Srinivas)
对我来说,这一切都关乎好奇心和知识。我认为保持思维活跃的方法有很多,每个人都可以选择不同的道路。更重要的是,我们要培养这种思维方式。人们天生具有好奇心,喜欢提问,而我们希望致力于满足这种需求。许多困惑的产生,主要是因为我们对很多事情不了解,对他人或世界的运作方式缺乏足够的认识。如果我们能更好地理解这些,我们都会心怀感激。我希望自己能更早认识到这一点,那样我会做出不同的决定,生活质量也会因此提高。
莱克斯·弗里德曼(Lex Fridman)
我指的是,是否有可能打破信息茧房。那么,你能理解其他人和其他观点吗?在战争时期,我看到,当存在非常强烈的分歧时,理解和爱能够为和平铺平道路。是的,因为在战争中,人们往往会对世界产生非常狭隘和浅薄的看法,每一方都有不同的观点。因此,弥合这些差距,才是真正的理解和共识。而我认为,AI 在这方面可能比人类做得更好。因为人类确实会带有偏见和其他因素,而 AI 可以更客观地处理信息。
阿拉温德·斯里尼瓦斯(Aravind Srinivas)
我希望通过人工智能,人类能够减少偏见。这对我来说是对未来的积极展望,因为它可以帮助我们更好地理解世界。
莱克斯·弗里德曼(Lex Fridman)
好奇心会指引方向。这次精彩的对话,你成为了我的灵感来源,并激励了所有喜欢创造的孩子们。感谢你开发了 Perplexity 项目。现在让我引用一下阿尔伯特·爱因斯坦的话:“重要的是不要停止提问。好奇心是有理由存在的。当人们思考永恒、生命和现实的奇妙结构时,总会感到敬畏。每天只要尝试理解一点点这个谜题就足够了。

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询