使用基于嵌入的搜索技术,Exa能够精确地在网络中找到您所需的内容。1. 网页搜索:使用自然语言查询在网络上查找任何网页。如果您需要,Exa还支持类似谷歌的关键词搜索。2. 页面内容获取:从Exa搜索结果中获取干净、最新、解析过的HTML内容。可以使用我们的“高亮显示”功能进行语义定位。3. 查找相似页面:基于一个链接,查找并返回在意义上相似的页面。Exa的精确内容检索功能极大地增强了RAG(检索增强生成)流程,自动化了数小时的研究工作,并为您的特定用例创建了高质量的数据集。Exa是一款创新的搜索引擎,它利用最新的人工智能语言处理技术,致力于提供最佳的搜索结果。- 引入神经搜索:通过“下一页链接预测”技术,Exa能够更深入地理解查询和索引文档的语义内容,从而预测最相关的网页链接,而不仅仅是直接的文字匹配。
- 构建高质量内容索引:Exa拥有自己的高质量网页内容索引,并训练了一个模型,利用与现代大型语言模型(LLMs)同样强大的基于嵌入的技术来查询此索引。
通过使用嵌入技术,Exa超越了传统的关键词搜索,采用“下一页链接预测”方法,理解查询和索引文档的语义内容。这种方法基于语义含义预测最相关的链接,而非仅仅基于直接的文字匹配。通过这种方式,Exa的模型能够理解复杂的查询,包括间接或主题性的关系,预测最相关的链接。这种方法特别适用于探索性搜索,其中精确的术语可能未知,或者查询需要许多通常语义密集的层次过滤。- 结合神经搜索和关键词搜索:Exa通过“自动搜索”功能,将两种搜索方式的优势结合起来。有时,关键词搜索是查询网络的最佳方式,例如,您可能有一个特定的单词或术语,希望明确地与结果匹配(通常是地名等专有名词)。在这些情况下,语义搜索并不是最有用的。
为了确保引擎全面,Exa并行构建了关键词搜索功能,与新颖的神经搜索能力相结合。这意味着Exa是一个“一站式”搜索解决方案,无论您的查询需求是什么。最后,通过“自动搜索”功能展示这两种查询类型,为用户提供两种搜索方式的最佳体验。Exa构建了一个小型分类模型,能够理解您的查询,我们的搜索基础设施,从而将您的特定查询路由到最佳匹配的搜索类型。以下是如何在一个简单的Python示例中设置自动搜索。类型选项包括神经搜索、关键词搜索或自动搜索。Exa自动搜索最初被称为“魔法搜索”,但这一名称已被更改。result = exa.search_and_contents(
"hottest AI startups",
type="auto",
)