我要投稿

Jina又开源：用于Agentic RAG的Jina Reranker v2，支持多语言、函数调用和代码搜索！

发布日期：2024-06-27 03:23:11 浏览次数： 2422 作者：PaperAgent

Jina Reranker v2来了！Agentic RAG一流的重新排序器。具有100多种语言的跨语言检索、函数调用、表格与代码搜索和极速响应，已在huggingface开源：

多语言：在100多种语言中提供更相关的搜索结果，性能超过bge-reranker-v2-m3；
Agentic：为Agentic RAG提供最先进的函数调用和文本到SQL重排；
代码检索：在代码检索任务上表现最佳；
极速：文档吞吐量是bge-reranker-v2-m3的15倍，是jina-reranker-v1-base-en的6倍。

Jina Reranker v2的多语言

用户在Reranker v1上最常请求的功能之一是多语言支持：允许以任何语言检索文档，无论查询的语言是什么。在v2中，将此支持扩展到100多种语言！

在MKQA数据集上评估了Reranker v2，该数据集包含来自现实世界知识库的 26种语言的问题和答案。该数据集旨在评估问答系统的跨语言性能。

显示了recall@10分数

Jina Reranker v2结构化数据查询

V2的一个有趣功能是它支持结构化数据。它理解在MySQL或MongoDB等数据库中搜索的意图，并根据自然语言查询对最相关的表进行排名。

一个具有代理性的RAG（Retrieval-Augmented Generation，检索增强生成）使用SQL查询检索数据，并将这些数据作为额外的上下文信息提供给大型语言模型（LLM）

使用NSText2SQL数据集基准测试了查询感知能力。从原始数据集的“指令”列中提取用自然语言编写的指令，以及相应的表格schema。

对比不同重排模型将正确的表格架构与自然语言查询进行排名的的Recall@3分数

Jina Reranker v2函数调用（Function Calling）

使用Jina Reranker v2，还可以对函数进行排名。它了解函数调用的意图，并相应地为函数规范分配相关性分数。

展示如何使用Reranker改进函数调用并最终改善Agent AI用户体验

使用ToolBench基准测试评估了该项能力，该基准测试收集了超过16,000个公共API及其相应的合成生成指令。

与其他重排模型相比的结果（使用recall@3指标）

Jina Reranker v2代码检索

Jina Reranker v2不仅在函数调用和结构化数据查询方面进行了训练，而且与类似大小的竞争模型相比，还提高了代码检索能力。使用CodeSearchNet基准测试评估了其代码检索能力。该基准测试是docstring和自然语言格式的查询组合，以及与查询相关的标记代码段。

与其他重排模型的MRR@10对比结果

在整个RAG流程中，除了Reranker，还涉及Embedding、Indexing等等，PaperAgent团队RAG专栏进行过详细的归纳总结：高级RAG之36技（术），可私信留言试看：RAG专栏。

https://huggingface.co/jinaai/jina-reranker-v2-base-multilingualhttps://jina.ai/news/jina-reranker-v2-for-agentic-rag-ultra-fast-multilingual-function-calling-and-code-search/?nocache=1

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-04-29

RAG性能暴增20%！清华等推出“以笔记为中心”的深度检索增强生成框架，复杂问答效果飙升

2025-04-29

超神了，ChatWiki 支持GraphRAG，让 AI 具备垂直深度推理能力！

2025-04-29

AI 产品思维：我如何把一个 AI 应用从基础 RAG 升级到 multi-agent 架构

2025-04-29

做好 AI Agent 最重要的是什么？

2025-04-29

颠覆传统RAG，创新大模型检索增强—Insight-RAG

2025-04-29

MCP：从理论到实践

2025-04-28

大模型RAG：基于大模型的机器人技术方案

2025-04-28

使用CAMEL实现RAG过程记录

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

全网最全国内Agent平台深度测评：扣子、Dify、FastGPT，谁是你的Agent开发首选？

2024-10-27

一文彻底搞懂大模型 - RAG（检索、增强、生成）

2024-09-04

GraphRAG+Ollama 本地部署，保姆教程，踩坑无数，闭坑大法

2024-07-18

RAGFlow：基于OCR和文档解析的下一代 RAG 引擎

2024-05-05

RAG框架，都在这了!

2024-06-20

RAG 高效应用指南：Embedding 模型的选择和微调

2024-06-13

深入解析 Graph RAG：提升语言模型问答能力的创新策略

2024-07-09

微软开源的GraphRAG解读

2024-07-09

基于Llama 3 构建RAG语音助手：将本地 RAG 与 Qdrant、Whisper 和 LangChain 集成

2024-05-19

Prompt工程师必备：复旦重磅 | 最佳RAG实践长什么样的？

2024-07-07

大家都在问

做好 AI Agent 最重要的是什么？

2025-04-29

RAG比之MCP或长上下文LLM，要没落了吗？

2025-04-26

HR AI小科普——什么是MCP？

2025-04-25

RAG应用必备！10种向量数据库全解析、Weaviate、Milvus、pgvector、Qdrant等热门工具谁更强？

2025-04-22

18种RAG技术大比拼：谁才是检索增强生成的最佳选择？

2025-04-22

大模型能像专业分析师一样提取用户需求吗？

2025-04-20

RAG vs. CAG vs. Fine-Tuning：如何为你的大语言模型选择最合适的“脑力升级”？

2025-04-19

什么是RAG与为什么要RAG？

2025-04-18

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB