我要投稿

RouteLLM：一个用于服务和评估 LLM 路由器的框架。

发布日期：2024-07-19 07:51:35 浏览次数： 1994

01。

概述

大型语言模型（LLMs）在多种任务中展现出了卓越的能力，但它们在成本和功能上存在显著差异，这一点从图1中性能与成本的对比图中可见一斑。一般来说，功能更强的模型往往比功能较弱的模型成本更高。这在实际部署LLMs时引发了一个难题：将所有查询路由到最大、功能最强的模型可以获得最高质量的响应，但可能会产生较高的成本；而将查询路由到较小的模型虽然可以节省成本，但可能会导致响应质量降低。

大型语言模型（LLM）路由提供了一种解决方案，该方案通过一个系统首先处理每个查询，然后决定将其路由到哪个LLM。理想情况下，所有能够由功能较弱的模型处理的查询都应被路由到这些模型，而其他所有查询则应被路由到功能更强的模型，以此在保持响应质量的同时最小化成本。然而，这实际上是一个挑战性问题，因为路由系统在路由时需要推断进入查询的特性和不同模型的能力。

为了解决这个问题，提出了RouteLLM，这是一种基于偏好数据的LLM路由的有原则框架。形式化了LLM路由问题，并探索了增强技术以提高路由器的性能。使用Chatbot Arena的公共数据训练了四种不同的路由器，并证明它们可以在不降低质量的情况下显著降低成本，在MT Bench上成本降低了85%以上，在MMLU上降低了45%，在GSM8K上降低了35%，相比仅使用GPT-4，同时仍达到GPT-4性能的95%。

02。

核心特性

核心功能包括：

1. 作为OpenAI客户端的即插即用替代品（或启动一个与OpenAI兼容的服务器），将简单查询路由到成本更低的模型。

2. 提供开箱即用的经过训练的路由器，这些路由器在广泛使用的基准测试如MT Bench上显示出在降低成本高达85%的同时，保持了95%的GPT-4性能。

3. 基准测试还表明，这些路由器在性能上与商业产品相当，同时成本降低了超过40%。

4. 轻松扩展框架以包含新的路由器，并在多个基准测试中比较路由器的性能。

03。

安装

From PyPI

pip install "routellm[serve,eval]"

From source

git clone https://github.com/lm-sys/RouteLLM.git
cd RouteLLM
pip install -e .[serve,eval]

参考：

1.https://github.com/lm-sys/RouteLLM?tab=readme-ov-file

2.https://arxiv.org/pdf/2406.18665

53AI，企业落地应用大模型首选服务商

产品：大模型应用平台+智能体定制开发+落地咨询服务

承诺：先做场景POC验证，看到效果再签署服务协议。零风险落地应用大模型，已交付160+中大型企业

160+中大型企业正在使用53AI

立即咨询预约演示

百度智能云邀53AI：共创AI新纪元，启航智能新时代

2024-05-27

钉钉恒星计划：53AI与百余位企业家及钉钉生态伙伴，共议“AI 浪潮下的新机遇”

2024-05-22

热点资讯

一文带你了解大模型——智能体（Agent）

2024-05-28

全面对比dify、coze、streamlit、chainlit

2024-04-26

Cursor 一个真正让程序员产生危机感的 AI 编程工具

2024-08-21

本地部署大模型？看这篇就够了，Ollama 部署和实战

2024-08-13

“大数据+”医疗

2024-04-11

【深度】AI搜索产品深度分析-搜索原理和商业模式分析

2024-07-09

Claude中国官网正式上线！1:1还原官网，非套壳，国内直连

2024-07-18

哈工大“风筝”航天知识大模型开放测试

2024-10-25

一文读懂大模型推理必备技术：KV Cache

2024-07-01

全球首个开源AIGC数字人模型免费使用，手机端可跑！

2024-06-16

大家都在问

AI Agent将给软件工程带来哪些新机遇与挑战？

2024-11-25

为什么大模型连"Strawberry"的"r"都数不对？

2024-11-21

数据库 + 大模型，DBA初级变高级？

2024-11-18

工业大模型落地加速，哪些场景将率先获益？

2024-11-14

AI 2.0时代，谁是未来的“掘金者”和“卖铲人”？

2024-11-08

如何泛化AI的深度推理能力？

2024-11-07

为了在AI时代做好“个人助理”，vivo做了哪些努力？

2024-11-05

什么是AI“世界模型”？为何如此重要？

2024-11-04

开箱即用的企业大模型应用平台

工作+AI

业务+AI

AIx业务

大模型咨询

大模型定制

相关资讯