微信扫码
添加专属顾问
我要投稿
今天在 GitHub 上逛到了一个很疯狂的项目,可以直接在浏览器端跑大模型,服务端都给省了
,也就是说,你不需要挂一个后端服务器来跑你的大模型出 token,妥妥的的分布式啊,把压力丢给了你的终端用户了,demo 上,m1 pro 的机器跑起来毫无压力。
,这个项目目前已经超过 10K star 了,项目地址是:
https://github.com/mlc-ai/web-llm
使用方式也是相当 easy,因为,他的资源都上 CDN 了,所以直接 import
就可以了,不需要安装什么依赖,也不需要配置什么环境,直接js 开写就完事。
import * as webllm from 'https://esm.run/@mlc-ai/web-llm';
async function main() {
const initProgressCallback = (report: webllm.InitProgressReport) => {
const label = document.getElementById("init-label");
label.innerText = report.text;
};
const selectedModel = "Llama-3-8B-Instruct-q4f32_1";
const engine: webllm.MLCEngineInterface = await webllm.CreateMLCEngine(
selectedModel,
/*engineConfig=*/{ initProgressCallback: initProgressCallback }
);
const reply0 = await engine.chat.completions.create({
messages: [{ "role": "user", "content": "Tell me about Pittsburgh." }]
});
console.log(reply0);
console.log(await engine.runtimeStatsText());
}
main();
怕卡顿?毕竟在浏览器主线程上跑大模型,怎么说也得担心下UI 卡死把,别急,Web Worker 搬出来
// worker.ts
import { MLCEngineWorkerHandler, MLCEngine } from "@mlc-ai/web-llm";
// Hookup an MLCEngine to a worker handler
const engine = new MLCEngine();
const handler = new MLCEngineWorkerHandler(engine);
self.onmessage = (msg: MessageEvent) => {
handler.onmessage(msg);
};
这下好了,直接把大模型跑到 Web Worker 里面,可以看出来,作者明显是个老手啊,性能优化安排的明明白白的。
支持的开源模型也还算比较多的,有 meta 的 llama,Google 的Gemma 等。
• Llama-2
• Llama-3
• Gemma
• Phi-1.5 and Phi-2
• Mistral-7B-Instruct
• OpenHermes-2.5-Mistral-7B
• NeuralHermes-2.5-Mistral-7B
• TinyLlama
• RedPajama
• 无需服务器:可以直接在浏览器中运行,无需服务器支持,相当低的运营成本。
• 高性能:使用 WebAssembly 和 Web Worker 技术,具有出色的性能。
• 易于使用:提供了简单易用的 API,方便开发者快速集成。
• 支持多种模型:支持多种预训练模型,满足不同需求。
• 隐私保护:因为直接在浏览器中运行,用户数据不会离开本地,保护用户隐私。
• 标准化 api:与 OpenAI API 完全兼容。也就是说,您可以在本地的任何开源模型上使用相同的 OpenAI API,其功能包括 json 模式、函数调用、流式处理等。
他提供了一个 demo 的网站可以体验:https://webllm.mlc.ai/
开始对话的时候,浏览器就回去把开源模型拖回来,然后开始跑,这个过程中,你可以看到模型下载的进度,等到进度条走完,就可以开始对话了。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-03-11
大模型无缝切换,QwQ-32B和DeepSeek-R1 全都要
2025-03-11
Manus AI:一夜爆红的AI新星——谈谈我的感受
2025-03-11
Manus 的胜利是产品的胜利
2025-03-11
尽可能简单地解释模型上下文协议MCP
2025-03-11
AI Agent的瓶颈与AI WorkFlow的流行
2025-03-11
当天复刻Manus,CAMEL-AI 聊Agent及Agent协作的发展趋势
2025-03-11
喝点VC|红杉对话OpenAI Deep Research团队:AI Agent将成为今年最具突破性技术,强化学习重新回归主流
2025-03-11
活久见!靠这篇搞懂AI Agent原理
2024-08-13
2024-06-13
2024-09-23
2024-08-21
2024-05-28
2024-07-31
2024-08-04
2024-04-26
2024-07-09
2024-09-17
2025-03-10
2025-03-10
2025-03-10
2025-03-10
2025-03-08
2025-03-08
2025-03-07
2025-03-07