微信扫码
添加专属顾问
我要投稿
本次更新重点是嵌入(Embedding)模型。
引入新的嵌入模型(embedding models)
BGE-M3:来自BAAI的大型嵌入模型,因其在多功能性、多语言性和多粒度方面的灵活性而著名。
BGE-Large:一个以英语为训练语言的大型嵌入模型。
Paraphrase-Multilingual:一个多语言嵌入模型,训练于50多种语言的平行数据上。
新嵌入API支持批处理:
Ollama现在支持新的API接口 /api/embed 用于生成嵌入:
curl http://localhost:11434/api/embed -d '{"model": "all-minilm","input": ["Why is the sky blue?", "Why is the grass green?"]}' 此API接口支持的新功能:
批量处理:一次请求生成多个文档的嵌入
标准化嵌入:嵌入现在被标准化,提高相似性结果
截断:新增加的截断参数,设置为false时会报错
统计指标:响应中包含 load_duration、total_duration 和 prompt_eval_count 指标
其他变更内容:
修复了Windows上初始下载速度缓慢的问题
NUMA支持将由Ollama自动检测,以提高性能
修复了/api/embed有时返回嵌入结果顺序错误的问题
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-03-27
林俊旸离职后首次发声!复盘千问的弯路,指出AI的新路
2026-03-26
GitHub 悄悄改了规则,你的代码可能正在被拿去训练 AI
2026-03-26
Harness is the New Dataset:模型智能提升的下一个关键方向
2026-03-26
Google 亲手证明:GUI 已死,但尸体还在动
2026-03-26
Claude Code 太烧钱了?我用这 5 招,把 token 成本砍了一半!
2026-03-26
治愈 Cursor AI 编程的 “幻觉”?用它就够了!
2026-03-26
Anthropic官方复盘Claude Code:智能体系统设计的四个核心
2026-03-26
Claude Code auto mode 解析:如何用 AI 分类器替代人工审批
2026-01-24
2026-01-10
2026-01-01
2026-01-26
2026-01-09
2026-01-09
2026-01-23
2025-12-30
2026-01-14
2026-01-21
2026-03-22
2026-03-22
2026-03-21
2026-03-20
2026-03-19
2026-03-19
2026-03-19
2026-03-18