AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


蚂蚁代码大模型推理部署探索与实践
发布日期:2024-04-10 20:44:59 浏览次数: 2061 来源:CodeFuse


01

CodeFuse 开源介绍

▲ CodeFuse 开源情况

(图片较长,点开看大图)

02

ModelOps 平台介绍

  • 挑战 1模型参数的持续增加导致对显存和计算资源的需求急剧上升,而且显卡技术更新缓慢;
  • 挑战 2大模型采用自回归的生成模式本质上效率不高;
  • 挑战 3不同的模型请求导致资源消耗的不确定性,进一步增加了部署的复杂性。

(图片较长,点开看大图)

(图片较长,点开看大图)


03

ModelCache 技术介绍


(图片较长,点开看大图)

04

ModelCache 研究及成果


(图片较长,点开看大图)

开源地址:
https://github.com/codefuse-ai/CodeFuse-ModelCache
文章介绍:

CodeFuse开源ModelCache大模型语义缓存


05

ModelOps 技术展望





53AI,企业落地应用大模型首选服务商

产品:大模型应用平台+智能体定制开发+落地咨询服务

承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询