微信扫码
添加专属顾问
我要投稿
数据:比DeepSeek-VL多一倍优质训练数据,引入梗图理解、视觉定位、视觉故事生成等新能力;
架构:视觉部分使用切图策略支持动态分辨率图像,语言部分采用低成本、高性能的MoE架构;
训练:继承DeepSeek-VL的三阶段训练流程,同时通过负载均衡适配图像切片数量不定的困难,对图像和文本数据使用不同流水并行策略,对MoE语言模型引入专家并行,实现高效训练。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-04-26
Ollama-Deep-Researcher-本地Mac结合魔搭社区模型搭建网页研究助手
2025-04-25
Manus开源版本!无需邀请码,老金手把手教你咋用!
2025-04-25
78k star,像写 Markdown 一样画流程图,这个开源工具太牛了!
2025-04-25
MarkItDown MCP:一款好用的将文件和办公文档转换为Markdown的AI工具!
2025-04-24
AI+SQL客户端,这款开源神器让数据库管理像聊天一样简单!
2025-04-24
效率革命!GitHub爆火的开源神器MinerU:PDF、网页、电子书一键转Markdown
2025-04-24
Suna:构建你专属“通用智能体”的开源利器
2025-04-24
开源TTS领域迎来重磅新星!Dia-1.6B:超逼真对话生成,开源2天斩获6.5K Star!
2024-07-25
2025-01-01
2025-01-21
2024-05-06
2024-09-20
2024-07-20
2024-07-11
2024-06-12
2024-08-13
2024-12-26
2025-04-21
2025-04-19
2025-04-17
2025-04-15
2025-04-13
2025-04-10
2025-04-07
2025-04-03