微信扫码
与创始人交个朋友
我要投稿
databricks 原本的业务主要是两块,一块是 spark 生态数仓相关,一块是以 spark 构建AI 小模型工具链。
收购了Mosaic AI 补齐了大模型相关工具链。目前大数据相关和大模型平台在逐步融合中。
通过收购和补齐 workflow,AI App 等能力,形成完整技术栈。
数据平台作⽤不⽌治理能⼒,还提供结构化、⾮结构化数据联合召回
提供 feature 和 function serving 应对结构化数据召回,向量搜索对应非结构化数据召回。
Feature and Function Serving 是低时延实时服务服务于结构化数据 serving 场景。可以通过 catalog 里面定义的 python 函数来实现实时数据转换。返回的数据可以用于实时规则引擎,经典的 ML 应用或者大模型应用。
2、Azure 核心理念:all your data in one place
Fabric 2023 年 11 月底GA,将数据工程、数据湖、数据仓库、机器学习和人工智能整合到一个平台中。
从时间节点来看,阿里的 Openlake 解决方案借鉴了 Azure 的思路,但是做得更大一些。整体理念:从结构化走向多模态数据统一管理和治理。
Openlake 是阿里云 AI 基础技术栈核心位置
通过 Openlake 解决方案,打通计算引擎,数据湖等,实现 Data+AI 统一治理
统一元数据和数据湖存储,融合多个计算引擎:支持各种分析引擎,包括向量引擎/数据上层使用的接口;针对底层存储加工提升性能
打通百炼,闭环用户模型微调场景:支持用户微调数据准备,然后送到百炼微进一步处理。
预置各种数据科学与数据处理算法。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-02-05
OpenAI发布了ChatGPT新功能Deep Research(深度研究),几分钟内完成人类需要数小时才能完成的工作
2025-02-05
独家:中国大模型中标项目监测与洞察报告(2025年1月)
2025-02-05
OpenAI智能体Operator背后CUA技术解析
2025-02-05
Google AI发布Gemini 2.0 Flash Thinking 模型
2025-02-05
万字长文详解DeepSeek-R1模型工作原理
2025-02-05
从0到1了解DeepSeek
2025-02-05
中国 AI 资产重估叙事
2025-02-05
全家桶来了!硅基流动上线加速版 DeepSeek-R1 蒸馏模型
2024-08-13
2024-09-23
2024-05-28
2024-06-13
2024-08-21
2024-04-26
2024-08-04
2024-07-09
2024-07-01
2024-09-17
2025-02-04
2025-02-01
2025-02-01
2025-02-01
2025-02-01
2025-01-29
2025-01-24
2025-01-24