微信扫码
与创始人交个朋友
我要投稿
声明:本文是读Sapphire Ventures最新博客“AI原生应用:未来企业级软件的评估框架”后的随笔,(https://sapphireventures.com/blog/ai-native-applications/),内容中部分译文和观点参考了拾象的编译。主要是对其中一些我认为有价值的理念做一个摘要,并附上个人的一些思考。
一、如何定义和判断AI原生
我总结为“3+1”要素:即,技术内核(大模型GenAI/小模型DecisionAI)+ 价值(突破性优于传统生产力)+ 自主泛化(基于数据反馈的自主提升)+ 专有能力(工程/专业知识DSK)。
具体而言,四个要素原文解读如下.
建立在基础 AI 能力之上,包括从大规模数据集中学习、理解上下文或生成新颖输出的能力。
.能够突破传统速度、规模和成本的限制,开创全新的可能性。
.具备持续改进的能力,既可以利用底层模型的进步,也可以通过真实世界数据的反馈循环来提升性能。
.拥有一定程度的专有 AI 技术,而不是完全依赖现成的解决方案(例如,针对特定功能微调开源模型、模型编排等)。
其中1是共性基础,2是目标/结果,3,4是技术护城河,4相对而言而模糊和泛指,所以我称之为3+1
我们现在这一波AI技术行情的早期阶段使用AI原生一词,来区分
1)快速增强和/或扩展现有产品的公司
2)从开始就着眼于构建全新能力和假设的公司。
随着时间推移,这种界限将变得模糊,起点并不重要,重要的是 AI 优先公司在构建产品和组织方面(利用AI技术)有多深入。
(拾象翻译的可能更符合国内的商业表达:“是否 Day 1 就围绕 AI 构建产品这件事”将不如企业在产品开发和组织建设过程中对 AI 的深度融合来得重要“)
个人认为上述观点也可以解读为AI距离AGI还很远
五个维度用来评估公司在构建AI原生应用方面的能力(to evaluate companies building applications with AI)。这里是评估的公司,主要是技术厂商,但鉴于数字化技术市场的甲乙方越来越模糊,这个架构对于技术用户方企业也不无意义。
是否具备创新的软件设计额能力,包括新交互 + 新反馈 + 系统性工程方法。
1) 传统方式:输出内容的赞踩投票、星级评分系统。
2) 人工审核机制:由专业审核人员对 AI 系统的输出进行审查和评估,帮助确保内容质量并收集改进建议。
3)创新监测:通过分享行为、停留时长、内容时效性、互动频率、复制粘贴等方式收集用户意图信号(Intent Signals)。
许多 AI-native 应用在用户界面层的优雅设计背后,实际上掩盖了大量后端的复杂性。
随着 AI 从行动辅助(assistance)转向决策(answers)和代理(agents),在流程各环节融入可解释性变得尤为重要。
作者提出的四类可解释性并非完全平行或递进关系,可以视为不同场景下的可解释性要求。
1) 清晰展示输入与输出的关联;(图谱路径可视化)
2) 引用具体内容来源;(搜索,e.g. Perplexity )
3) 适时提供置信区间;(依据不足、主观问题、预测)
4) 为需深入了解系统性能的用户提供更详细的解释机制(高级用户、高水平科研)
是否能够基于数据形成关键竞争优势,包括数据管理 + 隐/暗数据激活 + 专有数据。
这里提出四类数据管理活动
1)数据采购和策划(data procurement and curation)
2)数据质量管理(data quality)
3)数据治理(data governance)
4)数据安全(data security)
其中第一项往往被人忽视或不理解,尤其是。Data Curation是个舶来词,常用在博物馆领域,含义是“策展”,在数据管理中经常和Data Steward,即“数据管理”(也不是一个完全恰当的中文对应)混用,并没有太好的中文翻译,大致涵盖了根据特定业务要求“制作”相应数据的端到端内容,因此实际包括了收集、整理、清洗、标注、管理和维护等多种动作,个人认为有点儿数据产品经理+业务方数据管理专员的意思
数据质量管理和数据治理往往容易混淆,目前包括数据安全都被纳入数据管理国标DCMM的范畴。
1)存储在各类系统中未被充分利用的数据,例如 Box、Google Drive、SharePoint 中的数据,
2)完全未被系统捕获的数据,例如客户通话、患者讨论、会议记录等。
个人认为这部分对国内政企组织挑战很大,原因有三
一是,传统业务系统中大量的结构化数据尚未完全利用、数据管理水平整体不高,在总投入有限的情况下如何安排优先级是个挑战
二是,表面上看,收集、向量化、检索这把大象装进冰箱的三步法就可以实现暗数据的利用,但实际上需要多模态、主动元数据等更复杂的技术,也涉及更全面的数据治理和安全管理考量
三是,真正有价值、“推理性”数据可能更多的仍然存在于专家的脑海中,现有沉睡数据,尤其是在数字化成熟度和数据管理成熟度不高的组织中上述两类数据的价值存疑。
总之,激活数据也要考虑成本代价。
1)多模态交互数据(multi-modal engagement data)
2)AI 生成内容的创建和使用元数据(metadata)
3)数据中微观和宏观模式的识别(pattern recognition)(拾象译文略有偏差,但影响到了理解,因此特别指出:指的是从数据中发现规律,例如用户行为或消费数据得出异常判断、偏好标签或中长期趋势等)
这一部分大致符合主动元数据的定义。作者说,专有数据将带来数据量之外的优势(这句话也很重要,但原文漏译了)。个人认为,这实际和上面的沉睡数据一起都是推理数据,从原理而言,对于模型能力提升的确有很大潜力,但仍然面临冷启动、成本投入以及试错的挑战。
文中没有特别提出的,其实还有一点,就是数据管理的组织成本和持续性成本。无论是沉睡数据还是专有数据,都有过时贬值的属性,在一定意义上,实时的数据才是好的数据。因此,无论甲方还是乙方,考虑构建一款企业级AI应用时,都要考虑数据管理的成熟度、成本代价,制定相应的时间表。
另外,由于“这些数据在传统系统中并不存在”,创造专有数据也可以是AI创业企业的一个创造落地切入点和竞争优势的路径,例如,在ERP、CRM等incumbents player的既有业务系统之前,通过更人性化的人机互动设计等方法,“劫持”数据采集这一环节,获得专有数据的入口,即“这为 AI-native 企业提供了捕获这些数据、以此建立一个整合入口,并构建差异化的工作流程,从而以持续让这些数据产生价值的机会。”。
是否具备将行业和团队专业经验转化为数字化知识、形成护城河的能力。
在Cohere、C3.ai的分析文章中讲了类似这部分中提到的凭借专业知识或聚焦行业知识打造差异化优势的逻辑(95后用AI搞企业服务,估值400亿,C3.AI:AI时代的埃森哲)
本文中把打造专业护城河这一较为笼统的共识拆分为AI加速的工作流、专业数据规模化实时整合以及通用和本地知识融合三个方面较为具体的内容。整体而言有启发,但还是偏概念性,也和数据能力多有重叠。
这里谈三点我的理解。
一是知识的定义。中文的题目解读为“将Domain Knowledge转化为AI工作流”,不求精确这么说也没问题。但我还是倾向于避免过多过宽的使用“知识”的概念:数字化的、经过一定的分类处理、质量加工、可复用和有明确业务价值的资料。这里说的是未数字化、或以传统数字化手段较难提炼和沉淀知识的业务活动,还不是严格意义的、或显性知识。所以原文用词比较精确,是应用AI技术,将业务活动更高效、更高质量的转化为机器更友好的数据,从而能够更好的解读给人类,发掘更大的价值。
二是关键技术。我认为就是结合业务逻辑的意图理解+(主动)自动化,也就是深入理解特定行业或功能的上下文,并自动执行相关操作,帮助用户更快、更高效地达成目标。
三是落地路径。而关键中的关键还是数据,即上面提到的"专有数据",只有具备类似作者提到的“高级用户和资深领导者的使用模式”数据,才能将"模式转化为提示和结构化输出"。通俗的说,就是要把专家的工作模式用数据记录或解析出来,让大模型学习,然后实现能力普惠。
这部分主要讲的是专业领域实时数据资源(一般是成熟的信息产品)直接转化为高水平生产力。原文使用了“合成”一词,个人认为,结合外部高质量数据资源进行知识的再创造应是良好AI应用的一个路径。
包括模型知识、行业知识(数据集)和组织专有认知(Insights from organization's own artifacts)。这部分内容国内谈的都比较多了,而且也与之前的专有数据有重叠。但我认为这一部分还是有几个点需要解读。
一是,和数据部分不同,作者的视角是,好的AI原生应用应承担起融合各类数据的责任。
二是,原文中用Insight来描述组织内部专属的知识,而没有用Knowledge,拾象比较忠实的译为“认知”。也许原文只是简单的避免重复修辞,但如果我们继续严格用狭义的企业级知识定义,那么这里所描述的是从企业高质量数据中可能提取的洞察,具备成为知识的潜力,但还不是知识。作者指出,高质量的PPT,会议纪要、研究、培训等文档是AI应用优化的重要来源,因为用户脑海里的好就是这些资料的内容和形式。(通俗理解一下:好的应用输出的东西得照着用户“吃过见过”的标准来https://www.bilibili.com/video/BV18Z4y1T7rV/)
三是,作者认为除了前面说的专有数据获取和利用之外,更好的理解这些专有数据还能够发现背后的知识和知识间的联系(这是我的引申理解。原句比较晦涩不清:It's the understanding of how that data reflects the relevant knowledge of an employee, team or organization, within a specific context.),
四是,作者认为通用+本地因而能够实现全局自动化,而不是仅仅在局部Task方面的优化。此处的技术实现方式和逻辑应该还不太清晰,还仅仅是愿景层面的表述。
是否具备更广泛、更端到端的自适应/自动化、生成和个性化能力。
我认为这里谈的优化可以视为利用生成式AI的能力让机器具备更高水平的底层自动化。根据应用场景、用户问题类型等以自动化的方式进行底层技术组件编排,免除硬编码、手动规则或配置设定等偏技术性的工作。例如,在Chatbot种选择模型、语气等偏好配置,其目标是总体上提升性价比。
聚焦在定制化营销和销售领域,在B端表现为完全自动化的生成面对单一客户的全过程营销内容和形态,包括邮件、宣传册、促销文案、PPT,甚至还有产品初始页面和最终的合同,在C端表现为根据客户的显性和潜在偏好,以及实时互动,完全自动化的动态广告生成、效果测试和优化直至购买和售后的体验优化。设想未来无论是消费级还是企业级数字化产品,用户看到的界面和各种功能都是基于个性以及交互实时动态生成的,这不但会改变人们使用数字化应用的习惯,更会颠覆应用开发的内容和模式。
个人认为这部分在很大程度上还是愿景,主要还是被营销对象数据的可获得性问题,另外这种自动化在一定程度上也侵入了当前共识的隐私域,用户会产生冒犯感。
上面两条其实都可以成为“超级个性化”(因为利用数据进行千人千面个性化早已经被过度承诺了,这里不得不“超级”一下)。不但个体应用中的技术配置、内容体验可以个性化,可以在群体、团队以及组织层面实现个性化。这部分内容的落地就更加远期了,但作者提出了一个有趣的点,就是智能体未来具备共享记忆是未来组织级完全性化一种终极特征。
这部分有些烧脑(前同事首席数据架构师刘老师总是形象的说“二阶导数”)。
是否能够基于AI能力灵活的包装产品和定价方式,从而提升业务价值、实现模式创新
1)现有服务中免费嵌入GenAI功能(如 Workday)
2)现有产品中开发具备 GenAI 能力的高级功能(原文是可获取GenAI能力的功能)
3)提供全新的独立 GenAI 应用
4)在平台基础功能/服务不变的前提下测试根据用量或结果付费的产品
这里说的包装指的是对产品形态的设计或通常我们说的产品组合,如应用嵌入、Copilot还是Agent等。这些形态的边界可能有时非常模糊,也作为营销词汇被彻底的混用,所以暂时不用太纠结辨析各家厂商的提法。在定价方面,存在按坐席(seat-based)、按用量(consumption-based)以及更特定案例中的(more selectively)按结果(outcome-based)收费三种方式。
大部分情况下,包装和定价是配合着来的、是一种平衡的策略。作者认为,目前还不存在一种绝对优势的产品组合或定价模式,而最后胜出的企业要做到:一是产品组合能覆盖大块市场(breath of customer coverage),而且定价逻辑清晰透明、价格和客户价值获得感受匹配的(transparently aligning pricing with value delivered )。
简而言之,在目前市场和技术发展状态下,相比押宝任何一种产品形态,获取更广泛(类型)的市场客群更重要,那么根据客户需求决定产品形态和选择多形态的产品组合就是自然而然的事儿了。
例如基于智能体系统的按业务成果定价,或Software-Enabled Services。
这篇文章以前见到过但还没细读,不过“软件赋能的服务”这概念似乎也不新。好几年前埃森哲和印度外包企业就都在说"服务软件"(ServWare),而以此方式提供的服务称为“基于资产的服务”(Asset-based Service), 感觉和Service as a Software也有点儿翻来覆去说类似的AI故事。
但本质上,这一部分的能力已经超越了用定价来获得产品竞争优势,而是实际上从卖软件转变为卖服务,要跨界打劫了。
最后对企业软件应用的演变路径做了预测,可以参考,不过基本上面都提到过,这张图单看还是比较宏观,要理解还是要返回去对照文章内容体会。
作者的总结陈词中的一些关键词看上去宏观,但其实是对AI应用以及AI创业差异化很本质的思考和和自然的结论,摘出来分享给大家,括号里是以我自己理解添加的话外音
最后,要说拾象的文章编译的水平是很高的,虽然有一些小错误,也略掉了不少内容,但整体的可读性非常高,超越了99%的人翻和机翻,自忖我短时间借助AI也达不到这个水平。看了一下署名是位实习分析师,真是自古英雄出少年/少女啊。
53AI,企业落地应用大模型首选服务商
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-12-20
Anthropic宣告智能体时代来临: 如何构建高效的智能体, 从入门到实践的全面指南
2024-12-20
Anthropic:Agents 2024年度总结!
2024-12-20
不搞大模型是「等死」,搞了大模型是「找死」
2024-12-20
Mac版ChatGPT接入大量应用,但终极大招在明天
2024-12-20
火山引擎的新产品,字节和 100 多家企业的大模型实验场
2024-12-20
OpenAI Day11丨ChatGPT不仅仅是聊天工具了!
2024-12-20
谷歌版o1突发即屠榜!思考速度比所有模型快5倍,能解摩斯代码,数学物理秒秒钟解决
2024-12-19
极简开发,极速上线:构建端到端大模型应用
2024-05-28
2024-04-26
2024-08-13
2024-08-21
2024-07-09
2024-04-11
2024-08-04
2024-06-13
2024-07-18
2024-07-01
2024-12-16
2024-12-06
2024-12-03
2024-12-01
2024-11-29
2024-11-26
2024-11-25
2024-11-21