微信扫码
和创始人交个朋友
我要投稿
2025,AI,什么东西会先爆发呢?
现在,据 GeekSavvy 不完全统计,有两个方向是大家普遍能达成共识的,那就是 AI Agent 和 AI 玩具等 AI 硬件产品。
AI 从被大家饭前饭后提起,到现在大家似乎对 AI 已经失去耐心,但 AI 的能力不可否认给大家在效率、泛娱乐方面都带了前所未有的新体验,我们也都认同 AI 的潜力是巨大的,只是 AI 赋能产品、产业还需要很长的路要走。
过去几年,整个市场在 AI 领域的投入产出比太低了,市场似乎也没有太多的耐心,无论是投资人、创业者等等,大家都急需一个能爆发、能赚钱的行业,所以,我们也坚信就在2025,不管 AI 技术还是否需要成熟,还是 AI 跟产业的匹配度是否融合,都会爆发,量级区别而已。
2025,我们就以呼声最高的 AI Agent 作为开篇,这篇文章会介绍 AI Agent 为什么在今年会起飞,同时,还结合一个具体场景,保险,展开聊聊 AI Agent 的能力和魅力。
01 AI Agent 2025爆发前兆
OpenAI、Nvidia 、微软,包括国内的百度、字节、阿里等头部公司都在押注这一点,月之暗面、智谱、Salesforce 等明星初创公司也是如此,可见,AI Agent 正在真正起飞。
Google 趋势上的“AI Agents”(trends.google.com)
理解 Agents 的关键在于其能动性,也就是 Agent 能干什么。
与传统的生成式 AI 系统不同,Agents 不仅仅响应用户输入,它可以从头到尾处理复杂的问题。例如保险索赔,包括理解索赔的文本、图像和 PDF,从客户数据库检索信息,将案例与保险条款和条件进行比较,询问客户问题并等待他们的答复(即使需要数天),而不会丢失上下文。
Agents 可以自主完成此操作,无需人类检查 AI 是否正确处理所有内容。
与现有的 AI 系统和所有帮助员工完成工作的副驾驶相比,AI Agents 实际上就是成熟的员工本身,为流程自动化提供了巨大的潜力。
目前,AI 已经可以承担由人类员工或整个部门执行的复杂、多步骤的大部分任务。
举几个栗子:
规划、设计、执行、衡量和优化营销活动
通过与承运人、客户和仓库沟通,找到物流中丢失的货物,又或者,如果仍然丢失,则向负责的合作伙伴索赔。
每天搜索商标数据库,确定是否有新商标注册与我自己的商标冲突,并立即提出异议。
收集相关数据或询问员工,检查数据并编制 ESG 报告。
目前,AI 模型可以协助完成生成活动内容或评估电子邮件等任务,但它们缺乏执行整个流程的能力。AI Agents 则可以做到这一点。
传统的生成式 AI 可以帮助人类团队完成某个流程(黄色),而AI Agents 可以端到端地执行整个流程(橙色)。
传统模型就像是一台很棒的浓缩咖啡机,而基于 Agents 的 AI 则是咖啡师。他们不仅可以煮咖啡,还可以接待客人、接受订单、提供咖啡、收钱、将杯子放入洗碗机,甚至晚上关门。即使是世界上最好的浓缩咖啡机也无法独自经营一家咖啡馆,但咖啡师可以。
他们擅长掌握复杂工作的各种子流程,并可以独立决定下一步要处理的任务。如果他们需要更多信息(牛奶还是燕麦奶?),他们可以与客户等人员沟通。他们还可以决定在遇到问题时应该问谁(咖啡豆用完了 --> 老板,咖啡机罢工 --> 机器供应商的客户服务)。
这就是 Agents 的能力,也是魅力。
传统生成式 AI 与 AI Agents 对比
02 AI Agents 结合保险
深度结合保险的业务架构和流程,应该如何设计?(下面只涉及业务架构和流程)
1. 分类并将作业发送至处理通道
当客户向保险公司发送房屋保险索赔信息时,我们的工作流程就开始了。
Agents 通过分析消息的内容来确定客户想要什么。
根据此分类,系统启动处理通道。通常,这超出了函数调用的范围;它涉及对流程做出基本决策,然后执行许多离散步骤。
1. AI Agents:将邮件分类并路由到不同的处理通道。
2. 提取数据
Agents 的主要任务之一是将非结构化数据转换为结构化数据,使处理系统化、安全可靠。
分类将文本分配到预定义的类别,而提取则涉及从文本中读取和解释数据。但是,大模型不会直接从输入提示中复制数据;相反,它会生成响应。这允许数据格式化,例如将电话号码从“(718) 123–45678”转换为“+1 718 123 45678”。
2. AI Agents:从邮件和附件中提取数据。
数据提取不仅限于文本内容(来自电子邮件文本),还可以包括来自图像、PDF 或其他文档的数据,所以,我们需要使用了多个模型,LLM、图像识别模型、OCR 等。上述过程被简化了。实际上,我们经常将图像发送到 OCR 系统,以从扫描的发票或表格中提取文本。而且,在分析附件之前,我们通常也会对附件进行分类。
我们会强制使用 JSON 作为模型的输出格式,以确保数据的结构化。
以下是电子邮件输入,非结构化数据:
您好,
我想报告损坏情况并要求您赔偿。
昨天,我 9 岁的儿子 Rajad 和朋友一起玩耍时,用足球踢了客厅里的吊灯,吊灯从支架上脱落,掉在地上摔碎了(吊灯是玻璃制成的)。
幸运的是,没有人受伤,但吊灯损坏严重,无法修复。
附件是一张发票和一些被毁吊灯的图片。Deepak
Jamal
合同号:HC12-223873923
123 Main Street
10008 纽约市
(718) 123 45678
以下是模型处理之后,输出 JSON 结构化数据:
{ "name" :"Deepak" , "surname" :"Jamal" , "address" :"123 Main Street, 10008 New York City, NY" , "phone" : "+1 718 123 45678" , "contract_no" :"HC12-223873923" , "claim_description" :"昨天 [2024 年 12 月 8 日],我 9 岁的儿子 Rajad 和朋友一起玩耍时,将一个足球踢向客厅里的吊灯,吊灯随即从支架上脱落,掉落在地上摔碎了(吊灯是玻璃制成的)。\n幸运的是,没有人受伤,但吊灯已损坏到无法修复。\n" }
3. 调用外部服务,使上下文持久化
许多生成式 AI 系统可以直接回答查询,有时使用预先训练的数据、微调或对某些文档进行检索增强生成 (RAG),这对于 Agents 来说还不够,几乎每个相当强大的 AI Agents 都需要从数据库访问公司或外部数据。
为了使流程上下文在当前会话之外保持持久性,它还必须将数据写入系统和数据库。在案例中,Agents 根据客户数据库检查合同号,并将索赔状态写入问题跟踪系统,甚至还可以向客户请求确实数据。
3. AI 代理:调用外部服务并使上下文持久化。
4. 评估、RAG、推理和信心
每项行政工作的核心都是根据各种规则解释收到的案件, AI 在这方面尤其擅长。由于我们在调用模型时无法提供所有上下文信息(例如,政策内容或条款和条件),因此我们需要使用向量数据库来检索相关片段(RAG )。
我们提示 AI 在做出评估之前“思考”。在说出结果之前进行思考可以提高答案质量,这是我们从三年级数学开始就学到的。我们还可以通过许多明显和不太明显的方式使用模型推理的输出:
证实对客户的答案。
帮助提示工程师和数据科学家找出模型出错的原因。
用于检查:模型是偶然得出正确答案的,还是我们可以通过它的推理看出解决方案是不可避免的?
置信度是最大限度提高准确度的关键。如果模型能够估计其置信度(亲爱的工程师们,这也需要针对各种置信度值进行非常好的少量学习示例),那么我们就可以将系统配置为以极高安全性或高度自动化的方式运行,我们设置一个置信度阈值,低于该阈值的所有案例都应由人工支持。高阈值可确保错误最少,但需要更多手动处理,而较低的阈值允许自动处理更多案例,尽管错误风险增加。
4. AI Agents:使用 RAG/推理/置信度获得可靠的评估。
以上,这样的系统可以自动完成索赔管理部门 70%-90% 的工作量,而这在简单的生成 AI 系统上是无法实现的。
以上图片来源:Maximilian Vogel
Last but not least
最后,我想用美国科幻小说黄金时代的代表人物,艾萨克・阿西莫夫(Isaac Asimov)的 AI Agents 的三大定律,来总结一下。
AI Agents 的三大定律:
Agent 必须在无需人类帮助的情况下从头到尾完成一项工作。
Agent 必须遵循规则,以确保处理过程安全可靠。
Agent 必须运用推理能力并保持自信,以实现最高程度的准确性。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-02-20
9人团队2年狂揽1000万美金!这家华人创立的AI公司,正在掀翻尼康佳能的百年江山
2025-02-20
上海申通地铁集团打造智能内容审核系统,为乘客提供绿色安全出行空间|案例研究
2025-02-19
私有化部署DeepSeek,你需要准备怎样的硬件配置?
2025-02-19
问小白接入 DeepSeek,亲测全网最快!
2025-02-19
腾讯元宝DeepSeek-R1体验:一款真香的AI助手,但广告植入要来了?
2025-02-19
一文讲清Nvidia GPU和阿里云GPU异构机型
2025-02-18
DeepSeek-R1 昇腾910B满血版部署避坑指南
2025-02-17
AI 网关需要具备的10大基本能力
2024-03-30
2024-05-09
2024-07-07
2024-07-23
2024-06-23
2024-07-01
2024-06-24
2024-10-20
2024-06-08
2024-12-29
2025-02-19
2025-02-19
2025-02-05
2025-02-05
2025-01-22
2025-01-15
2025-01-13
2025-01-12