AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


写在GPT5之前|大模型、AIAgent在领域中替代边界在哪?
发布日期:2024-07-18 12:18:26 浏览次数: 1762


    前几天的OpenAI全员大会上提出AGI能力评分, 认为目前ChatGPT还处于第一阶段,即将达到第二阶段. 结合前些日子OpenAI关于GPT5的进展消息, GPT5能达到领域博士的能力. 可惜预期要到2025年底才能发布. 结合笔者前些日子高考志愿AIAgent对话助理实现的感受. 进行相关探讨. 

高考志愿AIAgent对话助理

前些日子,高考志愿AIAgent发布, 对比于当前几个其他AIAgent或大模型产品还是有些优势:



当前大模型、AIAgent还是人机接口

为啥我们的高考志愿推荐的学校、专业更靠谱. 关键一点是人工的问题拆解(构建Prompt), 并调用一个Action(Score2School)基于去年学校专业录取分数, 查询考生分数在所在省能上的学校专业列表. 再调用智能搜索KFind补充相关信息.

更详细的说明与实现代码参见公众号之前文章. 这里只说下为什么还只是人机接口, 因为大模型还无法拆解问题:

当前方案是手工拆解问题,也测试用大模型拆, AgentUniverse也提供了拆解的例子. 试了都还达不到人工拆解的效果. 也看到Chain of Thought(CoT)的一些方案, 后续还将继续研究下其他方案. 但也不用太深究, 毕竟GPT5前,都是缝缝补补的方案. 

zero_shot_template_decomposition = """introduction: 你是高考志愿填报专家。instruction:需要遵守下面的规则:1.去除重复的信息。2.去除对回答原始问题没有帮助的信息。        3.简要拆解问题,重点突出。        4.拆解问题中不要重复,一个问题只出现一次。        5.尽量使用数值类信息。6.提问需要高度注意信息的时效性。
Task: 将给定的问题分解成更易于回答的简单子问题。注意:只能返回分解后的问题。不要回答它们中的任何一个,包括原始问题。.
    原始问题: {question}    分解后的问题:     """

人机接口已经改变世界了

 2023年底, 微软CEO年度公开信 就提到人机接口, 人工智能以新方式与数据互动。虽然当时他期望的Dynamics 365 Copilot将人工智能带给各个职能和业务领域的员工并没有实现。

高考志愿AIAgent中如果没有大模型, 用之前的即使要完成NLP处理再score2School自然语言信息查询, 绝不是几十行代码就能实现的. 而有了大模型的能力, 有了新人机接口, 领域流程必将重构. 相关的系统建设完全可以干起来, 每个领域都不同, 就不展开讨论了.

GPT5之后, 大部分领域必然都是大模型方案,边界在哪?

前些天, OpenAI官方透露GPT-5发布时间居然要到25年底, 看来再次模型规模大跃进很不容易. 但应该几乎没有人会怀疑GPT5得模型能力会再次跃迁. . 这次高考, 大模型文科基本都能上一本了, 理科还不行. GPT5将重点优化逻辑推理方面的能力。GPT5的模型能力将从高中飞跃到博士, 也就可以预见到是ChatGPT能达到上图的Level3 水平.

这些天萝卜快跑引发社会热议, 作为中年人, 对滴滴司机的担心深有同感. 可惜市场经济中, 技术的替代边界在成本,而不是其他.

司机的边界替代边界在哪? 复杂场景,人车混行, 在异常天气等等. 总归人工作为全天候适应性最强的劳动工具, 有其不可替代性.

领域呢?

AI助理提升工具理性

       马克斯·韦伯认为人的理性可以区分成两种不同类型,一种叫工具理性(instrumental rationality),一种叫价值理性(value rationality)。工具理性作用是找到做事的手段,就是一件事怎么做才是最有效的。工具理性的关键就在于“计算”:针对确定的目标,计算成本和收益,找到最优化的手段。工具理性不关心目的,只关心达成目的的手段是不是最优的.  价值理性(value rationality)决定于对某种包含在特定行为方式中的内在价值的信仰,无论该价值是伦理的、美学的、宗教的还是其他的什么东西,只追求这种行为本身,而不管其成败与否.没有人会怀疑系统、AI提升了工具理性, 但对价值选择, 如小红书上一个问题:浙江考生问是选外省985还是本省或上海211. 点赞最多的一个回答是建议上海211, 其理由是外地的985在江浙沪影响力不高, 南北饮食差异大, 想家时回家一趟麻烦等. 另一条相反观点认为还是应该选985, 理由是招聘中硬性条件在那卡着呢. 这就涉及价值选择.外地985还是本地211, 看似就无能为力.

《卖桔者言》搜索成本

经济学家张五常教授有篇著名的文章《卖桔者言》以元宵节夜市卖四季桔盆栽的经历,探讨经济学中价格歧视、信息不对称、需求弹性、搜索成本等问题。那天张五常教授总共入货200多盆,每盆成本40,最终以最高80元,最低20元全部售出。起初开价是每盆80元,最低以60元出售。下雨,价立减,雨停,价立涨;午夜后每盆只开价30元。张五常教授发现, 人们不会将夜市走一遍再去性价比最高的那家买, 隔壁家卖40, 这家卖80的也是有可能成交的.当价格达到心理预期, 基于搜索成本的原因, 价格信息不对称又这么合理的发生了.

人们会评估搜索的代价,是否进行有利可图的搜索发现行为,和信息获取方便程度以及信息处理成本有很大关系。这和不确定性环境下有限理性决策描述的启发性搜索的终止条件非常类似,当达到预期满意度时,即停止搜索,而这个满意度也是和信息搜索成本以及期望结果直接相关。所以,交易中有意图的搜索是由他预期的商品或服务的价值以及搜索成本所决定的。奥地利经济学派的理论:市场是个竞争性发现的过程, 发现的过程也能看作搜索的过程.

高考志愿的搜索成本

今年的高考志愿填报, 因为张雪峰老师,因为国家的阳光志愿系统,搜索成本是极大降低了的.


张雪峰老师不但提供了工具理性, 更重要是提供了价值理性.比如:

  • 普通家庭的孩子更要优先选择一个可以让自己过得好的专业比所谓理想实际的多, 要选有专业壁垒的专业等等. 

  • 想学法律, 又考不上五院四系, 张老师会建议期望就业地域的法学院好于外地一般211法学院. 

  • 如告知想学气象专业的同学,清华气象专业和南京某非985、211院校气象专业单位基本上是一样的. 

  • 一个专业方向就业是否已饱和, 可以参考专业对口就业率.

  • 物生地的怎么报考偏理科的专业.

但你仔细看看,其实大部分都是工具理性, 少部分价值选择. 上面那位咨询本地211外地985看似完全是价值选择. 但如果能将本地211专业与就业,外地985专业与就业较为准确的列出, 也是将价值理性问题转为工具理性问题. 当然未来不可知, 所以还是需要价值理性为我们选择方向. 

提升工具理性能部分代替价值理性

在公众号之前文章讨论大模型如何能撑起几十万亿美元估值市场时,提到需要占据核心价值分配. 刚开始做高考志愿AIAgent时,觉得张雪峰老师的价值主要来自价值理性, 在高考志愿AIAgent实现过程中, 慢慢觉得其价值更多还是工具理性, 是在无法工具理性进行决策时才使用价值决策.

在替代中逐渐明确边界

本文有些标题党, 萝卜快跑的替代边界还在摸索中, 更别说GPT5之后的领域AI和人工的替代边界了.但既然我们生活在一个开放世界中, 总归未来无法预测. 虽然笔者在实现高考志愿AIAgent中还导入了张雪峰老师语录, 但也通过搜索、经济行业数据提供支持.毕竟当年张老师2020年也是力推过土木的. 

但领域AGI方案全面推广时:机器还是信人,是个问题.



53AI,企业落地应用大模型首选服务商

产品:大模型应用平台+智能体定制开发+落地咨询服务

承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询