我要投稿

写在GPT5之前|大模型、AIAgent在领域中替代边界在哪?

发布日期：2024-07-18 12:18:26 浏览次数： 2142

前几天的OpenAI全员大会上提出AGI能力评分, 认为目前ChatGPT还处于第一阶段,即将达到第二阶段. 结合前些日子OpenAI关于GPT5的进展消息, GPT5能达到领域博士的能力. 可惜预期要到2025年底才能发布. 结合笔者前些日子高考志愿AIAgent对话助理实现的感受. 进行相关探讨.

高考志愿AIAgent对话助理

前些日子,高考志愿AIAgent发布, 对比于当前几个其他AIAgent或大模型产品还是有些优势:

当前大模型、AIAgent还是人机接口

为啥我们的高考志愿推荐的学校、专业更靠谱. 关键一点是人工的问题拆解(构建Prompt), 并调用一个Action(Score2School)基于去年学校专业录取分数, 查询考生分数在所在省能上的学校专业列表. 再调用智能搜索KFind补充相关信息.

更详细的说明与实现代码参见公众号之前文章. 这里只说下为什么还只是人机接口, 因为大模型还无法拆解问题:

当前方案是手工拆解问题,也测试用大模型拆, AgentUniverse也提供了拆解的例子. 试了都还达不到人工拆解的效果. 也看到Chain of Thought(CoT)的一些方案, 后续还将继续研究下其他方案. 但也不用太深究, 毕竟GPT5前,都是缝缝补补的方案.

zero_shot_template_decomposition = """introduction: 你是高考志愿填报专家。instruction:需要遵守下面的规则：1.去除重复的信息。2.去除对回答原始问题没有帮助的信息。        3.简要拆解问题，重点突出。        4.拆解问题中不要重复，一个问题只出现一次。        5.尽量使用数值类信息。6.提问需要高度注意信息的时效性。
Task: 将给定的问题分解成更易于回答的简单子问题。注意：只能返回分解后的问题。不要回答它们中的任何一个，包括原始问题。.
    原始问题: {question}    分解后的问题:     """

人机接口已经改变世界了

2023年底, 微软CEO年度公开信就提到人机接口, 人工智能以新方式与数据互动。虽然当时他期望的Dynamics 365 Copilot将人工智能带给各个职能和业务领域的员工并没有实现。

高考志愿AIAgent中如果没有大模型, 用之前的即使要完成NLP处理再score2School自然语言信息查询, 绝不是几十行代码就能实现的. 而有了大模型的能力, 有了新人机接口, 领域流程必将重构. 相关的系统建设完全可以干起来, 每个领域都不同, 就不展开讨论了.

GPT5之后, 大部分领域必然都是大模型方案,边界在哪?

前些天, OpenAI官方透露GPT-5发布时间居然要到25年底, 看来再次模型规模大跃进很不容易. 但应该几乎没有人会怀疑GPT5得模型能力会再次跃迁. . 这次高考, 大模型文科基本都能上一本了, 理科还不行. GPT5将重点优化逻辑推理方面的能力。GPT5的模型能力将从高中飞跃到博士, 也就可以预见到是ChatGPT能达到上图的Level3 水平.

这些天萝卜快跑引发社会热议, 作为中年人, 对滴滴司机的担心深有同感. 可惜市场经济中, 技术的替代边界在成本,而不是其他.

司机的边界替代边界在哪? 在复杂场景,人车混行, 在异常天气等等. 总归人工作为全天候适应性最强的劳动工具, 有其不可替代性.

领域呢?

AI助理提升工具理性

马克斯·韦伯认为人的理性可以区分成两种不同类型，一种叫工具理性（instrumental rationality），一种叫价值理性(value rationality)。工具理性作用是找到做事的手段，就是一件事怎么做才是最有效的。工具理性的关键就在于“计算”：针对确定的目标，计算成本和收益，找到最优化的手段。工具理性不关心目的，只关心达成目的的手段是不是最优的. 价值理性(value rationality)决定于对某种包含在特定行为方式中的内在价值的信仰，无论该价值是伦理的、美学的、宗教的还是其他的什么东西，只追求这种行为本身，而不管其成败与否.没有人会怀疑系统、AI提升了工具理性, 但对价值选择, 如小红书上一个问题:浙江考生问是选外省985还是本省或上海211. 点赞最多的一个回答是建议上海211, 其理由是外地的985在江浙沪影响力不高, 南北饮食差异大, 想家时回家一趟麻烦等. 另一条相反观点认为还是应该选985, 理由是招聘中硬性条件在那卡着呢. 这就涉及价值选择.外地985还是本地211, 看似就无能为力.

《卖桔者言》搜索成本

经济学家张五常教授有篇著名的文章《卖桔者言》以元宵节夜市卖四季桔盆栽的经历，探讨经济学中价格歧视、信息不对称、需求弹性、搜索成本等问题。那天张五常教授总共入货200多盆，每盆成本40，最终以最高80元，最低20元全部售出。起初开价是每盆80元，最低以60元出售。下雨，价立减，雨停，价立涨；午夜后每盆只开价30元。张五常教授发现, 人们不会将夜市走一遍再去性价比最高的那家买, 隔壁家卖40, 这家卖80的也是有可能成交的.当价格达到心理预期, 基于搜索成本的原因, 价格信息不对称又这么合理的发生了.

人们会评估搜索的代价，是否进行有利可图的搜索发现行为，和信息获取方便程度以及信息处理成本有很大关系。这和不确定性环境下有限理性决策描述的启发性搜索的终止条件非常类似，当达到预期满意度时，即停止搜索，而这个满意度也是和信息搜索成本以及期望结果直接相关。所以，交易中有意图的搜索是由他预期的商品或服务的价值以及搜索成本所决定的。奥地利经济学派的理论：市场是个竞争性发现的过程, 发现的过程也能看作搜索的过程.

高考志愿的搜索成本

今年的高考志愿填报, 因为张雪峰老师,因为国家的阳光志愿系统,搜索成本是极大降低了的.