微信扫码
和创始人交个朋友
我要投稿
这就是方案一,通过提示词,这优势就是快速实施,修改提示词是相对简单和快速的,不需要重新训练模型。
这一点在是实际商业预判中非常重要,因为对于产品经理来说可以更快的通过调整提示词和用户确认场景和需求,灵活性就比较高,用户反馈就可以直接通过调整提示词来适应不同的任务和问题类型。
同时降低了开发成本,也不需要额外的计算资源或数据,只需设计良好的提示词。
然而,这一点并不是万能的,没有哪一个技术是没有缺点的,对于设计到多轮或长篇的对话时,提示词所带来的准确率效果就变低了。
并且不同的大模型对应的提示词方案也不一样,结合大模型本身就是一个概率生成,这就需要自己不断的测评。
大模型也不是万能的,总是有不同的知识盲区,这时候就有了方案二:RAG。
这种方式可以结合知识库: 能够利用外部知识库,提高回答的准确性和信息量。可以对知识库动态更新,确保信息的时效性和准确性。因为可以外挂不同的知识库,这样对就能处理更复杂和具体的问题,通过检索相关信息进行生成。
不足的地方就在于检索过程可能增加响应时间,影响用户体验,并且 需要额外的检索机制和数据处理,系统复杂度增加。整体准确性依赖于检索系统的效果和知识库的质量。
既然融于了新的环节,设计到了工作流,还要手工去组合,这个就有点麻烦了。
这时候我们可以考虑方案三:智能体。
首先就是能处理多样化的任务,通过不同模块协作完成复杂任务。并且可以针对不同的角色做个性化处理, 包含可以根据用户反馈和交互历史进行个性化调整,提高用户满意度。
不过这个前提就是本身对系统流程要了解,对于思考路径要清晰,也因此构建智能体系统复杂,开发和维护成本高。
同时,因为流程比较长,需要大量计算资源进行训练和运行。在复杂任务中可能出现不稳定或不可预测的行为。
写到这里,我们回头看,所有的优化都是基于模型之外进行提升,为什么呢?
因为过去ChatGPT出现的时候,好的模型并没有开源,其实最好是对模型调优。这就是方案四。
如果能本地私有化部署模型,我们就可以针对特定任务或领域进行优化,提升特定场景下的准确性。性能也能提升,通过在特定数据集上进行微调,能够显著提升模型的表现。
难点也很明显,数据需求高,需要大量高质量的标注数据进行调优。投入的时间成本和人力成本也比较高,调优过程需要较长时间,且需要大量计算资源。
特别是数据质量不行,或者数据不够多样,可能导致模型过拟合,影响泛化能力。
再进一步思考,单纯的通过语音对话很难提升,为什么呢?我们在中间做了什么?
很多时候我们都是在说明背景,为什么我们不做多模态融合呢?
结合文本、图像、音频等多种模态的信息,提高问答系统的理解能力和准确性。打开摄像头,就可以识别当前所在的环境,就有了上下文信息,就不用人工再交代背景。这就是方案五,多模态融合。
当然,对应的就是多模态融合技术复杂,涉及多种数据处理和模型融合。设计到图和视频的处理,需要的需要更高的计算资源和数据存储。
说了这么多,计算机哪有人聪明,为什么不做人工反馈回路?
要说准确,最后就会发现在有些专业内容,只有人工精准调优,人工反馈能够精准指出模型的缺陷,指导改进方向。也需要通过持续的人工反馈,模型可以不断优化和调整。但的确是人工能提升质量,真的能穷举场景,建好指标、维度和规则,那就是时间问题。
这就是方案六:人工反馈回路。
只是有人那就是成本高、效率低。终究我们需要找到一个平衡点。
最后想到的办法:混合模型。
优势互补,结合多个模型的优点,提升整体性能。可以根据任务需求调整不同模型的权重和组合方式。同时结合人工持续提升优化。
难点就在于复杂度高,系统架构复杂,开发和维护成本高。并且需要协调难度,不同模型之间的协调和融合存在技术难度。
要说事物的发展规律,最后都会回归到生态系统,世界本就是混沌的。
二、 结束语
人工智能问答提升的思考,通过提示词工程、RAG、多模态融合、智能体系统和混合模型等多种方法都可以优化提高准确度,只是这过程如同艺术创作,需要反复打磨和完善。
人工智能在理解和回应用户时,表现出的“懂你”其实并不是真正的理解,而是通过复杂的算法和模型,反映出用户所希望看到和听到的内容。
这种“懂”更多的是用户自己内心对AI的期望和投射,AI本身并没有真正的情感和意识。它的表现只是高效地模仿和回应人类的需求和情感,满足用户的心理期待。
最终的提升就在于我们想要什么,想成为什么样的人。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-02-21
用Grok、秘塔AI的Deep Research做股票网络调研
2025-02-20
全流程AI实现一个AIGC案例展示平台
2025-02-20
基于Multi-Agent的京东商家智能助手技术探索
2025-02-20
Excel重磅升级!零代码调用Deepseek自动处理表格!!
2025-02-20
扣子炸裂更新,轻松创建抖音 AI 分身,智能体将多场景落地抖音!
2025-02-19
Deepseek眼中的Martech(未经深思熟虑版)
2025-02-18
企服杂谈:接入DeepSeek,不如先想清楚这三件事
2025-02-18
面对大模型,SaaS厂商更难了
2024-12-25
2024-07-20
2024-07-18
2024-11-06
2024-11-02
2024-08-13
2024-07-25
2024-07-24
2024-07-16
2024-09-06