微信扫码
与创始人交个朋友
我要投稿
想象一下,你去参加一场重要考试。
方法A:考前狂补资料,把所有可能用到的知识都带进考场,需要时立刻翻阅(这就是RAG,全称"Retrieval Augmented Generation",检索增强生成技术)。
方法B:看几个典型例题,领悟解题思路,靠临场发挥(这就是ICL,全称"In-context Learning",上下文学习)。
哪种方法更好?答案是:看情况!这正是当下AI领域最热门的两种技术路线。
就像现在爆火的ChatGPT,它回答问题时也在权衡用哪种方法。RAG就像是给AI配了个"超级外挂",需要什么知识就去查什么资料,所以回答特别靠谱、够专业。而ICL则像是给AI看几个例子,让它自己悟出解题方法,更像人类学习的方式,更灵活自然。
来看个生动的例子:假设你是某手机店的店员,客人问:"最新款GalaxyPhone 15有什么特点?"
用RAG的AI会立马查阅最新产品数据库:"这款手机采用6.8英寸Dynamic AMOLED 2X显示屏,搭载最新骁龙8 Gen 2处理器,2亿像素主摄像头,5000mAh大电池支持45W快充,还新增了卫星通信功能..."(就像一个随身带产品说明书的专业销售)
用ICL的AI则会参考之前的对话经验回答:"这款手机配备了大尺寸AMOLED屏幕,强大的三摄系统,支持5G,续航特别棒!"(像个经验丰富的导购,虽然不够精确,但更接地气)
有趣的是,这两种方式各有优劣:
• RAG优势:信息准确、实时更新、细节到位
• RAG劣势:需要建立和维护知识库、响应可能较慢
• ICL优势:反应快速、语言自然、适应性强
• ICL劣势:可能产生幻觉、细节不够准确
现在最强大的AI系统往往会把这两种方法结合起来使用。就像一个优秀的学生,既有扎实的知识储备,又能灵活运用。比如客服机器人,可以用RAG查询准确的产品参数,再用ICL调整回复的语气和形式,让对话既专业又亲切。
展望未来,AI领域这场"知识检索"与"上下文理解"的较量还将继续。但可以确定的是,就像人类既需要扎实的知识储备,也需要灵活的应变能力一样,AI的发展也将在这两个方向上不断突破。
下次当你与AI对话时,不妨留意它是如何在专业知识和灵活思维之间达到平衡的。或许,这正是AI超越传统服务模式的关键所在
有一个很有趣的致力于简化AI应用开发的框架DSpy, 它提供了一种简单的提示词语法,抽象到极致,非常完美地展示了某一类提示词背后的核心思路。
可以总结成:给AI提供什么 -> 找AI要什么
问题 -> 答案
语法(没错,这就是整个需要写的提示词了):question -> answer
后台实际生成的提示词:
Given the fields `question`, produce the fields `answer`.
---
Follow the following format.
Question: ${question}
Answer: ${answer}
问题, 上下文 -> 答案:
这就是ICL的最底层原型了!
如果让context动态从外部知识库获取,那就是RAG了,非常抽象,也非常准确。
语法(没错,这就是整个需要写的提示词了):question, context -> answer
后台实际生成的提示词:
Given the fields `question`, `context` produce the fields `answer`.
---
Follow the following format.
Question: ${question}
Context: ${context}
Answer: ${answer}
关注不迷路
53AI,企业落地应用大模型首选服务商
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-11-07
为什么它是从PDF中解析数据的最佳工具?PDF文件解析新选择,构建LLM 大模型数据基础
2024-11-06
Long2RAG:评估长上下文与长形式检索增强生成与关键点召回
2024-11-06
微软GraphRAG 0.4.0发布,引入增量更新和DRIFT搜索
2024-11-06
StructRAG: 下一代GraphRAG - 中科院&阿里
2024-11-06
企业如何从0到1构建RAG系统?
2024-11-05
15种典型RAG框架:卡内基梅隆大学最新RAG综述
2024-11-05
Claude发布新的RAG方法 --- 通过上下文嵌入与BM25结合显著降低数据块检索失败率
2024-11-05
【大模型】深度解析:智能体如何突破 RAG 的三大技术瓶颈
2024-07-18
2024-07-09
2024-07-09
2024-05-05
2024-05-19
2024-07-07
2024-06-20
2024-07-07
2024-07-08
2024-07-09
2024-11-06
2024-11-06
2024-11-05
2024-11-04
2024-10-27
2024-10-25
2024-10-21
2024-10-21