支持私有云部署
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


如何让DeepSeek生成让人满意的回答?试试专业知识库

发布日期:2025-03-29 13:46:29 浏览次数: 1572 来源:Peron用户研究
推荐语

深度解析AI生成高质量回答的秘诀,探索专业知识库的构建策略。

核心内容:
1. 提示工程(Prompt Engineering)与AI回答质量的关系
2. 专业知识库对提升AI回答质量的重要性
3. 构建专业知识库的具体方法和实践案例

杨芳贤
53A创始人/腾讯云(TVP)最具价值专家

这是Peron《AI如何赋能市场&用户洞察》系列的第2篇文章。

当我们跟AI交互,AI没有给出我们预期的结果,原因可能是我们没有把我们的需求说清楚,没有正确地提出问题,对此可以用提示工程(Prompt Engineering)来解决。这是我们第一篇文章聊的话题。

随着AI的进化和推理模型的推出,大大降低了对提示工程的依赖,正确提需求如果不再是一个问题,但AI还是没有给出我们想要的答案,那可能是AI调用的知识库(数据源)本身有问题,或者说缺乏相关领域的知识

| 为什么要搭建专业知识库

不知道你有没有发现,AI在回答我们的提问前,会先进行搜索,寻找全网的资料,那么这些被搜索到的资料/数据,直接决定着回答的质量。

但在中文互联网,PC网页端的内容生产早已向移动端转移,剩下的大多是营销向的内容分发和AI暴力批量生产的低质量内容。

不只是中文互联网,海外互联网也一样,可以说AI的学习语料已经成为一个世界性难题。当投喂给AI 的学习语料质量越来越差、乃至越来越多AI本身制造的“幻觉”,AI的应用推广将会面临极大的挑战。

为此,未来企业和个人都需要搭建自己的知识库。

360公司老板周鸿祎对此举过一个例子:

“比如说A媒体和B媒体,同样是做一个对中国网游行业的一个调研报告,你们俩准备的知识库不一样,定向搜索的网站不一样,最后出来的结论一定是不一样的,所以一定要有专业知识库。”

除了知识库本身质量有问题,可能还缺乏相关领域的知识。

有人可能会问,AI学习了全网各个行业的数据,怎么会缺乏相关领域的知识?事实就是AI只是学习了公开的、上了网的各行业数据,但真正稀缺的、有价值的行业数据储存在各个企业的私有化部署系统、专家的个人知识库

拿市场调研行业举例,网上鲜有20年以上经验的市场研究专家的知识、经验分享,有也只是零星片段,构不成系统。

再拿咨询行业举例,各个智库的解决方案是不可能上网的,你要做一个品牌定位,AI是可以给你一个通用框架,但和智库的解决方案一比,高下立现。

再就是,很多时候我们需要解决的是一个特定垂直场景的问题,而AI如果不了解背景上下文,自然也无法解决我们的问题

举例来说,我是一个企业内部的用户研究人员,做了很多期NPS跟踪监测的项目,现在我想借助AI来帮我分析NPS数据、写洞察报告。

如果你只是直接把新一期的数据喂给AI,AI给到的结果大概率不尽如人意,但如果我们把之前的项目资料、数据喂给AI学习,那么产出的质量就会高很多。

该项目相关的所有资料、数据,本质上就构成了一个该项目的知识库,这个知识库是私人的,本地的,独占的。

从另一个角度,这个知识库实际上就是待解决问题的上下文,在以前是提示工程的一部分,当我们构建了特定场景的知识库,我们对提示词的依赖就会进一步降低,到最后可能只需要一句话:帮我分析下这个数据,然后给出洞察和行动建议。

| 如何搭建专业知识库

搭建专业知识库的工具不少,本文介绍比较主流的一款-ima。

ima是腾讯大厂推出的以知识库为核心的智能工作平台,已接入腾讯混元大模型(包括T1)和DeepSeek R1模型满血版,是最好用的知识库产品之一。

首先,官网下载ima(官方网址:https://ima.qq.com/

其次,安装好后左边点击“知识库”工具,导入学习资料,构建个人知识库。    

我这里上传了一些市场/人群细分的报告资料,构建了一个“人群细分”研究的知识库。

最好,你可以针对每个知识文件进行打标签,后面可以根据标签来搜索资料,而且可以输入#选择标签,获取基于指定标签下内容的回答。    

然后,就可以基于个人知识库提问啦,可以对比下通用知识库的回答。

我这里提的需求是:我现在要做一个中国智能手机的人群细分调研项目,请帮我设计一个研究方案,要求包含背景目标、研究方法、样本设计、研究思路和框架、时间排期等。

(以下为DeepSeekR1通用知识库生成回答)    

 

 

 

(以下为ima+DeepSeekR1个人知识库生成回答) 

 

 

 

通过比较可以发现,ima的回答会严格基于个人知识库,但凡超出知识库会拒绝回答,这意味着没有AI“幻觉”:

这样做的好处是非常适合追求精确、稳定输出的企业应用场景,不好的地方在于对专业知识库的质量要求很高,同时因为严格遵循旧有的经验(不一定是最佳实践),少了自主发挥

所以未来一定是通用知识库和专业知识库相结合,专业知识库为主导,起通用知识库为辅,起到创意和发散的作用。

值得一提的是,ima同时支持微信小程序

在微信顶部搜索“ima知识库”,进入小程序页面,可批量导入微信聊天中的文件(支持PDF、PPT、word等多种格式)、本地图片(支持PNG、JEPG等格式)、或者拍照导入图片。 

当把文件导入后,可以点击下方对话框,问全网相当于查找网络资料,问知识库相当于只在你的个人知识库和共享知识库中进行查找。 

    

这里可以注意到,PC端和移动端是云同步的,在PC端上传的资料,在移动端打开会发现知识库里面已经有了,非常方便。

再就是,ima支持知识库共享,支持笔记/文件/网页可在浏览时直接加入共享知识库,具体就不再展开。

| 如何理解知识库工具的本质

Ima这类知识库平台,本质上是一种RAG方案。

RAG(Retrieval-Augmented Generation,检索增强生成)是一种结合了信息检索(Retrieval)和生成模型(Generation)的混合技术,旨在提升生成式模型的准确性和可靠性。

其核心思想是:在生成答案前,先从外部知识库或文档中检索与输入相关的信息,再将这些信息作为上下文输入生成模型(如GPT等),从而生成更符合事实、更具深度的回答。

RAG 的典型流程:

检索:根据输入问题,从知识库中检索相关文档或段落。

增强:将检索到的信息与原始输入拼接,形成增强的上下文。

生成:生成模型基于增强后的上下文输出最终回答。

RAG 的关键特点:

动态知识库:不依赖模型本身的参数化知识,而是实时从外部数据源(如数据库、文档集)检索信息。    

减少幻觉(Hallucination):通过引入检索到的真实数据,降低生成模型“编造事实”的风险。

灵活性:知识库可独立更新,无需重新训练生成模型。

应用场景:问答系统、内容生成、客服对话等需结合实时或领域知识的任务。

除了ima以外,这里再给大家列举几种方案供选择:

如果你是企业,需要本地化部署的知识库,那么推荐CherryStudio这类开源软件;如果你是个人,构建云端知识库,那么腾讯的ima是个不错的选择;如果你想搭建出海/英文知识库,那么Google NotebookLM可以试一试。 

文中提到的报告资料均已放入“用户研究成长圈”知识星球,AI时代,每一个研究人员都需要提前搭建自己的专属知识库。

图片

-Peron推荐-
图片

这是一个高质量的市场与用户洞察学习&成长社区,随着AI时代的到来,我们正致力于构建洞察领域的专业知识库,同时探索AI赋能洞察工作的最佳实践。

【星球功能】

1.知识库

  • 各行业头部企业真金白银花费几十上百万元做的调研报告,独家

  • 最新消费者趋势报告

  • Peron星球会员专享文章

  • 《Peron大厂用户研究公开课》分享

  • 《Peron和他的朋友们》直播访谈分享

  • 可视化知识卡片


2.问答区 (回答星球会员的提问)

针对星友的提问,采用长文章公开回复或者1对1私信咨询的方式

3.职业成长

包括用研学习书单、面试求职工具、面试求职攻略、转正攻略、职业规划、能力模型、岗位盘点等

4.资源区

模板:需求书模板、问卷模板、笔录模板、笔录摘要模板、访谈脚本/大纲模板、图表制作模板、世界500强公司工作型PPT模板等

工具:抽样误差统计工具、文本分析工具、显著性检验工具、数据自动化分析工具(双重标准化分析、对应分析、RWA相对权重分析)、自动化出表工具等

教程/电子书/内部培训材料:Phthon教程电子书、R语言教程电子书、Excel高级应用、数据分析电子书、SPSS/SAS教程电子书等

5.出海

介绍海外市场与用户洞察领域的最新行业动态、方法&工具、职业发展趋势等

6.AI赋能

包括通过提示工程(Prompt Engineering)、检索增强生成(RAG)、模型微调优化洞察产出,通过AI智能体(Agent)构建洞察工作的自动化工作流等

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询