我要投稿

AIGC案例-腾讯文档 AI 架构剖析

发布日期：2024-06-12 20:38:27 浏览次数： 2625 作者：顶层架构领域

一、总体技术架构剖析

腾讯文档（https://docs.qq.com/）AI 大模型助手应用，如下图所示：

腾讯文档的 AI 大模型助手总体架构如下图所示，包括6大模块：AICopilot、AIServer、AIAgent、AIEngine、AIOperation、AIExtension。

AICopilot 模块：提供 AI 侧边栏对话功能，负责意图识别、对话管理、缓存及存档等功能。

AIServer 模块：提供各类别定制化的浮层助手服务。

AIAgent 模块：作为 AI 智能代理，集成并提供各类别的文档处理工具，由上层服务调用识别意图后驱动。AIEngine 模块：作为文档 AI 引擎，统一抽象并封装各项 AI 能力（比如：文生文、文生图、语音转写、语音识别、图像识别、嵌入式 AI 等），实现能力间无感切换。

AIOperation 模块：负责文档 AI 灰度发布策略、隐私保护措施以及运营操作。

AIExtension 模块：扩展 AI 服务，支持AI应用落地所需的支持能力，比如：文本搜索、图片搜索、Python 执行环境等。

二、问答场景技术架构剖析

针对 Word、PPT、Sheet、思维导图、数据收集表及知识库等多种内容形态的问题解答。

AI 大模型应用的核心挑战在于建立基础的问答系统架构。攻克这一难题的关键，在于如何使 AI 大模型精准掌握并理解各类文档的领域知识内容。

两种解决方案：

一种：领域知识通过微调（Fine-tuning）记忆到大模型中。

二种：通过 Prompt 的方式把领域知识即时给到大模型。

问题思考：

用户文档信息本质上是用户个人数据的整合，主要用于个性化服务。
由于用户文档常更新且注重时效性，无法每次变更都重新训练模型。
同时出于隐私保护原则，用户数据不能用于模型训练。因此，针对每位用户单独训练模型的方案并不现实可行。

一般第二种 RAG 方案：

RAG 技术方案工作流程：

第一、文档加载：定义统一的 Document 数据模型，将实现默认典型的数据源加载实现，业务方也可以根据接口自定义实现自身所需文档数据源。

第二、文档分片：大模型上下文大小有一定限制，需要将大量数据进行分割操作。

第三、文档 Embedding：Embedding 过程将对应文本向量化，以提供更好的语义表达。

第四、文档向量存储：使用向量数据库存储文档向量数据。

第五、文档召回：根据用户输入的问题召回和问题最相关的文档信息。

第六、问题解答：根据召回文档资料 + 用户输入问题提供给大模型进行知识问答。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-04-12

来了！10个构建Agent的大模型应用框架

2025-04-12

一文读懂MCP：从入门到精通的完整指南

2025-04-12

微软突发“封杀令”！全面禁止Cursor使用C、C++、C# 扩展，开发者被迫回退版本

2025-04-12

继续卷，Google 发布AI 编程工具 Firebase Studio

2025-04-12

DeepSearch：AI 搜索的未来，不止于快

2025-04-12

谷歌Agent Development Kit核心概念以及与其它框架的横向对比、适用场景总结与建议

2025-04-12

GPT-4 官宣退役！曾经的最强模型，正式交棒 GPT-4.1、o3、o4 mini！

2025-04-12

里程碑，GPT-4.5大模型正式通过图灵测试！

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

本地部署大模型？看这篇就够了，Ollama 部署和实战

2024-08-13

16个具有“联网搜索”功能的AI：总有一个适合你！

2024-06-13

Cursor 一个真正让程序员产生危机感的 AI 编程工具

2024-08-21

OpenAI o1与GPT4o的对比分析

2024-09-23

大模型｜“上下文长度”和“上下文窗口”不再傻傻分不清楚！

2024-07-31

一文带你了解大模型——智能体（Agent）

2024-05-28

50+个AI大模型在不同领域的应用案例

2024-08-04

全面对比dify、coze、streamlit、chainlit

2024-04-26

【深度】AI搜索产品深度分析-搜索原理和商业模式分析

2024-07-09

一文读懂OpenAI新发布o1系列大模型

2024-09-17

大家都在问

大模型备案详解：哪些企业需要备案？如何高效准备？

2025-04-12

一夜之间，所有AI都会“说普通话”！谷歌A2A协议到底有多猛？

2025-04-12

谁是MCP 的 AI 好搭档？

2025-04-11

大模型如何保证输出json格式？

2025-04-11

阿里百炼MCP一键部署简单到颠覆想象！字节Coze会否闪电跟进？

2025-04-10

All in 医疗，百川胜算几何？

2025-04-08

如何理解政务大模型？

2025-04-07

伯克利最新研究：为什么多 Agent 系统总是“高期待、低表现”？

2025-04-07

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB