我要投稿

大模型的嵌入——Embedding与向量——Ve ctor

发布日期：2024-12-28 11:11:01 浏览次数： 1968 作者：AI探索时代

“ 向量是大模型的基石，嵌入是大模型的入口 ”

最近在研究RAG然后带来了对嵌入与向量的思考；毕竟嵌入与向量是实现大模型的基础；嵌入解决的是数据向量化的问题，而向量解决的是数据之间的关系问题。

Embedding中文翻译是嵌入，但更形象的理解是——在机器学习和大模型中，嵌入是一种数据向量化或向量表示的技术；简单来说就相当于一个转换器，把人类能够理解的数据包括文本，图像等转换为大模型方便处理的向量数据。

而向量是数学概念中的一个表示有大小和方向的量，其空间几何意义就是一个带有方向的箭头，并且可以平移；而更直观的理解可以把向量当成一个多维矩阵，更确切的说是用多维矩阵来描述向量。

因此，我们在大模型技术中所说的向量指的并不是空间维度；而是数据所构成的维度。所以说，向量是一个数学概念，而矩阵是向量在计算机中的载体。

嵌入与向量

向量

向量在数学上表示的一个有方向和大小的量，在计算机中的载体是一个多维矩阵；因此向量从某些方面讲就具备矩阵的性质，比如维度变换。

在大模型中数据一半通过多维矩阵来描述，比如大模型参数中有一个很重要的参数就是维度(dimension)；这个维度指的就是多维矩阵的维度，维度越高，能够表示的场景就越复杂。

但同样，由于矩阵中存在着太多无用数据；因此就产生了密集矩阵和稀疏矩阵的区别；而稀疏矩阵可以通过降维的方式来压缩其矩阵大小，以此来获取更高的存储效率。

高维矩阵与低维矩阵的区别就类似于图片中的像素点；像素点越多，图片质量越好，观感上就更细腻；而像素点越低，图像就越模糊，丢失的东西就越多。

但同样的图片效果怎么样，除了像素点之外还有你观看距离的影响，离得越远，像素点的影响越小。

而为了解决近距离观看的效果，升维就有了用武之地；而远距离观看，就可以对数据进行降维处理，节省空间，提升效率。

而至于怎么描述数据之间的语义关系，就是通过向量之间的计算——比如欧式距离，余弦，内积等。

嵌入

嵌入虽然本质上都是把离散数据映射到高维矩阵中，通过向量的空间关系来捕捉数据之间的语义关系；但其在不同的场景中又有一定的区别。

词嵌入

词嵌入是将单词映射为数值向量，以捕捉单词间的语义和句法关系，为自然语言处理任务提供有效的特征表示。

方法与技术：词嵌入通过预测单词上下文（如Word2Vec）或全局词频统计（如GloVe）来学习，也可使用深度神经网络捕捉更复杂的语言特征。

图像嵌入

图像嵌入是将图像转换为低维向量，以简化处理并保留关键信息供机器学习使用。

方法与技术：利用深度学习模型（如CNN）抽取图像特征，通过降维技术映射到低维空间，训练优化嵌入向量。

在机器学习中，Embedding 主要是指将离散的高维数据（如文字、图片、音频）映射到低纬度的连续向量空间。这个过程会生成由实数构成的向量，用于捕捉原始数据的潜在的关系和结构。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-04-24

从搜索到解决方案：解锁火山 DeepSearch 的“三连跳” MCP 玩法

2025-04-24

一文搞懂：RAG、Agent与多模态的行业实践与未来趋势

2025-04-24

字节扣子空间 VS 智谱AutoGLM，谁家Agent更好用？（附邀请码）

2025-04-24

Function Calling已经过时，MCP才是真正的大模型接口标准

2025-04-24

大模型技术创新驱动的AI生态和应用演进

2025-04-24

除了MCP我们还有什么？

2025-04-24

LLM 推理引擎之争：Ollama or vLLM ?

2025-04-24

刚刚，OpenAI发布GPT-image-1模型，更强吉卜力版本来啦

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

本地部署大模型？看这篇就够了，Ollama 部署和实战

2024-08-13

16个具有“联网搜索”功能的AI：总有一个适合你！

2024-06-13

Cursor 一个真正让程序员产生危机感的 AI 编程工具

2024-08-21

OpenAI o1与GPT4o的对比分析

2024-09-23

大模型｜“上下文长度”和“上下文窗口”不再傻傻分不清楚！

2024-07-31

一文带你了解大模型——智能体（Agent）

2024-05-28

50+个AI大模型在不同领域的应用案例

2024-08-04

全面对比dify、coze、streamlit、chainlit

2024-04-26

【深度】AI搜索产品深度分析-搜索原理和商业模式分析

2024-07-09

一文读懂OpenAI新发布o1系列大模型

2024-09-17

大家都在问

除了MCP我们还有什么？

2025-04-24

LLM 推理引擎之争：Ollama or vLLM ?

2025-04-24

专题策划（下）| 如何实现大模型与行业的深度耦合？

2025-04-23

OpenAI：就你们也配做智能体？

2025-04-23

白话解析 DPO：如何让 AI 直接学习人类偏好？

2025-04-22

独家｜百度上线“心响”App，平替版Mauns来了？

2025-04-21

Deep Research 类产品深度测评：下一个大模型产品跃迁点到来了吗？

2025-04-21

从“大模型热”到“Agent 潮”，“真风口”还是“伪命题”？

2025-04-21

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB