我要投稿

Langchain更换embedding向量模型

发布日期：2024-07-09 08:33:44 浏览次数： 2767 来源：焊接新视野

点击蓝字

关注我们

前言

抱歉啊，好久没更新了。不过，也确实没闲着。

最近初步尝试了Langchain，发现《langchain入门指南》这本书中的例子用的都是openaiembeddings，这个需要魔法。为此，经过查阅官方文档和CSDN，找到了合适的方法，同时说说其中的坑。

干货

对于中文，目前个人用得比较多的就是m3e和bge-large-zh。

m3e

m3e属于HF系列，根据网上信息（需亲自验证），该系列的embedding模型都可以尝试使用下列方式进行向量模型加载：

from langchain.embeddings importHuggingFaceEmbeddings

bge

bge的效果目前是首屈一指的，该模型在langchain框架中的导入方法是：

from langchain.embeddings importHuggingFaceBgeEmbeddings

避坑

（1）网上也有用ModelScopeEmbeddings的：

embeddings=ModelScopeEmbeddings(model_id='iic/nlp_corom_sentence-embedding_chinese-base')

我试了一下，除了示例中的这个模型可以正常使用，m3e、bge以及很多其它模型都会报错：

please check whether model config exists in configuration.json

（2）bge模型与chatglm3大模型不匹配，导致在与大模型对话时报错：

同时，后台输出方面，bge与m3e的差别在于参数”tool”和”functions”的不同。

目前尝试后的结论是：

m3e的适用性较强，可以与chatglm和Qwen大模型进行匹配交互，bge目前仅限于Qwen大模型，其它的，我也不知道。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-03-10

【一文看懂】大白话解释大模型的技术原理，为什么它那么聪明？

2025-03-10

【一文看懂】7B、175B，这些大模型参数是什么意思？它们是怎么算出来的？参数越多=模型越强？

2025-03-10

大模型领域常用名词解释（近100个）

2025-03-10

大模型应用联网搜索：重塑智能时代的交互与决策

2025-03-10

MCP：为 AI Agent 打造开放与互操作性的“超级接口”

2025-03-10

QwQ-32B，支持Function Call的推理模型，深度思考Agent的时代来了！

2025-03-10

国产自强！实在Agent+DeepSeek+华为昇腾一体机重磅发布！

2025-03-10

1次搭建完胜1亿次编码，MCP硅谷疯传！Anthropic协议解锁智能体「万能手」

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

本地部署大模型？看这篇就够了，Ollama 部署和实战

2024-08-13

16个具有“联网搜索”功能的AI：总有一个适合你！

2024-06-13

OpenAI o1与GPT4o的对比分析

2024-09-23

Cursor 一个真正让程序员产生危机感的 AI 编程工具

2024-08-21

一文带你了解大模型——智能体（Agent）

2024-05-28

大模型｜“上下文长度”和“上下文窗口”不再傻傻分不清楚！

2024-07-31

50+个AI大模型在不同领域的应用案例

2024-08-04

全面对比dify、coze、streamlit、chainlit

2024-04-26

【深度】AI搜索产品深度分析-搜索原理和商业模式分析

2024-07-09

一文读懂OpenAI新发布o1系列大模型

2024-09-17

大家都在问

【一文看懂】大白话解释大模型的技术原理，为什么它那么聪明？

2025-03-10

【一文看懂】7B、175B，这些大模型参数是什么意思？它们是怎么算出来的？参数越多=模型越强？

2025-03-10

大模型时代，为什么模型都是多少B？

2025-03-10

什么是模型上下文协议（MCP）？它如何比传统API更简单地集成AI？

2025-03-10

大模型的未来，是 Agent 还是 App？

2025-03-08

通用Agent未来形态什么样？

2025-03-08

Manus引爆AI Agent热潮：企业如何在这场科技革命中不掉队？

2025-03-07

一夜刷爆全网的Manus，说是比DeepSeek还牛B？

2025-03-07

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB