支持私有化部署
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


本地化大模型接入RagFlow错误记录

发布日期:2025-04-13 05:21:45 浏览次数: 1598 作者:是十三不是四十三
推荐语

RagFlow与本地化大模型QwQ-32B接入实战经验分享。

核心内容:
1. RagFlow与QwQ-32B模型接入的基本步骤
2. 网络配置错误与解决方案
3. API-Key设置问题及其解决方法

杨芳贤
53A创始人/腾讯云(TVP)最具价值专家
     前两天搭建一个RagFlow和基于vLLM框架的QwQ-32B模型,今天尝试把QwQ-32B接入RagFlow,测试一下RagFlow的功能,以及基于它构建Rag模型的效果。结果一堆错,改了半天,这里记录一下
错误:连不上 connection error
  • 首先确保宿主机是能够连得上大模型的服务的
  • 登录ragflow容器内部测试连接,果然,连接失败
docker exec -it 0b527d272baa  /bin/bash curl -I http://10.10.10.10:8080
  • 怀疑是容器的网络配置有问题,于是检查相关的配置文件 docker-compose-CN-oc9.yml,果然发现问题,在部署ragflow的时候为了避开端口冲突,我把原文件(docker-compose.yml)中的80端口改成了8090,也就是容器的80端口映射到宿主机的8090端口,但是我没改 docker-compose-CN-oc9.yml 中的配置!!!
    • 修改完成后重启Docker服务
sudo systemctl restart docker
    • 重新进入ragflow容器内部验证是否连通
curl -X POST http://10.128.32.23:8080/v1/chat/completions \>   -H "Content-Type: application/json" \>   -d '{>     "model": "QWQ-32B",>     "messages": [{"role": "user", "content": "你好"}]>   }'
  • 顺利连通,到这里本来以为没事了,但是……
还是连不上,我真的天都塌了
  • 继续排查,发现虽然我在部署QwQ-32B的时候比没有设置API-Key,但是在用代码or框架连接的时候这个API-Key必填!!!补充之后,连接成功!

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询