我要投稿

Cloudflare AutoRAG：把RAG应用变得和安装微信一样简单

发布日期：2025-04-15 16:20:30 浏览次数： 1553 作者：字节笔记本

不需要部署，不需要了解原理，更不需要操心运维和安全，点两下就可以实现一个功能完备的RAG。

什么是RAG

—

你问大模型“美国2025年4最新关税提高到了多少？”，它一定不知道。

因为主流模型的训练数据就到2024年，大部分还是2023年的，这就是目前大多数AI的局限性——它们只知道训练时学到的内容，对于新信息或专属于你的信息则一无所知。

而RAG技术（全称是Retrieval-Augmented Generation，检索增强生成）就是为了解决这个问题。让AI能够主动去"查资料"。

传统RAG系统的痛点

—

RAG看起来很好，但搭建一个完整的RAG系统却十分复杂：

你得需要管理多种工具和服务，然后要编写大量的"胶水代码"将各个部分连接起来，这中间还要更新后需要重新索引，完了，维护成本高，容易出错。

等于是自己从零搭建一辆汽车，不仅要有发动机、轮胎、方向盘等各个部件，还要确保它们能够协调工作，一旦任何部分出了问题，整车就无法前行。

虽然市面还有类似于IMA这类的第三方集成度比较高的RAG应用，但是个人知识库的隐私性又无法保证。

赛博菩萨Cloudflare的AutoRAG就像是提供了一辆已经组装好的汽车，你只需要加油（提供数据）和开动（提问）即可。

它自动处理了从数据摄入、切片处理、向量嵌入到检索和响应生成的全过程。

它还会持续监控你的数据源，当有新信息时自动更新索引，始终是最新信息，而无需手动干预。

AutoRAG实现的步骤和原理

—

整个的索引流程是后台自动运行，用户只需要做一件事，
在数据源（如R2存储桶）放入文件，

之后就是后台的一系列操作：

将所有文件转换为结构化的Markdown格式
将文本分割成小块以提高检索精度
使用嵌入模型将内容转换为向量
将生成的向量存储在Cloudflare的Vectorize数据库中
查询流程（用户提问时触发）
接收用户查询
可选择性地重写查询以提高检索质量，将查询转换为向量
在向量数据库中搜索最相关的内容
从原始数据源获取内容
使用语言模型生成基于检索内容的回答

实践

—

第0步，注册Clouflare,因为AutoRAG是完全免费的，不需要绑卡，直接用就行。

第1步，来到个人中心，找到AI栏目下的，AutoRAG

第2步,创建 Create AutoRAG

第3步，选择“数据源”，目前仅支持R2,这个名字看着怪怪的，其实就是一个文件存储库。后续我们的资料就直接往里面扔就完了。

第4步，选择“Embedding model”嵌入模型，无脑选择‘auto’就行，但是需要注意的是这个会计入到你的模型使用量中，价格之前有介绍，这里就不再提了，反正就是每天的免费额度个人用完全够。

第5步，起个名字。比如这里的“bytenote"

最后一步，使用，Cloudflare最后一步提供了界面和相关的API调用代码。后续需要上传的资料直接放到上面创建的R2桶就会自动进行索引。

测试，我这里上传了一个关于模型参数的文档，在Playground进行测试，成功地召回，并且给出了出处。

同样也提供了友好的接口界面。

如何是做为个人或者企业资料库会是一个很方便快捷的方式，因为能省很多事。

限制方面：每个账户最多可创建10个AutoRAG实例，每个AutoRAG最多可处理10万个文件。

费用：Cloudflare AutoRAG 在公测期间启用是免费的，但会使用账户中的 Cloudflare 服务资源，这些资源将按您的 Cloudflare 使用量计费。具体包括：R2 存储，Vectorize 数据库。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-04-16

OneFileLLM：一键整合海量数据源

2025-04-16

强强联合！LangChain与CrewAI构建基于RAG的智能查询解答系统

2025-04-16

向量嵌入四种实现方式

2025-04-15

RAG优化策略总结

2025-04-15

其实RAG也是智商税，聊聊他与AI知识库的关系

2025-04-15

泄漏！知名程序员AI受害，3000字带你避坑

2025-04-15

Dify+RAGFLow：基于占位符的图片问答升级方案（最佳实践）

2025-04-14

Open WebUI中调用RAGFlow的聊天机器人——适合构建个人和企业级知识问答助手

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

全网最全国内Agent平台深度测评：扣子、Dify、FastGPT，谁是你的Agent开发首选？

2024-10-27

一文彻底搞懂大模型 - RAG（检索、增强、生成）

2024-09-04

GraphRAG+Ollama 本地部署，保姆教程，踩坑无数，闭坑大法

2024-07-18

RAGFlow：基于OCR和文档解析的下一代 RAG 引擎

2024-05-05

RAG框架，都在这了!

2024-06-20

RAG 高效应用指南：Embedding 模型的选择和微调

2024-06-13

深入解析 Graph RAG：提升语言模型问答能力的创新策略

2024-07-09

微软开源的GraphRAG解读

2024-07-09

基于Llama 3 构建RAG语音助手：将本地 RAG 与 Qdrant、Whisper 和 LangChain 集成

2024-05-19

Prompt工程师必备：复旦重磅 | 最佳RAG实践长什么样的？

2024-07-07

大家都在问

RAG系统中的“幕后英雄”：重排器如何提升信息检索的精准度？

2025-04-14

Dify 基础篇| 深度解读 RAG：为什么需要混合检索？

2025-04-13

OlmOCR如何成为搭建RAG 知识库的"智能中枢"？

2025-04-11

构建Agentic RAG 系统的方法有哪些？

2025-04-09

【AI知识点】什么是Agentic RAG？

2025-04-07

从“人工智障”到“真智能”：AI智能体如何突破最后一道技术壁垒？

2025-04-05

有Embedding模型不够，还需要Rerank模型？

2025-04-04

RAG如何选择最佳分块大小？

2025-04-03

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB