微信扫码
与创始人交个朋友
我要投稿
Easy-RAG是一个检索增强生成(RAG)系统,旨在提供一种简便的方式来学习和使用RAG技术,并支持用户自主扩展系统功能,之前分享过这个博主自己开源的项目RAG搜索增强生成系统,一个精简的版本,适合学习、使用、自主扩展,感谢大家支持目前已有300+star,最近做了一些更新给大家汇报一下,整体开发还是本着简单,清晰和方便二次开发。
项目地址:https://github.com/yuntianhe2014/Easy-RAG
项目特点
一个适合学习、使用、自主扩展的RAG【检索增强生成】系统,可以联网做AI搜索!
2024/9/04 增加 AI网络搜索 可以联网查询
2024/9/04 优化webui异步调用,提高响应速度
2024/8/21 增加对 Elasticsearch 支持,在config中设置
2024/7/23 参考 meet-libai 项目增加了一个知识图谱的时时提取工具,目前仅是提取,未存储 graph_demo_ui.py
2024/7/11 新增faiss向量数据库支持,目前支持(Chroma\FAISS)
2024/7/10 更新rerank搜索方式
2024/7/09 第一版发布
知识库(目前仅支持txt\csv\pdf\md\doc\docx\mp3\mp4\wav\excel\格式数据):
1、知识库的创建(目前仅支持Chroma\Faiss\Elasticsearch)
2、知识库的更新
3、删除知识库中某个文件
4、删除知识库
5、向量化知识库
6、支持音频视频的语音转文本然后向量化
语音转文本 使用的 funasr ,第一次启动时,会从魔塔下载模型,可能会慢一些,之后会自动加载模型
chat
1、支持纯大模型聊天多轮
2、支持知识库问答 ["复杂召回方式", "简单召回方式","rerank"]
AI网络搜索
支持网络搜素,大家可以优化 prompt 增加不同 程度的 总结
llm基于ollama可以选择不同模型
注意:联网基于 searxng,需要先本地或者服务启动 这个项目,我用docker 启动的
参考 https://github.com/searxng/searxng-docker
本次rerank 使用了bge-reranker-large 模型,需要下载到本地,
然后再 rag/rerank.py中配置路径
模型地址:https://hf-mirror.com/BAAI/bge-reranker-large
知识库:
0、支持Milvus,MongoDB等向量数据
chat:
1、添加 语音回答输出
2、增加 问题路由知识库的 功能
安装包,傻瓜式安装即可
https://ollama.com/download
Ollama 安装模型,本次直接安装我们需要的两个 cmd中执行
ollama run qwen2:7b
ollama run mofanke/acge_text_embedding:latest
模型然后在 rag/rerank.py中配置路径
https://hf-mirror.com/BAAI/bge-reranker-large
目前仅支持(Chroma和Faiss)
Config/config.py中配置你想用的 向量数据库
Elasticsearch 请先启动 Elasticsearch,我是使用docker 启动的
docker run -p 9200:9200 -e "discovery.type=single-node" -e "xpack.security.enabled=false" -e "xpack.security.http.ssl.enabled=false" docker.elastic.co/elasticsearch/elasticsearch:8.12.1
es_url
构造python环境
conda create -n Easy-RAG python=3.10.9
conda activate Easy-RAG
python3.10.9 经测试 pyhon3.8以上皆可使用
git clone https://github.com/yuntianhe2014/Easy-RAG.git
安装依赖
pip3 install -r requirements.txt -i https://mirrors.aliyun.com/pypi/simple
部署依赖联网项目searxng
https://github.com/searxng/searxng-docker
项目启动
python webui.py
知识图谱时时提取工具
python graph_demo_ui.py
如果项目对您有用请帮忙点个赞,也欢迎大家关注公众号、进群交流技术
技术咨询,商务合作可以加我
已在我其他群的就不要加这个新群了,我会清理幺^_^
历史回顾:
AI搜索,一个开源可本地部署的Ai搜索引擎,不需要gpu,免费用qwen2.5接口,也可以基于ollama
AI搜索第二弹,国产开源,可以参考【全网】或【学术】回答,拥有简洁、深入、研究三种模式,
VITA:腾讯开源交互式多模态大型语言模型,支持全模态、无障碍交流,可随时打断
llama3.1结合agent,实现大模型对工具的调用,【奥特曼】智能助手的核心调用组件就是他
GraphRAG+Ollama 本地部署,保姆教程,踩坑无数,闭坑大法
53AI,企业落地应用大模型首选服务商
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-11-15
破解PDF解析难题:RAG中高效解析复杂PDF的最佳选择
2024-11-15
RAG技术全解析:从基础到前沿,掌握智能问答新动向
2024-11-15
RAG在未来会消失吗?附RAG的5种切分策略
2024-11-15
HtmlRAG:利用 HTML 结构化信息增强 RAG 系统的知识检索能力和准确性
2024-11-15
打造自己的RAG解析大模型:表格数据标注的三条黄金规则
2024-11-13
RAGCache:让RAG系统更高效的多级动态缓存新方案
2024-11-13
Glean:企业AI搜索,估值46亿美元,ARR一年翻4倍
2024-11-12
从安装到配置,带你跑通GraphRAG
2024-07-18
2024-07-09
2024-05-05
2024-07-09
2024-05-19
2024-06-20
2024-07-07
2024-07-07
2024-07-08
2024-07-09
2024-11-06
2024-11-06
2024-11-05
2024-11-04
2024-10-27
2024-10-25
2024-10-21
2024-10-21