我要投稿

1.8K+ Star！一个由大型语言模型（LLM）驱动的知识整合系统，它能从零开始研究一个主题，并生成带有引用的完整报告

发布日期：2024-05-01 07:20:19 浏览次数： 2677

作者：AIGC创想者

微信搜一搜，关注“AIGC创想者”

https://github.com/stanford-oval/storm

【阅读原文】跳转Github项目

项目简介

STORM 是一个由大型语言模型（LLM）驱动的知识整合系统，它能够从零开始研究一个主题，并生成带有引用的完整报告。

该项目由Yijia Shao、Yucheng Jiang、Theodore A. Kanell、Peter Xu、Omar Khattab和Monica S. Lam共同开发，并在NAACL 2024会议上发表了相关论文。

使用方法

STORM将生成长篇文章与引用的过程分为两个阶段：

预写阶段：系统通过互联网研究收集参考资料，并生成大纲。
写作阶段：系统使用大纲和参考资料生成带有引用的全文文章。

相关配置

要在当地运行STORM以重现实验，请按照以下步骤操作：

安装所需的软件包。

conda create -n storm python=3.11
conda activate storm
pip install -r requirements.txt

设置OpenAI API密钥和You.com搜索API密钥（https://api.you.com/）。在根目录下创建一个名为secrets.toml的文件，并添加以下内容：

# 设置OpenAI API密钥。
OPENAI_API_KEY=<your_openai_api_key>
# 如果你使用的是OpenAI提供的API服务，请包含以下行：
OPENAI_API_TYPE="openai"
# 如果你使用的是Microsoft Azure提供的API服务，请包含以下行：
OPENAI_API_TYPE="azure"
AZURE_API_BASE=<your_azure_api_base_url>
AZURE_API_VERSION=<your_azure_api_version>
# 设置You.com搜索API密钥。
YDC_API_KEY=<your_youcom_api_key>

预写阶段

对于FreshWiki数据集的批量实验：

python -m scripts.run_prewriting --input-source file --input-path ../FreshWiki/topic_list.csv  --engine gpt-4 --do-research --max-conv-turn 5 --max-perspective 5

对于单个主题的实验：

python -m scripts.run_prewriting --input-source console --engine gpt-4 --max-conv-turn 5 --max-perspective 5 --do-research

写作阶段

对于FreshWiki数据集的批量实验：

python -m scripts.run_writing --input-source file --input-path ../FreshWiki/topic_list.csv --engine gpt-4 --do-polish-article --remove-duplicate

对于单个主题的实验：

python -m scripts.run_writing --input-source console --engine gpt-4 --do-polish-article --remove-duplicate

自动评估

论文将评估分为两部分：大纲质量和全文文章质量。可以使用提供的脚本来计算FreshWiki数据集上的指标。

大纲质量

python eval_outline_quality.py --input-path ../FreshWiki/topic_list.csv --gt-dir ../FreshWiki --pred-dir ../results --pred-file-name storm_gen_outline.txt --result-output-path ../results/storm_outline_quality.csv

全文文章质量

python eval_article_quality.py --input-path ../FreshWiki/topic_list.csv --gt-dir ../FreshWiki --pred-dir ../results --gt-dir ../FreshWiki --output-dir ../results/storm_article_eval_results --pred-file-name storm_gen_article_polished.txt

小结

STORM是一个由斯坦福大学开发的LLM（Large Language Model，大型语言模型）驱动的知识整合系统。

该系统能够基于互联网搜索，从零开始撰写类似维基百科的文章。

尽管STORM生成的文章可能需要进一步编辑才能达到出版标准，但经验丰富的维基百科编辑者发现它在预写阶段非常有帮助。

注：本文内容仅供参考，具体项目特性请参照官方 GitHub 页面的最新说明。

欢迎关注&点赞&在看，感谢阅读~

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2024-07-10

科研助力神器：Scholar GPT，百倍提升你的研究效率！

2024-07-09

Doc2X：一款功能超级强大的文档解析与转换工具

2024-07-06

我对多智能体协作过程自动演化架构设计

2024-07-06

可穿戴AI，底层逻辑的变化

2024-07-06

一文彻底搞懂Transformer - Word Embedding（词嵌入）

2024-07-06

AI动态 | 腾讯元宝AI搜索能力升级：深度搜索模式上线

2024-07-06

智能手表 + AI ，都已经这么智能了？？

2024-07-06

死磕10万卡GPU算力集群，腾讯星脉网络2.0有什么秘密武器？

了解更多

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

看大厂PM，如何玩转多个智能体开发平台

2025-06-17

53AI Hub重磅开源！让99%的智能体开发者赚到钱！

2025-06-17

DeepSeek R1-0528 小版本升级

2025-05-29

源神降临！阿里 Qwen3 全系发布，免费商用，消费级显卡就能跑！(深度解读 + 实战case)

2025-04-29

高效 Agents 构建指南

2025-05-23

分而治之：全面解析分布式分离 Inference 系统

2025-04-29

Qwen3发布: 4B干掉旧代 72B / Windsurf又增加新的免费计划

2025-04-29

忽视小模型和知识库，企业AI应用必将是死路一条

2025-05-07

CAG 与 RAG：哪种方法能带来性能更好的人工智能

2025-05-07

从RAG到CoT再到MCP，一文读懂AI Agent落地难题｜大模型研究

2025-05-07

大家都在问

从谨慎检查到一键接受，TRAE 如何成为我的主力 IDE？

2025-07-10

垂直赛道 Agent 闷声发财指南：如何实现一年超千万营收？

2025-07-10

你的大脑真的在被AI“腐蚀”吗？

2025-07-10

如何在 Elasticsearch 中构建你的智能 AI 助手？

2025-07-09

AI大模型落地最后一公里：RAG？

2025-07-09

微信支付这波操作把我干懵了，Agent能赚钱？

2025-07-08

🧠提示词的魔力：Prompt 为什么能控制大模型？

2025-07-08

OpenAI 的第一款 AI 硬件，竟然是一支笔？

2025-07-08

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB

应聘简历请发送至： ceo@53ai.com

友情链接：

CopyRight © 2012-2024 深圳市博思协创网络科技有限公司版权所有

粤ICP备17114055号

广州：广州市华景路37号(华景软件园)暨南大学科技大厦6楼（整层）

深圳：深圳市福田区泰然四路29号天安创新科技广场一期A座1204

上海：上海市浦东新区金新路58号1602室

微信扫码
和创始人交个朋友

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部