AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


1.8K+ Star!一个由大型语言模型(LLM)驱动的知识整合系统,它能从零开始研究一个主题,并生成带有引用的完整报告
发布日期:2024-05-01 07:20:19 浏览次数: 2078 来源:AIGC创想者


https://github.com/stanford-oval/storm

【阅读原文】跳转Github项目

项目简介

STORM 是一个由大型语言模型(LLM)驱动的知识整合系统,它能够从零开始研究一个主题,并生成带有引用的完整报告。

该项目由Yijia Shao、Yucheng Jiang、Theodore A. Kanell、Peter Xu、Omar Khattab和Monica S. Lam共同开发,并在NAACL 2024会议上发表了相关论文。

使用方法

STORM将生成长篇文章与引用的过程分为两个阶段:

  1. 预写阶段:系统通过互联网研究收集参考资料,并生成大纲。

  2. 写作阶段:系统使用大纲和参考资料生成带有引用的全文文章。

相关配置

要在当地运行STORM以重现实验,请按照以下步骤操作:

  1. 安装所需的软件包。
conda create -n storm python=3.11
conda activate storm
pip install -r requirements.txt
  1. 设置OpenAI API密钥和You.com搜索API密钥(https://api.you.com/)。在根目录下创建一个名为secrets.toml的文件,并添加以下内容:
# 设置OpenAI API密钥。
OPENAI_API_KEY=<your_openai_api_key>
# 如果你使用的是OpenAI提供的API服务,请包含以下行:
OPENAI_API_TYPE="openai"
# 如果你使用的是Microsoft Azure提供的API服务,请包含以下行:
OPENAI_API_TYPE="azure"
AZURE_API_BASE=<your_azure_api_base_url>
AZURE_API_VERSION=<your_azure_api_version>
# 设置You.com搜索API密钥。
YDC_API_KEY=<your_youcom_api_key>

预写阶段

对于FreshWiki数据集的批量实验:

python -m scripts.run_prewriting --input-source file --input-path ../FreshWiki/topic_list.csv  --engine gpt-4 --do-research --max-conv-turn 5 --max-perspective 5

对于单个主题的实验:

python -m scripts.run_prewriting --input-source console --engine gpt-4 --max-conv-turn 5 --max-perspective 5 --do-research

写作阶段

对于FreshWiki数据集的批量实验:

python -m scripts.run_writing --input-source file --input-path ../FreshWiki/topic_list.csv --engine gpt-4 --do-polish-article --remove-duplicate

对于单个主题的实验:

python -m scripts.run_writing --input-source console --engine gpt-4 --do-polish-article --remove-duplicate

自动评估

论文将评估分为两部分:大纲质量和全文文章质量。可以使用提供的脚本来计算FreshWiki数据集上的指标。

  • 大纲质量
python eval_outline_quality.py --input-path ../FreshWiki/topic_list.csv --gt-dir ../FreshWiki --pred-dir ../results --pred-file-name storm_gen_outline.txt --result-output-path ../results/storm_outline_quality.csv
  • 全文文章质量
python eval_article_quality.py --input-path ../FreshWiki/topic_list.csv --gt-dir ../FreshWiki --pred-dir ../results --gt-dir ../FreshWiki --output-dir ../results/storm_article_eval_results --pred-file-name storm_gen_article_polished.txt

小结

STORM是一个由斯坦福大学开发的LLM(Large Language Model,大型语言模型)驱动的知识整合系统。

该系统能够基于互联网搜索,从零开始撰写类似维基百科的文章。

尽管STORM生成的文章可能需要进一步编辑才能达到出版标准,但经验丰富的维基百科编辑者发现它在预写阶段非常有帮助。


注:本文内容仅供参考,具体项目特性请参照官方 GitHub 页面的最新说明。

欢迎关注&点赞&在看,感谢阅读~


53AI,企业落地应用大模型首选服务商

产品:大模型应用平台+智能体定制开发+落地咨询服务

承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询