微信扫码
与创始人交个朋友
我要投稿
https://github.com/stanford-oval/storm
【阅读原文】跳转Github项目
STORM 是一个由大型语言模型(LLM)驱动的知识整合系统,它能够从零开始研究一个主题,并生成带有引用的完整报告。
该项目由Yijia Shao、Yucheng Jiang、Theodore A. Kanell、Peter Xu、Omar Khattab和Monica S. Lam共同开发,并在NAACL 2024会议上发表了相关论文。
STORM将生成长篇文章与引用的过程分为两个阶段:
预写阶段:系统通过互联网研究收集参考资料,并生成大纲。
写作阶段:系统使用大纲和参考资料生成带有引用的全文文章。
要在当地运行STORM以重现实验,请按照以下步骤操作:
conda create -n storm python=3.11
conda activate storm
pip install -r requirements.txt
https://api.you.com/
)。在根目录下创建一个名为secrets.toml
的文件,并添加以下内容:# 设置OpenAI API密钥。
OPENAI_API_KEY=<your_openai_api_key>
# 如果你使用的是OpenAI提供的API服务,请包含以下行:
OPENAI_API_TYPE="openai"
# 如果你使用的是Microsoft Azure提供的API服务,请包含以下行:
OPENAI_API_TYPE="azure"
AZURE_API_BASE=<your_azure_api_base_url>
AZURE_API_VERSION=<your_azure_api_version>
# 设置You.com搜索API密钥。
YDC_API_KEY=<your_youcom_api_key>
对于FreshWiki数据集的批量实验:
python -m scripts.run_prewriting --input-source file --input-path ../FreshWiki/topic_list.csv --engine gpt-4 --do-research --max-conv-turn 5 --max-perspective 5
对于单个主题的实验:
python -m scripts.run_prewriting --input-source console --engine gpt-4 --max-conv-turn 5 --max-perspective 5 --do-research
对于FreshWiki数据集的批量实验:
python -m scripts.run_writing --input-source file --input-path ../FreshWiki/topic_list.csv --engine gpt-4 --do-polish-article --remove-duplicate
对于单个主题的实验:
python -m scripts.run_writing --input-source console --engine gpt-4 --do-polish-article --remove-duplicate
论文将评估分为两部分:大纲质量和全文文章质量。可以使用提供的脚本来计算FreshWiki数据集上的指标。
python eval_outline_quality.py --input-path ../FreshWiki/topic_list.csv --gt-dir ../FreshWiki --pred-dir ../results --pred-file-name storm_gen_outline.txt --result-output-path ../results/storm_outline_quality.csv
python eval_article_quality.py --input-path ../FreshWiki/topic_list.csv --gt-dir ../FreshWiki --pred-dir ../results --gt-dir ../FreshWiki --output-dir ../results/storm_article_eval_results --pred-file-name storm_gen_article_polished.txt
STORM是一个由斯坦福大学开发的LLM(Large Language Model,大型语言模型)驱动的知识整合系统。
该系统能够基于互联网搜索,从零开始撰写类似维基百科的文章。
尽管STORM生成的文章可能需要进一步编辑才能达到出版标准,但经验丰富的维基百科编辑者发现它在预写阶段非常有帮助。
注:本文内容仅供参考,具体项目特性请参照官方 GitHub 页面的最新说明。
欢迎关注&点赞&在看,感谢阅读~
53AI,企业落地应用大模型首选服务商
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-05-14
2024-04-26
2024-03-30
2024-04-12
2024-05-10
2024-07-18
2024-05-22
2024-05-28
2024-04-25
2024-04-26
2024-11-14
2024-11-13
2024-11-13
2024-11-13
2024-11-12
2024-11-11
2024-11-08
2024-11-07