我要投稿

基于多Agent系统自动发现科学假设

发布日期：2024-10-31 20:22:51 浏览次数： 2414

作者：AI 搜索引擎

微信搜一搜，关注“AI 搜索引擎”

本文是由南洋理工大学，德克萨斯大学，华中科技大学以及新加坡科技设计大学联合发表。本文提出一个用于社会科学学术假设发现的自然语言处理（NLP）数据集，来构建原始网络语料库，之后利用多Agent的方式生成对人类研究者有帮助的假设。

标题: Large Language Models for Automated Open-domain Scientific Hypotheses Discovery

论文地址：https://arxiv.org/pdf/2309.02726

代码链接：https://github.com/zongliny/moose

摘要

科学家在探索世界时，通常会采用归纳推理来形成假设，以解释他们的观察结果。然而，归纳推理的研究存在一些限制：

1. 首先，研究往往依赖于人工挑选的句子，而不是直接使用原始的网络数据，这限制了数据来源的多样性。

2. 其次，研究中作为基准的假设通常是一些常识性知识，这降低了研究的难度和挑战性。

因此，能够直接从未经处理的网络数据中自动提取信息，并提出对人类来说全新的科学假设，将是一项非常有价值的工作。

核心内容

数据集处理

1. 论文筛选：从2023年1月至今，挑选出50篇发表于顶尖社会科学期刊的论文。这些论文覆盖了心理学、人力资源管理、信息系统等多个社会科学子领域。

2. 专家分析：对于每篇选定的论文，由社会科学领域的专家负责提取论文的主要假设，并追溯其背后的背景和灵感来源，从而构建出推理过程。随后，专家会在网络语料库中搜寻与这些背景和灵感相似的内容，并收集相应的完整段落，这些段落将作为原始网络语料库的补充。

3. 数据纯净性：避免直接复制论文中的背景和灵感部分，而是在原始网络语料库中寻找语义相近的文本内容。这样做的目的是为了实现从原始网络语料库中提炼研究假设的目标。

4. 材料搜集：除了论文链接，还搜集了所有50篇论文的相关14篇综述文章。这些综述文章有助于评估假设的创新性。

5. 数据集制作：最终，这个数据集由一位社会科学领域的博士生独立构建。文档中指出，由于数据集的构建涉及大量手动筛选工作，因此这些手动筛选的内容更多地被用作衡量人类性能的基准。

MOOSE框架

MOOSE（MultimOdule framewOrk with paSt present future feEdback）是一个旨在自动化开放领域科学假设发现的先进框架。它的独特之处在于，它将大型语言模型的生成能力与复杂的反馈机制相结合，以实现从海量文本数据中自动识别和提炼出可能对科学研究具有重要价值的新假设。

1. 核心架构 (MOOSE-Core)

MOOSE体系的核心是一个多功能的基础架构，它复现了社会科学家构建初步研究假设的流程。该流程主要分为以下几个阶段：

背景探索器 (Background Explorer): 该组件通过分析原始网络文本资源，以识别合适的研究背景。
创意标题搜索器 (Creative Title Searcher): 在确立背景之后，该组件会搜索与背景相关的标题，旨在激发潜在的创意灵感。
创意搜索器 (Creative Searcher): 基于选定的标题，该组件在相关文献中挖掘能够激发假设构思的关键句子或段落。
假设生成器 (Hypothesis Generator): 结合背景和创意，该组件提出可能的研究假设。

2. 改进策略（Feedback）

MOOSE框架通过实施三种反馈策略来增强假设生成的准确性：

即时反馈：当一个模块的输出能够立即被评估时，框架会利用其他大型语言模型（LLMs）的反馈。这样，该模块可以根据这些反馈和之前的生成内容进行调整，以提升输出质量。
历史反馈：对于那些不能即时评估输出的模块，框架会持续运行直到产生可评估的输出。随后，利用这些评估结果为之前的操作提供反馈。例如，在生成 “灵感标题” 时，可能无法立即判断其质量，但可以在依赖该标题生成具体的 “假设” 后，通过评估 “假设” 的质量来推断标题生成的效果。
未来反馈：这种机制旨在为后续模块提供额外信息，以促进更高质量的输出。它包括两个方面：一是提供输出的理由（FF1），二是在关键模块前增设辅助模块以减轻推理负担（FF2）。