我要投稿

西湖大学发布「 AI 科学家」 Nova，效果相比 SOTA 提升 2.5 倍

发布日期：2024-10-30 20:57:23 浏览次数： 1921 作者：AI科技评论

还记得今年夏天让众多科研工作者“瑟瑟发抖”的 AI scientist 吗？

彼时的它，作为一个由谷歌Transformer 论文作者 Llion Jones 和前谷歌研究人员 David Ha 共同创立的全自动科学研究平台，从提出研究设想、检查创新程度，再到设计实验、编写程序、再GPU上执行实验并收集结果，到最后完成论文的撰写，一气呵成，让不少科研工作者早早就有了“事业危机感”。

此外，该项目还获得了New Enterprise Associates、Khosla Ventures、Lux Capital等多家全球知名投资机构以及NVIDIA等产业投资人的投资，进一步推动了其技术突破和市场化落地。

而这阵科学家“失业风”刚刮走没多久，又一位国产“AI科学家” Nova 便横空出世。

Nova 能够生成大量突破性的科学Idea，在创新性、价值性、可行性等方面可以媲美甚至超过人类科学家。

历史证明，突破性的Idea具有开启新技术纪元的潜力——比如Transformer的出现引领了波澜壮阔的AGI时代，ImageNet极大地加速了深度学习的发展，而最近的诺贝尔奖授予了几位AI领域的科学家，也标志着AI发展史上的一个重要转折点。

如今，Nova正站在这样的历史节点上，以2.5倍于AI scientist的Idea生成能力，迅速在科研领域掀起新一轮风暴。直观地说，当AI scientist还在思考第2个Idea时，Nova已经提出了5个高质量的创新Idea，每一个都有可能成为开启未来科技新纪元的钥匙。

这个“妙 idea 连珠”的 Nova 大模型，是由西湖大学蓝振忠团队联合浙江大学、电子科技大学等多所高校研发的。

而他们的出发点，就是解决现代科研工作中的一个难题：我要做什么？

他们希望大模型可以迅速阅读最新的Paper，帮助科研工作者提取其中的关键信息，根据提取的信息，生成多个高质量的 Idea。涉及到跨领域的知识，大模型也可以轻松完成。人类科学家只需要根据模型生成的内容进行判断，大大节省了科研的时间，从而提升科研的效率。

蓝振忠说：“我身边的科学家，包括我自己做科研这么多年了，有一个特别明显的感受，就是我们虽然做着最前沿的最具探索性的事情，但实际组织工作的方式却是非常传统的，甚至像是手工作坊。”

“正因如此，Nova的诞生不仅仅是一个技术突破，更像是科研领域的一场革命，将极大地加速科研创新的过程。Nove模型的发布，只是团队迈出的第一步，后续将持续发力：

1）从0到1：先让模型在单个学科、领域实现创新，快速验证算法和模型效果，把基建和底子打好，让模型成为一个可以给科学家使用的产品。

2）从1到10：进一步拓展模型的横向能力，成为多学科的创新专家，不仅能生成创新的科学Idea，而且能自动执行验证，最终发表科研论文。

3）终极目标：让模型能够自驱地进行科学探索、商业创新，让模型推进人类的科学突破与产业提升。”

妙 idea 连珠

而 Nova 的实力也并不是纸上谈兵，研究团队为了评估Nova模型的综合性能，分别从质量、多样性、新颖性三个方面对其进行了全面评估。

他们先是利用Claude-3 Sonnet作为裁判按照瑞士制锦标赛(Swiss System Tournament)对各个方法产生的idea的质量进行评估。结果显示，Nova方法生成的想法在质量上显著高于其他方法，有619和2521个想法得分为5和4，远超过其他最新的方法。

多样性方面，研究团队通过计算idea之间的相似度来对生成的idea来进行去重。实验中，随着生成的想法数量的增加，Nova 模型可以通过迭代规划和搜索不断产生新的想法。在非重复百分比方面，Nova 的表现明显优于其他方法，超过80%的想法都是不重复的。

最终，团队为了探索文章提出的方法对持续生成新的idea的影响，还进一步通过消融实验证明了该方法能持续生成新颖的非重复的idea。

实验中，当不采用文章提出的规划搜索方法时，迭代三次中的独特想法数量（44.1）与迭代两次 (42.4) 相比不再增加。这表明，如果没有规划搜索，仅依靠基于种子想法的检索会限制获取有价值的外部知识以进行创新。当规划和检索都被删除时，由于没有引入外部知识，独特新颖想法的数量在迭代两次后略有增加（从25.3增加到 30.6），在迭代三次的时候相比迭代两次则停滞不前（从30.6增加到31.35）。