一、引言
在科技飞速发展的当下,人工智能领域的创新不断涌现。2024 年 11 月,一个令人瞩目的消息传来:上海 AI Lab AI 科研团队的 VirSci 系统以其卓越的创新能力超越了 AI Scientist。
二、VirSci 系统简介
VirSci 是由上海人工智能实验室提出的一个基于大语言模型(LLM)的多智能体协作平台。它专注于模拟科学家团队的合作过程,以加速科研创新。与以往的单智能体系统不同,VirSci 通过使用真实科学家的数据来模拟科学团队的多人协作。
VirSci 的核心工作流程主要分为五个核心步骤:团队成员选择、研究主题讨论、Idea 生成、创新性评估和摘要生成。为每位智能体配备独立的科研背景信息,通过跨领域的团队合作、相互启发和知识补充,激发更多的 Idea。在科研协作过程中,VirSci 还会基于讨论内容查找并阅读论文来不断调整,最终生成有创新性的科研想法和内容。
三、创新能力超越 AI Scientist
为了验证 VirSci 在科研创新上的优势,研究团队将其生成的科研想法与目前的单智能体 SOTA 模型(AI Scientist)所生成的进行了对比分析。结果显示,VirSci 在创新性和影响力上的表现均显著优于 AI Scientist。
VirSci 系统生成的研究摘要在「新颖性(CD)」和「影响力(CI)」两方面均表现突出,既能贴近当前学术趋势,又具备较高的潜在引用影响力。此外,在 AI Scientist 中提出的基于大语言模型的评价指标(LLM Review Score)上,VirSci 也展现出优势,这充分说明多智能体协作模式对提升科研创新性具有积极作用。
四、面向未来的科学学领域应用
VirSci 系统不仅在加速科研创新方面表现出色,还展现出在科学学(Science of Science)研究领域中的巨大应用潜力。
研究团队通过实验探究了 VirSci 系统中的团队构成对创新性的影响。在不同团队规模与不同讨论轮数的实验中,发现规模适中的团队(8 人)在 5 轮讨论后创新性达到最高;而过大的团队规模或过多的讨论轮次可能导致协调困难和创意枯竭。
在不同团队新鲜度的实验中,当团队成员的新鲜度在 50%时,团队的创新性达到最高。这表明在新旧成员合理混合的情况下,团队能够实现最佳的科研创新表现。
最后,在考察团队成员研究背景多样性对结果创新性的影响实验中,4 人团队与 8 人团队分别在 50%和 75%的多样性水平时,生成的科研想法展现出较高的创新性和影响力。这说明适当的学科多样性有助于激发团队成员之间的跨领域互动,从而带来更具影响力的科研成果。
五、立即体验 VirSci
VirSci 现已开放供科研人士试用。通过这个平台,科研人员将能够体验到一个由智能体团队支持的、充满创造力的科研创新环境。欢迎各界科研人员前来体验 VirSci,感受多智能体协作系统在学术创新加速中的强大潜力!
Github:https://github.com/open-sciencelab/Social_Science
项目网页:https://open-science lab.github.io/Social_Science/。