⏶31
Spacer:迈向工程化科学灵感
发表
由
Seunghyun Moon 提交
作者:
Minhyeong Lee, Suyoung Hwang,
Seunghyun Moon,
Geonho Nah,
Donghyun Koh,
Youngjun Cho,
Johyun Park,
Hojin Yoo,
Jiho Park,
Haneul Choi,
Sungbin Moon,
Taehoon Hwang,
Seungwon Kim,
Jaeyeong Kim,
Seongjun Kim, Juneau Jung
摘要
大型语言模型 (LLM) 的最新进展使自动化科学研究成为通往人工智能超级智能的下一条战线。然而,这些系统要么被限制在狭窄范围的任务中,要么被限制在 LLM 有限的创造能力中。我们提出了 Spacer,一个科学发现系统,可在没有外部干预的情况下开发出富有创造力且事实依据充分的概念。Spacer 试图通过“故意去上下文化”来实现这一点,这是一种将信息分解为原子单元(关键词)并从它们之间未探索的联系中提取创造力的方法。Spacer 由 (i) Nuri,一个构建关键词集的灵感引擎,以及 (ii) 将这些关键词集提炼成详尽科学陈述的 Manifesting Pipeline 组成。Nuri 从使用 180,000 篇生物学领域的学术出版物构建的关键词图中提取新颖、高潜力的关键词集。Manifesting Pipeline 查找关键词之间的联系,分析其逻辑结构,验证其合理性,并最终起草原创科学概念。根据我们的实验,Nuri 的评估指标以 0.737 的 AUROC 得分准确地对高影响力出版物进行了分类。我们的 Manifesting Pipeline 还仅凭关键词集就成功地从最新的顶级期刊文章中重建了核心概念。基于 LLM 的评分系统估计,在超过 85% 的情况下,这种重建是合理的。最后,我们的嵌入空间分析表明,Spacer 的输出与领先出版物相比,与 SOTA LLM 的输出显著更相似。
Spacer:迈向工程化的科学灵感
欲了解更多详情,请访问我们的网站。
您也可以在我们的官方GitHub 存储库中找到其他资源。