CHIMERA:科学文献中的概念重组知识库

发表
Noy SternlichtNoy Sternlicht 提交
作者: Noy SternlichtNoy Sternlicht, Tom Hope

摘要

人类创新的一个标志是重组的过程——通过整合现有机制和概念的元素来创造原创思想。在这项工作中,我们自动挖掘科学文献并构建了 CHIMERA:一个大规模的重组示例知识库 (KB)。CHIMERA 可用于大规模地实证探索科学家如何重组概念以及如何从不同领域汲取灵感,或用于训练学习预测新的创意跨领域方向的监督机器学习模型。为了构建这个知识库,我们提出了一项从科学论文摘要中提取重组信息的新颖信息提取任务,收集了数百篇高质量的手动标注摘要语料库,并使用它来训练一个基于 LLM 的提取模型。将该模型应用于 AI 领域的大规模论文语料库,生成了一个包含超过 28K 重组示例的知识库。我们分析了 CHIMERA,以探索重组在 AI 的不同子领域中的属性。最后,我们利用该知识库训练了一个科学假设生成模型,该模型预测出真实世界的科研人员认为具有启发性的新的重组方向。我们的数据和代码可在 https://github.cs.huji.ac.il/tomhope-lab/CHIMERA 获取。
查看 arXiv 页面查看 PDF
CHIMERA:科学文献中的概念重组知识库

评论

Noy SternlichtNoy Sternlicht
论文作者
论文提交者

项目页面 - https://noy-sternlicht.github.io/CHIMERA-Web

Noy SternlichtNoy Sternlicht
论文作者
论文提交者

项目页面 - https://noy-sternlicht.github.io/CHIMERA-Web