前卫目录网

为科研人员带来福音 AI预测神经学研究结论超越人类专家水平


文章编号:1091 / 更新时间:2024-11-29 17:17:30 / 浏览:
水平

人工智能语言模型(LLM)正在迅速改变科学研究的格局,最新研究表明,LLM在预测神经科学研究结果方面的准确性甚至超过了人类专家。

LLM全面超越人类专家

一项发表在《自然人类行为》杂志上的研究,来自伦敦大学学院、剑桥大学和牛津大学等机构的研究团队,开发了一个专门针对神经科学的基准测试BrainBench。研究结果表明,经过该基准测试训练的LLM在预测神经科学结果方面的准确度高达81.4%,远高于人类专家的63.4%。

在神经科学常见的5个子领域:行为/认知、细胞/分子、系统/回路、神经疾病的神经生物学以及发育/塑性和修复中,LLM的表现也全面超过了人类专家。

LLM在神经科学不同子领域的预测准确度比较

LLM掌握科研模式,做出前瞻性预测

更重要的是,这些模型被证实对于数据没有明显的记忆。也就是说,它们已经掌握了一般科研的普遍模式,可以做出更多的前瞻性(Forward-looking)预测、预测未知的事物。

这一发现表明,LLM不再仅仅是信息存储库,它们已经能够自主学习和推理,推动科学研究的发展。

全新神经学基准BrainBench

该研究最重要的贡献之一,就是提出了一个前瞻性的基准测试BrainBench,可以专门用于评估LLM在预测神经科学研究方面的能力

BrainBench包含了2,000多个神经科学研究本文摘要,每个摘要分为原始版本和修改版本。研究者需要判断哪个版本包含实际的研究结果。

BrainBench基准测试示例:原始摘要(上)和修改摘要(下)

评估LLM是否纯记忆

狂喜

为了衡量LLM是否只是记忆了训练数据,研究团队使用zlib压缩率和困惑度比率来评估LLMs是否记忆了训练数据。

结果表明,LLM的zlib压缩率和困惑度比率显著低于人类专家的,这表明它们学习的是广泛的科学模式,而不是记忆训练数据。

LLM的zlib压缩率和困惑度比率,表明它们学习的是科学模式而不是记忆数据

争议与质疑

尽管这项研究令人兴奋,但也引发了一些争议和质疑。

一些研究者认为,实验才是科研最重要的部分,任何预测都没什么必要:还有研究者认为,LLM的预测准确性还不足以取代人类专家的判断。

这项研究表明,LLM在神经科学研究中具有巨大的潜力。它们可以帮助研究人员探索新的假设,识别有前景的研究方向,并加快科学发现的步伐。

研究

结论

LLM在神经科学预测中的准确性超越人类专家,为神经科学研究开辟了新的可能。随着LLM技术的不断发展,我们有望看到LLM在科学研究中发挥越来越重要的作用。

重要的是要记住,LLM并不是完美的,它们仍然需要人类专家的监督指导。通过将LLM与人类专家的优势相结合,我们可以进一步推动科学研究的边界,解决一些最紧迫的科学问题。


相关标签: 专家狂喜模型人类zlib困惑度人类Nature水平神经学研究预测神经结果结论

本文地址:http://dy.qianwe.com/article/1091.html

上一篇:游走义乌三平米走播客们的暴富梦...
下一篇:特朗普对墨西哥中企施加严厉打击令人担忧的...

温馨提示

做上本站友情链接,在您站上点击一次,即可自动收录并自动排在本站第一位!
<a href="http://dy.qianwe.com/" target="_blank">前卫目录网</a>