人工智能语言模型(LLM)正在迅速改变科学研究的格局,最新研究表明,LLM在预测神经科学研究结果方面的准确性甚至超过了人类专家。
一项发表在《自然人类行为》杂志上的研究,来自伦敦大学学院、剑桥大学和牛津大学等机构的研究团队,开发了一个专门针对神经科学的基准测试BrainBench。研究结果表明,经过该基准测试训练的LLM在预测神经科学结果方面的准确度高达81.4%,远高于人类专家的63.4%。
在神经科学常见的5个子领域:行为/认知、细胞/分子、系统/回路、神经疾病的神经生物学以及发育/塑性和修复中,LLM的表现也全面超过了人类专家。
更重要的是,这些模型被证实对于数据没有明显的记忆。也就是说,它们已经掌握了一般科研的普遍模式,可以做出更多的前瞻性(Forward-looking)预测、预测未知的事物。
这一发现表明,LLM不再仅仅是信息存储库,它们已经能够自主学习和推理,推动科学研究的发展。
该研究最重要的贡献之一,就是提出了一个前瞻性的基准测试BrainBench,可以专门用于评估LLM在预测神经科学研究方面的能力。
BrainBench包含了2,000多个神经科学研究本文摘要,每个摘要分为原始版本和修改版本。研究者需要判断哪个版本包含实际的研究结果。
为了衡量LLM是否只是记忆了训练数据,研究团队使用zlib压缩率和困惑度比率来评估LLMs是否记忆了训练数据。
结果表明,LLM的zlib压缩率和困惑度比率显著低于人类专家的,这表明它们学习的是广泛的科学模式,而不是记忆训练数据。
尽管这项研究令人兴奋,但也引发了一些争议和质疑。
一些研究者认为,实验才是科研最重要的部分,任何预测都没什么必要:还有研究者认为,LLM的预测准确性还不足以取代人类专家的判断。
这项研究表明,LLM在神经科学研究中具有巨大的潜力。它们可以帮助研究人员探索新的假设,识别有前景的研究方向,并加快科学发现的步伐。
LLM在神经科学预测中的准确性超越人类专家,为神经科学研究开辟了新的可能。随着LLM技术的不断发展,我们有望看到LLM在科学研究中发挥越来越重要的作用。
重要的是要记住,LLM并不是完美的,它们仍然需要人类专家的监督和指导。通过将LLM与人类专家的优势相结合,我们可以进一步推动科学研究的边界,解决一些最紧迫的科学问题。
本文地址:http://dy.qianwe.com/article/1091.html