前卫目录网

标志着科研领域的重大突破 AI预测神经学研究结论超越人类专家


文章编号:1512 / 更新时间:2024-11-30 11:19:22 / 浏览:
标志着科研领域的重大突破

最近,来自伦敦大学学院、剑桥大学、牛津大学等机构的团队发布了一个神经学专用基准BrainBench,登上了Nature子刊《自然人类行为(Naturehumanbehavior)》。结果显示,经过该基准训练的LLM在预测神经科学结果的准确度方面高达,远超人类专家的63%。

LLM预测能力全面超越人类专家

让我们先来看看本文的几个重要结论:

  • 总体结果:LLMs在BrainBench上的平均准确率为81.4%,而人类专家的平均准确率63.4%。
  • LLMs的表现显著优于人类专家
  • 模型对比:较小的模型如Llama2-7B和Mistral-7B与较大的模型表现相当,而聊天或指令优化模型的表现不如其基础模型。
  • AI预测学研究结论超越人类专家
  • 人类专家的表现:大多数人类专家是博士学生、博士后研究员或教职员工。当限制人类响应为自我报告专业知识的最高20%时,准确率上升到66.2%,但仍低于LLMS。
  • 置信度校准:LLMs和人类专家的置信度都校准良好,高置信度的预测更有可能是正确的。
  • 记忆评估:没有迹象表明LLMs记忆了BrainBench项目。使用zlib压缩率和困惑度比率的分析表明,LLMs学习的是广泛的科学模式,而不是记忆训练数据。

全新神经学基准

本本文的一个重要贡献,就是提出了一个前瞻性的基准测试BrainBench,可以专门用于评估LLM在预测神经科学结果方面的能力。

BrainBench包括了:

  • 来自广泛来源的2,641篇神经科学本文

相关标签: 狂喜研究结论神经Nature人类模型zlib困惑度人类神经学专家水平预测结果

本文地址:http://dy.qianwe.com/article/1512.html

上一篇:而是我们已不再相信真实照片AI最令人恐惧的...
下一篇:欧洲版宁德时代最终悲剧收场8年烧掉150亿美...

温馨提示

做上本站友情链接,在您站上点击一次,即可自动收录并自动排在本站第一位!
<a href="http://dy.qianwe.com/" target="_blank">前卫目录网</a>