SheepNav
新上线28天前0 投票

哈佛研究:AI在急诊室诊断准确率超过两位人类医生

一项由哈佛医学院和贝斯以色列女执事医疗中心主导的新研究显示,在急诊室场景下,OpenAI的o1模型在诊断准确率上超越了人类医生。研究发表于《Science》期刊,通过多项实验对比了AI模型与内科医生的诊断能力。

实验设计:真实急诊病例的盲测

研究团队选取了76名进入贝斯以色列急诊室的患者,由两位内科主治医生和OpenAI的o1、4o模型分别提供诊断。随后,另外两位不知情的主治医生对诊断结果进行评估。关键点在于,AI模型接收的信息未经任何预处理,与医生当时从电子病历中获取的数据完全一致。

关键结果:AI在分诊阶段优势显著

在急诊分诊这一信息最不充分、决策最紧迫的环节,o1模型的表现尤为突出:

  • o1模型:在67%的分诊案例中给出了“完全正确或非常接近”的诊断;
  • 人类医生A:准确率为55%;
  • 人类医生B:准确率为50%。

研究指出:“在每个诊断节点上,o1的表现要么优于、要么持平于两位主治医生,且差异在初始分诊阶段最为明显。”

行业意义:AI辅助医疗的潜力与边界

该研究并非首次证明AI在特定医疗任务上的能力,但其真实世界数据零预处理的设计更具说服力。哈佛医学院AI实验室负责人Arjun Manrai表示:“我们几乎测试了所有基准,AI模型超越了以往模型和医生基线。”

然而,研究者也强调,这并不意味着AI可以取代医生。在复杂病例、患者沟通和综合决策方面,人类医生仍不可替代。AI更适合作为辅助工具,在信息有限时提供快速、准确的参考,帮助医生减少误诊和延误。

展望:从实验室到临床的挑战

尽管结果令人振奋,但将AI真正融入急诊流程仍面临挑战:数据隐私、模型泛化能力、医生信任度以及监管审批等。不过,随着o1等模型在推理能力上的进步,AI在医疗领域的应用正从“概念验证”走向“临床辅助”。

延伸阅读

  1. 撒丁岛人为何抵制可再生能源转型?2700年的入侵与剥削史给出答案
  2. 挪威大西洋航空推出超低价机票,但有个大问题
  3. OpenAI模型破解困扰人类80年的著名数学难题
查看原文