新上线2个月前0 投票

哈佛研究：AI在急诊室诊断准确率超过两位人类医生

一项由哈佛医学院和贝斯以色列女执事医疗中心主导的新研究显示，在急诊室场景下，OpenAI的o1模型在诊断准确率上超越了人类医生。研究发表于《Science》期刊，通过多项实验对比了AI模型与内科医生的诊断能力。

实验设计：真实急诊病例的盲测

研究团队选取了76名进入贝斯以色列急诊室的患者，由两位内科主治医生和OpenAI的o1、4o模型分别提供诊断。随后，另外两位不知情的主治医生对诊断结果进行评估。关键点在于，AI模型接收的信息未经任何预处理，与医生当时从电子病历中获取的数据完全一致。

关键结果：AI在分诊阶段优势显著

在急诊分诊这一信息最不充分、决策最紧迫的环节，o1模型的表现尤为突出：

o1模型：在67%的分诊案例中给出了“完全正确或非常接近”的诊断；
人类医生A：准确率为55%；
人类医生B：准确率为50%。

研究指出：“在每个诊断节点上，o1的表现要么优于、要么持平于两位主治医生，且差异在初始分诊阶段最为明显。”

行业意义：AI辅助医疗的潜力与边界

该研究并非首次证明AI在特定医疗任务上的能力，但其真实世界数据和零预处理的设计更具说服力。哈佛医学院AI实验室负责人Arjun Manrai表示：“我们几乎测试了所有基准，AI模型超越了以往模型和医生基线。”

然而，研究者也强调，这并不意味着AI可以取代医生。在复杂病例、患者沟通和综合决策方面，人类医生仍不可替代。AI更适合作为辅助工具，在信息有限时提供快速、准确的参考，帮助医生减少误诊和延误。

展望：从实验室到临床的挑战

尽管结果令人振奋，但将AI真正融入急诊流程仍面临挑战：数据隐私、模型泛化能力、医生信任度以及监管审批等。不过，随着o1等模型在推理能力上的进步，AI在医疗领域的应用正从“概念验证”走向“临床辅助”。

延伸阅读

相关资讯

利用图同构网络实现NR-V2X车联网低延迟中继选择

10-K报告中的哪些内容真正重要？全文与风险因素的情绪价值因聚合层级而异

分支策略优化：面向沙盒的原生语言智能体强化学习新方法

可解释地理空间AI：利用LiDAR地形智能优化卫星地面站选址