哈佛研究揭示:AI大型语言模型医疗诊断准确率仅20%

2026-04-15 23:38:15未知 作者:徽声在线

近日,徽声在线从哈佛大学最新发布的一项研究中获悉,当运用AI大型语言模型进行医疗初步诊断时,其准确性竟令人堪忧——高达80%的初步诊断结果存在错误。这一发现无疑为当前火热的AI医疗应用领域敲响了警钟。

据研究团队介绍,他们选取了多种市面上主流的AI大型语言模型,通过模拟真实的医疗咨询场景,输入了大量患者的症状描述,并收集了这些模型给出的初步诊断结果。随后,将这些结果与专业医生的诊断进行了对比分析。

结果显示,在所有测试案例中,仅有约20%的初步诊断与专业医生的诊断相符,而剩余的80%则存在不同程度的偏差。这些偏差可能包括误诊、漏诊以及诊断建议不准确等问题,严重影响了患者的就医体验和治疗效果。

研究团队指出,AI大型语言模型在医疗领域的应用虽然具有巨大的潜力,但目前仍存在诸多挑战。其中,最关键的问题在于模型缺乏真实的医疗场景训练和临床经验积累,导致其在面对复杂多变的患者症状时,难以做出准确判断。

此外,研究还提醒广大患者和医疗机构,在使用AI医疗应用时,应保持谨慎态度,不要过分依赖其给出的诊断结果。在遇到健康问题时,仍应及时就医,寻求专业医生的帮助。

点击展开全文
你关注的
【出海聚焦】石油危机凸显中国电动车优势,性价比之外更有硬实力【出海聚焦】石油危机凸显中国电动车优势,性价比之外更有硬实力 AI玩具赛道迎重大变革:模型“套壳”问题有望短期解决,智能体研发加速推进AI玩具赛道迎重大变革:模型“套壳”问题有望短期解决,智能体研发加速推进 深圳低空经济全域竞速:百企试飞、基金赋能、标准引领深圳低空经济全域竞速:百企试飞、基金赋能、标准引领
相关文章
哈佛研究揭示:AI大型语言模型医疗诊断准确率仅20%哈佛研究揭示:AI大型语言模型医疗诊断准确率仅20% 算力新变局|深度剖析与展望算力新变局|深度剖析与展望 中国民航大学赵桂红:中西亚航空市场爆发前夜,西向通道建设进入战略机遇期中国民航大学赵桂红:中西亚航空市场爆发前夜,西向通道建设进入战略机遇期 海信回应:主流品牌空调都用铜管,“真铜实料”非格力原创海信回应:主流品牌空调都用铜管,“真铜实料”非格力原创 AI赋能网络视听新篇章,但“人”的创造力仍是核心灵魂AI赋能网络视听新篇章,但“人”的创造力仍是核心灵魂 中国工程院院士郑纬民:智能体时代,从模型服务到词元服务的跃迁是基础设施的必然选择中国工程院院士郑纬民:智能体时代,从模型服务到词元服务的跃迁是基础设施的必然选择