哈佛研究揭示:AI大型语言模型医疗诊断准确率仅20%
2026-04-15 23:38:15未知 作者:徽声在线
近日,徽声在线从哈佛大学最新发布的一项研究中获悉,当运用AI大型语言模型进行医疗初步诊断时,其准确性竟令人堪忧——高达80%的初步诊断结果存在错误。这一发现无疑为当前火热的AI医疗应用领域敲响了警钟。
据研究团队介绍,他们选取了多种市面上主流的AI大型语言模型,通过模拟真实的医疗咨询场景,输入了大量患者的症状描述,并收集了这些模型给出的初步诊断结果。随后,将这些结果与专业医生的诊断进行了对比分析。
结果显示,在所有测试案例中,仅有约20%的初步诊断与专业医生的诊断相符,而剩余的80%则存在不同程度的偏差。这些偏差可能包括误诊、漏诊以及诊断建议不准确等问题,严重影响了患者的就医体验和治疗效果。
研究团队指出,AI大型语言模型在医疗领域的应用虽然具有巨大的潜力,但目前仍存在诸多挑战。其中,最关键的问题在于模型缺乏真实的医疗场景训练和临床经验积累,导致其在面对复杂多变的患者症状时,难以做出准确判断。

此外,研究还提醒广大患者和医疗机构,在使用AI医疗应用时,应保持谨慎态度,不要过分依赖其给出的诊断结果。在遇到健康问题时,仍应及时就医,寻求专业医生的帮助。
