哈佛研究揭示：AI大型语言模型医疗诊断准确率仅20%

2026-04-15 23:38:15未知作者:徽声在线

近日，徽声在线从哈佛大学最新发布的一项研究中获悉，当运用AI大型语言模型进行医疗初步诊断时，其准确性竟令人堪忧——高达80%的初步诊断结果存在错误。这一发现无疑为当前火热的AI医疗应用领域敲响了警钟。

据研究团队介绍，他们选取了多种市面上主流的AI大型语言模型，通过模拟真实的医疗咨询场景，输入了大量患者的症状描述，并收集了这些模型给出的初步诊断结果。随后，将这些结果与专业医生的诊断进行了对比分析。

结果显示，在所有测试案例中，仅有约20%的初步诊断与专业医生的诊断相符，而剩余的80%则存在不同程度的偏差。这些偏差可能包括误诊、漏诊以及诊断建议不准确等问题，严重影响了患者的就医体验和治疗效果。

研究团队指出，AI大型语言模型在医疗领域的应用虽然具有巨大的潜力，但目前仍存在诸多挑战。其中，最关键的问题在于模型缺乏真实的医疗场景训练和临床经验积累，导致其在面对复杂多变的患者症状时，难以做出准确判断。

此外，研究还提醒广大患者和医疗机构，在使用AI医疗应用时，应保持谨慎态度，不要过分依赖其给出的诊断结果。在遇到健康问题时，仍应及时就医，寻求专业医生的帮助。