字节员工妻子吐槽:病人用AI看病,医生解释起来欲哭无泪

2026-06-14 17:05:26未知 作者:徽声在线

一位在字节跳动工作的员工分享了他身为医生的妻子的烦恼:当患者们开始尝试用AI来自我诊断病情时,她在解释病情时常常感到力不从心,甚至有种欲哭无泪的感觉。而作为研发大模型技术的丈夫,他一时之间也不知道该如何安慰妻子。



谈及现在许多患者利用AI进行自我诊断的现象,我回忆起一位来自知名三甲医院的医生的观点。他在一段视频中提到:医生在使用AI辅助诊断时,总是保持批判性思维,不会盲目接受AI给出的所有答案,而是会结合自身的医学知识,筛选出有用且正确的信息。他曾经用AI搜索某个医学论题的相关文献,结果发现AI竟然编造了一篇文献知识。经过仔细阅读,他发现AI将两篇观点相近的文献混淆了,给出了完全错误的结论。这种错误,对于缺乏专业医学知识的患者来说,是根本无法察觉的。

这位医生在实践中还发现:对于一些简单的小毛病,AI的参考价值相对较高,准确率也还不错。然而,一旦遇到疑难杂症,AI就容易“胡说八道”了。在AI普及的时代,利用AI进行医学科普确实是个不错的选择,但将其视为看病神器,那就大错特错了。

对于这一点,我也深有体会。我通常会在遇到突发情况,需要查询某个不了解的知识时使用AI。但在使用过程中,我也发现AI有时会出错。比如,一道初中数学题,我用了两三个主流的AI平台来解答,结果有的计算错误,有的思路错误。思路错误时,我还得跟AI不停地“掰扯”,试图纠正它的思路,但AI却固执地认为自己是对的。因此,我认为在专业领域,还是应该以行业权威为准。去医院看病,当然要以医生的说法为准。即使你觉得医生可能不对,也应该多咨询几家医院,而不是盲目依赖AI。

那么,AI为什么会出错呢?特别是它还会一本正经地胡说八道,这在行业内被称为“幻觉”现象。从技术角度来看,这除了与模型的理解、推理能力较弱有关外,更大的问题在于数据训练方面。

1、训练数据存在缺陷。大模型在训练过程中,可能会将互联网上的一些错误信息纳入训练数据库,导致用户在询问时得到错误的回答。有研究发现,当大模型在数据训练过程中,错误文本的比例仅占0.01%时,错误输出的概率就会提升至11.2%。

2、知识覆盖不全面。特别是一些冷门、小众的领域,由于专业数据、实时事件在训练数据库中的出现次数较少,就像你对某个领域的内容了解不全面一样,在回答这个领域的问题时,就很容易出现错误。

3、引用的信息时间有限制。AI在训练数据时存在知识截止时间,因此它无法知道截止日后发生的事情。这也是为什么现在很多模型需要联网回答,以提升准确度。

用简单易懂的话来说,任何大模型(AI)的核心都是通过统计概率来生成文本的,它并不真正理解语义,学的是“说话的模式”而不是“事实”。当遇到训练数据不足或者数据库中没有的问题时,它会按照最相似的模式“脑补”出一个看起来通顺合理,但实际上漏洞百出的回答。就像我们学习英语时,虽然记忆了很多单词,但不知道语法,最终写出来的句子看似没问题,但实际上错误百出。

这也是为什么主流大模型在发布新版本时,降低整体幻觉率成为了一项非常重要的指标。

点击展开全文
你关注的
攻防失序 辽篮亟需破局重生攻防失序 辽篮亟需破局重生 NBA历史新篇章!三兄弟同队共战,字母哥续约风波再起NBA历史新篇章!三兄弟同队共战,字母哥续约风波再起 山东男篮季后赛前景堪忧,邱彪用人僵化成最大障碍山东男篮季后赛前景堪忧,邱彪用人僵化成最大障碍
相关文章
字节员工妻子吐槽:病人用AI看病,医生解释起来欲哭无泪字节员工妻子吐槽:病人用AI看病,医生解释起来欲哭无泪 闹剧!顾客因灰色期待给正规足疗店差评,行业信任危机何解?闹剧!顾客因灰色期待给正规足疗店差评,行业信任危机何解? 中方全球通告后,马尼拉回应无力,菲反对党叫嚣拆除中方建筑中方全球通告后,马尼拉回应无力,菲反对党叫嚣拆除中方建筑 “大家很反感这样的朋友圈吗”:你记录的是生活,他们酸的是不敢活的自己“大家很反感这样的朋友圈吗”:你记录的是生活,他们酸的是不敢活的自己 八村垒首谈训练营理念:沿袭姚明传承精神 打造亚洲篮球新纽带八村垒首谈训练营理念:沿袭姚明传承精神 打造亚洲篮球新纽带 中泰反恐里程碑:11年追凶终判死刑,中国表态震撼国际社会中泰反恐里程碑:11年追凶终判死刑,中国表态震撼国际社会