字节员工妻子吐槽：病人用AI看病，医生解释起来欲哭无泪

2026-06-14 17:05:26未知作者:徽声在线

一位在字节跳动工作的员工分享了他身为医生的妻子的烦恼：当患者们开始尝试用AI来自我诊断病情时，她在解释病情时常常感到力不从心，甚至有种欲哭无泪的感觉。而作为研发大模型技术的丈夫，他一时之间也不知道该如何安慰妻子。

谈及现在许多患者利用AI进行自我诊断的现象，我回忆起一位来自知名三甲医院的医生的观点。他在一段视频中提到：医生在使用AI辅助诊断时，总是保持批判性思维，不会盲目接受AI给出的所有答案，而是会结合自身的医学知识，筛选出有用且正确的信息。他曾经用AI搜索某个医学论题的相关文献，结果发现AI竟然编造了一篇文献知识。经过仔细阅读，他发现AI将两篇观点相近的文献混淆了，给出了完全错误的结论。这种错误，对于缺乏专业医学知识的患者来说，是根本无法察觉的。

这位医生在实践中还发现：对于一些简单的小毛病，AI的参考价值相对较高，准确率也还不错。然而，一旦遇到疑难杂症，AI就容易“胡说八道”了。在AI普及的时代，利用AI进行医学科普确实是个不错的选择，但将其视为看病神器，那就大错特错了。

对于这一点，我也深有体会。我通常会在遇到突发情况，需要查询某个不了解的知识时使用AI。但在使用过程中，我也发现AI有时会出错。比如，一道初中数学题，我用了两三个主流的AI平台来解答，结果有的计算错误，有的思路错误。思路错误时，我还得跟AI不停地“掰扯”，试图纠正它的思路，但AI却固执地认为自己是对的。因此，我认为在专业领域，还是应该以行业权威为准。去医院看病，当然要以医生的说法为准。即使你觉得医生可能不对，也应该多咨询几家医院，而不是盲目依赖AI。

那么，AI为什么会出错呢？特别是它还会一本正经地胡说八道，这在行业内被称为“幻觉”现象。从技术角度来看，这除了与模型的理解、推理能力较弱有关外，更大的问题在于数据训练方面。

1、训练数据存在缺陷。大模型在训练过程中，可能会将互联网上的一些错误信息纳入训练数据库，导致用户在询问时得到错误的回答。有研究发现，当大模型在数据训练过程中，错误文本的比例仅占0.01%时，错误输出的概率就会提升至11.2%。

2、知识覆盖不全面。特别是一些冷门、小众的领域，由于专业数据、实时事件在训练数据库中的出现次数较少，就像你对某个领域的内容了解不全面一样，在回答这个领域的问题时，就很容易出现错误。

3、引用的信息时间有限制。AI在训练数据时存在知识截止时间，因此它无法知道截止日后发生的事情。这也是为什么现在很多模型需要联网回答，以提升准确度。

用简单易懂的话来说，任何大模型（AI）的核心都是通过统计概率来生成文本的，它并不真正理解语义，学的是“说话的模式”而不是“事实”。当遇到训练数据不足或者数据库中没有的问题时，它会按照最相似的模式“脑补”出一个看起来通顺合理，但实际上漏洞百出的回答。就像我们学习英语时，虽然记忆了很多单词，但不知道语法，最终写出来的句子看似没问题，但实际上错误百出。

这也是为什么主流大模型在发布新版本时，降低整体幻觉率成为了一项非常重要的指标。

点击展开全文