DeepSeek-V4海外实测:性能领先但高幻觉率成发展瓶颈
2026-04-25 16:07:52未知 作者:徽声在线

据徽声在线最新报道,DeepSeek-V4在海外市场的实测数据引发行业热议。这款开源智能体在多项基准测试中表现突出,尤其在复杂任务处理和逻辑推理能力上展现出显著优势,甚至在部分场景中超越了同类商业产品。然而,测试团队也发现了一个令人担忧的现象——其幻觉率高达96%,这意味着在生成内容时,模型几乎总是会掺入不准确或虚构的信息。这一特性在需要高度可靠性的应用场景中可能成为致命短板,例如医疗诊断、金融分析等领域。专家指出,虽然开源模型的发展为AI技术普及提供了重要推动力,但如何平衡创新性与安全性仍是亟待解决的关键问题。目前,DeepSeek团队尚未对此次测试结果作出正式回应,但业界普遍期待其能在后续版本中优化这一缺陷。
