DeepSeek-V4海外实测：性能领先但高幻觉率成发展瓶颈

2026-04-25 16:07:52未知作者:徽声在线

据徽声在线最新报道，DeepSeek-V4在海外市场的实测数据引发行业热议。这款开源智能体在多项基准测试中表现突出，尤其在复杂任务处理和逻辑推理能力上展现出显著优势，甚至在部分场景中超越了同类商业产品。然而，测试团队也发现了一个令人担忧的现象——其幻觉率高达96%，这意味着在生成内容时，模型几乎总是会掺入不准确或虚构的信息。这一特性在需要高度可靠性的应用场景中可能成为致命短板，例如医疗诊断、金融分析等领域。专家指出，虽然开源模型的发展为AI技术普及提供了重要推动力，但如何平衡创新性与安全性仍是亟待解决的关键问题。目前，DeepSeek团队尚未对此次测试结果作出正式回应，但业界普遍期待其能在后续版本中优化这一缺陷。

点击展开全文