全球大模型编程能力盲测揭晓阿里千问3.6荣膺中国最佳

2026-04-03 18:13:51未知作者:徽声在线

徽声在线4月3日讯，当日，全球极具影响力的大模型盲测榜单LMArena旗下专注于AI编程能力评估的Code Arena，正式对外发布了新一期的排名情况。在此次榜单中，阿里巴巴最新推出的新一代大语言模型Qwen 3.6 - Plus表现极为亮眼，一举登上全球榜单的第二名，成功超越了OpenAI、Google、xAI等一众国际科技巨头，成为该榜单上排名最为靠前的中国大模型。

Qwen3.6 - Plus是阿里巴巴于4月2日全新发布的新一代大语言模型。它具备原生多模态理解能力，这意味着它能够同时处理和理解多种不同类型的数据，如文本、图像等；其推理能力也十分强大，可以基于已有的信息进行深入分析和推断。特别是在代码生成与Agent能力方面，Qwen3.6 - Plus展现出了突出的优势，能够高效准确地生成代码，并且可以很好地模拟智能体的行为和决策。

从榜单的具体数据来看，千问3.6的得分仅次于Anthropic旗下的Claude - Opus - 4.6 - Thinking（1540分），仅仅以4分的微弱优势领先于OpenAI最新发布的GPT - 5.0 - High（1448分），同时以12分的差距超越了Google的Gemini 3.1 Pro Preview（1440分）。这一成绩充分彰显了Qwen3.6 - Plus在AI编程领域的强大竞争力。

据了解，Qwen3.6 - Plus是阿里千问3.6系列推出的第一款模型。后续，千问3.6系列还将陆续开源其他尺寸的模型，为更多的开发者和研究人员提供便利。而且，性能更为强劲的旗舰模型Qwen3.6 - Max也即将在近期发布，这无疑让人们对阿里巴巴在大语言模型领域的发展充满了期待。

点击展开全文

全球大模型编程能力盲测揭晓 阿里千问3.6荣膺中国最佳

全球大模型编程能力盲测揭晓阿里千问3.6荣膺中国最佳