全球大模型编程能力盲测揭晓 阿里千问3.6荣膺中国最佳

2026-04-03 18:13:51未知 作者:徽声在线

徽声在线4月3日讯,当日,全球极具影响力的大模型盲测榜单LMArena旗下专注于AI编程能力评估的Code Arena,正式对外发布了新一期的排名情况。在此次榜单中,阿里巴巴最新推出的新一代大语言模型Qwen 3.6 - Plus表现极为亮眼,一举登上全球榜单的第二名,成功超越了OpenAI、Google、xAI等一众国际科技巨头,成为该榜单上排名最为靠前的中国大模型。

Qwen3.6 - Plus是阿里巴巴于4月2日全新发布的新一代大语言模型。它具备原生多模态理解能力,这意味着它能够同时处理和理解多种不同类型的数据,如文本、图像等;其推理能力也十分强大,可以基于已有的信息进行深入分析和推断。特别是在代码生成与Agent能力方面,Qwen3.6 - Plus展现出了突出的优势,能够高效准确地生成代码,并且可以很好地模拟智能体的行为和决策。

从榜单的具体数据来看,千问3.6的得分仅次于Anthropic旗下的Claude - Opus - 4.6 - Thinking(1540分),仅仅以4分的微弱优势领先于OpenAI最新发布的GPT - 5.0 - High(1448分),同时以12分的差距超越了Google的Gemini 3.1 Pro Preview(1440分)。这一成绩充分彰显了Qwen3.6 - Plus在AI编程领域的强大竞争力。

据了解,Qwen3.6 - Plus是阿里千问3.6系列推出的第一款模型。后续,千问3.6系列还将陆续开源其他尺寸的模型,为更多的开发者和研究人员提供便利。而且,性能更为强劲的旗舰模型Qwen3.6 - Max也即将在近期发布,这无疑让人们对阿里巴巴在大语言模型领域的发展充满了期待。

点击展开全文
你关注的
深圳低空经济全域竞速:百企试飞、基金赋能、标准引领深圳低空经济全域竞速:百企试飞、基金赋能、标准引领 AI产业链价格全景解析:哪些核心环节正在经历涨价潮?AI产业链价格全景解析:哪些核心环节正在经历涨价潮? 国内首个!新型储能AI分析平台投用 新能源消纳电量提升30%国内首个!新型储能AI分析平台投用 新能源消纳电量提升30%
相关文章
全球大模型编程能力盲测揭晓 阿里千问3.6荣膺中国最佳全球大模型编程能力盲测揭晓 阿里千问3.6荣膺中国最佳 充电宝新国标实施,明确建议使用年限充电宝新国标实施,明确建议使用年限 小米产品价格调整:内存上涨成主因,REDMI K90 Pro Max涨价,Turbo 5特惠取消小米产品价格调整:内存上涨成主因,REDMI K90 Pro Max涨价,Turbo 5特惠取消 徽声在线 : 全球首创量子电池或实现瞬间充电 引领储能与交通领域变革,开启设备极速充电新纪元徽声在线 : 全球首创量子电池或实现瞬间充电 引领储能与交通领域变革,开启设备极速充电新纪元 蔚来遭AI“洗稿”抹黑:4000余账号被操控,犯罪嫌疑人已被刑拘蔚来遭AI“洗稿”抹黑:4000余账号被操控,犯罪嫌疑人已被刑拘 北京生成式AI服务备案再扩容:15款新应用通过审核北京生成式AI服务备案再扩容:15款新应用通过审核