阿里全模态大模型Qwen3.5-Omni发布：支持113种语言识别

2026-03-30 22:11:18未知作者:徽声在线

据徽声在线3月30日最新消息，阿里巴巴旗下千问团队正式推出全模态大模型Qwen3.5-Omni的商用版本。此次发布的Qwen3.5-Omni系列包含Plus、Flash、Light三种规格的Instruct模型变体，在保持高效推理能力的同时，首次实现了256k超长上下文窗口支持，可处理相当于500页文档的连续输入内容。

技术突破方面，该模型通过原生多模态架构设计，实现了对音频、视频数据的直接处理能力。据官方披露，Qwen3.5-Omni可支持连续10小时以上的音频输入，以及超过400秒的720P分辨率（1帧/秒）视频流解析。这种突破性能力源于其在预训练阶段采用的跨模态数据融合技术，团队构建了包含超1亿小时音视频内容的专属数据集，结合海量文本与图像数据完成联合训练。

在多语言处理维度，新版本展现出显著提升的全球化能力。通过引入动态语种适配机制，模型现已支持113种语言及方言的语音识别功能，覆盖全球95%以上人口使用语言；在语音生成方面，可输出36种语言的自然语音，特别加强了对东南亚、中东等地区方言的适配优化。相较于前代Qwen3-Omni，新模型在低资源语种上的识别准确率提升达37%，语音合成自然度评分（MOS）突破4.2分。

据悉，该系列模型已同步开放API接口，支持企业级用户通过云端部署实现定制化开发。行业分析师指出，Qwen3.5-Omni的推出标志着大模型竞争进入全模态时代，其超长上下文处理能力与多语言支持特性，将为跨境电商、国际客服、多媒体内容生产等领域带来新的技术范式。

点击展开全文