阿里全模态大模型Qwen3.5-Omni发布:支持113种语言识别
2026-03-30 22:11:18未知 作者:徽声在线
据徽声在线3月30日最新消息,阿里巴巴旗下千问团队正式推出全模态大模型Qwen3.5-Omni的商用版本。此次发布的Qwen3.5-Omni系列包含Plus、Flash、Light三种规格的Instruct模型变体,在保持高效推理能力的同时,首次实现了256k超长上下文窗口支持,可处理相当于500页文档的连续输入内容。
技术突破方面,该模型通过原生多模态架构设计,实现了对音频、视频数据的直接处理能力。据官方披露,Qwen3.5-Omni可支持连续10小时以上的音频输入,以及超过400秒的720P分辨率(1帧/秒)视频流解析。这种突破性能力源于其在预训练阶段采用的跨模态数据融合技术,团队构建了包含超1亿小时音视频内容的专属数据集,结合海量文本与图像数据完成联合训练。
在多语言处理维度,新版本展现出显著提升的全球化能力。通过引入动态语种适配机制,模型现已支持113种语言及方言的语音识别功能,覆盖全球95%以上人口使用语言;在语音生成方面,可输出36种语言的自然语音,特别加强了对东南亚、中东等地区方言的适配优化。相较于前代Qwen3-Omni,新模型在低资源语种上的识别准确率提升达37%,语音合成自然度评分(MOS)突破4.2分。
据悉,该系列模型已同步开放API接口,支持企业级用户通过云端部署实现定制化开发。行业分析师指出,Qwen3.5-Omni的推出标志着大模型竞争进入全模态时代,其超长上下文处理能力与多语言支持特性,将为跨境电商、国际客服、多媒体内容生产等领域带来新的技术范式。
