OpenAI前CTO创业模型首秀,竟与面壁智能“不谋而合”

2026-05-14 02:04:37未知 作者:徽声在线



今日,人工智能大模型领域再度掀起热潮,焦点人物是前OpenAI应用研究负责人翁荔(Lilian Weng)。她携手前OpenAI CTO米拉·穆拉蒂(Mira Murati)共同创立的Thinking Machines Lab(TML),首次对外披露了其技术愿景,剑指人机交互的终极形态——打造一个能与人类展开「全双工」(Full-Duplex)实时对话的AI模型。

然而,当TML展示无缝、主动交互能力的Demo视频在网络上广泛传播时,众多AI领域的专业人士却产生了强烈的熟悉感——因为TML所描绘的未来场景,早在三个月前,就已被中国公司「面壁智能」通过开源的MiniCPM - o 4.5模型变成了现实。

这并非简单的巧合,更像是跨越太平洋的一场技术共识。它不仅验证了下一代AI交互的技术走向,也促使我们重新审视中国AI力量在全球创新格局中的地位

一、一场不期而遇的交互变革:突破「对讲机」模式桎梏

要深入理解这场技术共识的深远意义,首先得清楚TML和面壁智能共同挑战的对象——长久以来存在的「回合制」(turn - based)交互范式

从常见的Siri到各类语音助手,再到GPT - 4o的语音模式,我们与AI的交流方式就如同使用一部「对讲机」:一方说完,等待「滴」的一声提示音后,另一方才能回应。

这种交流模式背后,是一套名为「语音活动检测」(VAD)的机制在发挥作用。它就像一个严格的裁判,精准划分着人类与AI的发言轮次。然而,这种模式与人类自然对话中那种信息相互交织、你来我往的流畅状态相差甚远。

而面壁智能与TML敏锐地察觉到,真正的自然交互必须打破这种轮次限制,步入一个「全双工」的流式处理新时代。在这个新时代,AI与人类的交流将如同人与人之间的对话一样自然流畅,信息能够实时、双向地传递。

双方虽然使用了不同的表述方式,但都描绘了同一个充满希望的未来。这充分表明,AI交互的下一次范式革命,已经有了明确的目标和方向

二、高度契合的技术架构:殊途同归的探索之路

如果说目标一致是「英雄所见略同」,那么实现路径的高度相似,则让这场技术共识更加坚不可摧。TML与面壁智能,仿佛手持同一张精确的地图,朝着同一个理想的目的地稳步迈进。

这张「地图」的核心,是一种基于时间对齐的流式处理框架。这种框架为AI处理多模态信息提供了全新的思路和方法。

面壁智能将其命名为「Omni - Flow」框架。其工作原理是将连续的音视频流,像精细切割香肠一样,切成以毫秒(如200ms)为单位的微小片段。然后,将同一时间片段内的视觉、听觉和已生成的文本token进行「打包」处理,形成一个按照时间顺序排列的统一序列,并将其输入到大模型中。通过这种方式,大模型能够同时处理多种模态的信息,实现更加全面、准确的理解和回应。



面壁智能Omni - Flow框架示意图

而TML在其博客中提出的,是「基于时间对齐的微轮次」(Time - aligned micro - turn based)概念。从图示来看,其原理与Omni - Flow框架如出一辙。同样是将多模态信息流切割成带有时间戳的微小单元,然后在一条共享的时间轴上进行对齐融合。这种设计使得不同模态的信息能够在时间维度上保持一致,为AI的综合处理提供了便利。



TML微轮次框架示意图

这种设计的精妙之处在于,它将AI视角下离散的、模态各异的数据,还原成了世界本来的模样——一个连续不断、多感官信息相互交织的整体。就像人类在感知世界时,会同时运用视觉、听觉、触觉等多种感官,将各种信息综合起来形成对世界的完整认识。基于这一共同的底层架构,TML和面壁智能都实现了两个具有颠覆性的能力。

从革命的目标设定,到核心的实现框架搭建,再到最终呈现的强大能力,TML的首秀与面壁智能三个月前的工作形成了完美的相互印证,共同推动了AI交互技术的发展。

三、愿景与现实的较量:谁先跨越终点线?

既然技术路线高度一致,那么评判的标准就落在了「执行力」上——谁能够更迅速、更有效地将蓝图变为现实?

答案一目了然。

MiniCPM - o 4.5技术报告地址:

https://github.com/OpenBMB/MiniCPM - V/blob/main/docs/MiniCPM_o_45_technical_report.pdf

如果说翁荔团队是向世界宣告「我们发现了一片新的科技大陆」,那么面壁智能则是早在三个月前就已经成功登陆这片大陆,并且精心绘制了详细的海图,甚至向所有后来者开放了港口,欢迎大家一起探索和开发这片新的领域。

这种「交付」形态的差异至关重要。在当今大模型技术发展日新月异的时代,三个月的时间差足以让技术格局发生巨大的变化。而且,「概念展示」与「开源实物」之间存在着巨大的鸿沟,前者只是停留在理论层面的设想,后者则是经过实际验证、可供使用的成果。因此,这种差异足以定义谁是真正的先行者,谁是对先行者进行验证和跟进的验证者。

四、中国AI的一次有力「自我证明」

TML与面壁智能的这次「技术撞车」,与其说是一场激烈的竞赛,不如说是一次相互成就的契机。

翁荔凭借其在全球AI领域的巨大影响力和崇高声誉,为「全双工」AI这一技术方向带来了极高的关注度和大量的资源支持。她的宣传和推广让「全双工」AI的概念迅速成为行业焦点,吸引了众多科研人员和企业的投入,推动了整个行业的发展。

而面壁智能则以其更早的布局、扎实的工程实现能力和彻底的开源精神,向世界证明了中国AI团队不仅有能力跟上世界科技发展的潮流,更有能力在关键领域引领潮流。中国AI团队在技术研发过程中展现出的创新能力和执行力,得到了国际同行的认可和尊重。

直接的数据佐证就是:面壁智能的MiniCPM - o 4.5在2026年2月就已正式开源,比翁荔TML团队领先了3个月。这3个月的时间差,不仅体现了面壁智能在技术研发上的高效和敏锐,也为中国AI在全球竞争中赢得了宝贵的时间和优势。

未来已经悄然来临,只是它的分布还不够均匀。这一次,中国AI团队有幸站在了更早的时区,能够更早地迎接未来的挑战和机遇,为推动全球AI技术的发展做出更大的贡献。

点击展开全文
你关注的
攻防失序 辽篮亟需破局重生攻防失序 辽篮亟需破局重生 NBA历史新篇章!三兄弟同队共战,字母哥续约风波再起NBA历史新篇章!三兄弟同队共战,字母哥续约风波再起 山东男篮季后赛前景堪忧,邱彪用人僵化成最大障碍山东男篮季后赛前景堪忧,邱彪用人僵化成最大障碍
相关文章
OpenAI前CTO创业模型首秀,竟与面壁智能“不谋而合”OpenAI前CTO创业模型首秀,竟与面壁智能“不谋而合” 22岁大学生连夜开车1300多公里,自费5200多元送校友回家奔丧!利川宣布:4人全年免门票,为该校学子提供见习岗位、实践平台22岁大学生连夜开车1300多公里,自费5200多元送校友回家奔丧!利川宣布:4人全年免门票,为该校学子提供见习岗位、实践平台 心理学新发现:爱抬杠、争对错者,99%是这两个价值感缺失在作怪心理学新发现:爱抬杠、争对错者,99%是这两个价值感缺失在作怪 “老鳳詳”售足金戒指实为“金包银”,拒三倍赔偿后店铺被淘宝关闭“老鳳詳”售足金戒指实为“金包银”,拒三倍赔偿后店铺被淘宝关闭 “莫奈紫”风波不断!OPPO营销遭流量反噬“莫奈紫”风波不断!OPPO营销遭流量反噬 女子河边“放生”奶茶引热议,贵阳水务部门:污染河道不认可,警方介入处理女子河边“放生”奶茶引热议,贵阳水务部门:污染河道不认可,警方介入处理