深度剖析:中国AI圈的独特魅力与文化差异,美国研究员的中国行启示
2026-05-09 22:02:41未知 作者:徽声在线
Jay 发自 凹非寺
徽声在线 | 公众号 QbitAI
中国AI研究员的亲和力、专业素养与真诚态度……令人印象深刻。
艾伦研究所(Ai2)的研究员Nathan Lambert在结束他的中国AI探索之旅后,由衷地发出了这样的感慨。
在Nathan的眼中,国内的LLM领域宛如一片净土,研究者们彼此尊重,即便观点相左也能保持礼貌与克制。
相比之下,大洋彼岸的AI巨头们,却时常陷入激烈的争论与竞争之中。
这种氛围,让他不禁感叹,仿佛看到了两个截然不同的世界……
这并非只是表面的客套话。
在短短36小时的中国之行中,Nathan几乎走遍了国内AI圈的各大名企与学府,包括月之暗面、智谱、清华、美团、小米、千问等,与众多一线AI研究员和学生进行了深入的交流。
经过这些深入的对话,Nathan得出了一个结论:
这里的AI从业者,更懂得合作与共赢。
基于这一发现,Nathan撰写了一篇长文,分享了他此次中国行期间那些令人难忘的瞬间与感悟——
- 所有实验室都对字节跳动保持警惕,同时对DeepSeek充满敬意。
- 北京,这座古老而又现代的城市,竟然与硅谷有着惊人的相似之处,Nathan在36小时内走访了6家AI公司。
- 当他询问一名中国研究员对AI风险的看法时,对方却显得有些困惑——这似乎并不是他们当前关注的重点。
- 美团、小米等公司也在自主研发大模型,这在中国AI圈已成为一种常态。
- 抬头望向窗外,地平线上那连绵不绝的起重机,仿佛是中国工程师文化的一种生动写照。
这份真诚与热情,甚至吸引了MiniMax的关注,他们表示希望Nathan的下次“中国行”能够涵盖上海和深圳等更多城市。
以下是经过整理与扩展的文章节选。
Enjoy。
中国研究员的心态剖析
Nathan在文中深入探讨了为何中国实验室在追赶前沿技术方面如此擅长。
他的核心观点是:文化差异。
在打造一个优秀的LLM过程中,从数据收集到架构设计,再到RL算法的应用,每一个环节都需要精心打磨。而如何将这些提升整合在一起,则是一个极其复杂的多目标优化问题。
有时,某个天才研究员的工作可能需要为整体模型的表现做出牺牲。
在美国,这种情况往往容易引发冲突。
Nathan透露了一个内幕消息:Llama团队的解散据说就是因为内部政治斗争过于激烈。
每个人都希望别人按照自己的想法行事,实验室甚至需要花费资金来安抚顶级研究员,以平息他们的不满。
基于这些观察,他得出了一个结论:
过度的自我意识与野心,可能会阻碍最佳模型的诞生。
而在中国,他却发现了一个微妙的差异:
中国实验室的核心贡献者中,有大量是在读学生。他们被视为同事,直接参与核心研发工作。
这些学生愿意承担那些不那么光鲜亮丽的工作,只要能够提升模型的整体表现。
反观美国,OpenAI、Anthropic、Cursor等顶级公司几乎不提供实习机会。
Google等公司虽然名义上提供与Gemini相关的实习,但实际上,实习生往往被隔离在边缘区域,无法接触到核心工作。
然而,中国的经验却证明,学生的参与可以显著加快研发进程。
除此之外,这些学生还带来了一个意想不到的优势:全新的视角。
在LLM的关键范式从Scaling MoE到Scaling RL,再到Agent的转换过程中,每一次都需要疯狂吸收新的上下文信息。
而学生恰恰最擅长这一点。他们善于快速学习,也乐于放下一切预设,全身心地投入其中。
Nathan还注意到一个有趣的现象。当他询问中国研究员对AI的经济影响或长远社会风险有何看法时,很多人的反应是——
愣了一下。
这并不是因为他们不想回答,而是真的觉得这些问题与他们无关。他们的任务就是打造出最好的模型,其他的事情则不在他们的考虑范围内。
相比之下,美国文化更强调为自己发声。
作为科学家,你越能为自己的工作发声,就越容易取得成功。
硅谷文化也在推动一种新的成名路径,即成为明星AI科学家。因此,大家热衷于参加Dwarkesh、Lex Fridman等超级播客节目。
一位研究员引用了Dan Wang的经典说法,非常精辟:中国是工程师治国,美国是律师治国。
工程师考虑的是如何解决问题,而律师则更关注如何定义问题。
概括一下,Nathan认为有以下四点重要的文化差异:
1、更愿意承担那些不那么光鲜亮丽,但能提升最终模型质量的工作。
2、刚进入AI领域的新人不受上一轮AI炒作周期的影响,因此能更快适应新的现代技术。
3、更少的自我意识使得组织结构能够更好地扩张,因为更少有人试图钻组织系统的空子。
4、大量人才非常适合解决那些已经在别处得到概念验证的问题。
北京:中国的硅谷
Nathan的北京之行充满了惊喜。
他说北京简直就像湾区一样。随便走两步就能看到一个竞争对手的办公室。
他一下飞机,在去酒店的路上就顺便拐进了阿里巴巴北京园区。然后在接下来的36个小时里,他依次走访了智谱、月之暗面、清华、美团、小米、零一万物等地方。
在与研究员们的交流中,他好奇地询问了中国的人才争夺情况如何。得到的回答是:
与美国差不多。
跳槽很正常,主要看当前哪个团队的氛围最好。
但有一点与美国很不一样。
在中国的AI圈,实验室之间更像是一个生态共同体,而不是互相厮杀的部落。在很多私下交流中,大家对同行都充满了尊重。
所有实验室都对字节跳动和豆包保持高度关注。在Nathan看来,字节是中国少数走闭源路线推进的大模型玩家。
所有人都对DeepSeek充满敬意,认为它是研究品味最好的实验室。
这让Nathan感到非常惊讶。与美国研究员的线下对话相比,这里的氛围要和谐得多。
但在中国,大家似乎在无形中形成了一种默契的共识。
还有一点让他觉得非常奇怪——
中国研究员在谈到商业化时经常耸耸肩说:那不是我的事。
而在美国,从数据供应商到算力提供商再到融资方,人人都对各种生态级别的产业趋势了如指掌。
中国AI产业的真实面貌
聊完文化差异后,Nathan接着聊了聊他在产业层面观察到的几个关键差异。我挑几个最有意思的来说。
1、国内AI需求的早期信号
一直有一种说法认为中国AI市场会比较小,因为中国公司不太愿意为软件付费。Nathan认为这个判断只对了一半。确实,中国公司在SaaS生态上的投入相对较小。但中国有一个庞大的云计算市场。
关键问题在于:企业在AI上的花费最终会走SaaS的路线还是云的路线?
Nathan的感受是AI更接近云服务,而且没有人在担心围绕新工具是否能长出市场。
2、中国公司的技术自研执念
为什么美团、蚂蚁集团等公司也在自己研发大模型?
西方人可能会对此感到奇怪。
但在Nathan看来,中国人的逻辑是:LLM显然会成为未来科技产品的核心组件,因此必须自己掌握这项技术。
不过,虽然自研,但也开源。
他们会先训练一个通用底座模型并开源出去让社区帮忙打磨,内部再微调一个版本用到自己的产品里。
开源并不是一种信仰,而是一种实用主义策略——它能获得社区反馈、回馈开源生态,也能帮助他们更好地理解自己的模型。
3、算力瓶颈
英伟达仍然是训练大模型的黄金标准,但每个实验室都因为芯片供应不足而受到限制。
4、数据产业尚不成熟
Nathan听说过Anthropic和OpenAI动辄花费1000万美元以上购买单个RL训练环境,每年累计花费数亿美元来推动前沿研究。
他很好奇中国实验室是否也在从美国公司购买这些环境或者是否有镜像的国内供应链?
答案是:中国有数据产业但质量参差不齐。
因此自己做更靠谱。一般来说研究员们会亲自花大量时间搭建RL训练环境,而字节和阿里等大公司则有内部数据标注团队来支持这项工作。
尾声
Nathan文章最后的一段话关乎“了解”。
Nathan表示来之前就知道自己对中国了解甚少,但走了一圈之后反而更强烈地感受到自己根本不了解这块土地。
中国不是一个能用简单规则或公式来概括的地方,它有着完全不同的动力学和化学反应。
如此古老且深厚的文化却又与当下的技术建设完全交织在一起。
在与几乎所有中国领先AI实验室交谈后,Nathan发现中国有很多特质和直觉是很难用西方的决策框架去建模的。
他不明白为什么这些实验室要开源自己好不容易训练出来的模型。
它们不会认为自己构建的每一个模型都必须开源,但都非常有意愿支持开发者、支持生态,并把开源作为进一步了解模型的一种方式。
这些公司构建LLM并不是因为追逐热点或想在新潮技术里刷存在感。
这一切的背后是一种Nathan没有想过的强烈深层愿望:
把技术栈牢牢掌控在自己手中。
这也让Nathan在文章结尾直言自己有些许焦虑:
如果说我不希望美国实验室在AI的每个领域都保持明确领先——特别是在开源模型这块——那我就是在骗人。
我是美国人,这是一个诚实的偏好。
我希望开源生态能在全球繁荣发展,这能为世界创造更安全、更可及、更有用的AI。
但现在的问题是硅谷是否能保住这个领导地位?
归根结底,这依旧是在谈论中国的开源文化。
关于这一点,Nathan说了一句非常有画面感的话,很适合用作结尾:
当我从笔记本电脑上抬起头时,总能看到地平线上的一簇簇起重机。
这跟中国的开源精神显然是一脉相承的。
Nathan报告原文: https://www.interconnects.ai/p/notes-from-inside-chinas-ai-labs
