AI 抢人大战,批量制造这个时代的流量明星
2026-05-22 09:08:31未知 作者:徽声在线
三年内,AI研究员的薪酬从百万年薪飙升至破亿,成为科技圈的“顶流”。
文丨陈佳惠 赵磊
编辑丨赵磊
在中国,年收入过亿的人凤毛麟角。娱乐圈中,只有最顶尖的流量明星才能触及这一收入水平,即便是在2017年娱乐圈的鼎盛时期,福布斯中国名人榜上也只有十几位明星年收入过亿。
到了2024年,A股5400多家上市公司中,董事长年薪最高的药明康德李革仅为4180万,A股董事长的平均年薪也不过133.94万元。而超过一半的A股上市公司,全年净利润甚至不足1亿。
然而,一个新兴群体却悄然跻身这一收入层级:大模型研究员。
在中国,有传言称姚顺雨以亿元薪酬加入腾讯(尽管公司后来否认了这一说法),而郭达雅则以近亿年薪(期权价值增长后的平均收入)加盟字节跳动。在大洋彼岸,一些研究员的年薪甚至超过了NBA顶级球星库里,以及执掌苹果多年的库克。
三年前,AI研究员的年薪普遍在百万级别。然而,到了2024年,少数人的年薪膨胀至千万,如今更是极少数人能突破亿元大关。
这一薪资膨胀速度远超以往任何行业。无论是2015年的O2O、出行大战,2020年的社区团购,还是后来的直播电商,都没有如此疯狂。字节跳动、腾讯、阿里巴巴、DeepSeek、Meta、OpenAI等国内外科技巨头,纷纷加入抢人大战,争夺这几百名顶尖人才。
他们是这个时代的明星,被各家公司提前锁定、天价签约、竞业隔离,甚至有人被前东家蹲守偷拍,只能戴口罩出门,流动上班。为了吸引他们,各家公司的一号位亲自下场,开出数倍薪资,许诺更大的管理权限和自由。
徽声在线通过访谈研究员、猎头、大厂HR和投资人,还原了这场抢人大战的过程,以及中国最贵的几百个人是如何诞生的。
大模型三年,研究员收入翻了6倍不止
2023年,顶级AI研究员的薪酬不过上百万。然而,经历了ChatGPT的震撼后,中国一年内涌现出上百家大模型公司。但一年过去,市场情绪从狂热转向怀疑,一级市场融资降温,二线大模型公司开始裁员收缩。
彼时,大厂还处于降本增效的尾声,对大模型投入有限。2023年初,字节跳动的Seed团队只有一两百人,在内部是一个探索性项目;腾讯的混元大模型团队分散在TEG和各BG,管理层的态度是“不必冲在最前面”;而阿里巴巴云在2023年换帅后,通义千问团队在达摩院和阿里云的组织调整中反复摇摆。在这样的情况下,研究员的薪资也在大厂正常的薪酬序列里,没有额外的溢价。
以前,大多数研究员的心态是,在大厂做研究、发论文、拿一个不错的薪水,已经是很好的职业状态了。但从2023年底开始,两个代表性玩家率先搅乱了原本平静的市场。
首先是成立不久的DeepSeek。梁文锋很早就意识到人才的重要性,当时已经在寻找最优秀的研究员,用高于市场的价格挖人,给研究员开更高的现金,不仅能覆盖之前的总包,甚至部分可以有30%-50%的涨幅。但DeepSeek社招不多,以应届生和实习生留任为主,其内部超7成的人是本科生和硕士生,对市场的影响有限。
真正让市场水温升高的是字节跳动。2023年底开始,字节跳动后知后觉地意识到模型的重要程度,开始奋起追赶,饱和式投入。2024年,字节跳动对基础模型研发人才的招聘名额不设上限,从阿里巴巴通义、百度文心和月之暗面、智谱等团队广泛挖人,经常开出双倍的薪资涨幅。
一个标志性的跳槽案例是2024年下半年周畅离开阿里巴巴加盟字节跳动。八位数总包、4-2职级,字节跳动给的待遇十分优厚,他带过去的几个人都一起升职加薪。一位曾在Seed的人士透露,周畅到字节跳动后,迅速推动了多模态基模能力的提升。
到了2025年,DeepSeek的爆火让全行业意识到,极少数对的人能带来颠覆性的结果。创业公司和腾讯等大厂也加大投入,重整模型团队,抢人大战再次升级,普通研究员开始有了八位数的offer。
新的锚点产生后,行情迎来跳涨。有猎头表示,2025年上半年,行情是按月在变的,“三月给的价四月就不够用了”。
猎头们意识到招聘市场在变化的一个细节是,当时字节跳动愿意多花比2024年还多出至少50%的溢价,吸引人才的加入。2025年的TopSeed计划(字节跳动面向大模型领域前5%人才的“顶尖AI研究人才专项”)可以给应届生开出300-500万的年包,而2024年只有150万元。此时,DeepSeek的薪酬仍保持着对人才的吸引,能开出仅现金就300万的年包,还将内推成功一个研究员的奖金提高到20万。
但总有后来者带着更强的焦虑和更充沛的资金奋起追赶。在海外,这个角色是Meta,扎克伯格在一个月之内,用1亿美元从OpenAI挖角到了感知技术负责人余家辉;2亿美元从苹果AI挖到了基础模型团队(AFM)的负责人庞若鸣;2.5亿美元(四年)挖到了Vercept天才创始人Matt Deitke;给OpenAI的高级研究员更是开出了四年3亿美元的薪酬,部分人第一年总薪酬可以达到1亿美元。
在国内,这个角色一开始是字节跳动,从阿里巴巴和百度挖人,后来又变成腾讯,从字节跳动挖人。
2025年下半年,腾讯一直大手笔地从字节跳动AI大模型团队挖人,一出手就是高溢价,向顶尖研究人员开出至少双倍薪资。
腾讯有个实用的策略:找到一些在Seed面临薪资倒挂的老将,向他们开出极具诱惑力的offer。“这些人在原来公司做了两三年,但因为市场普遍职级体系膨胀,新来的人的薪资和他们差不了多少,甚至更多。这个口子,是最容易撬开的。”一位猎头说。
腾讯吸引到了不少人才。Seed视觉AI平台团队负责人肖学锋,RL负责人袁钰峰,Seed Infra成员张弛、黄启——这些人陆续出现在了腾讯混元的组织架构里。
腾讯挖人的标志性事件是姚顺雨的加入。入职时,他年仅27岁,没在大厂待过,一毕业就去了OpenAI,加入腾讯后直接出任大模型负责人,向刘炽平汇报。这不仅打破了大公司传统的资历、级别、年限体系,也传递出一个信号:中国公司从硅谷抢人,是必要的,也是可行的。尽管过亿年薪的传闻被腾讯官方辟谣,但这变成了一个新的参照。
一位猎头透露,2025年下半年,越来越多的研究员愿意出来看看机会。此前他们还会带着对现东家的“某种忠心”拒绝邀请,但腾讯和Meta的入场,让他们不得不重新掂量自己在市场上的价值。
业内人士透露,2025年下半年,DeepSeek就有部分人收到过Meta的邀请,开出了“像网络上传的(数千万美元甚至更多)那样富有诱惑力的offer”。
2026年,郭达雅高薪加入字节跳动,再一次打破了人们的预期。姚顺雨的成长路径是标准的精英通道,清华姚班、普林斯顿博士、OpenAI,做出过范式级别的学术贡献,腾讯需要他的方向判断力,在顶层重新设计腾讯的模型路径。
郭达雅是中山大学博士,没有海外经历。他是DeepSeek R1、Coder、Math的核心贡献者,他的定价逻辑与姚顺雨不同,是按他已经创造的价值倒推出来的。
2025年之前,“从Google/OpenAI出来”是AI人才的最强背书。现在,“从DeepSeek出来”成了同等甚至更强的履历,因为DeepSeek团队用极少的资源做出了世界级的成果,其coding、infra、data等方向的人才,都是各家最急需的。
为了争抢郭达雅,阿里巴巴、腾讯、字节跳动三家大厂先后行动。了解情况的人透露,其中有两家的老板亲自去邀请他。阿里巴巴最早,给的现金更多,职权范围更大;字节跳动的期权部分更有吸引力,更重要的是,字节跳动将重点投入Coding Agent方向,与郭达雅的想法更契合,“接下来两年的发展最符合他预期”。
郭达雅的离开加剧了DeepSeek的人才流失压力,也让更多参与过大模型训练的研究员开始重新衡量自己的价值,行业内人心浮动。
社招薪资或许因人而异,校招更能反映市场行情的变化。2023年,顶级AI研究员校招入职字节跳动,年包在百万左右;到了2025届,字节跳动的顶尖人才招聘计划TopSeed可以开300万-500万;2026届,字节跳动取消了校招生TopSeed的标签,提高了人才招聘的标准,开出更高的薪资吸引人才,某些岗位核心的校招生可以开到600万,部分人能开更高。同期,Seed、Kimi、腾讯混元少数的实习生也能拿到300万的薪资。
短短三年,研究员的薪资翻了6倍不止。
只有几百人,怎么拉拢都值得
训练一个大模型的成本,包含几个部分:算力、数据和人。
训练投入是最大的。Anthropic CEO Dario Amodei在2024年预测,正在训练中的模型耗资已接近10亿美元,2025到2027年将出现100亿美元级的训练。
而维持模型运转同样昂贵,OpenAI 2024年仅推理服务就花了近40亿美元。训练加推理,OpenAI一年烧掉约70亿美元算力费用。在这场AI竞赛中,算力投入已经膨胀到百亿美元量级,而且每年还在以成倍的速度增长。
一位业内人士透露,一个靠谱的Infra人才,能提高算力利用率多达50%。“即便已经开源了,到现在为止很多二级算力提供商,也无法把DeepSeek V3.2优化到官方宣称的水平。”
不止Infra。在大模型的训练流程的关键节点上,一个足够聪明、有研究品味(taste)的人,能把整条链路的效率拉升一个数量级。关于Loss曲线在某个点突然抖动的归因,不同的人会有不同的判断。这个判断引发的决策分歧,可能让两个团队在几个月拉开巨大差距。
对公司来说,模型率先突破某个能力阈值——比如可靠的代码生成、稳定的多步推理——它就能率先切入商业场景,一旦成功建立用户习惯,后来者很难撬动。
模型能力的代际差距在商业端被急剧放大。Anthropic的Claude Code帮助公司ARR从2025年底的不到100亿美元飙升到接近300亿美元;而同期OpenAI的ARR增速只有约25%。两家公司模型能力只差三个月,但商业价值可能差好几倍。
因此,对大厂来说,时间是比金钱更重要的成本。大厂们能做的,就是把市场上最聪明的这批人,用尽一切手段锁在自己这里。
全球能真正推动大模型进步的研究员有多少?多位业内人士给出的估算都比较一致,只有几百人。
他们的画像是这样的。首先是天才,市场上公认最值钱的那批人,往往有类似的经历:高中阶段打过数学、信息学竞赛,拿过奖项,凭此保送进了清华或北大。DeepSeek内部有很多奥赛(或者其他竞赛)金银牌,保送清北的学生,有些还没毕业,甚至放弃读博,就出来工作。另一条路径是,各大名校的少年班,保送高校,本科毕业后在UC伯克利、CMU等国际高校进修,之后加入谷歌、OpenAI、Anthropic等海外大模型公司,参与过模型训练。
除了天才以外,人才第一梯队里被反复抢的,还有那些在出身上叠加了研究成果的人。比如,DeepSeek和Seed基模组的核心研究员。对现在的市场来说,从0到1做过模型训练,或者在一个成熟团队里主导过有外界认可度的技术迭代,在圈子里也是“硬通货”。
再下一个梯队的人才,是在中国C9院校的本硕博,或者在新加坡国立、港中文这类学校读PhD,能拿到TopSeed或阿里星这类顶级项目认证的人。他们和有过模型训练经验的人才都属于这个梯队。
储备人才方面,整个清华大模型相关专业——计算机系、电子系、自动化系和交叉信息研究院——每年本科生大约700人,超过80%选择深造。他们在校招时竞争力最强,是中国大模型研究的人才基本盘。
天才们能拿到的是大几千万人民币甚至过亿的薪酬包,各大模型公司的核心研究员们也能拿到千万,再往下的储备人才和普通研究员,基本都能拿到几百万的offer。
这些天才在校期间,或者工作初期就有大把的投资人、猎头建联。一位关注AI的投资人透露,他认识大部分知名AI相关实验室的学生。
大模型领域比较受关注的教授以及实验室,语言模型有清华大学朱军、唐杰、刘知远、黄民烈等老师的学生,北京大学NLP实验室;语音领域有西北工业大学谢磊教授的团队,香港中文大学的语音大模型实验室、中国科学院的声学研究所等团队;多模态模型是香港中文大学的MMLab、复旦大学视觉智能实验室、浙江大学的CAD&CG实验室,以及姜育刚教授的团队。
他们也会早早被VC或者FA锁定,给出类似“只要你创业我就会给你拿一笔钱”的承诺。
但天价薪酬有时也会失效。在有限供给下,薪资只是一个起步门槛,业务方向、项目的重视程度、团队人才密度、算力资源等,同样在天平上。
2025年底,OpenAI首席研究官Mark Chen在播客中透露:扎克伯格为了从OpenAI挖人,亲手煲了汤,亲自送到研究员家门口。扎克伯格还建了一个WhatsApp群叫“Recruiting Party”,在群里协调挖人目标名单。对于他认为重要的候选人,他会亲自发消息,请求“聊15分钟”,然后邀请对方到帕洛阿尔托和太浩湖的私人别墅吃饭。仅在Google DeepMind一家,他就给数十名研究员发过这种消息。
从2023年四季度开始,有投资人发现,字节跳动创始人张一鸣开始频繁约见AI研究者,并循着AI方向的论文一对一拜访作者,其中还有未毕业的博士生。
这个极端稀缺的市场里,CEO们的行为模式是趋同的:面对一个市场上只有几百人的群体,传统的招聘流程、薪酬体系、组织层级全部失效,只剩下人与人之间最原始的说服方式。
激进挖人,让对手失守
这个极端稀缺的市场里,各家的抢人策略出现了明显分化。
一位猎头把这件事说得很直白:“你以为大厂在招人,其实是把对手能用的人,从市场上提前清掉。”一个明显的例子是,最近大公司们对天才的渴求不再像以前那样强烈,但面向2027届的秋招启动时间,反而比往年同期更早。
在人才金字塔顶端,中国做大模型公司的核心研究员大概有500人。除了他们,一线团队现在想要的是“打娘胎里就开始做AI”的那批人,本科就进实验室,博士期间参与过训练流程,或者有明星paper的人。有限供给下,有人多自然就会有人少,各家要比拼的是出手的速度和投入的决心。
字节跳动曾是几家国内公司中行动最快、投入最大的那家。2023年成立,三年时间,字节跳动负责大模型研发的部门Seed就从最开始的一两百人团队,到近期1300人的规模,膨胀了接近十倍。
字节跳动对人才的争抢也是系统性的。从张一鸣到技术leader再到HR,整个组织都有计划地分类招募不同等级的人才。蒋路、黄文灏、周畅,以及近期加入Seed的郭达雅,背后都有最高层的直接参与。
多位猎头透露,字节跳动不只想要对应岗位的人,还想要全世界最聪明的人。这家公司肯为好人选开绿灯,因人设岗常常发生,先把人抢过来,再给他找位置。
抢人大战中,Seed和Deepseek是出手最果断的两家。他们不仅有经验辨识好的人选,也更清楚一个人选的价值,可以优先出价。而后面出价的人,面临的是“我要比上一个高多少才有竞争力”。
腾讯在一段时间内被迫成为后出价的人,要付出更高的溢价争抢人才。2025年,意识到模型层面的落后,腾讯的方式是不惜成本地挖人,要在最快时间内建立起一支能打仗的队伍。
过去一年,字节跳动Seed有近30名成员加入腾讯。据了解,原Seed视觉AI平台团队负责人肖学锋,入职后加入AI Infra部,负责多模态推理相关工作,向姚顺雨汇报。训练Infra组负责人黄启来自Seed;RL Infra组负责人张弛2025年底从Seed离职后加入腾讯,直接向姚顺雨汇报;大语言模型部的RL算法组负责人袁钰峰,同样从Seed挖来。
原Seed视觉基础研究团队负责人也在2025年下半年加入了腾讯AI Lab,近期随AI Lab组织调整转入大语言模型部,当前向姚顺雨汇报。这位负责人2021年从新加坡国立大学加入字节跳动,在多模态领域是全球知名的研究科学家,曾是字节跳动TopSeed人才计划的导师。
腾讯从Seed集中挖人的意图也比较明确:补齐训练平台、推理系统和强化学习框架等底层能力。尤其是Infra能力,字节跳动Seed的AI Infra能力曾被其内部高层认为是国内领先水平,腾讯储备的算力不足,定向挖有经验的人成了短时间内的最优解。
“腾讯不会错过谁。”一位猎头评价腾讯的招聘策略。为了追赶,腾讯会以广撒网的方式抢夺人才,对人才的要求最早也没有Seed和DeepSeek那么高,一些研究员甚至会在拿到Seed的offer后,转头去跟腾讯要更高的薪酬。
相比之下,阿里巴巴Qwen在抢人这件事上比较保守,更倾向于通过校招内部培养。过去通义实验室下属的Qwen团队,以氛围好著称,90%都是阿里巴巴自己培养的校招生,各个环节之间合作紧密。他们和字节跳动一样,没有职级、没有OKR,研究员可以专注于自己的事情。当时林俊旸领导下的Qwen也不过100人左右,人少,对研究员来说Scope大,且会公开发布技术报告,向外界展示成果。
但阿里巴巴严格的职级体系也给人才招聘制造了障碍。原Qwen负责人林俊旸是P10,其他负责人P9、P8,在社招时只能招对应P6或者P7职级的人才。此时,Qwen的研究员去Seed,一般来说职级上至少升2级。晋升难,薪资和职级严格挂钩,Qwen一度面临人才流失。
2024年7月,周畅从Qwen离职并签署竞业协议。两个月后他加入字节跳动,从事大模型相关工作。阿里巴巴递交了劳动争议仲裁申请。这是这场人才大战中最早引起公众关注的竞业纠纷之一。
周畅离职后,阿里巴巴高层给Qwen大多数成员升了一个职级,附带提高激励,但也只是亡羊补牢。Qwen也一直在向阿里巴巴高层争取和行业同水平的人才激励。2025年下半年,林俊旸曾让Qwen研究员主动出去面试,以求到涨薪的机会,避免人才外流。直到2026年3月,林俊旸本人也离开了阿里巴巴。
除了大厂,AI初创公司同样是这场博弈中激进的买家。有创业公司愿意为研究员开出高额纯现金的薪酬包,来吸引核心人才加入。
目前,这场大战已经变成了一个混乱的漩涡,几百人在几家公司来回流动。
DeepSeek、Kimi等还没上市的创业公司失血,研究员流向字节跳动、腾讯、小米等大厂;Seed内部竞争激烈,过去一年至少流失70人,同时又从DeepSeek和阿里巴巴定向挖人;Qwen内部经历人才与组织的摩擦,和管理的阵痛,一部分人去了字节跳动、腾讯和创业公司;而腾讯暂时成为最激进的买家,从国内外同时挖人,想快速赶上大模型第一梯队。
比抢人更难的是留人
在这场天才的争夺中,对公司来说,留人的成本和挖人的几乎一样高。一贯用纯现金薪酬吸引人才的DeepSeek,在智谱和MiniMax上市后,吸引力有些失效了。
智谱和MiniMax相继上市、股价高涨,期权价值膨胀接近10倍;阶跃星辰、Kimi的IPO也提上了日程。对于创业公司来说,留人的最大筹码就是上市后手中期权的暴涨,以及上市后长达半年到一年的解禁期。因此目前,智谱和Minimax的人才流失压力不大。
但DeepSeek不是。DeepSeek此前没有估值,也没有明确的融资计划,员工手中的期权无法流通,也没有可预期的变现方式;且DeepSeek期权归属期很长。一般公司的期权全部归属年限是4年。
梁文锋重新接洽投资方,融资、估值,给员工们更强的确定性。2025年秋天开始,DeepSeek开始做更多产品化和商业化方面的布局。梁文锋多次在全员会上提及上市,和员工同步融资、估值计划。最近的消息是,DeepSeek的首轮融资,计划融500亿元,梁文锋个人出资200亿,投后估值或超3500亿元,目前这轮融资还没有最终敲定。
同期,没有上市计划的字节跳动也多次提高Seed部门成员激励,避免人才外流。2025年9月,字节跳动为Seed部门单独发了一笔期权津贴:按绩效和职级不同,每人每月可获得价值9万、11万或13.5万元的字节期权,首批连续发放18个月——按1300个正式员工,金额取最低9万,字节跳动投入了超过20亿的成本留人。
除此之外还有豆包股。豆包股是去年10月字节跳动内部为豆包相关大模型业务建立的一套虚拟股机制,通过为员工发放虚拟股权,激励、稳定人才。员工入职字节跳动总包有很多部分,现金、期权、豆包股、签字费,与未来激励相关的还有项目奖、绩效奖、创业激励等。
入职腾讯的总包虽然没有这么复杂,包含常规的现金、期权、签字费,但腾讯一般会用签字费补全和其他家浮动的金额;阿里巴巴也有相应的激励,且P9以下直接发放现金吸引人才。知情人士透露,曾有P8向通义高层提出离职,阿里巴巴为了挽留人才,当即承诺给人晋升,以及发放接近百万的现金奖励。月之暗面也在今年初推出新的顶尖人才校招计划,直接授予尚未毕业的实习生公司期权股数。
即便如此,还是不断有人离开,只靠钱有时候也留不住人,还要靠制度和文化。
公司们通过各种协议,层层设卡,让这些跳槽的研究员付出更高代价。竞业协议是最常用的手段。研究员离职后6到24个月不能加入竞对,有些公司虽然会帮忙承担违约金,但对大部分普通研究员,这还是比较有效的限制手段。从全行业来看,一个显著的变化是,2023年,竞业协议还未覆盖基模团队所有成员;到2025年,进入基模训练流程的每一位入职员工都必须签署。
近期字节跳动还要求员工签署脱敏协议,提出离职申请的员工需要继续待在公司3个月才能离开。据了解,这也是行业普遍存在的现象,腾讯也在推行。这在以月为单位变化的模型领域,对员工来说是巨大的机会成本。
除了这些,大模型研究员们在意的还有:和谁一起工作、做的事有没有意义、有没有自由。
各家都在调整组织形态来匹配这种需求。大公司取消KPI/OKR,弱化职级,组成项目制,甚至实习生也能直接与最高层交流。
《海外独角兽》在文章里统计,研究员入职Claude Code母公司Anthropic 2年后还在的比例是80%,是当时头部AI labs里最高的,超过DeepMind的78%。CEO Dario会花30%到40%的时间确保Anthropic的文化是好的。
DeepSeek曾用“不融资、不商业化、只做研究”的叙事吸引了一波行业内最顶尖的天才。他们人少,每个人的权限足够大,展现出了少数好的人能带来“突破性”成果的可能性。
随着人数的变多,“天才的想法”也成为组织熵增的一大来源。“他们从前是自己领域内的‘小霸王’,带着ego来到Seed,每个人都想成就一番事业。”一位Seed人士说。我们此前提到,Seed会出现一种情况:几个研究员决定自发研究一个方向,如果上级不同意、不分配资源,他们可以上升汇报,得到认可后,就可以从上到下推进。
天才们有自己对这个领域走向的判断,这些尝试有时候和公司的商业利益完全不相关。过去这是一些大公司能承受的损耗。但行业内明显的感知是,模型的技术路径在收敛,很多人担心行业对创新的需求不那么高了。抢人大战或许很快会迎来转折点。
努力变得值钱,同时付出代价
这个行业里的人才,放到任何别的地方都是被仰望的天才。他们聪明、有能力,名校毕业、顶会论文、有扎实的工程能力——这在大多数行业,足以让他们成为组织里的焦点。
当全世界最顶尖的人同时涌入同一条赛道,天才和天才之间的竞争,就成了神仙打架,天才们需要用更多的努力去证明自己的身价。
对大模型研究员来说,最直接影响自己身价的,是自己的研究成果会不会被看到。一位招聘从业人士透露,研究员的“定价”,是根据“AI native”的程度,学历背景、论文情况、项目经历都有影响,面试更多是增量信息和薪资谈判。
一个典型例子是,DeepSeek-V4技术报告公布后,有公司的高招人士、猎头,连夜根据V4列出的核心贡献者“按图索骥”,寻求联系。去年3月,吴永辉刚接管Seed基础研究不久,曾在部门全员会上提到,Seed做了很多不错的工作,但外界不太了解,他鼓励研究者以论文和博客的形式发表成果。“他还建议大家‘装修’下个人主页。”一位曾在Seed的人说。
根据我们初步统计,吴永辉加入Seed之后的三个月,该团队发布的论文数量就超过2024年全年。但后来由于人才竞争太激烈,对外的展示逐步减少。目前,各家公司都尽可能保护核心研究员的信息,让他们减少和外界沟通,防止被对手挖角。
但对研究员个人来说,代码不开源,论文不发表,成果就只存在于公司内网。且技术迭代太快,几天之前还很新的进展,一周之后就被新的成果淹没了。
越来越多人主动做起技术PR,这成为大多数AI领域的博士生,和开源模型研究员们工作生活的一部分。2025年,从“Ask me Anything”,到技术问题、论文解读,再到研究困惑、行业见解,越来越多的研究员开始在小红书、推特等平台运营自己的账号,尽管此前他们从不在社交媒体发言。
“技术需要PR。”一位研究员透露,“对做开源模型的公司来说,两个技术实力相差不大,但其中有位自带流量的技术Leader,公司会更偏向于要后者。”顶流研究员能给一家公司带来更多曝光和机会。
研究员们拿着和流量明星几乎同水平的工资,工作内容也越来越像流量明星:工作,为自己“打歌”(做技术PR);他们接受播客的采访,发表自己的观点,甚至“发疯”;也像流量明星一样,花时间思考受众喜欢看什么样的内容。学术会议后,研究员们应邀参加大公司的宴会,在米其林菜品前谈论技术进展。
甚至他们的日常生活都变得像明星,要随时保护自己的个人隐私。有些研究员因为竞业失去自己的名字,为了避免前公司聘请的私家侦探在他们可能入职的公司门口拿着相机偷拍,他们不得不换上全新的手机号、微信号,带着口罩、墨镜出现在公司,有时还会流动办公,没有自己的工位。
问题在于,研究员的工作强度更高,甚至职业周期可能还不如流量明星。一位大模型研究员透露,他们的工作常态是10116(10点上班,11点下班,一周工作6天),但他只是实习生。正式员工熬夜到两三点是常态,从前工作比较多的时候也会通宵,“2023年那会经常三天睡两觉”。
公司为了留住他们,提供充足的资源,足够的权限,不设KPI和OKR。天才天生自驱,他们需要超越同行来证明自己。激烈的竞争中,总有人会被淘汰。“有明星paper,做过核心项目的,职业周期可能长一些,1年以上;一般的研究员3个月不出成果,可能就要面临认知过时的质疑了。”一位研究员说。
xAI是一个典型样本。马斯克给研究员们发足够多的钱。早期,员工晚入职一天就可能错过百万美元的收益。但入职后,员工处于高压状态:每两周汇报一次成果,没有产出的人随时会被辞退。
不到一年,联创出走,团队核心成员接连离职。xAI说明一件事,当人们做事的追求,从“把这件事做好”,悄悄变成了“我做什么,才能在这儿多待一周,拿到更多的钱”,这对需要长周期积累的基础研究来说,无疑是一种损伤。
2026年初,一位一线团队核心研究员透露,Agent的能力不断延伸,他们的团队正在焦虑未来可能会被AI取代,但他们不能停止研究的步伐。另一位研究员也透露,Coding Agent已经能帮助他做90%执行的工作,他每天需要做的事情是给这些Agent下达清晰、高质量的指令。
“这个行业最终会变成,前5%的人拿着从前10倍的工资,干着100个人的活。”一位研究员说。技术正在服务越来越多的人,但获得高额收入的人却越来越少。随着技术路线收敛,创新的需求降低,大多数研究员会回归普通工作。
窗口不会永远都开着。
司雯雯、申远对本文亦有贡献
题图来源:Billions


