千问模型负责人林俊旸提出离职,阿里高管紧急答疑

博主:fm5i0dxdb2j0考研资深辅导 2026年03月04日 21:54:25

编辑 | 苏建勋 杨轩

" 我应该要更早知道这些。"

北京时间 3 月 4 日下午约 13:00,通义实验室紧急召开了 All Hands 会议,阿里集团 CEO 吴泳铭向千问员工坦诚表示了歉意。

12 个小时前(北京时间 3 月 4 日凌晨 0 点 11 分),阿里千问大模型技术负责人林俊旸在 X 上突然宣布离职——林俊旸是阿里 AI 开源模型的核心推手,也是阿里最年轻的 P10 之一——行业一片哗然之时,据《智能涌现》独家了解,Qwen 的很多成员也无法接受团队灵魂人物的突然出走,他们希望阿里集团层面给出更多解释。

" 在资源远少于竞对的前提下,能取得今天的成绩,俊旸的领导力是核心因素之一。" 不止一位千问成员对 36 氪评价。

在会上,以刘大一恒(Qwen RL leader)为代表,Qwen 成员们围绕包括团队拆分、新成员周浩、对模型路线选择、资源投入等等维度,对阿里高层提出了多项疑问。

这场会议与会者包括阿里数位高管、Qwen 团队以及通义实验室其他团队成员。围绕团队调整、战略方向等关键议题,包括阿里巴巴董事长兼 CEO 吴泳铭,阿里巴巴首席人才官蒋芳、阿里云 CTO 周靖人做出多个回应。

对于此次调整,阿里高层给出的核心定性是:Qwen 没有收缩,这是一次团队扩张,无关任何政治斗争,反而需要投入更多资源。

" 我们在快速发展,这波调整是为了扩充更多人才、提供更多资源。" 阿里巴巴首席人才官蒋芳也承认沟通存在不足," 这次组织形式没沟通好,新人引入肯定会带来阵型变化,扩大过程中必然涉及到这些,我们可能没处理好。"

有传言称周浩将直接领导林俊旸及其相关团队,但据智能涌现获悉,包括周浩的接任职位,汇报线,尚在讨论中。

会上,阿里高层强调多次,千问基础模型是集团当前最重要的事情,大模型的竞争不仅仅是 Qwen 团队的事,而是整个阿里集团的事——无论是基础模型研发,还是底层 infra 建设,都将在集团层面统筹推进," 一定要超越 "。

阿里云 CTO 周靖人则回应了包括招聘名额、算力短缺等尖锐问题:为何外部客户(如大模型创业公司)购买阿里云算力用得顺畅,内部团队反而在算力、招聘名额上捉襟见肘?

周靖人表示,团队处于 " 一直资源紧张 ",内外差异有很多历史原因,未来正在做整体规划,但没有进一步展开说明。

关于林俊旸的动向,会上也没有更新的结论。但下午 2 点左右,林俊旸再度发布朋友圈,表示 "qwen 的兄弟们,按照原来安排继续干,没问题的 ",并未明确是否回归。

来源:林俊旸个人朋友圈

而在数日前,阿里刚刚完成一轮 AI 战略更新,内部将 AI 的总称和核心品牌统一为千问,组织层面也迎来了新一轮调整。

《智能涌现》了解到,此前 Qwen 拥有自己的预训练、后训练、Infra 团队;从模型模态上看,也有语言模型、多模态、代码等多个方向。

在过往,训单模态的模型曾是业界主流,但在 DeepSeek 用推理模型带动了新的技术范式之后,各个模态的融合成为趋势。

一位知情人士曾对《智能涌现》表示,从 2025 年开始,林俊旸就在寻求让语言、图像、视频、代码等方向的员工一起工作,以寻求提升模型训练效率。Qwen 团队曾提出与万相团队合并,但没有完成,才开始做了自己的 qwen-image 模型。

但在这轮调整中,通义实验室希望将 Qwen 团队按预训练、后训练、视觉理解、图像等维度拆分,和通义实验室中的团队合并(如通义万相、通义百聆等团队),一起工作。但在没有充分信息沟通的情况下,矛盾就此爆发。

" 林俊旸,他一个人就值一亿美金 "

就在 3 月 2 日晚间,千问还在 X 上宣布开源四款 Qwen 3.5 小尺寸模型,马斯克点赞了这条推文,并表示 " 令人惊叹的智能密度。"

千问模型灵魂人物林俊旸毫无征兆地突然提出离职,让阿里 AI 团队陷入一片迷茫。

在前任阿里千问技术负责人周畅离职后,生于 1993 年的林俊旸从 2022 年起开始接手阿里 Qwen 团队,负责整体技术工作。

这几年间,阿里 Qwen 模型家族也在快速发展,从最开始的通义模型家族到 Qwen 2.5、Qwen 3.5 Max 等模型,一路成长为世界一流模型团队。在多个维度上,Qwen 都是毫无疑问的开源模型第一家族。

多位前阿里模型团队的人士对《智能涌现》都曾表示,2023 年国内大模型刚起步时,国内大厂对是否开源、开源力度多少也有分歧。但阿里的开源战略做得足够早,足够有战略定力,很大程度上得益于周畅、林俊旸等人的积极推动和执行。

而随着林俊旸离开,一同宣布离职的,还有多位 Qwen 成员,其中有负责 Qwen 各个模型细分方向的核心负责人,如:

惠彬原(Binyuan Hui):Qwen 代码方向负责人,Qwen-Coder 系列模型主理人,负责从预训练到后训练的全流程 Agent 训练,近期也有参与具身智能(Robotics)相关研究。

郁博文(Bowen Yu):Qwen 后训练研究负责人,毕业于中国科学院大学,主导 Qwen-Instruct 系列模型的开发。

Kaixin Li:Qwen 3.5/VL/Coder 的核心贡献者。

除了上述几位人员,还有不少年轻研究员,也在同一天提出了离职。

不止一位 Qwen 研究员在推特、小红书发布情绪低落的贴文。"Qwen is nothing without its people." 这番发言套用了 2024 年 OpenAI 陷入 CEO 更换风波时,OpenAI 员工在推特上的刷屏发言。

来源:X

林俊旸官宣离职在 AI 社区引起了巨大轰动,很多反馈来自海外开发者,均在表达对林俊旸推动 Qwen 开源工作的感谢。" 一个时代的结束。"Hyperbolic Labs 创始人兼 CTO Yuchen Jin 表示。

来源:X

" 如果这一批人真要是离开了,Qwen 模型至少得耽误半年到 1 年,重组团队重新训。" 一位 AI 方向的资深投资人对《智能涌现》表示。另一位字节 AI 人士则称 " 林俊旸至少是 1 亿美金以上级别的人才。"

不少传言称,林俊旸离开是 " 非自愿 ",但经《智能涌现》确认,林俊旸在 3 月 3 日提出离职,并且还没有和阿里谈好相关的细节,Qwen 团队成员在 3 月 4 日下午得到的消息。

《智能涌现》最新得到的消息是,阿里巴巴高层还和林俊旸密切沟通中,林俊旸是否确认离开阿里巴巴还未可知。

林俊旸离开后,即将接手阿里 Qwen 后训练工作的新成员,是来自 Google DeepMind 的周浩。一位 Qwen 团队人士对《智能涌现》称,周浩于 2026 年 1 月短暂入职夸克,而后调至通义实验室。从汇报线上看,周浩直接汇报给周靖人,不少声音称,他将接手 Qwen 的后训练工作。

周浩(Hao Zhou)本科毕业于中科大。此前,他在 Google DeepMind 担任 Gemini 的强化学习与自我改进团队的负责人。

阿里在开源上赢了口碑,但它还想要更多

就在 3 月 3 日,林俊旸刚刚在 X(推特)上发布数款小尺寸的开源模型,这些模型适用于手机等,也贯彻了 Qwen 一直以来的开源路线。

很多人认为将做开源模型粗暴理解为 " 做慈善 ",但这并不公允。

开源做得好,首先服务了整个阿里云的开发者生态。因为更早做开源,Qwen 模型家族在模型发展早期能够快速得到社区反馈,成长迅速,反哺了模型训练。

Qwen 全尺寸、全模态的模型路线,让很多企业、学校的技术从业者能够很快选用到合适自己的模型,建立了一波好口碑。在这些模型落到生产环境后,很多企业主也会倾向于购买 Qwen 的模型服务,间接转化成了阿里云的商业收入。

但这其中的商业逻辑很难论证,这也是开源长期以来面临的问题,国内外都如此—— Meta 花了数十亿美元训练 Llama 却免费开放,外界至今争论这笔账究竟怎么算,也从来无法体现在 Meta 财报当中。

而尽管在开源依旧维持着优秀的口碑,但在闭源旗舰模型一侧,阿里在 2025 年发布的 Qwen 3、Qwen-3.5 系列,尽管维持在第一梯队,但已有吃力之势。

林俊旸等核心成员离开,很大程度是源于阿里巴巴当前 AI 战略的快速变化,和基础模型团队的目标产生了差距。

追赶旗舰模型、维持开源领先地位都很重要,但阿里巴巴的基础模型团队训练资源相对有限。

如今,Qwen 家族有超过百款细分模型,很难想象,支撑这些模型更新主力的 Qwen 团队,仅有 100 多人。即使是算上通义实验室整体团队,也刚刚超过 600 人。

作为对比,字节负责基模训练的 Seed 团队就已经近 2000 人。在各个方向上,阿里投入的绝对人数,都是友商的几分之一。不少 Qwen 人士都曾对 36 氪表示,Qwen 的算力、Infra 建设都长期缺乏资源和支持,这部分阻碍了模型的迭代速度。

这是如今阿里 AI 战略急行军的一个激烈切面。2025 年 11 月,千问 App 上线,大打春节大战,只是刚刚拉开 AI To C 战争的序幕——字节旗下的豆包已然接近 2 亿日活大关,还有尚未完全发力的腾讯;同时,阿里在旗舰模型也不能掉队——这关系着阿里云的商业化闭环,以及整个阿里集团的未来。

(36 氪作者周鑫雨对本文已有贡献)

The End