財經新聞

林俊旸曾经历通义内部赛马，这种赛马还会继续｜新皮层独家

March 7, 2026

记者：陆彦君

编辑：吴洋洋

Key Points

2025年，林俊旸曾经历与许主洪的内部赛马，周浩是许主洪后的下一个；

阿里还没有在大模型领域占据安全位置，提升人才密度是必然选择；

Qwen系列模型是目前全球累积下载量和衍生模型数量最多的开源模型。不过在以模型调用量统计的维度上，Qwen并不在全球前列；

Qwen正面临来自原生多模态的挑战，它最新发布的Qwen3.5没有在风靡全球的OpenClaw模型调用中胜过Kimi K2.5；

Qwen3.5的发布和周浩的引入都意味着阿里可能也开始在模型策略上向Google学习，但在更大的产模策略上，没有迹象表明它会学习Google。

3月5日，阿里巴巴CEO吴泳铭发布内部邮件称「公司已决定批准林俊旸同学的辞职」。

3月4日凌晨，阿里Qwen（通义千问）团队技术负责人林俊旸在社交媒体X上宣布：「me stepping down. bye my beloved qwen.」（我辞职了，再见，我亲爱的Qwen）。同一天，Qwen后训练负责人郁博文也宣布离职，而Qwen Code负责人惠彬原已在1月加入Meta。

第一财经「新皮层」从一位接近通义的人士处获悉，林俊旸辞职前曾在通义内部与许主洪赛马，2026年年初加入的周浩是下一个潜在的赛马对象。

许主洪2025年2月加入阿里巴巴，担任阿里智能信息事业群首席科学家，向吴嘉汇报，主要工作内容是负责AI To C业务的多模态基础模型及Agents相关基础研究与应用解决方案。2025年9月，许主洪转岗至通义实验室，从事多模态交互模型方向的研究。

加入阿里巴巴前，许主洪曾是新加坡管理大学终身教授，主要研究「多模态预训练」，还曾创办AI初创公司HyperGAI，开发多模态大模型。

上述人士称，许主洪转岗至通义实验室后，共同向阿里通义实验室负责人、阿里云CTO周靖人汇报，两人之间的赛马由此开始。不过许主洪在这场赛马中的产出并不理想，而林俊旸带领的Qwen团队在2026年春节期间交出了Qwen3.5系列模型。

2026年年初，阿里巴巴通义实验室继续引入了Google DeepMind前高级资深研究科学家周浩加入。一位Qwen团队离职员工告诉「新皮层」，周浩入职后同样直接向周靖人汇报。前述接近通义的人士称，周浩的空降与许主洪的转岗逻辑一致，都是通过增设平级负责人强化内部竞争。

林俊旸本科毕业于国际关系学院英语系，硕士就读北京大学语言学专业，2019年加入阿里巴巴，是阿里早期MoE大模型M6的核心成员。2024年千问模型原技术负责人周畅离职后，林俊旸接管团队，推进了Qwen3和Qwen3.5系列模型的训练与发布。

3月5日的内部邮件中，吴泳铭称阿里巴巴会「继续坚持开源模型策略」，同时也会继续「加大吸纳优秀人才的力度」。

在大模型领域，阿里目前还没有站在一个安全位置，提升人才密度是必然选择。

单从下载量和衍生模型数量上看，Qwen系列模型是目前全球累积下载量和衍生模型数量最多的开源模型。开源社区Hugging Face 1月21日的统计数据显示，Qwen自2023年4月首次开源以来，模型全球累积下载次数已突破10亿次，衍生模型数量突破20万个。相较而言，DeepSeek的全球累积下载数量只有5000多万，衍生模型数量也只有2000多个。

OpenClaw模型调用量排名。数据来源：OpenRouter

不过在以模型调用量统计的维度上，Qwen并不在全球前列。全球最大的语言模型API聚合平台OpenRouter的数据显示，2月16日至22日的周榜单中，平台调用量排名前5的模型中有4家来自中国，分别是MiniMax的M2.5、月之暗面的Kimi K2.5、智谱的GLM-5和DeepSeek的V3.2。Qwen相关模型并不在其列。

而在全球风靡的AI智能体OpenClaw的模型调用量中，K2.5也至今保持榜首位置，成为最受欢迎模型。由于这种推动，Kimi在发布K2.5模型后不到一个月的累计收入，已超过其2025年全年收入总和。被OpenClaw带火的前10大模型中，中国模型还包括MiniMax的M2.5、阶跃星辰的Step 3.5 Flash和DeepSeek的V3.2，Qwen也没有模型在其中——包括其2月16日最新推出的最新模型Qwen3.5。

阿里要面对的模型挑战并不少。

原生多模态之战

原生多模态是Google 2023年提出来的概念，它当年12月发布的Gemini 1.0被官方定义为「原生多模态」，区别于GPT-4那样的「拼装多模态」。意思是Gemini是一个将文本、图像、音频和视频等多模态数据同时用于预训练的原生多模态架构，而之前包括GPT-4在内的所谓多模态模型都是拼装式的：其主体仍然是个语言模型，只是当用户需要多模态能力时，它会再调用额外的多模态模块——图片理解或生成模型、视频理解或生成模型——来提供服务。

2025年11月，Google凭借Gemini3在多项基准测试的多项指标上超越GPT-5，迫使OpenAI在2025年12月启动「红色警报」，暂停广告等非核心项目，以应对Gemini3的冲击。

Gemini的成功印证了原生多模态架构的可行性和潜力。

2026年中国春节期间，月之暗面、字节跳动和阿里巴巴也先后发布了各自的原生多模态模型——K2.5、Seed2.0和Qwen3.5。但截至目前，只有K2.5被OpenClaw带火了，Qwen3.5和Seed2.0几乎都没有从这个现象级传播和实际调用中受益。

不过字节跳动同期发布的另一款视频生成模型Seedance2.0在影视创作领域掀起了风暴，被外媒评价为「令好莱坞陷入恐慌」的中国AI模型。而Qwen3.5没有获得明确的市场标签。

周浩，今年年初加入通义实验室。

林俊旸宣布离职后，Qwen的后训练负责人郁博文也宣布了离职，他的工作将由今年年初入职阿里的周浩负责。根据领英资料，周浩曾是Google DeepMind高级资深研究员，作为核心参与了Gemini3.0、AI Mode与深度研究等关键项目的研发。

字节跳动在2025年年初引入的大模型一号位吴永辉也来自Google DeepMind，曾作为DeepMind研究副总裁深度参与Gemini1.0和Gemini1.5的研发，Gemini1.0开启了Google的原生多模态和长上下文时代。字节跳动2026年春节期间发布的Seed2.0原生多模态模型与视频生成模型Seedance2.0，均是其加入后的最大成果。

现在，阿里也挖来了Google DeepMind背景的人。3月4日的通义全员会及3月5日的内部信中，阿里管理层连续两次明确对全员表态：需要吸纳更多外部人才。

随着更多人被引入通义实验室，类似林俊旸和许主洪那样的赛马肯定还将继续。

要学Google吗？

Qwen3.5的发布和周浩的引入都意味着阿里可能也开始在模型策略上向Google学习，但在更大的涉及产品和模型关系的产模策略上，没有迹象表明它会学习Google。

Google在2024年10月将原本独立运行的Gemini应用团队并入Google DeepMind，以解决长期以来研究成果与市场需求脱节的问题。到了2025年4月，连负责从0到1做AI产品孵化的Google Labs——NotebookLM就是这个团队的成果——也被并入了Google DeepMind，实现了从模型到应用的垂直整合，由Google DeepMind CEO哈萨比斯（Demis Hassabis）统一管理。

阿里的动作刚好相反。早期，阿里云完全主导了通义模型和通义应用（现「千问」App）的开发。但2024年12月，阿里将通义应用团队从阿里云拆分出来，并入了夸克所在的智能信息事业群，这个事业群2025年12月与智能互联事业群（天猫精灵等AI硬件团队）合并为千问C端事业群，由吴嘉负责管理。

多家媒体报道称，林俊旸相信模型层的垂直整合，他认为预训练、后训练，乃至Infra团队，应该更紧密地结合和沟通。然而，为Qwen做Infra工程的团队隶属于阿里云，与Qwen模型训练团队存在沟通挑战。

前述Qwen离职员工告诉「新皮层」，林俊旸期待Qwen团队自主承接更多Infra的工作。2025年12月，林俊旸还曾在小红书的个人账号上亲自发了多篇Infra相关的招聘帖。

Qwen只是通义实验室旗下3个模型团队之一。

不过，传闻阿里管理层可能的架构调整方向是将包括通义千问（Qwen模型所在团队）在内的3个模型团队（通义千问、通义万相和通义百聆）分拆，然后按照预训练、后训练、文本、多模态等职能来划分部门。在此之前，3个模型团队有各自的预训练和后训练模块，能够在一个小团队内闭环地完成模型训练。这种调整通常意味着一个行业已经迈过从0到1阶段、技术路径开始收拢、不再需要更多闭环小团队才能完成的实验性项目。这个判断目前还不是业内共识。不过这项调整如果推行，包括林俊旸在内的3位模型技术负责人原来的职位将不再存在。

在产模层面，截至目前，没有信息表明包括Qwen在内的通义系列模型和千问App等应用团队相互独立的架构短期内会发生变化。

通义应用团队与夸克、天猫精灵等面向C端的业务合并后，已经更名成为「千问」，今年1月15日打通了淘宝、淘宝闪购、支付宝、飞猪、高德等阿里生态，让用户可以在千问内直接点外卖。后来还发布了千问眼镜。3月2日，阿里还进一步将此前发布的夸克眼镜直接更名为千问眼镜。

即使将模型和应用团队重新合并，阿里目前也缺乏一位像哈萨比斯那样的资深领导者。主管通义实验室的周靖人更多只是一位技术领袖，整个阿里云至今没有一位可以统领技术和业务的CEO，这一职位目前仍然由阿里巴巴集团CEO吴泳铭兼任。

此外，千问应用团队也尚未出现像NotebookLM背后推手Josh Woodward那样的角色，能够紧跟模型迭代、通过产品最大程度放大自身模型性能和特长，从而建立产品与模型的正向循环。

开源战略与云增长的冲突

最后，阿里仍然面临开源战略与云业务增长存在潜在冲突的挑战。

就在林俊旸宣布离职的前一天，他还在X上回应马斯克对Qwen3.5小尺寸模型的点赞。而 Qwen3.5正是他离职前最后一次公开产品发布。在林俊旸的离职帖下，全球AI开发者、开源社区的建设者们纷纷留言，感谢他与Qwen团队为开源大模型生态做出的贡献。

阿里2023年8月开始就在模型层实行开源战略，这种开源并不只针对Qwen（通义千问）系列模型，视觉模型通义万相和语音模型通义百聆同样走开源路线。

一位接近阿里云的人士对「新皮层」称，阿里对大模型的终极判断是，模型本身不足以构成技术护城河，最后将变成基础设施。因此，模型的商业价值更可能通过云服务变现，核心还是卖算力，而开源更有助于建立这种商业模式需要的全球影响力。

3月5日的内部信中，吴泳铭称，阿里「将继续坚持开源模型策略」，间接否认阿里大模型要转向闭源的传闻。

但阿里管理层预期的从开源到云增长的正循环并没有变成现实。相反，AI云市场最大的市场份额被字节跳动旗下的火山引擎夺走。

根据IDC数据，2024年中国公有云大模型对外调用量（Tokens）达114.2万亿，其中火山引擎以46.4%的份额位居第一，阿里云与百度智能云都位列第二（19.3%）。到了2025年上半年，阿里云的占比虽提升至27%，但火山引擎依然以49.2%的市场份额继续保持第一。通义庞大的开源模型生态并未转化为阿里云在大模型云服务市场的主导权。

-END-