北斗专访|无问芯穹夏立雪:如今更关注“用对芯片”而非“用贵芯片”

博主:fm5i0dxdb2j0考研资深辅导 2025年05月28日 06:57:35

【编者按】

“星汉灿烂,若出其里。”人工智能迈入闪耀时刻。

4月29日,习近平总书记来到位于徐汇区的上海“模速空间”大模型创新生态社区调研。他指出,人工智能技术加速迭代,正迎来爆发式发展,上海要总结好以大模型产业生态体系孵化人工智能产业等成功经验,加大探索力度,力争在人工智能发展和治理各方面走在前列,产生示范效应。

如今,徐汇区已形成“北斗列阵”+“群星闪耀”的AI生态布局。其中,“北斗七星”由稀宇科技、商汤科技、阶跃星辰、无问芯穹、星纪魅族、特赞科技和斑马智行7家标杆企业构成。

这些企业何以成为“北斗”?它们在人工智能领域有哪些探索和前瞻性的思考?澎湃新闻推出“北斗专访”系列报道,通过深度对话,解码标杆企业的AI星辰版图。

祝碧晨 海报设计

作为企业掌舵人,清华大学电子工程系毕业夏立雪身上带有理工科学生的气质。如今他的身份是无问芯穹CEO,常穿公司文化衫或西装出席公开场合,每次采访均准时现身。

面对澎湃新闻记者的提问,他总会迅速作答,有问必答、条理清晰,即使谈及激烈而残酷的竞争,也保持平和而克制的语调。

来到上海发展,这个出生于1991年的青年企业家开始喜爱这座城市。“上海确实让我有很大的一个感触,它和年轻人是很匹配的。我们公司平均年龄32岁,年轻人喜欢上海,可能因为它的文化基因更加开放和活泼。”

无问芯穹至今成立刚满两年,融资近10亿元。接下来要不要上市,夏立雪似乎并不心急。他说:“我相信只要坚持做好两件事,既有技术的持续领先,又有商业化的成功,上市只是一个水到渠成的事情。”

无问芯穹,位于上海徐汇滨江模速空间一楼。受访者 供图

摆在眼前的,是AI竞争来到“深水区”。2025年,大模型在算力上的比拼正发生深刻转变:从原来的“比谁有更多GPU”,演变成了“比谁能更聪明、更经济地用好手中算力”。

“我们现在需要考虑的是,在算力资源有限的情况下,怎么去解决模型持续增长的问题?”在夏立雪看来,AI的任务越来越多样,芯片技术越来越细分,算力资源越来越紧张——于是,“用最适合的芯片做最适合的任务”就成了大趋势。比如,适合训练的芯片专注训练,适合推理的芯片完成推理,适合端侧的芯片负责部署。更重要的是,要发挥异构算力资源的整体效能。

无论对中国还是全球,整合多元异构算力已不再是权宜之计,而是技术演进、成本压力和应用多样化之下的一个必然方向。

2025年5月,上海模速空间,无问芯穹公司门口。澎湃新闻记者 李佳蔚 图

中国算力资源的一大突出特点是多元异构。市场上主流CPU生态有5种以上,GPU生态则多达10种以上,不同的算力芯片、服务器形态、存储形态,以及网络形态组合配置在一起,可以形成成百上千的组合。

“没有用不完的英伟达GPU,也不是必须用英伟达的GPU。”夏立雪说,AI企业如今更关注“用对芯片”,而非“用贵芯片”。掌握整合多元异构算力的核心技术,是中国确保人工智能安全、可靠、可控的一部分。

他进一步谈到,“打开水龙头,我们可能不知道水是从哪个水库过来的,只知道它是标准化的自来水。同理,作为算力运营商,我们要调用不同的基座模型、使用不同的算力芯片,最终为AI企业提供标准化的算力服务。”

【对话夏立雪】 

澎湃新闻:这两年大模型技术更迭非常快,每年都有新焦点,你对行业变化有什么感受?

夏立雪:这两年人工智能发展飞速变化,前年我们在讨论大语言模型,去年多模态已经进入视野,今年的推理模型大家也习以为常了,技术飞快地迭代。随着模型能力增强,背后是模型的体量增大。

人工智能依然遵循Scaling Law(尺度定律),对算力的需求越来越大,大到了一个什么程度?大到了你不能再假设你的资源是无限的。前两年训练模型的时候,很多大厂有一个基本假设,算力是无限的,至少在做单一任务时算力是无限的。但是,现在这个假设的边界已经逼近,我们需要考虑,中国的算力资源是有限的,怎么去解决模型持续增长的问题?

DeepSeek提供了一个很好的例子,它没有用“大力出奇迹”的方式,而是用低成本、高效率的方式,在资源有限的情况下造出了一个好模型。所以,在打造更好的模型方面,现在我们需要更加精细化地把现有算力资源用好。

另外,我们还要考虑供需关系的问题。比如,当很多算力资源被用在模型训练上,而推理落地的算力需求也在上升,那后者的资源就有限了。这中间,算力资源的供需匹配和性价比是一个很大的挑战。

当前,我们特别需要把没有被用起来的算力资源充分利用,同时要确保使用效率高。如果你拿来的算力不好用,大模型跑得非常卡,三秒才出一个字,那没人愿意用。

2025年5月,上海模速空间,无问芯穹办公空间一隅。澎湃新闻记者 李佳蔚 图

澎湃新闻:算力资源有限,是中国特有的还是全球性问题?

夏立雪:大多数国家都面临这个问题,只是有些国家会选择放弃。在AI大模型的赛道上,目前来看主要是中国和美国仍在坚持,随着模型不断增大,都会面临算力资源有限的瓶颈。

澎湃新闻:你提到算力供需错配,这是怎么回事?这个市场痛点如何解决?

夏立雪:现阶段,算力市场的供需错配是比较明显的。举个简单例子,由于使用习惯问题,大家都优先选择所谓的高质量算力,最尖端的GPU,它经过市场验证,一定好用。但问题是,每家企业都需要用尖端卡吗?对性能要求不高的企业,用一般性能的GPU行不行?不同企业需求不同,可以用不同的卡。如果所有企业都抢最尖端的卡,一方面成本极高,另一方面资源很快短缺。

事实上,市场上还有大量性能不错,但没有被关注或接受的算力,我们要让这些算力都被利用起来。这当中要解决一些问题,比如,这种算力和模型是不是适配,企业会不会用。异构卡出于不同的设计理念,会有很多性能差异,适配不同的任务,因此多种不同类型的卡展现出的效率差异会导致大规模分布式训练变得低效。

我们有一个公式,AI模型的算力=芯片算力×优化系数×多元异构能力。其中,优化系数是通过软硬件协同发挥芯片算力最大价值的能力;多元异构,则是让不同类型的算力资源都进入算力池,并实现算力适配的能力。

打开水龙头,我们可能不知道水是从哪个水库过来的,只知道它是标准化的自来水。同理,作为算力运营商,我们要调用不同的基座模型、使用不同的算力芯片,最终为AI企业提供标准化的算力服务。

2025年5月,上海模速空间,无问芯穹成立2周年的一处照片墙。澎湃新闻记者 李佳蔚 图

澎湃新闻:既然AI任务变得越来越多样化,芯片技术也越来越细分,是不是意味着算力应该用在最适合它的地方?

夏立雪:是的,企业手里有算力,一定要把它用好。算力需求本身是分层的,供给也应该分层。一些芯片更适合承担大模型训练的高吞吐任务,另一些则在低延迟、低功耗的推理场景中更有优势,还有些专为端侧部署设计,追求轻量化,实时响应。不同类型的AI应用,匹配最适合的算力资源,才能在性能、效率与成本之间找到最优解。

澎湃新闻:能否解释一下,在庞大的AI产业当中,你们具体提供怎样的产品和服务?

夏立雪:就像刚才说的,我们有点像一个“自来水厂”,从不同水库调取水源,经过统一标准化的处理,再供给到千家万户。我们也像是大模型算力的电商平台,你要部署AI应用,可以像在电商平台上购物一样,在我们这里选择不同芯片、不同模型,选购最适合自己的组合套餐。最终,我们希望让更多的企业能用得起算力,也用得好算力。

目前,无问芯穹拥有全球首个可进行单任务千卡规模异构芯片混合训练的平台,支持包括华为昇腾、天数智芯、沐曦、摩尔线程与AMD、NVIDIA六种异构芯片在内的大模型混合训练,集群算力利用率最高可达97.6%。

澎湃新闻:你是清华博士,也是“90后”,你怎么看如今越来越多的科学家和年轻人投身AI行业?

夏立雪:这两个问题在人工智能行业是有统一性的。也就是说,科学家创业和年轻人创业,在人工智能行业很普遍,也很匹配。人工智能是一个快速迭代的技术体系,现在很多技术都来不及写书、来不及成为教材,就已经被广泛应用起来了。和传统上我们先在学校学习,然后才进入行业应用的模式非常不同。

我们公司平均年龄只有32岁,比我更小,如果算上实习生,那平均年龄才28岁。2023年我们公司推出的第一个在业界打响名气的推理加速方法FlashDecoding++,通过异步方法实现注意力计算的真正并行,它就是一个年仅24岁的实习生作为主要贡献者实现的,那年她也拿到了我们公司最高荣誉“无穹之星”。所以在这个行业,年轻人大有可为。

澎湃新闻:来到上海,你对这座城市以及这里的人工智能发展环境有什么感受?

夏立雪:北京、上海都是人工智能很强的城市,有各自不同的优势。上海确确实实让我有很大的一个感触,就是它和年轻人的匹配,可能因为它的文化基因更加开放、更加活泼,年轻人生活工作在其中比较舒适。这种环境既有利于创新,也吸引了大量人工智能企业的聚集。

澎湃新闻:无问芯穹是否有融资压力,考虑上市吗?

夏立雪:我们有自己的技术理想,同时也考虑商业化落地。从公司发展角度,一方面我们会继续坚持一套自主、可控的技术方向,符合且服务国家需求;另一方面,我们不是一家研究院,我们乐于追求商业价值,不仅仅是给股东交答卷,更是要让技术接受市场的验证。我相信只要坚持做好两件事,既有技术的持续领先,又有商业化的成功,上市只是一个水到渠成的事情。

澎湃新闻:无问芯穹是首批入驻模速空间的企业,讲一个你对模速空间的深刻印象吧。

夏立雪:我们公司和模速空间共同成长,感情很深。模速空间为我们提供了全方位的贴心服务,并给予了大力支持。这里聚集了大量人工智能上下游企业,我经常上楼找其他同行聊一聊天,相互交换一些行业早期的信息和判断,这对各自发展都有好处。另外,我们很多合作也是这样达成的,有时模速空间两家企业相互合作,有时我们携手去服务外部的另一个客户。在这里,机遇非常多。

The End