即梦总算赢了一次豆包

博主:fm5i0dxdb2j0考研资深辅导 2025年05月14日 15:33:16

打完与 DeepSeek 和腾讯元宝的 AI 助手之战后,字节又盯上了视频生成。

据字母榜(ID:wujicaijing)获悉,进入 5 月份以来,字节进一步加大了对旗下视频生成应用即梦 AI 的重视程度。直观表现之一是,即梦 AI 在苹果中国区 App Store 免费应用下载榜上排名急速上升。

从 5 月 13 日开始,即梦 AI 已经超越字节旗下豆包和红果短剧两大常年霸榜前二的应用,首次登顶。

字节之前,另一短视频平台快手,其对 AI 视频生成的重视度,则是先在组织架构上体现了出来。

近期,快手通过成立可灵 AI 事业部,将可灵 AI 提升至与主站、商业化、电商等并列的一级业务部门。

快手之前,字节也曾将 2023 年后成立的 AI 应用部门 Flow,和模型研发部门 Seed,先后升格为与抖音、飞书、火山引擎等并列的一级部门。

如今,内外部的压力都给到了抖音原 CEO 张楠。环顾字节新组建的 AI 业务,几乎只剩下张楠负责的即梦 AI,暂未迎来业务升级机会。Flow 之外,即梦 AI 是字节探索 AI 应用的另一主路。某种意义上,即梦 AI 的成败与否,直接关乎着张楠能否重回字节权力核心。

去年 2 月宣布辞去抖音集团 CEO 一职时,张楠称自己未来将把精力聚焦在剪映的发展上。作为抖音在 2019 年 5 月推出的一款视频剪辑软件,从核心业务抖音轮岗至相对边缘业务剪映的张楠,不免被外界贴上了 " 流放 " 的标签。

但张楠的野心则是寄希望于押注 AI,实现内部再创业。OpenAI 成了张楠下定决心的催化剂。

2022 年 OpenAI 旗下文生图模型 DALL-E 2 的发布,让张楠首次直观感受到 AI 图像生成给传统内容创作方式所带来的颠覆式变革威力,这既是字节 CEO 梁汝波口中 " 会产生新的创作平台 " 的机会,也是促成张楠转岗剪映的原因之一。

宣布辞职 3 个月后,去年 5 月,张楠交出了自己转岗后的首份作业——定位 AI 创作社区、支持图片和视频生成的即梦 AI,后者成了张楠再造下一个抖音的机会所在。

据 " 晚点 LatePost" 报道,目前张楠把更多精力都花在了即梦 AI 上,剪映则交给了自己的直管下属去带。

QuestMobile 数据显示,截至 2025 年 3 月,即梦 AI 月活用户数达到 893 万,可灵 AI 则为 180 万。两款产品数据量上的差距,一定程度上反映了字节和快手对视频生成产品的不同策略:即梦 AI 更倾向发展普通用户,优先追求用户扩张;可灵 AI 则更重视专业用户的渗透,优先追求收入增长。

但对于走在追求用户扩张路上的即梦 AI 而言,其不足千万的月活,距离张楠想要实现的规模效应,还差着 " 十万八千里 " 的距离。毕竟,对比内部另一明星 AI 应用豆包,同期月活已经超过了 1 亿用户。

想要重回字节核心,张楠起码要证明即梦 AI 有不输于豆包的潜力。

在这场视频生成领域的竞争中,张楠原本有望带领字节创造领先优势。

去年 2 月 Sora 亮相后,一众国内 AI 厂商都开始着力打造 " 国产版 Sora"。早在可灵 AI 发布前 1 个月,去年 5 月,即梦 AI 上线之初便推出了视频生成功能。但因为生成效果一般,即梦 AI 并未迎来破圈效应。

张楠错失的机会,落到了快手头上。去年 6 月,快手可灵大模型上线,成为全球第一个与 Sora 一致采用 DiT 路线,且直接面向普通用户开放的视频大模型,使得可灵 AI 短时间内便收获了数百万用户。

直到去年 9 月借助发布 PixelDance 和 Seaweed 两款视频生成大模型,字节才逐渐稳住阵型。两个月后的同年 11 月份,即梦 AI 拿下视频模型首发资格,成为公众免费体验的主要入口。

经过近一年发展,即梦 AI 和可灵 AI,从视频模型性能到产品功能,正逐步趋同。这种趋同的直观表现之一,便是对 DeepSeek R1 的接入。

3 月份,在抖音和快手都没有宣布接入 DeepSeek 的前提下,即梦 AI 和可灵 AI,相继选择接入 DeepSeek,用以辅助用户为图片和视频生成灵感词。

图注:可灵 AI 产品页面

在产品功能上,即梦 AI 和可灵 AI 均能够实现图片生成、文生视频、图生生成、数字人等。具体到视频生成领域,两款产品均提供免费版和会员版。免费版中,生成视频时长包括 5s 和 10s 两种,生成 1s 视频需耗费 2 积分(可灵 AI 中,积分被称为灵感值)。

除了使用每日登录赠送的免费积分外,用户想要获取积分还有两种途径:一是直接充值,1 块钱可购买 10 积分;二是开通会员,即梦 AI 连续包月 69 元,每月赠送 1080 积分,可灵 AI 连续包月 66 元,每月赠送 660 灵感值。

单以价格论,字节再次发挥了自己在大模型领域的性价比策略。值得一提的是,开通会员后,用户除了享受更多积分奖励外,还能够在生成作品中去除品牌水印,以及延长生成视频时长等。

图注:即梦 AI 产品页面

科技大厂中,字节和快手,也成了做视频生成产品最激进的两家。在 Sora 掀起浪潮后,百度创始人李彦宏便明确表示 " 不追 Sora"。

这也跟两家公司的短视频主业,更易受视频生成影响有关。

2019 年剪映等视频剪辑工具的出现,帮助短视频平台内容生态从偏向 PGC(专业机构生产内容)转向 UGC(用户生产内容),大大降低用户创作门槛。

如今,随着 AI 生成视频产品的出现,其有望进一步拉低每一个普通人创作视频的门槛,进而带动内容创作形式和数量的新的爆发。

除此之外,具体到短视频平台的业务层面,图片 / 视频生成还能帮助提效平台的商业化需求,如帮助字节和快手广告客户低成本、便捷地制作视频。

产品功能趋同、月活用户数更高的即梦 AI,并未像可灵 AI 一样,等来业务升格机会,原因之一便出在字节和快手两家公司的 AI 发展策略上。

不同于快手力出一孔,将所有 AI 雄心都押宝在视觉生成上,字节则选择了全面出击,除了主打视觉生成的即梦 AI,内部还有 AI 助手类产品豆包,娱乐陪伴类产品猫箱,以及 AI 教育类产品豆包爱学等等。希望将 AI 赛道的诸多可能性,都一网打尽。

但这样带来的代价便是,各个团队之间不可避免陷入内部赛马机制。

去年 2 月份张楠转岗剪映之前,围绕大模型技术开发与应用,字节当时已经有了三支团队:位于新加坡的 TikTok 产品技术负责人朱文佳团队,位于西雅图的技术中台旗下 Data-AML(数据 - 应用机器学习) 负责人项亮团队,以及位于北京的字节 AI Lab(人工智能实验室)总监李航团队。

彼时,有知情人士告诉字母榜,剪映所在的影像团队驻扎在厦门,这也意味着随着张楠入局 AI 大模型之争,仅国内,字节就有了两支在合作中又相互竞争的团队。

这样的赛马机制,更是直接体现在即梦 AI 上。不同于可灵 AI 在单一模型上迭代升级,即梦 AI 接入的则是不同团队研发的视频模型。

目前,即梦 AI 可供用户调用的五款视频生成模型,分别来自四个不同研发团队:视频 1.2 版本来自 AI lab;视频 P2.0 Pro 版本来自 PixelDance;视频 S2.0 Pro 和视频 S2.0,均来自 Seaweed aipha;视频 3.0 版本来自 Seedance 1.0。

除了因赛马机制而暂时难获业务升格机会之外,相比即梦 AI 所处的小众赛道的视频生成,对话应用显然是字节当下更需应对的挑战。

DeepSeek 爆火之前,豆包已经顺利跻身国内第一大 AI 助手产品。但年初以来,凭借率先接入 DeepSeek 所攫取的红利,腾讯仅用字节约 1/10 的时间和小得多的投放预算,便将元宝的用户规模做到了豆包的约 1/4(截至 3 月份,豆包月活 1.16 亿,腾讯元宝 4100 万)。

腾讯之外,包括阿里在内的科技大厂,也重新展现出了对 AI to C 的兴趣。对手林立之下,豆包的增长势头正在被遏制。根据 QuestMobile 数据,一季度周活跃用户数复合增长率方面,DeepSeek 为 58%,腾讯元宝为 23%,豆包只有 3.39%。

尽管即梦 AI 暂未成为字节的一级业务,但张楠手中仍握有破局之牌,AI 社区便是之一。

顶着超 1 亿月活的豆包,目前并未真正实现社区功能,其应用内可以看到 " 创作 " 页面,用户也可以分享创作案例,但是却还无法跟其他用户留言互动。

当下,AI 产品为了增强用户粘性,做社区已渐渐成为共识。近期,便先后有 Kimi 测试产品内社区功能,以及 OpenAI 被传正在测试社交网络的消息。

即梦 AI 成立之初,张楠便为其定下了 AI 创作社区的目标,并希望以此来打造 AI 版抖音。

甚至,据 " 智能涌现 " 爆料,去年 12 月,字节管理层还判断豆包等 AI 对话类产品可能只是 AI 产品的 " 中间态 ",长期更理想的产品形式,大概率需要更视觉化的用户体验、更低的用户使用门槛。因此,字节提升了即梦 AI 的产品优先级。

但在日新月异的 AI 领域,不仅模型技术在飞速迭代,行业对 AI 产品的认知也在时刻更新。从字节以往产品发展经历来看,现在还没有完整社区和更强生成能力的豆包,以后未必不会有。

参考抖音赛马胜出后吞并火山小视频、西瓜视频的前车之鉴,一旦豆包在规模效应上一路绝尘,未必不会重演新的吞并潮。

且这样的迹象已经发生。4 月中下旬," 晚点 LatePost" 报道,字节猫箱负责人梁琛奇离开,猫箱由星绘产品负责人西原(化名)接管,而星绘团队则计划并入豆包。这也意味着,原来同属 Flow 旗下 AI 产品的星绘,现在在组织架构上,成为豆包的一份子了。

即便即梦 AI 不会被豆包兼并,但随着多模态大模型技术迭代,用一个模型解决用户所有需求将从理论照进现实。如果豆包也融合了多模态能力,未必不会将更强生成能力直接融入其中。

目前,在豆包内选择 " 照片动起来 " 功能,用户已经可以完成文生视频和图生视频的操作。不过,对比即梦 AI,豆包内的视频生成功能,暂时只支持 5s 时长,还不支持例如分辨率和视频延长等更多功能。

面对用户规模和技术迭代的双重压力,即梦 AI 究竟是能够成为字节新的一级业务部门,还是沦为豆包的一个子功能,就看张楠的表现了。

The End