Agent进入生态战：腾讯WorkBuddy的底牌与AICoding的成本账

考研资深辅导 2026年06月11日 10:33:28

OpenAI、Anthropic、字节、阿里、百度 …… 几乎所有大厂都在同一时间把 Agent 能力推到了产品级。OpenAI 把 Codex 合并进 ChatGPT，引发了 " 通用入口吞并垂直 Agent" 的行业大讨论；与此同时，硅谷和国内的 AI Coding 工具都进入了一轮密集迭代。

然而，随着 AI 生成代码量的指数级爆发，行业正面临一个普遍的 " 提效悖论 "：员工个人的代码产出速度大幅加快，但企业整体的项目交付周期、需求响应速度（即组织级效能）却并未见同比例提升。此外，海量 AI 代码的 Review 瓶颈、AI 幻觉带来的生产环境风险，以及底层大模型同质化下的生态竞争，正成为云厂商和企业共同迈入的 " 深水区 "。

近日，在 2026 腾讯云 AI 产业应用大会期间，速途网与多家媒体采访了腾讯云副总裁、CodeBuddy & WorkBuddy 负责人刘毅与 CodeBuddy & WorkBuddy 商业化负责人张翔，试图了解腾讯云在内部数万名工程师中打磨出的 "AI 原生组织 " 实战经验。

一、个体提效容易，为什么组织提效却很难？

" 到 2025 年底，腾讯大部分团队 90% 以上的代码都是用 AI 生成的，程序员甚至能同时指挥 4 个 AI 助理并行开发。" 当腾讯云副总裁、CodeBuddy & WorkBuddy 负责人刘毅抛出这组数据时，还在为 AI 渗透率发愁的企业应该会感到更加焦虑。

但他却话锋一转，抛出了一个另一个真相：个体效率的提升，并不自动等于组织效率的提升。

在行业中，衡量 AI 编码效果的常见指标是 " 代码接受率 " 或 " 编码时间缩短比例 "。而在组织层面，刘毅盯的是另一个指标——需求吞吐率。

在他看来，需求吞吐率代表一个团队把用户需求快速转化为上线功能的速度。" 对于软件企业来说，需求吞吐率代表一个组织的创新速度，能快速响应市场和用户的需求，快速把需求承载的用户价值真正交到用户手里，我们内部把它定义为 AI Coding 的北极星指标 "。

" 如果不重新定义北极星指标，企业很容易陷入 AI 生产力幻觉。" 刘毅说。

此前，速途网在对企业 AI 实践的长期观察中发现，很多企业引入 AI 工具之后，个体层面的提效非常明显，程序员写得更快、文案产出更多、客服响应更短，然而组织层的关键指标（即人均产值、新功能交付周期、跨部门协作效率等）几乎看不到显著变化。

围绕 " 需求吞吐率 " 这个北极星指标，腾讯内部走通了一条从超级个体到超级团队的四步路径：先培养超级个体；再把经验沉淀成技能、专家、AI 助理，变成组织资产；接着把这些沉淀融入财务、行政、招聘、法务这些生产流程；最后配套 AI 治理，把成本、安全、权限、风险管控全部跟上。

当然，腾讯的实践过程并非没有波折。刘毅坦言，AI 幻觉曾经把问题带入生产环境，我们也交过学费。2026 年行业开始强调 "harness"，给 AI 更多约束，快速校验。另外，人性上员工不一定愿意分享自己的经验，所以企业内部要用激励和晋升通道来引导。

二、AI 写代码之后，人类专家 " 退居二线 "，AI 开始 " 审查 AI"

AI Coding 的副作用，2026 年开始集中暴露。" 如果组织内的代码以 10 倍速度增长，顶层专家天天除了评审代码，不用干别的活了。" 刘毅描绘的这个场景，正是当下无数技术总监的梦魇，人类肉眼的 Review 速度，已经远远跟不上 AI" 吐 " 代码的速度。

面对行业级的 " 代码爆炸 " 危机，刘毅在采访中称腾讯做了三件事。

首先是人类专家守架构。在他看来，AI 可以大量生产代码，但不能随便改架构。架构一改动就会触发告警，由最有经验的专家判断新代码是否需要重构。

另外，腾讯还引入 AI review AI，但评审的 AI 和生产代码的 AI 不是同一个，这是为了让 AI 在另一个角度、决策和约束下去发现代码的隐患。

最后是质量左移，用 AI 大量生产自动化测试代码。以前想用测试代码覆盖整个项目，100%UAT 是个巨大成本，AI 时代这个成本不再是问题，可以在 UAT 阶段直接拦截 AI 生产的风险。

刘毅还分享了一个内部实践，团队从第一天起就做成 AI 原生组织，极度扁平，同时，他还要求所有团队的上下文都是透明的、共享的，即所有代码、需求、反馈、设计都在一个共享的 " 大餐 " 里。在这种模式下，AI 的开发范式转变为人类给 AI 提需求，AI 在非常透明且充分的上下文工作，不会因为信息隔阂而低效，它根据人类意图拆解任务，找到上下文，生成制品，然后结果又回流到大餐里。

可见，" 用 AI 监督 AI" 已经从一句口号，变成了 2026 年 AI Coding 的基础设施。

三、生态，是 AI Agent 的下半场

据腾讯 2026 年 Q1 财报披露：以日活跃账户数计，WorkBuddy 已成为中国最受欢迎的效率 AI 智能体服务。在 2026 腾讯云 AI 产业应用大会上，WorkBuddy 企业版及办公智能体套件 Agent Suite 正式发布。

那么，衡量企业 AI 落地健康程度的核心指标到底是什么？刘毅在采访中表示是需求吞吐率与 AI 留存的平滑度。至于 WorkBuddy 为什么能跑出行业第一，底牌在于其底层嵌入了腾讯打磨两年多的 Coding Agent OS 内核，这个强大的内核让 WorkBuddy 处理各种场景游刃有余。

不过，刘毅在采访中也直言，字节、阿里都已经推出类似产品，前面基于 Coding Agent 积累的优势也不会持续，最后决胜负的是生态。在速途网看来，这与行业对 AI Agent 的判断一致，上半场的关键词是 " 模型 "，下半场的关键词正在变成 " 生态平台 "，而这个转变，正在以肉眼可见的速度发生。

在生态之外，模型调用的成本也是行业热议的话题。随着 DeepSeek 等模型将百万 token 定价拉低至 " 永久二五折 "，企业开始用 " 每任务成本 " 而非 " 每百万 token" 来评估 ROI。

CodeBuddy&WorkBuddy 商业化负责人张翔认为，不同的模型价格不同，不同的任务复杂度也不同，重构一个大型工程和修改一个小模块，token 消耗天差地别。我们在 WorkBuddy 平台内建立了统一的货币体系，打通各个智能体（包括腾讯文档等套件），用户提交任务前可以预估算成本。

四、写在最后

"2026 年下半年，企业级 AI Agent 通用生产力产品会出现快速增长、快速爆发、快速落地的阶段 "，刘毅这样判断企业级 AI Agent 接下来的发展，在他看来，用户用习惯一个 AI 入口之后，离开工作岗位也会接着用。

速途网也判断，AI Agent 从 " 个体提效 " 到 " 组织提效 " 的拐点正在到来，谁能先跨过去，用工程化的手段守住质量红线，谁就是下一个十年的基础设施。

The End

相关文章