一文读懂OpenAIDevDay：应用、Agent、代码，勾勒AI商业蓝图

考研资深辅导 2025年10月07日 11:03:19

如果说，前几天刚刚登顶 App 榜的 Sora 2 是 OpenAI 技术硬实力的直观展现，那么美国时间 10 月 6 日举办的 OpenAI DevDay，则更清晰地展示了 OpenAI 的野心。

整场发布会的内容可拆解为四个部分，除了 API 开放之外，其他三个部分一起构成了 OpenAI 的未来蓝图，也可能是所有 AI 公司的未来路径：构建一个以 AI 为绝对核心的全新软件生态体系。

发布会上展示的功能，大多可视为过去两年 AI 技术演进的线性延伸，并无太多意外之处。但 OpenAI 此次首次将这一蓝图更系统化、平台化地呈现出来。

现在，就让我们一起逐步拆解，这个宏大的蓝图都由什么构建而成。

一、LLM，作为软件的唯一入口

"LLM 即将成为所有软件的入口 "，这个在 2024 年人们脑中还略显模糊的想象，到 2025 年已然成为共识。

OpenAI 此次推出的 Apps SDK，基于已建成的 MCP 体系，首次将这一愿景的实现路径完整呈现出来。

Apps SDK 是一套完整的开发堆栈，允许开发者在 ChatGPT 内部构建真实、可交互的应用程序。通过这套 SDK，开发者可以连接自己的数据、触发具体操作、并渲染出完全交互式的用户界面。

此前，Claude、GitHub Copilot 等其他产品虽有工具使用能力，但只是将外部服务的结果以文本形式返回，缺乏真正的上下文理解和自然的交互界面。也就是说，过去的工具难以真正被 " 用起来 "，而 OpenAI 的 Apps SDK 让用户能在 LLM 中像在电脑上一样使用 App。

现场展示了这样一个案例：

当用户正在为宠物狗业务进行头脑风暴时，可以直接 "@" 出 Canva，它会立刻理解之前用户和它聊到的所有点子，并根据 " 色彩丰富、异想天开 " 的模糊要求，生成一系列精美的海报。

如果灵感迸发，用户甚至可以要求它把其中一张海报直接扩展成一份完整的商业计划书（Pitch Deck）。

而当业务需要扩张时，ChatGPT 会根据上下文建议用户考虑 " 匹兹堡 " 这个城市，并无缝唤起 Zillow 应用，直接扩大到全屏，帮助寻找合适的房源，用户只需要在 ChatGPT 内提出新要求，就能让它筛选出 " 带院子的三居室 "。

接着，用户还可以跟它继续沟通，在 ChatGPT 里问它诸如 " 这个房子离狗狗公园有多远 " 之类的问题。

这一系列操作行云流水，背后展现的是 Apps SDK 将不同应用无缝融合的能力。

App 不再是孤立的程序，而是能随时被调用、能完全理解对话上下文、并以视频、地图等丰富形态呈现结果的智能插件。用户无需在不同软件间切换，只需通过对话，就能在一个统一的入口中，让最合适的工具在最恰当的时机出现，并协同完成一项复杂的任务。

OpenAI 发布的重要进展是基于 MCP，使开发者可以设计其应用的逻辑和界面。结合 GPT 本身对图像的识别能力，它让 App 更 " 自然 " 地融合在了对话过程中。

因为对话和理解的便捷性，尤其是 OpenAI 在这场展示中着重强调的对上下文的记忆和理解，用户可以很容易地在 GPT 中调用多种 App 去完成同一个工作。

（演示中有一段跨对话记忆的展示，ChatGPT 在另一个对话中延续了上一个对话的话题）

这种强大的上下文理解能力，正是 LLM 有望成为主流软件入口的核心竞争力之一。

而 App 也不再是功能孤岛，而是能被随时唤醒、能充分理解对话背景的 " 插件 "，并以最合适的用户界面融入当前的对话流中。

用户的主入口只有一个，就是 ChatGPT 的对话框。

那如何让 App 更好地适应用户需求，和对话更好的连接，以推动万物都在 LLM 内的大计呢？

这就要靠这场发布会的第二部分，AgentKit 了。

二、Agent 时代来的太慢，我们来推一把

此前行业间普遍将 2025 年称作 "Agent 元年 "，可如今时间已行至 10 月，市场上却始终未出现能复刻去年 Manus 那般、引发行业震荡的现象级 Agent 产品。

OpenAI 希望让 Agent 时代来得更快，他们推出了号称 " 最简便、快捷 " 的 Agent 开发工具包—— AgentKit。

面对 Dify、Coze 等市场主流工具，OpenAI 的答案是：让一切回归可视化。

AgentKit 的核心是一套可视化的画布 "Agent Builder"，开发者不再需要从零开始编写代码，而是通过拖拽和连接不同的功能节点，比如文件搜索等，来直观地设计和测试复杂的业务流程。

此外，AgentKit 还提供了名为 "ChatKit" 的可嵌入聊天组件，让开发者能轻松地将具备品牌定制能力的聊天界面集成到自己的应用中。

同时，它还有一个 Connector 功能，可以直接把 Agentkit 的 Agent 工具建构和企业内部数据和工具联系到一起。

为了展示 AgentKit 的便捷性，产品经理 Christina 在现场仅用了 8 分钟，从零开始为一个静态的 DevDay 活动官网构建并上线了一个智能问答 Agent。

从演示中可以看到，AgentKit 只有 Agent、End（结束）、Note（笔记）三个功能节点，各个 Agent 间，可以用条件、同时进行和用户许可三个逻辑点决定分叉走向。

每个 Agent 中，可以使用文件搜索、安全防护和 MCP 应用这三个工具。也可以将它们作为功能点加在外部。

目前看，这个 AgentKit 并没有整体在设计逻辑上超越 Dify 类工具很多，但确实更精简，更易用。

但是，如果想让习惯了 Dify 类用户真正转投 OpenAI 门下，还有两个重要的原因：

第一，是 RFT（强化学习微调）的定制。

第三方工具只能将 GPT 作为 API" 黑箱 " 调用，而 AgentKit 则能深入模型内部进行优化。目前，OpenAI 已经开始实验对 GPT-5 的 RFT 功能，开发者可以通过 RFT 来定制 OpenAI 的推理模型，还可以专门训练模型，让其学会在最恰当的时机、以最优的方式调用工具，从而实现更好的推理效果。

这对于想用 GPT 作为基础模型，达成最好的 Agent 效果的公司和开发者来讲，是个巨大的优势。

第二，是 AgentKit 的 Evals 板块。

它增加了 " 数据集构建 "、" 跟踪评估 " 和 " 自动化提示优化 " 等能力，允许开发者对工作流进行端到端的评估，精准定位并修复问题。这对于 Agent 开发而言，确实十分便捷。

今天的展示，不禁让我想到了当年 OpenAI 发布的 Agent alpha 版本，就是 GPT Store 的命运。当时，模型主要依赖上下文，无法有效调用工具和数据，导致应用场景受到很大限制。而当下，Agent 面临的一些具体落地问题，这个框架是否能够解决还是疑问重重。

但是，OpenAI 已经开始做了，这些问题也许可以更快地找到解法。

三、Codex，小露了未来编程的一手

不论是开发 Agent，还是部署 App，最底层的都是编程。

据 Sam Altman 介绍，自八月上线以来，Codex 已经处理了 40T 的 token，成为 OpenAI 增长最快的产品之一。从程序员社群的反馈来看，Codex 的出现确实让 Claude 一直以来的编程王者地位摇摇欲坠。

本次发布会中，Codex 正式从研究预览版转为正式版（GA），其主要更新来自于对企业和工程团队的深度支持，具体可以分为三个方面：

首先是 Slack 集成。这是一个被社区呼吁已久的功能。现在，团队可以直接在日常沟通的 Slack 频道中调用 Codex，让它在对话流里直接回答技术问题或编写代码片段，无需切换应用。

其次是推出了全新的 Codex SDK。这使得企业可以将 Codex 的能力作为模块，自动化并扩展到自己内部的开发工作流中，让 Codex 能更好地融入企业现有开发体系。

最后，OpenAI 提供了一套新的后台管理与报告工具。这包括了环境控制、监控、分析仪表盘等一系列功能，让企业的管理者能够更好地追踪和管理 Codex 在组织内的使用情况。

但这些升级，远不如现场最后的那段演示来得震撼。演示者 Raman 的目标是仅通过对话，让现场的语音助手调用 Codex SDK，命令它做一个滚动的开发者名单。Codex 在后台实时修改了前端应用的 React 代码，屏幕上立刻开始滚动开发者的姓名。

这个场景就是 OpenAI 预想的软件开发的未来——你甚至不需要看到代码，软件就可以在与你的对话中，实时地自我迭代和进化。

四、API 开放：GPT-5 Pro、Sora 2 全面上线

除了上述三个构成全新生态的板块，发布会第四部分是相对传统的 API 更新。

首先，OpenAI 迄今为止最强大的模型 GPT-5 Pro 正式通过 API 向所有开发者开放。

其次，为了普及语音交互，OpenAI 发布了一款更小、更便宜的语音模型 GPT Real-time mini。它的成本比之前的版本降低了 70%，但保留了同样优秀的音质和情感表现力，无疑将大大降低开发者构建语音应用的门槛。

而其中最重要的是 Sora 2 API 的开放。这意味着，开发者终于可以将 OpenAI 顶级的视频生成能力，集成到自己的产品中。

这个 API 的开放，表明未来在各种应用中，我们都可以方便地用上 Sora 2 来创作内容了。

五、商业帝国的轮廓，已经盖住了 AGI 的图景

今年的旗舰模型 GPT-5，尽管依旧强大，却缺少了当初 GPT-4 发布时那种跨时代的惊艳感，它更像是一次稳健但可预期的迭代。

Sora 2 的发布也是如此，其真正的惊艳之处，并非视频生成技术本身相较于早它发布的 Veo 3 等竞品。而是其产品团队精准洞察到了社交媒体的下一个爆点：将真实的人物无缝融入 AI 生成的视频中。

这是一个天才的产品构想，但它的光芒更多来自于商业嗅觉，而非底层的技术革命。

此次 DevDay，正是这一趋势的集中爆发。无论是试图将所有应用纳入对话框的 Apps SDK、旨在统一开发标准的 AgentKit，还是面向企业深度定制的 Codex，OpenAI 的每一步动作，都在沿着一条早已清晰的路径深耕：搭建一个以自家大模型为绝对核心、封闭且极具掌控力的软件生态。

只是，我们分明能感受到，OpenAI 早年那种自带的神秘感与对未知领域的探索气质，正变得越来越淡；曾经让人肾上腺素飙升的 " 惊艳感 "，似乎也在慢慢褪色。

如今的 OpenAI，商业帝国的轮廓愈发清晰，甚至已经隐隐盖住了通用人工智能（AGI）的远景图景。

The End

相关文章