
30%
依托 GPT-5.5,单任务 Token 开销减少幅度
90%
由智能体创建的内部 Pull Request 占比
作为一款现代终端工具,Warp(在新窗口中打开) 凭借其极速的运行体验、强大的协作功能、流畅的命令流设计以及 AI 原生的交互界面,在早期便赢得了广大开发者的青睐。随着编程智能体 (coding agent) 从实验阶段正式步入日常工程开发,Warp 敏锐地洞察到:终端天然是开发者与智能体协同工作的最佳阵地 — 在这里,指令下达、上下文语境、团队协作与代码审查早已实现了无缝交汇。
今年,Warp 成功将其终端客户端开源(在新窗口中打开),并由 OpenAI 担任该代码库的创始赞助方。与此同时,公司还创新性地推出了一种在开放环境下构建软件的新模式 — “开放智能体开发” (Open Agentic Development)。在该模式下,人类只需负责设定总体目标并监督最终成果,而智能体则包揽了工作规划、代码编写、变更测试以及提交 Pull Request 等繁杂的执行环节。
前沿 AI 模型的最新突破,使得这种大规模智能体编排的落地应用成为现实。在 Warp 的开源工作流中,GPT‑5.5 赋能智能体在更广阔的问题空间内进行逻辑推理,并妥善处理好各项前置工作以供人类最终审核。内部基准测试表明,在执行单项智能体编程任务时,GPT‑5.5 消耗的 Token 数量比 GPT‑5.4 减少了 30%。这一突破不仅显著提升了 Warp 的运行效率,更为其扩展长周期智能体工作流 (long-running agent workflow) 提供了强有力的支撑。
时至今日,Warp 已成功汇聚了近 100 万名开发者,并被超过 56% 的财富 500 强企业广泛使用。在 Warp 自身的工程团队内部,如今约有 90% 的 Pull Request 都是由智能体协同创建的。这一深度的亲身实践,让团队获得了极为宝贵的第一手洞察,也让他们深刻理解了实现长周期智能体工作流规模化所不可或缺的核心要素:可观测性、多方协调、记忆能力以及人工审查。
“我们相信,通过与社区携手监督一批智能体,我们能够以更快的速度交付更出色的 Warp 产品。对于这类系统所需的长周期编程工作,OpenAI 模型为整个过程的可持续性提供了切实保障。”
“开放智能体开发” (Open Agentic Development) 承载了 Warp 对软件开发未来走向的深刻洞见与重磅布局。在这个新模式下,智能体将全面承担代码编写的重任,而开发者则可抽身专注于明确核心意图、验证输出成果,并对最终交付的代码进行拍板。这些由人类做出的关键决策,将沉淀为未来智能体随时可调用的复用上下文 (reusable context),从而赋能整个系统在时间的推移中实现持续的自我进化。
Warp 坚信,只要底层的编排足够出色,智能体完全能比协作松散的人类团队产出一致性更高的代码。在这一愿景下,开源社区的运作逻辑也将迎来根本性重塑:人类的贡献将不再局限于亲力亲为的代码实现 (implementation work),而是全面升华为提供唯有人类才能具备的产品判断力与共同愿景。

要让智能体实现持久运行与高效并行,离不开共享内存、可复现环境、评估系统、权限控制以及协作机制等一系列核心组件的坚实支撑。为此,Warp 倾力打造了专属的云端编排平台 Oz,旨在跨越本地与云端环境,对海量智能体进行统一而高效的管理与调度。
据公司透露,在“开放智能体开发”工作流中,Warp 积极引入 GPT‑5.5 来驱动智能体,以协助高效管理繁杂的开源贡献。此外,在 Warp 针对长周期工程任务的内部深度评估中,OpenAI 模型在逻辑推理、任务规划、代码生成以及代码审查等关键环节,均展现出了极为强劲的综合实力。
Oz(在新窗口中打开) 扮演着“核心控制中枢”(control plane) 的角色,负责在本地与云端环境中统筹部署并协调各个智能体。开发者只需通过便捷的 Web 界面即可轻松启动智能体,灵活挑选预设技能与运行环境,按需配置底层模型与托管方案,并在长周期工作流执行期间对其进行集中的全局监控。



智能体一旦启动,便能在后台持续进行远程运作。与此同时,开发者可以随时查看运行实况、监控执行状态、审核生成的代码产物,甚至在云端与本地环境之间无缝流转工作流,而无需担心任何上下文语境的丢失。此外,Oz 平台还全面支持周期性工作流,使智能体能够像传统的定时任务 (cron job) 一样按计划自动执行。
随着时间的推移,智能体积累的状态信息会日益庞杂,此时要想保持其“专注力”并妥善保存各项关键决策便显得愈发困难。为了破解这一难题,Oz 巧妙地引入了上下文压缩、持久化记忆等先进技术,并为代码搜索、文件分析等特定任务配备了专属的子智能体”。这些举措共同发力,确保了智能体在执行冗长的扩展工作流时,依然能够保持极高的稳定性与可靠性。
在 Oz 平台内部,OpenAI 模型扮演着多重关键角色。以 Warp 智能体为例,系统会依据任务的类型与难度进行精细化分级,将那些更为复杂的编程与逻辑推理工作,智能路由给配置更强大的模型来处理。在应对那些极具挑战性的智能体编程工作流时,GPT‑5.5 正是 Warp 所依赖的 OpenAI 核心模型矩阵中的关键一员。不仅如此,Warp 还将 OpenAI 模型深度融入其评估流水线中,充当 LLM-as-a-judge(大模型裁判)系统,对智能体的产出与表现进行严格的评估与把关。
“我们发现,OpenAI 模型能够稳定提供前沿水准的智能表现,同时在完成相同任务时,消耗的 Token 数量与交互轮次 (turn) 都更少。对于那些需要在庞大问题空间内进行逻辑推理的编程任务,这些模型的表现尤为出色。”
归根结底,无论是推行“开放智能体开发”模式,还是打造 Oz 编排平台,本质上都源自 Warp 的同一项长期押注:软件开发的范式正在经历一场深刻演进 — 它正从过去开发者与编程助手之间的单点交互,全面跃升为一套能够在漫长时间维度下,统筹调度海量且持久运行智能体的庞大系统工程。
如今看来,这一前瞻性的长远布局已然成效斐然。去年,Warp 的年度经常性收入 (ARR) 实现了惊人的 35 倍增长;而自 2025 年第四季度以来,其企业级业务营收的增幅更是飙升了 500% 以上。公司方面坦言,如此强劲的增长势头,很大程度上得益于广大企业正迫切寻求更为灵活的手段,以实现智能体工作流的大规模扩展。
诚然,当前围绕智能体开发的底层工作流仍处于早期探索阶段,带有极强的实验色彩。通过将核心终端客户端全面开源,并依托“开放智能体开发”工作流践行“公开构建” (building in public) 理念,Warp 殷切期盼广大开发者能够深度参与其中。随着未来智能体自主性的不断攀升,Warp 希望能汇聚社区之智,共同塑造并引领编排、监督把控及结果验证体系的演进方向。
“谁也无法准确预判,智能体开发的未来究竟会呈现出怎样的一番图景,”Lloyd 感慨道,“但我们坚信,整个社区理应拥有参与并塑造这一未来的力量。”


