Genspark 推出基于 GPT‑4.1 和 OpenAI 实时 API 的无代码个人助手
并在 45 天内凭借 20 人团队实现 3,600 万美元年度经常性收入。

Genspark(在新窗口中打开)是 Super Agent 背后的公司,这是一款无代码、可定制的 AI 代理,帮助用户自动化完成现实世界中的任务,如拨打电话、生成演示文稿或将食谱转化为短视频。
Super Agent 利用 OpenAI 的多模态模型和实时 API,支持文本、图片和语音等多模态任务,使用户能够通过简单的提示将复杂的工作流程实现自动化,无需编码。该系统迅速发展:仅用 45 天,Super Agent 就达到了 3,600 万美元年度经常性收入,这得益于强劲的用户需求。
“OpenAI 自项目启动之初便一直支持 Genspark。他们的 API 不仅为我们的模型提供了动力,还帮助我们这个 20 人的团队以超出所有人预期的速度完成了模型构建、上线和规模化。”
Genspark 最初作为 AI 搜索引擎推出,旨在帮助消费者和专业人士整合信息,并实现信息结构化。到 2024 年底,用户行为开始发生转变。用户不再仅仅寻求答案。而是希望获得具体成果。他们不再问“总结这个市场”,而是要求生成演示文稿、视频脚本和跟进邮件。与此同时,模型能力迅速扩展。更长的背景信息窗口、更强大的推理能力以及新的多模态 API,使整个工作流程实现自动化而非仅仅检索信息变得越来越可行。
用户需求转变与模型成熟度的结合促使团队做出大胆决策:2025 年 4 月,Genspark 放弃搜索业务,全面转向智能代理 AI。
2025 年 4 月,Genspark 推出Super Agent:一款完全自主、无代码的助手,可拨打电话、设计幻灯片、生成视频等。该平台内部协调九个专用大型语言模型和超过 80 个集成工具,动态将每个任务分配给最适合的组件。
OpenAI 模型是该系统的核心。GPT‑4.1 负责处理研究和结构化输出,其改进的指令遵循能力及 100 万令牌的背景信息窗口,使代理能够完整处理长文档而无需截断。严格的 JSON 输出设计确保下游工具获得可靠的结构化回复,而自动提示缓存则降低了延迟和 API 成本,这在多步骤工作流程中尤为重要。在图像生成方面,该平台通过 OpenAI API 使用 GPT‑image‑1 模型。
由于系统完全无需编码,用户无需考虑这些技术细节。他们只需描述需求,如“联系我的牙医”、“总结这份报告”、“制作幻灯片演示文稿”,Super Agent 将自动完成后续操作。
See how Super Agent creates AI-powered slides, sheets, and phone calls using simple prompts, no code required.
Super Agent 最受关注的功能之一是 Call For Me,这是一个能够为您拨打真实电话并进行对话的人工智能系统。无需脚本。无需繁琐的转接。无论是预订预约还是重新安排送货,该系统都会利用 OpenAI 实时 API 和语音转语音技术,以自然流畅的方式实时处理对话。
该交互系统采用双层架构:实时 API 管理实时对话,而影子模型通过消息队列监控并引导交互。即使通话中包含等待音乐或模糊的人工回复,也能实现快速、连贯的双向交流。在日本,一个应用案例引发热议:用户让代理代为处理向雇主提交的辞职电话。这种深度人性化的交互正是大多数人未曾预期 AI 代理能处理的场景。
除了电话通话,用户还使用 Super Agent 创建个性化内容。请求一个蒸汽波风格的演示文稿,代理会起草幻灯片,使用 GPT‑image‑1 生成风格化的封面图片,并编译最终文稿。对于视频,它可以编写分场景脚本,生成图片,并制作一个适合 Instagram 的短视频。
这些用例得益于 OpenAI 的多模态能力、Genspark 的执行速度,以及与 OpenAI 初创团队的紧密合作。Genspark 定期与 OpenAI 解决方案架构师交流最佳实践、优化工作流程并提升模型性能。他们是首批使用实时 API 推出语音体验的团队,并持续提供反馈以推动模型改进。
“我们选择 OpenAI 不仅因为其跨模态的模型性能,还因为开发者体验,”Zhu 表示。“OpenAI 的 API 设计帮助我们快速推进,实现发布、调试和扩展而不会遇到瓶颈。”

在 Super Agent 上线仅一个月后,Genspark 已实现:
- 45 天内达到 3,600 万美元年度经常性收入
- 70 天内发布八项核心代理功能
这一切仅凭 20 人团队且未投放任何付费广告。该增长完全源于产品病毒式传播和口碑效应。Super Agent 的吸引力很大程度上源于其易用性。用户无需构建工作流程或配置设置。他们只需说明需求,代理便会自动处理后续事宜。
接下来,Genspark 将拓展至新领域,利用自主代理创造更多价值,例如能够处理浏览内容的 AI 浏览器和生成格式丰富文档的 AI 文档工具。OpenAI API 仍是团队快速开发并高效交付的核心技术。
“我们打造 Genspark 不仅是为了成为一个聊天界面,而是一个全能型 AI 工作空间,”Zhu 表示。“借助 OpenAI API,我们得以在创纪录的时间内实现这一愿景。”


