跳至主要內容
OpenAI

2025年7月1日

Genspark 推出採用 GPT‑4.1 和 OpenAI Realtime API 技術的零程式碼個人智慧體。

僅靠著 20 人的團隊,在短短 45 天內達成年營收 3600 萬美元的成績。

Genspark 標誌以白色呈現,背景為閃閃發光的深色沙粒與岩石
載入中…

Super Agent 是一款可自訂的零程式碼 AI 智慧體,由 Genspark(在新視窗中開啟) 精心打造,這款智慧體可協助使用者將各種現實世界的任務自動化,例如打電話、製作簡報,或將食譜轉換為短影片等。

Super Agent 採用 OpenAI 的多模態模型與 Realtime API,支援文字、圖像與語音等任務,讓使用者只需簡單提示,就能自動化執行複雜的工作流程,完全無需撰寫程式碼。這套系統一推出便大獲成功:短短 45 天內,Super Agent 就在強勁的使用需求驅動下,實現 3,600 萬美元的年經常性營收 (ARR)。 

「OpenAI 從一開始就一路支持 Genspark。他們的 API 不僅支援我們的模型,也幫助我們這支僅 20 人的團隊,以遠超外界預期的速度完成開發、上線與擴展。
Genspark 技術長暨共同創辦人 Kay Zhu

從搜尋引擎邁向智慧體的新時代

Genspark 最初以 AI 搜尋引擎的形式推出,目的是幫助消費者與專業人士整合並結構化資訊。到了 2024 年底,使用者行為開始出現轉變:他們不再只滿足於獲得答案,而是期待看到具體成果。他們開始不只要求「幫我整理這個市場的重點資訊」,而是進一步想要簡報稿、影片腳本,甚至後續的電子郵件內容。同時,模型的能力也在快速提升。更大的內容視窗、更強的推理能力,以及全新的多模態 API,讓自動化整個工作流程 (不只是資訊檢索) 變得越來越可行。

使用者需求轉變與模型成熟度提升,促使團隊做出大膽決策:2025 年 4 月,Genspark 由搜尋引擎轉型,全面擁抱自主式 AI。

運用 OpenAI 多模態模型打造零程式碼自主智慧體

2025 年 4 月,Genspark 推出了 Super Agent:一款完全自主、零程式碼的智慧助理,能執行撥打電話、設計簡報、生成影片等多項任務。在技術層面,該平台協調九個專用的大型語言模型和超過 80 種整合工具,並將各項任務動態指派給最合適的元件執行。

OpenAI 的模型是此系統的核心。GPT‑4.1 負責研究和結構化輸出,具備更強的指令遵循能力和 100 萬 token 的內容視窗大小,讓智慧體能夠完整處理長篇文件而不發生截斷。嚴格的 JSON 輸出設計確保下游工具能穩定取得結構化回應,同時自動化快取提示可降低延遲與 API 成本,對多步驟工作流程而言尤為重要。在圖像產生方面,該平台則是透過 OpenAI API 使用 GPT‑image‑1 模型執行任務。

由於系統完全零程式碼,使用者無需操心這些技術方面的細節。使用者只需簡單描述需求,例如「幫我打電話給牙醫」、「整理報告重點」、「做個簡報」等,後續就能完全交由 Super Agent 處理。

See how Super Agent creates AI-powered slides, sheets, and phone calls using simple prompts, no code required.

利用 AI 處理離職通話

Super Agent 最受矚目的功能之一是「代打電話」(Call For Me),這是一個能為您撥打真實電話,並進行對話的 AI 功能。沒有制式話術,也沒有繁瑣轉接。無論是預訂餐廳還是重新安排配送,這個智慧體都會運用 OpenAI Realtime API 與語音轉語音功能,自然且即時流暢地進行對話。

整段互動由一套雙層系統所驅動:Realtime API 負責即時對話管理,陰影模型則透過訊息佇列,持續監控並引導整體互動流程。結果實現了快速且連貫的雙向對話,即使通話中有等待音樂或人類模糊的回應,也能順利進行。在日本,有一個使用案例迅速走紅:使用者請智慧體替他們向僱主打離職電話。這類對話涉及深度的人際互動,多數人不曾預料 AI 智慧體竟能勝任。 

除了打電話之外,使用者還仰賴 Super Agent 來製作個人化內容。只要請求製作一份蒸汽波風格的簡報,智慧體便會協助草擬投影片,利用 GPT‑image‑1 產生風格鮮明的封面圖片,並完成簡報整合。在影片製作方面,它也能逐個場景撰寫劇本、產生圖像,並組合成適合發佈到 Instagram 的短影片。

這些使用案例之所以能夠實現,主要歸功於 OpenAI 的多模態技術、Genspark 的快速執行能力以及與 OpenAI 新創團隊的緊密合作。Genspark 定期與 OpenAI 解決方案架構師會面,分享最佳做法、微調工作流程,並最佳化模型效能。他們是最早利用 Realtime API 推出語音體驗的團隊之一,而且持續提供回饋,協助推動模型的改進。

「我們選擇與 OpenAI 合作,除了看重其模型在多模態技術上的優異表現,也因其為開發者提供了出色的整體體驗,」Zhu 表示。「OpenAI API 的設計幫助我們快速前進,從上線、偵錯到擴展都沒有阻礙。」

UI from Genspark's Super Agent, displaying the product's ability to generate a detailed report and slide deck based on a user's prompt

實現破紀錄的成長,且全程未投入任何付費行銷

Super Agent 上線後短短一個多月,Genspark 已經:

  • 在短短 45 天內達成年營收 3600 萬美元
  • 70 天內推出八項主要智慧體功能

這所有成果由一支僅 20 人的團隊達成,且完全未使用付費廣告。這波成長完全是自然發生的,全仰賴產品自身的傳播力與用戶的真實推薦。Super Agent 的魅力有很大一部分來自於其易用性。使用者無需建立工作流程或設定參數。他們只要說出需求,智慧體就能代勞一切。

與 OpenAI 攜手,進一步推進自主式 AI 的發展

接下來,Genspark 計劃拓展到更多領域,讓自主式智慧體能創造更大價值,例如能操作您所瀏覽的各種內容的 AI 瀏覽器,以及用來產生格式豐富的文件的 AI 文件工具。OpenAI API 依然是團隊快速開發與加速上線的核心利器。

「成立 Genspark 的初衷,是為了超越聊天介面,提供整合多元功能的 AI 工作平台,」Zhu 表示。「有了 OpenAI API,我們才能以破紀錄的速度實現這一切。」

想進一步了解適用於企業的 ChatGPT 嗎?