Przejdź do treści głównej
OpenAI

1 lipca 2025

Genspark oferuje niewymagające kodowania osobiste agenty oparte na GPT‑4.1 i interfejsie Realtime API od OpenAI

20-osobowemu zespołowi firmy udało się osiągnąć roczny przychód cykliczny (ARR) na poziomie 36 milionów USD w zaledwie 45 dni.

Białe logo Genspark na tle lśniącego, ciemnego piasku i skał
Ładowanie…

Genspark(otwiera nowe okno) jest firmą, która stworzyła Super Agent, niewymagającego kodowania, konfigurowalnego agenta AI umożliwiającego użytkownikom automatyzację codziennych zadań, takich jak wykonywanie połączeń telefonicznych, generowanie prezentacji czy stworzenie krótkiego nagrania wideo na podstawie przepisu.

Super Agent wykorzystuje modele multimodalne OpenAI oraz interfejs Realtime API, aby generować, tekst, obraz i dźwięk, pozwalając użytkownikom na automatyzację złożonych przepływów pracy z użyciem prostych poleceń, bez konieczności kodowania. Po udostępnieniu, w ciągu zaledwie 45 dni system Super Agent osiągnął roczny przychód cykliczny na poziomie 36 milionów USD dzięki ogromnemu zainteresowaniu użytkowników. 

„OpenAI wspiera prace Genspark od samego początku. Ich interfejsy API nie tylko leżą u podstaw naszych modeli. Umożliwiają one naszemu 20-osobowemu zespołowi tworzenie, udostępnianie i skalowanie rozwiązań szybciej, niż wydawało się to możliwe”.
Kay Zhu, CTO i współzałożyciel, Genspark

Od wyszukiwarek po agenty

Firma Genspark stworzyła pierwotnie wyszukiwarkę AI zaprojektowaną w celu usprawnienia syntetyzacji i strukturyzacji na potrzeby użytkowników konsumenckich i eksperckich. Pod koniec 2024 r. zaobserwowano zmiany w zachowaniach użytkowników. Okazało się, że nie oczekują już oni samych odpowiedzi. Chcą generować wyniki. Zamiast pytać o „streszczenie informacji z danego rynku” oczekiwali gotowych do użycia prezentacji dla inwestorów, scenariuszy do nagrań wideo i wiadomości e-mail. Jednocześnie szybko rozwijały się możliwości modelu. Większe okna kontekstowe, bardziej rozbudowane zdolności rozumowania i nowe multimodalne API umożliwiały w coraz większym stopniu automatyzację całych przepływów pracy, a nie tylko pozyskiwanie informacji.

Ewolucja oczekiwań konsumentów przy jednoczesnym rozwoju zdolności modeli skłoniła zespół do podjęcia odważnego kroku: w kwietniu 2025 r. produkty Genspark odeszły od podejścia opartego na wyszukiwaniu informacji w kierunku pełnej funkcjonalności agenta AI.

Budowanie niewymagających kodowania, autonomicznych agentów z wykorzystaniem modeli multimodalnych OpenAI

W kwietniu 2025 r. firma Genspark udostępniła produkt Super Agent: w pełni autonomicznego asystenta niewymagającego kodowania, zdolnego do wykonywania połączeń telefonicznych, projektowania prezentacji, generowania treści wideo itd. Silnik platformy wykorzystuje dziewięć wyspecjalizowanych, dużych modeli językowych i ponad 80 zintegrowanych narzędzi, dynamicznie przypisując konkretne zadania do najbardziej odpowiednich narzędzi funkcjonalnych.

Modele OpenAI odgrywają kluczową rolę w ramach tego systemu. GPT‑4.1 obsługuje prace badawcze i ustrukturyzowane dane wyjściowe z wykorzystaniem usprawnionych instrukcji bazujących na oknie kontekstowym obejmującym 1 milion tokenów, co umożliwia agentom przetwarzanie długich dokumentów w całości, bez konieczności przycinania. Dane wyjściowe Strict JSON pozwalają na generowanie wiarygodnych, ustrukturyzowanych odpowiedzi na potrzeby narzędzi końcowych, zaś automatyczne buforowanie poleceń pozwala na zmniejszenie opóźnień i kosztów API, co ma szczególne znaczenie w przypadku wieloetapowych przepływów pracy. Na potrzeby generowania obrazów platforma wykorzystuje model GPT‑image‑1 za pośrednictwem API OpenAI.

Dzięki braku konieczności kodowania użytkownicy mogą zapomnieć o wszystkich związanych z tym trudnościach. Po prostu opisują pożądany rezultat, na przykład „zadzwoń do mojego dentysty”, „streść ten raport” czy „przygotuj prezentację”, a Super Agent samodzielnie wykonuje konieczne czynności.

See how Super Agent creates AI-powered slides, sheets, and phone calls using simple prompts, no code required.

Wykorzystanie AI do wykonywania połączeń telefonicznych

Jedną z najszerzej komentowanych funkcji platformy Super Agent jest Call For Me, w ramach której AI wykonuje połączenia telefoniczne i prowadzi rzeczywiste rozmowy. Bez scenariusza. Bez niezręcznych transferów. Niezależnie od tego, czy chcesz zarezerwować pokój czy umówić termin dostawy, agent wykorzysta interfejs OpenAI Realtime API oraz funkcje generowania mowy, aby odbyć w Twoim imieniu naturalną i płynną rozmowę w czasie rzeczywistym.

Interakcje takie wykorzystują dwuwarstwowy system: Realtime API obsługuje dialog, zaś pracujący w tle model monitoruje i ukierunkowuje interakcję z wykorzystaniem kolejki wiadomości. Pozwala to na uzyskanie spójnej i szybkiej wymiany zdań, nawet w przypadku gdy rozmowa obejmuje muzykę w czasie oczekiwania na połączenie czy niejednoznaczne odpowiedzi człowieka. Do najszerzej komentowanych przykładów wykorzystań w Japonii należą przypadki, w których użytkownicy zlecają agentowi wykonanie telefonu do pracodawcy i złożenie wypowiedzenia Jest to głęboko ludzki rodzaj interakcji i zdolność agenta AI do przeprowadzenia takiej rozmowy jest dla wielu osób zaskakująca. 

Oprócz rozmów telefonicznych użytkownicy mogą również zlecać agentowi Super Agent opracowanie różnorodnych spersonalizowanych treści. Można poprosić o przygotowanie prezentacji dla inwestorów w stylu vaporwave, a agent opracuje kolejne slajdy, wygeneruje dostosowane stylistycznie obrazy z wykorzystaniem GPT‑image‑1, a następnie połączy to wszystko w spójną prezentację. W przypadku treści wideo agent może przygotować scenariusz do kolejnych scen, wygenerować potrzebne obrazy i połączyć całość w poście gotowym do opublikowania na Instagramie.

Zastosowania tego rodzaju są możliwe dzięki multimodalnym zdolnościom OpenAI, szybkości działania agenta Genspark oraz bliskiej współpracy firmy z zespołem wspierania startupów w OpenAI. Przedstawiciele Genspark regularnie konsultują się z architektami rozwiązań z OpenAI, dzieląc się najlepszymi praktykami, udoskonalając przepływy pracy i optymalizując wydajność modelu. Ich rozwiązanie było jednym z pierwszych, w których wykorzystano zdolności głosowe Realtime API, a przesyłane przez nich opinie pomagają nam w dalszym doskonaleniu tego modelu.

„Wybraliśmy OpenAI nie tylko ze względu na wydajność modelu w ramach różnorodnych modalności, lecz również ze względu na jakość współpracy z programistami” – stwierdził Zhu. „Struktura OpenAI API pozwoliła nam na szybkie tworzenie, debugowanie i skalowanie rozwiązań, bez ograniczeń przepływów”.

UI from Genspark's Super Agent, displaying the product's ability to generate a detailed report and slide deck based on a user's prompt

Rekordowy wzrost bez wydatków marketingowych

W ciągu niewiele ponad miesiąca od udostępnienia rozwiązania Super Agent firma Genspark:

  • Osiągnęła roczny przychód cykliczny na poziomie 36 milionów USD w ciągu zaledwie 45 dni
  • Poszerzyła ofertę o osiem rozbudowanych funkcji agenta w ciągu 70 dni

A wszystko to w ramach 20-osobowego zespołu, bez jakichkolwiek wydatków reklamowych. Ich w pełni organiczny rozwój opierał się wyłącznie na popularności produktu i marketingu szeptanym. Atrakcyjność narzędzia Super Agent wynika w dużym stopniu z łatwości jego użycia. Użytkownicy nie muszą tworzyć przepływów pracy ani konfigurować jakichkolwiek ustawień. Po prostu opisują to, co chcą uzyskać, a agent zajmuje się resztą.

Dalszy rozwój agentów AI dzięki OpenAI

Genspark kontynuuje prace ukierunkowane na opracowanie nowych kategorii potencjalnych zastosowań autonomicznych agentów, przykładowo przeglądarek internetowych reagujących na przeglądane treści czy edytorów generujących dokumenty o zaawansowanym formatowaniu. Opracowane przez OpenAI interfejsy API niezmiennie umożliwiają zespołowi szybkie tworzenie i udostępnianie produktów.

„Genspark to więcej niż tylko interfejs czatu. To wszechstronne środowisko robocze oparte na AI” – zauważa Zhu. „A dzięki API od OpenAI jesteśmy w stanie urzeczywistniać tę wizję w rekordowym tempie”.

Chcesz dowiedzieć się więcej o ChatGPT dla firm?