Genspark llança agents personals sense codi amb GPT‑4.1 i OpenAI Realtime API
I va assolir 36 M$ d’ARR en només 45 dies amb un equip de 20 persones.

Genspark(s'obre en una finestra nova) és l’empresa darrere de Super Agent, un agent d’IA personalitzable i sense codi que ajuda els usuaris a automatitzar tasques del món real com fer una trucada, generar una presentació o convertir una recepta en un vídeo curt.
Super Agent fa servir models multimodals d’OpenAI i Realtime API per permetre tasques en text, imatge i veu, cosa que permet als usuaris automatitzar fluxos de treball complexos amb indicacions senzilles, sense necessitat de programar. El sistema es va enlairar: en només 45 dies, Super Agent va arribar als 36 M$ d’ARR, impulsat per una forta demanda dels usuaris.
«OpenAI ha donat suport a Genspark des del principi. Les seves API no només van impulsar els nostres models, sinó que també van ajudar el nostre equip de 20 persones a crear, llançar i escalar més ràpid del que ningú hauria cregut possible.»
Genspark es va llançar inicialment com un motor de cerca amb IA dissenyat per ajudar consumidors i professionals a sintetitzar i estructurar informació. A finals del 2024, el comportament dels usuaris va començar a canviar. Els usuaris no volien només respostes. Volien resultats. En lloc de «resumeix aquest mercat», demanaven presentacions per a inversors, guions de vídeo i correus de seguiment. Al mateix temps, les capacitats dels models s’estaven ampliant ràpidament. Finestres de context més llargues, un raonament més potent i noves API multimodals feien cada cop més possible automatitzar fluxos de treball sencers, no només recuperar informació.
Aquest canvi en la demanda dels usuaris i en la maduresa dels models va portar l’equip a fer un moviment agosarat: l’abril del 2025, Genspark va deixar enrere la cerca i va adoptar completament la IA agentic.
L’abril del 2025, Genspark va llançar Super Agent: un assistent totalment autònom i sense codi que pot fer trucades, dissenyar diapositives, generar vídeos i molt més. Internament, la plataforma orquestra nou grans models lingüístics especialitzats i més de 80 eines integrades, assignant dinàmicament cada tasca al component més adequat.
Els models d’OpenAI són centrals en aquest sistema. GPT‑4.1 gestiona la recerca i els resultats estructurats amb un seguiment d’instruccions millorat i una finestra de context d’1 M segments, cosa que permet als agents processar documents llargs sencers sense truncament. La sortida estricta en JSON està pensada per garantir respostes estructurades de manera fiable per a les eines posteriors, mentre que la memòria cau automàtica d’indicacions redueix la latència i els costos de l’API, cosa especialment valuosa en fluxos de treball de diversos passos. Per a la generació d'imatges, la plataforma fa servir el model GPT‑image‑1 a través de l’API d’OpenAI.
Com que el sistema és completament sense codi, els usuaris no han de pensar en res d’això. Descriuen el que volen, «truca al meu dentista», «resumeix aquest informe», «fes-me una presentació», i Super Agent s’encarrega de la resta.
Descobreix com Super Agent crea diapositives, fulls i trucades amb IA amb indicacions senzilles, sense necessitat de codi.
Una de les funcions de Super Agent que més ha fet parlar és Call For Me, una IA que fa trucades telefòniques reals per tu i que realment manté una conversa. Sense guions. Sense transferències feixugues. Tant si es tracta de reservar una taula com de reprogramar un lliurament, l’agent fa servir OpenAI Realtime API i capacitats de veu a veu per gestionar la conversa de manera natural i amb fluïdesa en temps real.
La interacció funciona amb un sistema de doble capa: Realtime API gestiona el diàleg en directe, mentre que un model en ombra supervisa i guia la interacció mitjançant una cua de missatges. El resultat és un intercanvi ràpid i coherent, fins i tot quan la trucada inclou música d’espera o respostes humanes ambigües. Al Japó, un cas d’ús es va fer viral: usuaris que demanaven a l’agent que gestionés trucades de renúncia als seus ocupadors. És el tipus d’interacció profundament humana que la majoria de la gent no espera que un agent d’IA pugui gestionar.
Més enllà de les trucades, els usuaris confien en Super Agent per crear contingut personalitzat. Demana una presentació per a inversors d’estil vaporwave, i l’agent redacta les diapositives, genera imatges de portada estilitzades amb GPT‑image‑1 i compila la presentació final. Pel que fa al vídeo, pot escriure un guió escena per escena, generar les imatges i muntar un curt preparat per a Instagram.
Aquests casos d’ús són possibles gràcies a les capacitats multimodals d’OpenAI, la velocitat d’execució de Genspark i la seva estreta col·laboració amb l’equip de startups d’OpenAI. Genspark es reunia regularment amb arquitectes de solucions d’OpenAI per compartir bones pràctiques, ajustar fluxos de treball i optimitzar el rendiment dels models. Van ser dels primers a llançar experiències de veu amb Realtime API i continuen aportant comentaris que ajuden a impulsar millores dels models.
«Vam triar OpenAI no només pel rendiment dels models en totes les modalitats, sinó també per l’experiència de desenvolupament», diu Zhu. «El disseny de l’API d’OpenAI ens va ajudar a avançar ràpidament, llançant, depurant i escalant sense colls d’ampolla.»

En poc més d’un mes després de llançar Super Agent, Genspark ha:
- Arribat als 36 M$ d’ARR en només 45 dies
- Llançat vuit grans funcions d’agent en 70 dies
Tot això es va aconseguir amb un equip de 20 persones i sense publicitat de pagament. Aquest creixement va ser totalment orgànic, impulsat per la viralitat del producte i el boca-orella. Bona part de l’atractiu de Super Agent prové de la seva accessibilitat. Els usuaris no han de crear fluxos de treball ni configurar ajustos. Només diuen què necessiten i l’agent s’encarrega de la resta.
A continuació, Genspark s’està expandint a noves categories on els agents autònoms poden aportar encara més valor, com ara un navegador amb IA que actua sobre tot el contingut que estàs consultant i documents amb IA per generar documents rics en format. Les API d’OpenAI continuen sent centrals en la manera com l’equip crea ràpid i llança encara més ràpid.
«Vam crear Genspark perquè fos més que una interfície de xat; és un espai de treball d’IA tot en un», diu Zhu. «I amb les API d’OpenAI vam poder fer-ho realitat en un temps rècord.»


