Passer au contenu principal
OpenAI

1 juillet 2025

Genspark lance des agents personnels sans codage avec GPT‑4.1 et l’API Realtime d’OpenAI

Résultat : un revenu annuel récurrent de 36 millions de dollars en seulement 45 jours avec une équipe de 20 personnes.

Logo Genspark en blanc sur fond de sable et de rochers gris foncé avec des reflets scintillants
Chargement...

Genspark(ouverture dans une nouvelle fenêtre) est l’entreprise à l’origine de Super Agent, un agent d’IA personnalisable sans codage qui aide les utilisateurs à automatiser des tâches concrètes comme le passage d’un appel téléphonique, la création d’une présentation ou la transformation d’une recette en courte vidéo.

Super Agent s’appuie sur les modèles multimodaux d’OpenAI et l’API Realtime pour des tâches impliquant des contenus textuels, visuels ou vocaux. Les utilisateurs peuvent ainsi automatiser des workflows complexes à l’aide de simples prompts, sans aucun codage. Ce système a connu un démarrage fulgurant : la demande a été telle qu’en 45 jours seulement, Super Agent a atteint un revenu annuel récurrent de 36 millions de dollars. 

« OpenAI soutient Genspark depuis le début. Les API d’OpenAI n’ont pas seulement alimenté nos modèles. Grâce à elles, notre équipe de 20 personnes a pu concevoir, lancer et mettre à l’échelle à un rythme qu’aucun de nous n’aurait cru possible ».
Kay Zhu, CTO et co-fondateur, Genspark

De la recherche aux agents

L’activité initiale de Genspark était centrée sur un moteur de recherche d’IA conçu pour aider les consommateurs et les professionnels à synthétiser et à structurer l’information. Mais le comportement des utilisateurs a commencé à changer fin 2024. Ils ne voulaient pas seulement des réponses. Ils voulaient des résultats : des présentations, des scripts vidéo et des e-mails de suivi… et plus seulement un « résumé du marché », par exemple. Dans le même temps, les capacités des modèles ont rapidement évolué. Des fenêtres contextuelles plus longues, des capacités de raisonnement plus puissantes et de nouvelles API multimodales ont rendu possible l’automatisation de workflows entiers, et pas seulement la recherche d’informations.

Cette double évolution des attentes des utilisateurs et des performances des modèles a conduit l’équipe de Genspark à prendre une décision audacieuse : en avril 2025, elle a complètement délaissé la recherche au profit de l’IA agentique.

Mise au point d’un agent autonome sans codage avec les modèles multimodaux d’OpenAI

En avril 2025, Genspark a lancé Super Agent : un assistant entièrement autonome, sans codage, capable de passer des appels téléphoniques, de concevoir des diapositives, de générer des vidéos, etc. La plateforme assure l’orchestration en arrière-plan de neuf grands modèles de langage spécialisés et plus de 80 outils intégrés, avec une assignation dynamique de chaque tâche au composant le mieux adapté.

Les modèles d’OpenAI sont au cœur de ce système. GPT‑4.1 gère la recherche et les sorties structurées avec un meilleur suivi des instructions et une fenêtre contextuelle d’un million de jetons, permettant ainsi le traitement par les agents de longs documents dans leur intégralité, sans les tronquer. La stricte sortie JSON est conçue pour garantir des réponses structurées fiables pour les outils en aval ; la mise en cache automatique des prompts réduit la latence et les coûts de l’API, un véritable avantage dans les workflows multi-étapes. La plateforme utilise le modèle GPT‑image‑1 via l’API d’OpenAI pour la génération d’images.

Les utilisateurs n’ont plus à se préoccuper du code, le système étant entièrement sans codage. Ils décrivent simplement ce qu’ils veulent, « appelle mon dentiste », « fais-moi un résumé de ce rapport », « crée un diaporama », et Super Agent s’occupe de tout.

See how Super Agent creates AI-powered slides, sheets, and phone calls using simple prompts, no code required.

Traitement des appels de démission avec l’IA

L’une des fonctionnalités de Super Agent qui a fait le plus parler est Call For Me, une IA capable de passer des appels téléphoniques et de tenir une conversation. Aucun script. Aucun transfert compliqué. Qu’il s’agisse de faire une réservation ou de reporter une livraison, l’agent utilise l’API Realtime d’OpenAI et des capacités de synthèse vocale pour gérer la conversation de manière fluide et naturelle en temps réel.

Un système à deux niveaux soutient l’interaction : l’API Realtime gère le dialogue en direct et un modèle en arrière-plan suit et guide l’interaction par le biais d’une file d’attente de messages. Résultat : des échanges fluides et cohérents, même en cas de mise en attente ou de réponses humaines ambiguës. Au Japon, un cas d’utilisation est devenu viral : des utilisateurs ont demandé à l’agent de s’occuper des appels de démission à leurs employeurs. Un exemple d’interaction profondément humaine que la plupart des gens ne s’attendent pas à voir traitée par un agent IA. 

Au-delà des appels téléphoniques, les utilisateurs s’appuient aussi sur Super Agent pour créer du contenu personnalisé. Demandez par exemple à l’agent de créer une présentation de style vaporwave. Il prépare les diapositives, génère des images de couverture stylisées avec GPT‑image‑1 et compile le diaporama final. Autre cas d’usage : la vidéo. Super Agent assure la création de vidéos prêtes à être publiées sur Instagram en suivant les différentes étapes : préparation d’un script scène par scène, génération des images et montage.

Ces cas d’utilisation n’ont pu voir le jour qu’avec les capacités multimodales d’OpenAI, la rapidité d’exécution de Genspark et son étroite collaboration avec l’équipe de start-up d’OpenAI. Genspark a régulièrement rencontré les architectes de solutions d’OpenAI afin de partager les meilleures pratiques, d’affiner les workflows et d’optimiser les performances des modèles. Entreprise pionnière dans le lancement d’expériences vocales avec l’API Realtime, elle contribue toujours par ses retours à l’amélioration des modèles.

« Nous avons choisi OpenAI non seulement pour la performance des modèles sur différentes modalités, mais aussi pour l’expérience de ses développeurs, explique Kay Zhu. La manière dont l’API d’OpenAI est conçue nous a permis d’avancer rapidement, de livrer, de déboguer et de mettre à l’échelle sans obstacle. »

UI from Genspark's Super Agent, displaying the product's ability to generate a detailed report and slide deck based on a user's prompt

Croissance record, zéro marketing payant

Un peu plus d’un mois après le lancement de Super Agent, les résultats sont impressionnants :

  • Un revenu annuel récurrent de 36 millions de dollars en seulement 45 jours
  • La livraison de huit fonctionnalités agentiques majeures en 70 jours

Le tout avec une équipe de 20 personnes et sans publicité payante. La viralité du produit et le bouche-à-oreille expliquent cette croissance exclusivement organique. Le succès de Super Agent repose en grande partie sur son accessibilité. Les utilisateurs n’ont pas à créer des workflows ni configurer des paramètres. Ils indiquent simplement ce dont ils ont besoin et l’agent s’occupe de tout.

Exploiter le potentiel de l’IA agentique avec OpenAI 

Genspark étend aujourd’hui ses activités à de nouveaux axes de création de valeur à l’aide d’agents autonomes, par exemple un navigateur basé sur l’IA qui agit sur l’ensemble du contenu que vous parcourez ou la génération de documents au formatage complexe. Les API d’OpenAI constituent toujours un élément essentiel pour la conception et la livraison rapide de fonctionnalités.

« Nous avons conçu Genspark comme un espace de travail d’IA tout-en-un, au-delà d’une simple interface de chat, souligne Kay Zhu. Grâce aux API d’OpenAI, nous avons également pu concrétiser ce projet en un temps record. »

Souhaitez-vous en savoir plus sur ChatGPT pour les entreprises ?