स्किप करके मेन कंटेंट पर जाऍं
OpenAI

1 जुलाई 2025

Genspark ने GPT‑4.1 और OpenAI Realtime API के साथ नो-कोड पर्सनल एजेंट्स की पेशकश की

और 20 लोगों की टीम के साथ मात्र 45 दिनों में 36 मिलियन डॉलर का ARR हासिल किया.

चमकदार, गहरे रेत और चट्टानों की बैकग्राउंड में सफ़ेद रंग में Genspark का लोगो
लोड किया जा रहा है...

Genspark(एक नई विंडो में खुलेगा) सुपर एजेंट के पीछे की कंपनी है, जो एक नो-कोड, कस्टमाइज़ेबल AI एजेंट है जो यूज़र्स को फ़ोन कॉल करने, प्रेजेंटेशन तैयार करने, या एक रेसिपी को छोटे-से वीडियो में बदलने जैसे असली-दुनिया के टास्क ऑटोमेट करने में मदद करता है.

सुपर एजेंट OpenAI मल्टीमॉडल मॉडल और Realtime API का इस्तेमाल करके टेक्स्ट, इमेज और वॉइस में टास्क करने में मदद करता है, जिससे यूज़र्स सिंपल प्रॉम्प्ट्स के साथ कॉम्प्लेक्स वर्कफ़्लो को ऑटोमेट कर सकते हैं, इसके लिए कोडिंग की ज़रुरत नहीं होती है. सिस्टम ने उड़ान भरी: केवल 45 दिनों में, सुपर एजेंट यूज़र की मज़बूत डिमांड की वजह से, ARR में $36M तक पहुंच गया. 

“OpenAI शुरू से ही Genspark को सपोर्ट कर रहा है. उनके APIs ने न सिर्फ़ हमारे मॉडल्स को शक्ति दी, बल्कि उन्होंने हमारी 20-लोगों की टीम को निर्माण, लॉन्च और स्केल करने में मदद की, जो किसी ने भी मुमकिन नहीं समझा था.”
Kay Zhu, CTO और सह-संस्थापक, Genspark

सर्च से आगे बढ़कर एजेंट्स तक

Genspark को शुरू में एक AI सर्च इंजन के तौर पर लॉन्च किया गया था, जिसे उपभोक्ताओं और प्रोफ़ेशनल्स को जानकारी को सिंथेसाइज़ और स्ट्रक्चर करने में मदद करने के लिए डिज़ाइन किया गया था. 2024 के आखिर तक यूज़र बिहेवियर में बदलाव आना शुरू हो जाएगा. यूज़र्स सिर्फ़ जवाब नहीं चाहते थे. वे परिणाम चाहते थे. "इस मार्केट की समरी दो" के बजाय, वे पिच डेक, वीडियो स्क्रिप्ट और फ़ॉलो-अप ईमेल मांग रहे थे. उसी दौरान, मॉडल की क्षमताएं तेज़ी से बढ़ रही थीं. लंबी कॉन्टेक्स्ट विंडो, मज़बूत रीज़निंग और नए मल्टीमॉडल APIs ने न केवल सूचना प्राप्त करना, बल्कि पूरे वर्कफ़्लो को ऑटोमेट करना भी मुमकिन बना दिया है.

यूज़र की डिमांड और मॉडल की तत्परता में इस बदलाव ने टीम को एक साहसिक कदम उठाने के लिए प्रेरित किया: अप्रैल 2025 में, Genspark ने सर्च से दूरी बना ली और एजेंटिक AI को पूरी तरह से अपना लिया.

OpenAI मल्टीमोडल मॉडल्स के साथ एक नो-कोड ऑटोनोमस एजेंट का निर्माण

अप्रैल 2025 में, Genspark ने सुपर एजेंट लॉन्च किया: एक पूरी तरह से ऑटोनोमस, नो-कोड असिस्टेंट जो फ़ोन कॉल कर सकता है, स्लाइड्स डिज़ाइन कर सकता है, वीडियो बना सकता है, और भी बहुत कुछ कर सकता है. इसके अंतर्गत, ये प्लैटफ़ॉर्म नौ विशिष्ट बड़े लैंग्वेज मॉडल्स और 80 से ज़्यादा इंटीग्रेटेड टूल्स का संचालन करता है, और प्रत्येक टास्क को डायनामिक तरीके से सबसे उपयुक्त घटक को असाइन करता है.

OpenAI मॉडल्स इस सिस्टम के केन्द्र में हैं. GPT‑4.1 बेहतर अनुदेश अनुगमन और 1M-टोकन संदर्भ विंडो के साथ अनुसंधान और संरचित आउटपुट को संभालता है, जिससे एजेंट्स को बिना काट-छांट किए लंबे डॉक्यूमेंट्स को पूरी तरह से प्रोसेस करने में मदद मिलती है. सख्त JSON आउटपुट को डाउनस्ट्रीम टूल्स के लिए भरोसेमंद तरीके से स्ट्रक्चर किए गए जवाबों को पक्का करने के लिए डिज़ाइन किया गया है, जबकि ऑटोमैटिक प्रॉम्प्ट कैशिंग लेटेंसी और API के खर्चों को कम करता है जो मल्टी-स्टेप वर्कफ़्लो में ख़ास तौर से कीमती है. इमेज क्रिएशन के लिए, प्लैटफ़ॉर्म OpenAI API के ज़रिये GPT‑image‑1 मॉडल का इस्तेमाल करता है.

चूंकि ये सिस्टम पूरी तरह से कोड-रहित है, इसलिए यूज़र्स को इसके बारे में सोचने की ज़रुरत नहीं है. वे बताते हैं कि उन्हें क्या चाहिए, "मेरे डेंटिस्ट को कॉल करो", "इस रिपोर्ट की समरी बनाओ", "मेरे लिए एक स्लाइड डेक बनाओ", और सुपर एजेंट बाकी काम संभालता है.

See how Super Agent creates AI-powered slides, sheets, and phone calls using simple prompts, no code required.

इस्तीफ़ों के कॉल्स को हैंडल करने के लिए AI का इस्तेमाल करना

सुपर एजेंट की सबसे चर्चित फ़ीचर्स में से एक है कॉल फ़ॉर मी, एक ऐसा AI है, जो आपके लिए रियल फ़ोन कॉल्स करता है, और वाकई में बातचीत करता है. कोई स्क्रिप्ट नहीं. कोई भी भद्दे ट्रांसफ़र नहीं. चाहे रिज़र्वेशन बुक करना हो या कोई डिलीवरी दोबारा शेड्यूल करनी हो, एजेंट बातचीत को नेचुरल तरीके से और रियल-टाइम में फ़्लुएन्सी के साथ हैंडल करने के लिए OpenAI Realtime API और स्पीच-टू-स्पीच क्षमताओं का इस्तेमाल करता है.

एक दोहरे-लेयर वाला सिस्टम ठीक से बातचीत होने में मदद करता है: Realtime API लाइव संवाद को मैनेज करता है, जबकि एक शैडो मॉडल मेसेज की कतार के ज़रिए बातचीत को मॉनिटर और गाइड करता है. इसका रिज़ल्ट तेज़, सुसंगत बातचीत है, तब भी जब कॉल में होल्ड म्यूज़िक या अस्पष्ट मानवीय जवाब शामिल हों. जापान में, एक यूज़ केस वायरल हुआ: यूज़र्स एजेंट से अपने नियोक्ताओं को त्यागपत्र देने के लिए कॉल्स को हैंडल करने के लिए कह रहे थे. ये एक ऐसा गहन मानवीय इंटरैक्शन है, जिसे ज़्यादातर लोग AI एजेंट द्वारा हैंडल किए जाने की उम्मीद नहीं करते हैं. 

फ़ोन कॉल्स के अलावा, यूज़र्स पर्सनलाइज़्ड कंटेंट बनाने के लिए सुपर एजेंट पर निर्भर रहते हैं. एक वेपरवेव-स्टाइल पिच डेक के लिए पूछें, और एजेंट स्लाइड्स का ड्राफ़्ट तैयार कर देगा, GPT‑इमेज‑1 के साथ स्टाइलाइज़्ड कवर इमेजेस जनरेट करेगा, और फ़ाइनल डेक कम्पाइल करेगा. वीडियो के लिए, ये सीन-दर-सीन स्क्रिप्ट लिख सकता है, इमेज जनरेट कर सकता है, और एक इंस्टाग्राम-रेडी छोटी फ़िल्म तैयार कर सकता है.

ये यूज़ केसेस OpenAI मल्टीमोडल क्षमताओं, Genspark की एक्सीक्यूशन स्पीड, और OpenAI स्टार्टअप टीम के साथ उनके गहरे सहयोग से मुमकिन हैं. Genspark ने सबसे अच्छी आदतों को शेयर करने, वर्कफ़्लो को बेहतर बनाने और मॉडल के परफ़ॉर्मेंस को फ़ाइन-ट्यून करने के लिए OpenAI सॉल्यूशन्स आर्किटेक्ट्स के साथ नियमित तौर पर मुलाकात की. वे Realtime API के साथ वॉइस अनुभव शुरू करने वाले पहले लोगों में से थे, और फ़ीडबैक देना जारी रखते हैं जिससे मॉडल में सुधार लाने में मदद मिलती है.

Zhu कहते हैं, "हमने OpenAI को सिर्फ़ विभिन्न मॉडल्स के तौर-तरीकों के लिए नहीं चुना है, बल्कि डेवलपर अनुभव के लिए भी चुना है." "OpenAI API डिज़ाइन ने हमें बिना किसी रुकावट के तेज़ी से आगे बढ़ने, शिपिंग, डीबगिंग, और स्केलिंग में मदद की."

UI from Genspark's Super Agent, displaying the product's ability to generate a detailed report and slide deck based on a user's prompt

रिकॉर्ड-तोड़ विकास, ज़ीरो पेड मार्केटिंग

सुपर एजेंट को लॉन्च करने के एक महीने के अंदर ही, Genspark में:

  • ARR मात्र 45 दिनों में $36M तक बढ़ गया है
  • 70 दिनों में आठ प्रमुख एजेंट फ़ीचर्स भेजे गए

ये सब 20 लोगों की टीम और बिना कोई पेमेंट वाली एड्वर्टाइज़िंग के साथ हासिल किया गया. ये कामयाबी पूरी तरह से ऑर्गेनिक थी, जो प्रोडक्ट के वायरल होने और मौखिक-प्रचार से प्रेरित थी. सुपर एजेंट की अपील इसे आसानी से एक्सेस कर पाने की वजह से है. यूज़र्स को वर्कफ़्लो बनाने या सेटिंग्स कॉन्फ़िगर करने की ज़रूरत नहीं है. वे सिर्फ़ वही बताते हैं जो उन्हें चाहिए और बाकी काम एजेंट हैंडल कर लेता है.

OpenAI के साथ एजेन्टिक AI को और आगे बढ़ाना

आगे, Genspark नई कैटेगरीज़ में इज़ाफ़ा कर रहा है, जहां ऑटोनोमस एजेंट्स और भी ज़्यादा वैल्यू जनरेट कर सकते हैं, जैसे कि एक AI ब्राउज़र जो आपके द्वारा ब्राउज़ किए जा रहे सभी कंटेंट पर काम करता है और बेहतरीन फ़ॉर्मेट-वाले डॉक्यूमेंट्स बनाने के लिए AI डॉक्स. OpenAI APIs टीम के तेज़ी से निर्माण और तेज़ी से शिप करने के लिए मूल तौर पर जाना जाता है.

Zhu कहते हैं, "हमने Genspark को एक चैट इंटरफ़ेस से कहीं ज़्यादा बनाया है, ये एक ऑल-इन-वन AI कार्यस्थल है." "और OpenAI APIs के साथ, हम रिकॉर्ड टाइम में इसे सच कर पाए हैं."

क्या आप व्यवसाय के लिए ChatGPT के बारे में और जानना चाहते हैं?