Îți prezentăm AgentKit
Instrumente noi pentru construirea, implementarea și optimizarea agenților.
Azi lansăm AgentKit, un set complet de instrumente pentru dezvoltatori și companii, care permit construirea, implementarea și optimizarea agenților. Până acum, construirea agenților presupunea să jonglezi cu instrumente fragmentate — o orchestrare complexă fără versiuni, conectori personalizați, canale de evaluare manuală, reglaje ale solicitărilor și săptămâni întregi de lucru în frontend înainte de lansare. Cu AgentKit, dezvoltatorii pot acum să proiecteze vizual fluxuri de lucru și să integreze interfețe cu utilizatorul agentice mai rapid folosind noi elemente constitutive precum:
- Generatorul de agenți: un canvas vizual pentru crearea și versionarea fluxurilor de lucru multi-agent
- Registrul de conectori: un loc central pentru administratori, de unde pot gestiona modul în care datele și instrumentele se conectează în toate produsele OpenAI
- ChatKit: un set de instrumente pentru integrarea în produsele tale a unor experiențe personalizabile cu agenți, bazate pe chat
De asemenea, extindem capacitățile de evaluare cu noi funcții, precum seturi de date, evaluarea urmelor, optimizarea automată a solicitărilor și compatibilitatea cu modele terțe, pentru a măsura și îmbunătăți performanța agenților.
De la lansarea API-ului Răspunsuri și a SDK-ului Agenți din martie, am constatat că dezvoltatorii și companiile creează fluxuri de lucru agentice de la un capăt la altul pentru cercetare aprofundată, asistență pentru clienți și multe altele. Klarna a construit un agent de asistență care se ocupă de două treimi din toate tichetele, iar Clay a crescut de 10 ori cu un agent de vânzări. AgentKit se bazează pe API-ul Răspunsuri pentru a ajuta dezvoltatorii să creeze agenți mai eficienți și mai fiabili.
Pe măsură ce fluxurile de lucru ale agenților devin mai complexe, dezvoltatorii vor avea nevoie de o vizibilitate mai clară asupra funcționării acestora. Generatorul de agenti(se deschide într-o fereastră nouă) oferă un canvas vizual pentru compunerea logicii cu noduri de tip glisare și fixare, conectarea instrumentelor și configurarea măsurilor de protecție personalizate. Acceptă rulări de previzualizare, configurarea evaluării în linie și versionarea completă — ideal pentru iterații rapide.

Generatorii pot începe cu un canvas gol sau cu șabloane predefinite.
La Ramp, echipa a trecut de la un canvas gol la un agent de achiziții în doar câteva ore:
Generatorul de agenți a transformat ceea ce înainte ar fi necesitat luni întregi de coordonare complexă, cod personalizat și optimizări manuale într-o operațiune de doar câteva ore. Canvasul vizual menține produsul, aspectele juridice și ingineria pe aceeași lungime de undă, reducând ciclurile de iterație cu 70% și punând un agent în funcțiune în două sprinturi în loc de două trimestre.”
În mod similar, LY Corporation — o companie japoneză de top în domeniul tehnologiei și serviciilor de internet — a creat un agent asistent de lucru cu Generatorul de agenți în mai puțin de două ore.
„Generatorul de agenți ne-a permis să coordonăm agenții într-un mod cu totul nou, în care inginerii și experții în domeniu pot colabora într-o singură interfață. Ne-am construit primul flux de lucru multi-agentic și l-am rulat în mai puțin de două ore, accelerând dramatic timpul necesar pentru crearea și implementarea agenților.”
De asemenea, lansăm un Registru de conectori pentru a le permite companiilor să-și gestioneze și întreține datele în mai multe spații de lucru și organizații. Registrul de conectori(se deschide într-o fereastră nouă) consolidează sursele de date într-un singur panou de administrare în ChatGPT și în API. Registrul include toți conectorii pre-construiți, cum ar fi Dropbox, Google Drive, SharePoint și Microsoft Teams, precum și MCP-uri de la terți.
Dezvoltatorii pot activa și Măsurile de siguranță(se deschide într-o fereastră nouă) din Generatorul de agenți — protejează agenții împotriva comportamentului inadecvat sau rău intenționat. Măsurile de siguranță pot masca sau semnaliza informațiile personale identificabile, detecta evitarea restricțiilor și aplica alte măsuri de protecție, pentru crearea și implementarea de agenți fiabili și siguri. Măsurile de siguranță pot fi implementate independent sau prin biblioteca de măsuri de siguranță pentru Python(se deschide într-o fereastră nouă) și JavaScript(se deschide într-o fereastră nouă).
Implementarea interfețelor de discuții pentru agenți poate fi surprinzător de complexă — gestionarea răspunsurilor în flux și a firelor de discuție, afișarea modului de gândire al modelului și proiectarea unor experiențe captivante în cadrul discuțiilor. ChatKit(se deschide într-o fereastră nouă) simplifică integrarea agenților bazați pe chat, care se potrivesc perfect produsului tău. Poate fi încorporat în aplicații sau site-uri web și personalizat pentru a se potrivi temei sau mărcii tale.
„Am economisit peste două săptămâni de timp construind un agent de asistență pentru comunitatea noastră de dezvoltatori Canva cu ChatKit și l-am integrat în mai puțin de o oră. Acest agent de asistență va transforma modul în care dezvoltatorii interacționează cu documentele noastre, transformând-o într-o experiență conversațională, facilitând construirea de aplicații și integrări pe Canva.”
ChatKit este deja utilizat într-o varietate de cazuri, de la asistenți de Internal Knowledge și ghiduri de înscriere până la asistență pentru clienți și agenți de cercetare. Agentul de asistență pentru clienți de la HubSpot(se deschide într-o fereastră nouă)este un exemplu:

Construirea unor agenți fiabili, gata de producție, necesită evaluări riguroase ale performanței. Anul trecut, am lansat Evals(se deschide într-o fereastră nouă) pentru a ajuta dezvoltatorii să testeze solicitările și să măsoare comportamentul modelului. Adăugăm acum patru noi funcționalități care facilitează și mai mult construirea evaluărilor:
- Seturi de date–construiește rapid evaluări ale agenților de la zero și extinde-le în timp cu evaluatori automați și adnotări umane.
- Evaluarea urmelor– efectuează evaluări complete ale fluxurilor de lucru agentice și automatizează evaluarea pentru a identifica deficiențele.
- Optimizare automată a solicitărilor– generează solicitări îmbunătățite pe baza adnotărilor umane și a datelor de ieșire ale evaluatorilor.
- Compatibilitate cu modele de la terți –evaluează modele de la alți furnizori din cadrul platformei OpenAI Evals.
Am observat deja creșteri majore de performanță la clienții care utilizează Evals.
„Platforma de evaluare ne-a redus timpul de dezvoltare a cadrului de due diligence multi-agent cu peste 50% și a crescut acuratețea agenților cu 30%.”

Reglarea fină prin consolidare(se deschide într-o fereastră nouă) (RFT) le permite dezvoltatorilor să ne personalizeze modelele de raționament. Este disponibilă la nivel general în OpenAI o4-mini și în versiune beta privată pentru GPT‑5. Lucrăm îndeaproape cu zeci de clienți pentru a rafina RFT-ul pentru GPT‑5 înainte de lansarea pe scară mai largă.
Astăzi, introducem două funcționalități noi în versiunea beta a RFT, concepute pentru a îmbunătăți și mai mult performanța agenților:
- Apeluri personalizate către instrumente– instruiește modelele să apeleze instrumentele potrivite la momentul potrivit pentru un raționament mai bun
- Evaluatori personalizați–setează criterii de evaluare personalizate pentru ceea ce contează cel mai mult în cazul tău de utilizare
Începând de astăzi, ChatKit și noile funcționalități Evals sunt disponibile la nivel general pentru toți dezvoltatorii. Generatorul de agenți este disponibil în versiune beta, iar Registrul de conectori începe lansarea beta pentru anumiți clienți API, ChatGPT Enterprise și Edu cu o Consolă de administrare globală(se deschide într-o fereastră nouă) (unde proprietarii globali pot gestiona domenii, SSO, organizații API multiple). Consola de administrare globală este o condiție prealabilă pentru activarea Registrului de conectori. Toate aceste instrumente sunt incluse în prețul standard al modelelor API.
În curând, intenționăm să adăugăm la ChatGPT un API pentru fluxuri de lucru independent și opțiuni de implementare a agenților.
Abia așteptăm să vedem ce vei construi.


