6 octombrie 2025

Îți prezentăm AgentKit

Instrumente noi pentru construirea, implementarea și optimizarea agenților.

Se încarcă…

Azi lansăm AgentKit, un set complet de instrumente pentru dezvoltatori și companii, care permit construirea, implementarea și optimizarea agenților. Până acum, construirea agenților presupunea să jonglezi cu instrumente fragmentate — o orchestrare complexă fără versiuni, conectori personalizați, canale de evaluare manuală, reglaje ale solicitărilor și săptămâni întregi de lucru în frontend înainte de lansare. Cu AgentKit, dezvoltatorii pot acum să proiecteze vizual fluxuri de lucru și să integreze interfețe cu utilizatorul agentice mai rapid folosind noi elemente constitutive precum:

Generatorul de agenți: un canvas vizual pentru crearea și versionarea fluxurilor de lucru multi-agent
Registrul de conectori: un loc central pentru administratori, de unde pot gestiona modul în care datele și instrumentele se conectează în toate produsele OpenAI
ChatKit: un set de instrumente pentru integrarea în produsele tale a unor experiențe personalizabile cu agenți, bazate pe chat

De asemenea, extindem capacitățile de evaluare cu noi funcții, precum seturi de date, evaluarea urmelor, optimizarea automată a solicitărilor și compatibilitatea cu modele terțe, pentru a măsura și îmbunătăți performanța agenților.

De la lansarea API-ului Răspunsuri și a SDK-ului Agenți⁠ din martie, am constatat că dezvoltatorii și companiile creează fluxuri de lucru agentice de la un capăt la altul pentru cercetare aprofundată, asistență pentru clienți și multe altele. Klarna a construit un agent de asistență⁠ care se ocupă de două treimi din toate tichetele, iar Clay a crescut de 10 ori⁠ cu un agent de vânzări. AgentKit se bazează pe API-ul Răspunsuri pentru a ajuta dezvoltatorii să creeze agenți mai eficienți și mai fiabili.

Proiectează fluxuri de lucru cu Generatorul de agenți

Pe măsură ce fluxurile de lucru ale agenților devin mai complexe, dezvoltatorii vor avea nevoie de o vizibilitate mai clară asupra funcționării acestora. Generatorul de agenti⁠(se deschide într-o fereastră nouă) oferă un canvas vizual pentru compunerea logicii cu noduri de tip glisare și fixare, conectarea instrumentelor și configurarea măsurilor de protecție personalizate. Acceptă rulări de previzualizare, configurarea evaluării în linie și versionarea completă — ideal pentru iterații rapide.

Vizualizare a interfeței unui flux de automatizare a serviciului pentru clienți într-un generator vizual. Canvasul prezintă noduri conectate etichetate cu Început, Măsură de siguranță împotriva evadării restricțiilor, Agent de clasificare, If/else, Agent de returnare, Agent de retenție, Agent de informații, Măsură de siguranță împotriva halucinațiilor și Sfârșit. O bară laterală din stânga enumeră tipurile de noduri disponibile, cum ar fi Agent, Notă, Căutare de fișiere, Măsuri de siguranță, MCP și Aprobarea utilizatorilor. Controalele principale includ opțiuni pentru Evaluare, Cod, Previzualizare și Publicare.

Generatorii pot începe cu un canvas gol sau cu șabloane predefinite.

La Ramp, echipa a trecut de la un canvas gol la un agent de achiziții în doar câteva ore:

Generatorul de agenți a transformat ceea ce înainte ar fi necesitat luni întregi de coordonare complexă, cod personalizat și optimizări manuale într-o operațiune de doar câteva ore. Canvasul vizual menține produsul, aspectele juridice și ingineria pe aceeași lungime de undă, reducând ciclurile de iterație cu 70% și punând un agent în funcțiune în două sprinturi în loc de două trimestre.”

— Ramp

În mod similar, LY Corporation — o companie japoneză de top în domeniul tehnologiei și serviciilor de internet — a creat un agent asistent de lucru cu Generatorul de agenți în mai puțin de două ore.

„Generatorul de agenți ne-a permis să coordonăm agenții într-un mod cu totul nou, în care inginerii și experții în domeniu pot colabora într-o singură interfață. Ne-am construit primul flux de lucru multi-agentic și l-am rulat în mai puțin de două ore, accelerând dramatic timpul necesar pentru crearea și implementarea agenților.”

— LY Corporation

De asemenea, lansăm un Registru de conectori pentru a le permite companiilor să-și gestioneze și întreține datele în mai multe spații de lucru și organizații. Registrul de conectori⁠(se deschide într-o fereastră nouă) consolidează sursele de date într-un singur panou de administrare în ChatGPT și în API. Registrul include toți conectorii pre-construiți, cum ar fi Dropbox, Google Drive, SharePoint și Microsoft Teams, precum și MCP-uri de la terți.

Dezvoltatorii pot activa și Măsurile de siguranță⁠(se deschide într-o fereastră nouă) din Generatorul de agenți — protejează agenții împotriva comportamentului inadecvat sau rău intenționat. Măsurile de siguranță pot masca sau semnaliza informațiile personale identificabile, detecta evitarea restricțiilor și aplica alte măsuri de protecție, pentru crearea și implementarea de agenți fiabili și siguri. Măsurile de siguranță pot fi implementate independent sau prin biblioteca de măsuri de siguranță pentru Python⁠(se deschide într-o fereastră nouă) și JavaScript⁠(se deschide într-o fereastră nouă).

Integrează experiențe de discuție agentice cu ChatKit

Implementarea interfețelor de discuții pentru agenți poate fi surprinzător de complexă — gestionarea răspunsurilor în flux și a firelor de discuție, afișarea modului de gândire al modelului și proiectarea unor experiențe captivante în cadrul discuțiilor. ChatKit⁠(se deschide într-o fereastră nouă) simplifică integrarea agenților bazați pe chat, care se potrivesc perfect produsului tău. Poate fi încorporat în aplicații sau site-uri web și personalizat pentru a se potrivi temei sau mărcii tale.

„Am economisit peste două săptămâni de timp construind un agent de asistență pentru comunitatea noastră de dezvoltatori Canva cu ChatKit și l-am integrat în mai puțin de o oră. Acest agent de asistență va transforma modul în care dezvoltatorii interacționează cu documentele noastre, transformând-o într-o experiență conversațională, facilitând construirea de aplicații și integrări pe Canva.”

— Canva

ChatKit este deja utilizat într-o varietate de cazuri, de la asistenți de Internal Knowledge și ghiduri de înscriere până la asistență pentru clienți și agenți de cercetare. Agentul de asistență pentru clienți de la HubSpot⁠(se deschide într-o fereastră nouă)este un exemplu:

Vizualizare tablou de bord a platformei Ramp care prezintă o interfață de gestionare a cheltuielilor. Panoul principal îl întâmpină pe utilizator, Daniel, și enumeră solicitări precum „Solicitare pentru ChatGPT Business” (în curs de revizuire) și „Solicitare pentru HubSpot” (schiță), împreună cu cheltuielile recente pentru companii aeriene, servicii de ridesharing și software. În dreapta, este deschis un formular de solicitare software pentru ChatGPT Business, care detaliază 5 posturi la 125 USD pe lună, în perioada 1 octombrie 2025 - 1 octombrie 2026, cu un buton galben „Trimite solicitarea”.

Măsoară performanța agenților cu Evals, noile capacități de evaluare

Construirea unor agenți fiabili, gata de producție, necesită evaluări riguroase ale performanței. Anul trecut, am lansat Evals⁠(se deschide într-o fereastră nouă) pentru a ajuta dezvoltatorii să testeze solicitările și să măsoare comportamentul modelului. Adăugăm acum patru noi funcționalități care facilitează și mai mult construirea evaluărilor:

Seturi de date–construiește rapid evaluări ale agenților de la zero și extinde-le în timp cu evaluatori automați și adnotări umane.
Evaluarea urmelor– efectuează evaluări complete ale fluxurilor de lucru agentice și automatizează evaluarea pentru a identifica deficiențele.
Optimizare automată a solicitărilor– generează solicitări îmbunătățite pe baza adnotărilor umane și a datelor de ieșire ale evaluatorilor.
Compatibilitate cu modele de la terți –evaluează modele de la alți furnizori din cadrul platformei OpenAI Evals.

Am observat deja creșteri majore de performanță la clienții care utilizează Evals.

„Platforma de evaluare ne-a redus timpul de dezvoltare a cadrului de due diligence multi-agent cu peste 50% și a crescut acuratețea agenților cu 30%.”

— Carlyle

Interfață care afișează un tabel cu seturi de date cu coloane pentru Evaluare, Ton, Feedback și Acuratețe. Rândurile afișează intrări cu pictograme cu semnul de apreciere sau de neapreciere, etichete de ton precum Profesional, Prietenos, Nepoliticos și Rău și rezultate de acuratețe etichetate Admis sau Respins cu un scor de 3,5. Bara de instrumente din partea de sus include opțiuni pentru Încărcare, Coloane, Notare, Generarea datelor de ieșire și Salvare.

Îmbunătățește performanța agentului cu reglarea fină prin consolidare

Reglarea fină prin consolidare⁠(se deschide într-o fereastră nouă) (RFT) le permite dezvoltatorilor să ne personalizeze modelele de raționament. Este disponibilă la nivel general în OpenAI o4-mini și în versiune beta privată pentru GPT‑5. Lucrăm îndeaproape cu zeci de clienți pentru a rafina RFT-ul pentru GPT‑5 înainte de lansarea pe scară mai largă.

Astăzi, introducem două funcționalități noi în versiunea beta a RFT, concepute pentru a îmbunătăți și mai mult performanța agenților:

Apeluri personalizate către instrumente– instruiește modelele să apeleze instrumentele potrivite la momentul potrivit pentru un raționament mai bun
Evaluatori personalizați–setează criterii de evaluare personalizate pentru ceea ce contează cel mai mult în cazul tău de utilizare

Prețuri și disponibilitate

Începând de astăzi, ChatKit și noile funcționalități Evals sunt disponibile la nivel general pentru toți dezvoltatorii. Generatorul de agenți este disponibil în versiune beta, iar Registrul de conectori începe lansarea beta pentru anumiți clienți API, ChatGPT Enterprise și Edu cu o Consolă de administrare globală⁠(se deschide într-o fereastră nouă) (unde proprietarii globali pot gestiona domenii, SSO, organizații API multiple). Consola de administrare globală este o condiție prealabilă pentru activarea Registrului de conectori. Toate aceste instrumente sunt incluse în prețul standard al modelelor API.

În curând, intenționăm să adăugăm la ChatGPT un API pentru fluxuri de lucru independent și opțiuni de implementare a agenților.

Abia așteptăm să vedem ce vei construi.

Autor

OpenAI

Continuă să citești

Vezi toate

GPT-5.6 is now the preferred model in Microsoft 365 Copilot > Cover image

GPT-5.6 este acum modelul preferat în Microsoft 365 Copilot

Produs9 iul. 2026

GPT-5.6: inteligență de vârf care crește odată cu ambiția ta

Produs9 iul. 2026

ChatGPT este acum un partener pentru munca ta cea mai ambițioasă

Produs9 iul. 2026