Actualizat la: 30 aprilie 2025

Cum sunt dezvoltate ChatGPT și modelele noastre fundamentale

Aflați mai multe despre modul în care ne dezvoltăm modelele și le aplicăm în cadrul unor produse precum ChatGPT

Modelele fundamentale OpenAI, inclusiv modelele care stau la baza ChatGPT, sunt dezvoltate cu ajutorul a trei surse principale de informații: (1) informații care sunt disponibile public pe internet, (2) informații la care avem acces ca urmare a parteneriatelor cu terțe părți și (3) informații pe care ni le furnizează sau le generează utilizatorii noștri sau instructorii și cercetătorii noștri umani.

Acest articol prezintă o imagine generală a informațiilor disponibile public pe care le folosim pentru a ne dezvolta modelele și modul în care colectăm și folosim aceste informații în conformitate cu legile privind confidențialitatea. Pentru a înțelege modul în care colectăm și folosim informațiile de la utilizatorii serviciilor noastre, inclusiv felul în care puteți renunța la utilizarea conversațiilor ChatGPT pentru instruirea modelelor noastre, vă rugăm să consultați_Politica de confidențialitate⁠ și acest articol.

Ce este ChatGPT și cum funcționează?

ChatGPT este un serviciu bazat pe inteligență artificială pe care îl puteți accesa pe internet. Puteți utiliza ChatGPT pentru o varietate de sarcini, cum ar fi organizarea sau rezumarea informațiilor, ajutor la traduceri, analiza sau generarea unei imagini, inspirarea creativității și generarea de idei și asistarea la sarcinile de zi cu zi. ChatGPT a fost dezvoltat într-un mod care îi permite să înțeleagă și să răspundă la întrebările și instrucțiunile utilizatorului. Realizează acest lucru prin revizuirea unei cantități mari de informații existente, cum ar fi texte, imagini, fișiere audio sau video, și învățând din relațiile dintre informații. De exemplu, modelul învață cum cuvintele tind să apară în context alături de alte cuvinte și apoi folosește ceea ce a învățat pentru a prezice următorul cuvânt cel mai probabil care ar putea apărea ca răspuns la o solicitare a utilizatorului și fiecare cuvânt următor aceluia. Aceste modele pot învăța să genereze și alte forme de informații, precum imagini, prin învățarea modului în care pixelii care alcătuiesc imaginile din datele de instruire relaționează între ei și cu legendele utilizate pentru descriere.

De exemplu, pe parcursul procesului de învățare a modelului (denumit „instruire”), am putea cere modelului să completeze propoziția: „în loc să meargă la stânga, ea a mers ___.” Înainte de instruire, răspunsul modelului cuprinde cuvinte aleatorii, dar pe măsură ce citește și învață din numeroase rânduri de text, modelul înțelege mai bine acest tip de propoziție și poate prezice mai precis următorul cuvânt. După aceea, repetă acest proces cu un număr foarte mare de propoziții.

Deoarece există multe cuvinte posibile care ar putea apărea în continuare în această propoziție (de exemplu: în loc să meargă la stânga, ea a mers „la dreapta”, „împrejur” sau „înapoi”), există un element de aleatorism în modul în care un model poate răspunde și, în multe cazuri, modelele noastre vor răspunde la aceeași întrebare în moduri diferite.

Modelele de învățare automată sunt alcătuite din șiruri mari de numere, denumite „ponderi” sau „parametri” și dintr-un cod care interpretează și execută numerele respective. Modelele nu conțin sau nu stochează copii ale informațiilor din care au învățat. Pe măsură ce un model învață, unele numere care alcătuiesc modelul se schimbă ușor pentru a reflecta ce a învățat. În exemplul de mai sus, modelul a revizuit informații care l-au ajutat să se îmbunătățească de la prezicerea de cuvinte aleatorii incorecte la prezicerea de cuvinte mai precise, dar tot ce s-a întâmplat de fapt în modelul în sine a fost că numerele s-au schimbat ușor. Modelul nu a stocat sau nu a copiat propozițiile, imaginile sau fișierele audio pe care le-a revizuit.

Ce tip de informații sunt folosite pentru a instrui ChatGPT?

După cum s-a menționat mai sus, ChatGPT și celelalte servicii ale noastre sunt dezvoltate folosind (1) informații care sunt disponibile public pe internet, (2) informații la care avem acces ca urmare a parteneriatelor cu terțe părți și (3) informații pe care ni le furnizează sau le generează utilizatorii noștri sau instructorii și cercetătorii noștri umani. Acest articol se axează pe primul set: informațiile care sunt disponibile public pe internet.

Pentru acest set de informații, utilizăm doar informații publice disponibile liber și deschis pe internet, de exemplu, nu căutăm informații pe care știm că sunt protejate de paywalls sau de pe „dark web”. Aplicăm filtre și eliminăm informațiile pe care nu dorim ca modelele noastre să le învețe sau rezultate, cum ar fi discursurile instigatoare la ură, conținuturile pentru adulți, site-urile care colectează în principal date cu caracter personal și spam-ul. Apoi, folosim informațiile pentru instruirea modelelor noastre.

Sunt folosite date cu caracter personal pentru instruirea ChatGPT?

Un volum mare de date de pe internet se referă la persoane, așadar informațiile noastre folosite în instruire includ incidental date cu caracter personal. Nu căutăm în mod activ date cu caracter personal pentru a ne instrui modelele.

Utilizăm informațiile de instruire doar pentru a învăța modelele noastre inteligența, cum ar fi capacitatea de a prezice, raționa și rezolva probleme. Nu folosim și nu vom folosi date cu caracter personal în informațiile destinate instruirii, cu scopul de a crea profiluri ale persoanelor, de a le contacta, de a le trimite materiale publicitare, de a încerca să le vindem ceva sau de a le vinde informația ca atare.

Modelele noastre pot învăța din datele cu caracter personal pentru a înțelege modul în care lucruri precum numele și adresele sunt folosite în limbaj și în propoziții sau pentru a învăța despre persoane celebre ori personalități publice. Acest lucru înseamnă că modelele noastre pot oferi mai bine răspunsuri pertinente.

Totodată, luăm măsuri pentru a reduce prelucrarea datelor cu caracter personal atunci când ne instruim modelele. De exemplu, eliminăm site-urile web care folosesc volume mari de date cu caracter personal și ne instruim modelele să respingă solicitările de informații private sau sensibile despre persoane.

Cum respectă dezvoltarea ChatGPT legile în materie de confidențialitate?

Folosim în mod legal informațiile destinate instruirii. Modelele noastre fundamentale au numeroase utilizări care oferă beneficii semnificative și care ajută deja oamenii să creeze conținut, să îmbunătățească serviciile pentru clienți, să dezvolte programe, să personalizeze educația, să sprijine cercetarea științifică și multe altele. Aceste avantaje nu se pot materializa în lipsa unei cantități mari de informații care să instruiască modelele. În plus, utilizarea informațiilor pentru instruire nu are rolul de a afecta negativ persoanele fizice, iar sursele principale ale acestor informații pentru instruire sunt deja disponibile public. Din aceste motive, colectarea și utilizarea datelor cu caracter personal incluse în informațiile pentru instruire se bazează pe interese legitime în conformitate cu legile privind protecția datelor, cum ar fi Regulamentul general privind protecția datelor (GDPR), așa cum se explică mai detaliat în Politica de confidențialitate⁠. Totodată, am realizat o evaluare a impactului asupra protecției datelor, pentru a ne asigura că noi colectăm și utilizăm aceste informații în mod legal și responsabil.

Răspundem solicitărilor în care se exprimă dreptul la opoziție și drepturi similare. Ca urmare a învățării limbajului, răspunsurile ChatGPT pot include uneori date cu caracter personal despre persoanele ale căror date apar de multe ori pe internet (de exemplu, personalitățile publice). Persoanele fizice din anumite jurisdicții se pot opune prelucrării datelor lor cu caracter personal de către modelele noastre sau pot face alte cereri privind drepturile persoanelor vizate prin intermediul Portalului nostru de confidențialitate⁠(se deschide într-o fereastră nouă). Vă puteți exercita aceste drepturi contactând dsar@openai.com⁠.

Vă rugăm să țineți cont de faptul că, în conformitate cu legile privind confidențialitatea, unele drepturi nu sunt absolute. Putem respinge o solicitare, dacă avem temeiul legal de a face acest lucru. Totuși, încercăm să prioritizăm protecția datelor cu caracter personal și să respectăm toate legile în vigoare cu privire la confidențialitate. În cazul în care considerați că nu am abordat o problemă în mod corespunzător, aveți dreptul să depuneți o reclamație la autoritatea de supraveghere locală.

Pentru mai multe informații despre practicile OpenAI cu privire la datele cu caracter personal pe care le colectăm de la sau despre dvs. atunci când utilizați site-ul web, aplicațiile și serviciile noastre, vă rugăm să consultați Politica de confidențialitate⁠.