Deu anys
Reflexions sobre una dècada d’avenços, aprenentatges i el camí cap a una AGI que beneficiï tota la humanitat.
OpenAI ha aconseguit més del que m’atrevia a somiar possible; ens vam proposar fer una cosa esbojarrada, improbable i sense precedents. Vam començar des d’una incertesa profunda i, contra tot pronòstic raonable, ara sembla que, amb treball intens sostingut, tenim opcions d’aconseguir la nostra missió.
Avui fa deu anys que vam anunciar al món aquest esforç, tot i que oficialment no vam començar(s'obre en una finestra nova) fins unes setmanes més tard, a principis de gener del 2016.
Deu anys és molt de temps en un cert sentit, però en termes del temps que sol caldre perquè l’arc de la societat es doblegui, no és gaire temps en absolut. Tot i que la vida quotidiana no sembla tan diferent de com era fa una dècada, l’espai de possibilitats que tenim avui al davant se sent molt diferent del que sentíem quan érem 15 friquis asseguts intentant esbrinar com avançar.
Quan miro enrere les fotos dels primers dies, el primer que em crida l’atenció és com de jove sembla tothom. Però després em sorprèn com d’injustificadament optimista sembla tothom, i com de feliç. Va ser una època divertidament esbojarrada: tot i que se’ns entenia molt poc, teníem una convicció profunda, la sensació que allò era tan important que valia la pena treballar molt de valent fins i tot amb poques probabilitats d’èxit, persones amb molt de talent i un enfocament clar.
Pas a pas, vam construir una comprensió del que estava passant a mesura que obteníem algunes victòries (i moltes derrotes). En aquells dies era difícil esbrinar exactament en què calia treballar, però vam construir una cultura increïble per afavorir el descobriment. L’aprenentatge profund era clarament una gran tecnologia, però desenvolupar-lo sense adquirir experiència operant-lo al món real no semblava del tot adequat. M’estalviaré les històries de totes les coses que vam fer (espero que algun dia algú n’escrigui una història), però teníem un gran esperit de simplement resoldre sempre el següent obstacle que teníem al davant: cap a on ens podia portar la recerca, o com aconseguir diners per a ordinadors més grans, o qualsevol altra cosa. Vam ser pioners en treball tècnic per fer la IA segura i robusta d’una manera pràctica, i aquest ADN continua viu encara avui.
El 2017, vam obtenir diversos resultats fonamentals: els nostres resultats a Dota 1v1, on vam portar l’aprenentatge per reforç a nous nivells d’escala. La neurona de sentiment no supervisada, on vam veure un model de llenguatge aprendre de manera innegable semàntica i no només sintaxi. I el nostre resultat d’aprenentatge per reforç a partir de preferències humanes, que mostrava un camí rudimentari per alinear una IA amb els valors humans. En aquell moment, la innovació era lluny d’haver-se acabat, però sabíem que havíem d’escalar cadascun d’aquests resultats amb una potència computacional enorme.
Vam continuar endavant i vam millorar la tecnologia, i vam llançar ChatGPT fa tres anys. El món se’n va adonar, i encara molt més quan vam llançar GPT‑4; de sobte, l’AGI ja no era una idea esbojarrada a considerar. Aquests darrers tres anys han estat extremadament intensos i plens d’estrès i d’una gran responsabilitat; aquesta tecnologia s’ha integrat al món a una escala i amb una velocitat que cap tecnologia no havia assolit mai abans. Això va requerir una execució extremadament difícil i ens va obligar a desenvolupar immediatament una nova capacitat. Passar del no-res a una empresa enorme en aquest període de temps no va ser fàcil i ens va exigir prendre centenars de decisions cada setmana. Estic orgullós de quantes d’aquestes l’equip ha encertat, i les que hem errat són sobretot culpa meva.
Hem hagut de prendre nous tipus de decisions; per exemple, mentre afrontàvem la qüestió de com fer que la IA fos al màxim beneficiosa per al món, vam desenvolupar una estratègia de desplegament iteratiu, amb la qual vam posar amb èxit al món versions primerenques de la tecnologia, perquè la gent pogués formar intuïcions i la societat i la tecnologia poguessin coevolucionar. En aquell moment això va ser força controvertit, però crec que ha estat una de les nostres millors decisions i que s’ha convertit en l’estàndard del sector.
Deu anys després d’OpenAI, tenim una IA que pot fer-ho millor que la majoria de les nostres persones més brillants en les nostres competicions intel·lectuals més difícils.
El món ha pogut utilitzar aquesta tecnologia per fer coses extraordinàries, i n’esperem moltes més fins i tot durant l’any vinent. Fins ara, el món també ha fet una bona feina mitigant-ne els possibles inconvenients, i hem de continuar treballant perquè això segueixi sent així.
Mai no m’havia sentit més optimista sobre els nostres fulls de ruta de recerca i de producte, i, en general, sobre la visibilitat del camí cap a la nostra missió. D’aquí a deu anys més, crec que és gairebé segur que construirem superintel·ligència. Espero que el futur se senti estrany; en un cert sentit, la vida quotidiana i les coses que més ens importen canviaran molt poc, i estic segur que continuarem molt més pendents del que facin les altres persones que no pas del que facin les màquines. En un altre sentit, la gent del 2035 serà capaç de fer coses que ara mateix no crec que puguem imaginar fàcilment.
Estic agraït a les persones i empreses que han dipositat la seva confiança en nosaltres i utilitzen els nostres productes per fer grans coses. Sense això, només seríem una tecnologia en un laboratori; els nostres usuaris i clients han apostat per nosaltres de manera primerenca i, en molts casos, amb una convicció injustificadament alta, i la nostra feina no hauria arribat a aquest nivell sense ells.
La nostra missió és garantir que l’AGI beneficiï tota la humanitat. Encara tenim molta feina al davant, però estic realment orgullós de la trajectòria en què l’equip ens ha posat. Ja estem veient enormes beneficis en allò que la gent fa amb la tecnologia, i sabem que n’arribarà molt més durant els pròxims dos anys.


