Aqbeż għall-kontenut prinċipali
OpenAI

8 ta’ Jannar 2024

Prodott

OpenAI u l-ġurnaliżmu

Aħna nappoġġjaw il-ġurnaliżmu, nissieħbu ma’ organizzazzjonijiet tal-aħbarijiet, u nemmnu li l-kawża ta’ The New York Times hija bla mertu.

OpenAI u l-Ġurnaliżmu

Illustrazzjoni: Justin Jay Wang × DALL·E

Qed jillowdja…

L-għan tagħna huwa li niżviluppaw għodod tal-IA li jagħtu s-setgħa lin-nies(jinfetaħ f’tieqa ġdida) biex isolvu problemi li inkella jkunu lil hinn mill-possibbiltà tagħhom. Nies madwar id-dinja diġà qed jużaw it-teknoloġija tagħna biex itejbu l-ħajja ta’ kuljum tagħhom(jinfetaħ f’tieqa ġdida). Illum miljuni ta’ żviluppaturi u aktar minn 92% tal-Fortune 500 qed jibnu fuq il-prodotti tagħna.

Filwaqt li ma naqblux mal-pretensjonijiet fil-kawża ta’ The New York Times, narawha bħala opportunità biex niċċaraw in-negozju tagħna, l-intenzjoni tagħna, u kif nibnu t-teknoloġija tagħna. Il-pożizzjoni tagħna tista’ tinġabar f’dawn l-erba’ punti, li nispjegaw aktar hawn taħt:

  1. Aħna nikkollaboraw ma’ organizzazzjonijiet tal-aħbarijiet u qed noħolqu opportunitajiet ġodda
  2. It-taħriġ huwa użu ġust, iżda noffru opt-out għax hija l-ħaġa t-tajba li nagħmlu
  3. “Riproduzzjoni” hija bug rari li qed naħdmu biex innaqqsu għal żero
  4. The New York Times mhux qed jirrakkonta l-istorja kollha

1. Aħna nikkollaboraw ma’ organizzazzjonijiet tal-aħbarijiet u qed noħolqu opportunitajiet ġodda

Aħna naħdmu iebes fil-proċess tad-disinn tat-teknoloġija tagħna biex nappoġġjaw organizzazzjonijiet tal-aħbarijiet. Iltaqgħna ma’ għexieren minnhom, kif ukoll ma’ organizzazzjonijiet ewlenin tal-industrija bħan-News/Media Alliance, biex nesploraw opportunitajiet, niddiskutu t-tħassib tagħhom, u nipprovdu soluzzjonijiet. Nimmiraw li nitgħallmu, nedukaw, nisimgħu l-feedback, u naddattaw.

L-għanijiet tagħna huma li nappoġġjaw ekosistema b’saħħitha tal-aħbarijiet, inkunu sħab tajbin, u noħolqu opportunitajiet ta’ benefiċċju reċiproku. B’dan f’moħħna, fittixna sħubijiet ma’ organizzazzjonijiet tal-aħbarijiet biex nilħqu dawn l-objettivi:

  1. Innedu l-prodotti tagħna biex jibbenefikaw u jappoġġjaw lill-ġurnalisti u lill-edituri, billi ngħinu f’kompiti li jieħdu ħafna ħin bħall-analiżi ta’ rekords pubbliċi voluminużi u t-traduzzjoni ta’ stejjer.
  2. Ngħallmu lill-mudelli tal-IA tagħna dwar id-dinja billi nħarrġuhom fuq kontenut storiku addizzjonali li mhuwiex disponibbli pubblikament.
  3. Nuru kontenut f’ħin reali b’attribuzzjoni f’ChatGPT, u nipprovdu modi ġodda biex pubblikaturi tal-aħbarijiet jikkonnettjaw mal-qarrejja.

Is-sħubijiet bikrin tagħna mal-Associated Press(jinfetaħ f’tieqa ġdida), Axel Springer(jinfetaħ f’tieqa ġdida), American Journalism Project(jinfetaħ f’tieqa ġdida) u NYU(jinfetaħ f’tieqa ġdida) joffru ħarsa lejn l-approċċ tagħna.

2. It-taħriġ huwa użu ġust, iżda noffru opt-out għax hija l-ħaġa t-tajba li nagħmlu

It-taħriġ ta’ mudelli tal-IA bl-użu ta’ materjali tal-internet disponibbli pubblikament huwa użu ġust, kif sostnut minn preċedenti stabbiliti u aċċettati b’mod wiesa’ li ilhom jeżistu. Aħna nqisu dan il-prinċipju bħala ġust għall-ħallieqa, meħtieġ għall-innovaturi, u kritiku għall-kompetittività tal-Istati Uniti.

Il-prinċipju li t-taħriġ ta’ mudelli tal-IA huwa permess bħala użu ġust huwa appoġġjat minn firxa wiesgħa ta’ akkademiċi(jinfetaħ f’tieqa ġdida), assoċjazzjonijiet tal-libreriji(jinfetaħ f’tieqa ġdida), gruppi(jinfetaħ f’tieqa ġdida) tas-soċjetà(jinfetaħ f’tieqa ġdida) ċivili(jinfetaħ f’tieqa ġdida), startups(jinfetaħ f’tieqa ġdida), kumpaniji(jinfetaħ f’tieqa ġdida) ewlenin tal-Istati Uniti(jinfetaħ f’tieqa ġdida), ħallieqa(jinfetaħ f’tieqa ġdida), awturi(jinfetaħ f’tieqa ġdida), u oħrajn(jinfetaħ f’tieqa ġdida) li reċentement issottomettew kummenti lill-US Copyright Office. Reġjuni u pajjiżi oħra, inklużi l-Unjoni Ewropea(jinfetaħ f’tieqa ġdida), il-Ġappun(jinfetaħ f’tieqa ġdida), Singapore(jinfetaħ f’tieqa ġdida), u Iżrael(jinfetaħ f’tieqa ġdida) għandhom ukoll liġijiet li jippermettu t-taħriġ ta’ mudelli fuq kontenut bid-drittijiet tal-awtur—vantaġġ għall-innovazzjoni, l-avvanz u l-investiment fl-IA.

Madankollu, id-dritt legali huwa inqas importanti għalina milli nkunu ċittadini tajbin. Aħna mexxejna l-industrija tal-IA billi pprovdejna proċess(jinfetaħ f’tieqa ġdida) sempliċi ta’ opt-out għall-pubblikaturi (li The New York Times adotta f’Awwissu 2023) biex jipprevjenu l-għodod tagħna milli jaċċessaw is-siti tagħhom.

3. “Riproduzzjoni” hija bug rari li qed naħdmu biex innaqqsu għal żero

Il-mudelli tagħna ġew iddisinjati u mħarrġa biex jitgħallmu kunċetti sabiex japplikawhom għal problemi ġodda.

Il-memorizzazzjoni hija falliment rari tal-proċess tat-tagħlim li fuqu qegħdin kontinwament nagħmlu progress, iżda hija aktar komuni meta kontenut partikolari jidher aktar minn darba fid-data tat-taħriġ, bħal jekk partijiet minnu jidhru fuq ħafna websajts pubbliċi differenti. Għalhekk għandna miżuri fis-seħħ biex nillimitaw il-memorizzazzjoni involontarja u nipprevjenu r-riproduzzjoni fl-outputs tal-mudell. Nistennew ukoll li l-utenti tagħna jaġixxu b’mod responsabbli; il-manipulazzjoni intenzjonata tal-mudelli tagħna biex jirriproduċu mhijiex użu xieraq tat-teknoloġija tagħna u tmur kontra t-Termini tal-Użu tagħna.

Bħalma l-bnedmin jiksbu edukazzjoni wiesgħa biex jitgħallmu kif isolvu problemi ġodda, irridu li l-mudelli tal-IA tagħna josservaw il-firxa tal-informazzjoni tad-dinja, inkluż minn kull lingwa, kultura, u industrija. Minħabba li l-mudelli jitgħallmu mill-aggregat enormi tal-għarfien uman, kull settur wieħed—inklużi l-aħbarijiet—huwa porzjon żgħir tad-data ġenerali tat-taħriġ, u kull sors ta’ data wieħed—inkluż The New York Times—mhuwiex sinifikanti għat-tagħlim maħsub tal-mudell.

4. The New York Times mhux qed jirrakkonta l-istorja kollha

Id-diskussjonijiet tagħna ma’ The New York Times dehru li kienu mexjin ’il quddiem b’mod kostruttiv sal-aħħar komunikazzjoni tagħna fid-19 ta’ Diċembru. In-negozjati ffukaw fuq sħubija ta’ valur għoli madwar wiri f’ħin reali b’attribuzzjoni f’ChatGPT, li fiha The New York Times kien jikseb mod ġdid kif jikkonnettja mal-qarrejja eżistenti u ġodda tiegħu, u l-utenti tagħna kienu jiksbu aċċess għar-rappurtaġġ tagħhom. Konna spjegajna lil The New York Times li, bħal kull sors wieħed, il-kontenut tagħhom ma kkontribwiex b’mod sinifikanti għat-taħriġ tal-mudelli eżistenti tagħna u lanqas ma kien se jkollu impatt biżżejjed fuq taħriġ futur. Il-kawża tagħhom tas-27 ta’ Diċembru—li sirna nafu biha billi qrajna The New York Times—ġiet għalina bħala sorpriża u diżappunt.

Matul it-triq, huma kienu semmew li raw xi riproduzzjoni tal-kontenut tagħhom iżda ripetutament irrifjutaw li jaqsmu xi eżempji, minkejja l-impenn tagħna li ninvestigaw u nsolvu kwalunkwe problema. Urejna kemm nieħdu dan bis-serjetà bħala prijorità, bħal f’Lulju meta neħħejna karatteristika ta’ ChatGPT(jinfetaħ f’tieqa ġdida) immedjatament wara li sirna nafu li setgħet tirriproduċi kontenut f’ħin reali b’modi mhux intenzjonati.

B’mod interessanti, ir-riproduzzjonijiet li qanqal The New York Times jidhru li ġejjin minn artikli ta’ snin ilu li nfirxu fuq diversi(jinfetaħ f’tieqa ġdida) websajts(jinfetaħ f’tieqa ġdida) ta’(jinfetaħ f’tieqa ġdida) partijiet terzi(jinfetaħ f’tieqa ġdida). Jidher li intenzjonalment immanipulaw prompts, spiss inkluż siltiet twal ta’ artikli, biex iġiegħlu lill-mudell tagħna jirriproduċi. Anke meta jintużaw prompts bħal dawn, il-mudelli tagħna tipikament ma jġibux ruħhom kif jissuġġerixxi The New York Times, u dan jindika li jew taw struzzjonijiet lill-mudell biex jirriproduċi jew għażlu apposta l-eżempji tagħhom minn ħafna tentattivi.

Minkejja l-allegazzjonijiet tagħhom, dan l-użu ħażin mhuwiex attività tipika jew permessa tal-utent, u mhuwiex sostitut għal The New York Times. Irrispettivament minn dan, aħna kontinwament qed nagħmlu s-sistemi tagħna aktar reżistenti għal attakki avversarji biex jirriproduċu data ta’ taħriġ, u diġà għamilna ħafna progress fil-mudelli reċenti tagħna.

Aħna nqisu l-kawża ta’ The New York Times bħala bla mertu. Xorta waħda, nittamaw għal sħubija kostruttiva ma’ The New York Times u nirrispettaw l-istorja twila tiegħu, li tinkludi r-rappurtaġġ dwar l-ewwel network newrali li verament ħadem(jinfetaħ f’tieqa ġdida) aktar minn 60 sena ilu u d-difiża tal-libertajiet tal-Ewwel Emenda.

Nistennew bil-ħerqa kollaborazzjoni kontinwa ma’ organizzazzjonijiet tal-aħbarijiet, billi ngħinu biex intejbu l-kapaċità tagħhom li jipproduċu ġurnaliżmu ta’ kwalità permezz tat-twettiq tal-potenzjal trasformattiv tal-IA.