8 Januari 2024

OpenAI lan jurnalisme

Kami ndhukung jurnalisme, kerja bareng karo organisasi warta, lan yakin gugatan The New York Times ora ana dhasaré.

Ilustrasi: Justin Jay Wang × DALL·E

Lagi dimuat…

Tujuan kami yaiku ngembangake piranti AI sing nguatake wong⁠(mbukak ing jendhela anyar) supaya bisa ngrampungake masalah sing sakliyane angel digayuh. Wong ing saindenging jagad wis nggunakake teknologi kami kanggo nambah kualitas urip saben dina⁠(mbukak ing jendhela anyar). Yutaan pangembang lan luwih saka 92% perusahaan Fortune 500 saiki mbangun nganggo produk kami.

Sanajan kami ora setuju karo klaim ing gugatan The New York Times, kami ndeleng iki minangka kesempatan kanggo njlentrehake bisnis kami, maksud kami, lan cara kami mbangun teknologi. Posisi kami bisa diringkes ing papat poin iki, sing dijlentrehake luwih rinci ing ngisor:

Kami kolaborasi karo organisasi warta lan lagi nggawe kesempatan anyar
Pelatihan iku fair use, nanging kami nyedhiyakake opt-out amarga kuwi pancen sing bener ditindakake
“Regurgitation” iku bug langka sing lagi kami upayakake dadi nol
The New York Times ora nyritakake crita saklengkape

1. Kami kolaborasi karo organisasi warta lan lagi nggawe kesempatan anyar

Kami kerja tenanan ing proses desain teknologi kami kanggo ndhukung organisasi warta. Kami wis ketemu karo puluhan organisasi, uga organisasi industri utama kaya News/Media Alliance, kanggo njajaki kesempatan, ngrembug kekuwatirane, lan nyedhiyakake solusi. Kami ngarah sinau, menehi edukasi, ngrungokake masukan, lan adaptasi.

Tujuan kami yaiku ndhukung ekosistem warta sing sehat, dadi mitra sing becik, lan nggawe kesempatan sing padha-padha nguntungake. Kanthi iki ing pikiran, kami ngupayakake kemitraan karo organisasi warta kanggo nggayuh tujuan iki:

Nerapake produk kami kanggo mupangati lan ndhukung reporter lan editor, kanthi mbantu tugas sing mbutuhake wektu akeh kaya nganalisis cathetan publik sing akèh banget lan nerjemahake berita.
Ngajari model AI kami babagan donya kanthi nglatih nganggo konten historis tambahan sing ora kasedhiya kanggo umum.
Nampilake konten real-time kanthi atribusi ing ChatGPT, nyedhiyakake cara anyar kanggo penerbit warta supaya nyambung karo pamaca.

Kemitraan awal kami karo Associated Press⁠(mbukak ing jendhela anyar), Axel Springer⁠(mbukak ing jendhela anyar), American Journalism Project⁠(mbukak ing jendhela anyar) lan NYU⁠(mbukak ing jendhela anyar) menehi gambaran cekak babagan pendekatan kami.

2. Pelatihan iku fair use, nanging kami nyedhiyakake opt-out amarga kuwi pancen sing bener ditindakake

Pelatihan model AI nganggo materi internet sing kasedhiya kanggo umum iku fair use, kaya didhukung preseden lawas sing wis suwe ana lan ditampa jembar. Kami ndeleng prinsip iki adil kanggo para kreator, perlu kanggo para inovator, lan penting kanggo daya saing AS.

Nanging, hak legal ora sepenting dadi warga sing becik kanggo kami. Kami mimpin industri AI kanthi nyedhiyakake proses⁠(mbukak ing jendhela anyar) opt-out sing prasaja kanggo penerbit (sing diadopsi The New York Times ing Agustus 2023) supaya piranti kami ora ngakses situs dheweke.

3. “Regurgitation” iku bug langka sing lagi kami upayakake dadi nol

Model kami dirancang lan dilatih kanggo sinau konsep supaya bisa ngetrapake konsep kasebut marang masalah anyar⁠.

Hafalan iku kegagalan langka saka proses sinau sing terus kami benahi, nanging luwih umum kedadeyan nalika konten tartamtu muncul luwih saka sepisan ing data pelatihan, kaya nalika bagean saka konten kuwi muncul ing akèh situs web publik sing beda. Mula kami nduwèni langkah-langkah kanggo matesi hafalan sing ora disengaja lan nyegah regurgitation ing output model. Kami uga ngarepake pangguna tumindak kanthi tanggung jawab; sengaja memanipulasi model kami supaya mbalekake isi dudu panggunaan teknologi kami sing trep lan nalisir Syarat Penggunaan kami.

Kaya manungsa entuk pendidikan sing jembar kanggo sinau cara ngrampungake masalah anyar, kami pengin model AI kami ngamati jangkauan informasi donya, kalebu saka saben basa, budaya, lan industri. Amarga model sinau saka agregat gedhe kawruh manungsa, sektor siji wae—kalebu warta—mung potongan cilik saka total data pelatihan, lan sumber data siji wae—kalebu The New York Times—ora wigati kanggo sinau sing dikarepaké model.

4. The New York Times ora nyritakake crita saklengkape

Diskusi kami karo The New York Times katoné maju kanthi konstruktif nganti komunikasi pungkasan ing 19 Desember. Negosiasi iki fokus marang kemitraan bernilai dhuwur babagan tampilan real-time kanthi atribusi ing ChatGPT, ing ngendi The New York Times bakal entuk cara anyar kanggo nyambung karo pamaca lawas lan anyar, lan pangguna kami bakal entuk akses menyang laporane. Kami wis nerangake marang The New York Times manawa, kaya sumber tunggal liyane, kontené ora nyumbang kanthi migunani kanggo pelatihan model kami sing wis ana lan uga ora bakal cukup duwé dampak kanggo pelatihan mbesuk. Gugatané ing 27 Desember—sing kami ngerti kanthi maca The New York Times—teka minangka kejutan lan kuciwa kanggo kami.

Sajrone proses iki, dheweke tau nyebut weruh ana sawetara pengulangan kontené nanging bola-bali nolak nuduhake conto, senajan kami wis komit kanggo nyelidiki lan ndandani masalah apa wae. Kami wis nuduhake sepira seriusé iki dadi prioritas, contoné ing Juli nalika kami langsung mbusak fitur ChatGPT⁠(mbukak ing jendhela anyar) sawisé ngerti yen fitur kuwi bisa ngasilake maneh konten real-time kanthi cara sing ora disengaja.

Sing narik kawigaten, pengulangan sing dipancing The New York Times katon asalé saka artikel lawas pirang-pirang taun sing wis nyebar ing akeh⁠(mbukak ing jendhela anyar) situs⁠(mbukak ing jendhela anyar)-web⁠(mbukak ing jendhela anyar) pihak katelu⁠(mbukak ing jendhela anyar). Katoné dheweke sengaja memanipulasi prompt, kerep kalebu kutipan artikel sing dawa, supaya model kami mbalekake isi kasebut. Sanajan nganggo prompt kaya mengkono, model kami biasané ora tumindak kaya sing diisyaratake The New York Times, sing nuduhake manawa dheweke bisa wae menehi instruksi marang model supaya mbalekake isi utawa milih conto sing cocog saka akèh upaya.

Senajan klaimé kaya ngono, panyalahgunaan iki dudu aktivitas pangguna sing umum utawa diidini, lan dudu pengganti kanggo The New York Times. Apa wae kuwi, kami terus nggawe sistem kami luwih tahan marang serangan adversarial kanggo mbalekake data pelatihan, lan wis nggawe akèh kemajuan ing model kami sing anyar.

Kami nganggep gugatan The New York Times ora ana dhasaré. Nanging, kami tetep nduwèni pangarep-arep kanggo kemitraan sing konstruktif karo The New York Times lan ngajèni sejarahé sing dawa, kalebu laporan babagan jaringan saraf pisanan sing bisa digunakake⁠(mbukak ing jendhela anyar) luwih saka 60 taun kepungkur lan pembelaan marang kabebasan Amandemen Kapisan.

Kami ngarepake kolaborasi sing terus lumaku karo organisasi warta, mbantu ngunggahake kemampuan dheweke kanggo ngasilake jurnalisme bermutu kanthi mujudake potensi transformatif AI.

Penulis

OpenAI