Diterbitaké: 27 Maret 2024

Komentar OpenAI marang NTIA babagan bobot model mbukak

Komentar iki diajukaké déning OpenAI minangka tanggapan marang Request for Information NTIA Maret 2024 babagan Dual-Use Foundation Models with Widely Available Weights.

Ana akèh dalan menyang AI sing aman lan migunani.

OpenAI yakin⁠(mbukak ing jendhela anyar) yèn mbangun, nyebaraké kanthi amba, lan nggunakaké AI bisa ningkataké urip wong lan mbukak masa depan sing luwih apik. Kemajuan gumantung marang inovasi lan kompetisi pasar bebas. Ing njero pandhuan umum kuwi, ana akèh dalan béda sing bisa ditempuh wong kanggo nerusaké janji AI. OpenAI kalebu salah siji pangembang AI pisanan sing ngadhepi pitakon babagan carané nyebaraké mupangat model pondasi kanthi kapabilitas sing durung tau ana sadurungé, lan kita miwiti kanthi nyedhiyakaké konteks sajarah iki kanggo mbantu ngandhani pertimbangan NTIA.

Ing 2019, kita nggawe GPT‑2, sing nduwé kapabilitas anyar kanggo ngasilaké paragraf teks sing runtut, lan banjur ngadhepi pitakon babagan carané nyebaraké. Ing siji sisih, model iki katon migunani banget; ing sisih liyané, kita durung yakin⁠ apa model iki bisa migunani kanggo tujuan ala kayata gawé email phishing. Kita milih nyoba “rilis bertahap”. Kaya sing kita tulis⁠ wektu kuwi, “rilis bertahap nyakup rilis kulawarga model kanthi alon-alon saka wektu ke wektu. Tujuan saka rilis bertahap GPT‑2 yaiku maringi wektu marang wong supaya netepaké sipat model-model iki, ngrembug implikasi sosialé, lan ngevaluasi dampak saka rilis sawise saben tahap.” Nalika kita ora ndelok efek penyalahgunaan sing signifikan, iki maringi kita kapercayan kanggo ngrilis kanthi mbukak bobot model lengkap⁠.

Ing 2020, kita nggawe GPT‑3, sing jauh luwih mumpuni tinimbang model basa sadurungé ing saben benchmark, lan maneh ngadhepi pitakon babagan carané ngrilis. Wektu iki, kita mutusaké ngrilis liwat produk pisanan kita, yaiku OpenAI API (Application Programming Interface, sing ngidini pangembang mbangun app ing ndhuwur teknologi kita). Kaya sing kita tulis⁠ wektu kuwi, kita nduwé sawetara motivasi kanggo strategi rilis anyar iki: “ngomersialaké teknologi iki mbantu kita mbayar riset AI, safety, lan upaya kabijakan sing terus lumaku” lan “model API ngidini kita nanggapi penyalahgunaan teknologi iki kanthi luwih gampang. Amarga angel prédhiksi kasus panggunaan hilir saka model kita, rasane luwih aman kanthi alami kanggo ngrilis liwat API lan nggedhekaké akses saka wektu ke wektu, tinimbang ngrilis model open source sing aksesé ora bisa diatur yèn jebulé nduwé aplikasi sing mbebayani.” Sajeroning sawetara taun, rilis API iki mulangaké kita lan komunitas piwulang babagan pola safety lan penyalahgunaan model tingkat GPT‑3⁠.

Ing taun-taun sabanjuré, kita terus ndhukung lan yakin marang janji ekosistem AI open-source, kalebu kanthi ngrilis kanthi mbukak bobot saka sawatara model state-of-the-art kita (kayata CLIP lan Whisper) lan ngembangaké infrastruktur open-source kanggo pangembang AI liyané (kayata basa pemrograman GPU Triton). Kita wis ndelok bobot sing dirilis kanthi mbukak nggawa macem-macem mupangat penting, kalebu nggampangaké riset akademik babagan njero model AI, ngidini pangguna lan organisasi mbukak model sacara lokal ing piranti edge, lan nggampangaké modifikasi kreatif model supaya cocog karo tujuan pangguna. Akeh perusahaan AI milih nandur modal gedhé ing rilis bobot model mbukak amarga macem-macem sebab, kalebu merek, rekrutmen, lan narik ekosistem pangembang supaya mbangun ing ndhuwur lan nyepetaké njero teknologi perusahaan.

Ing wektu sing padha, pendekatan kita kanggo ngrilis model AI unggulan liwat API lan produk komersial kaya ChatGPT wis ngidini kita terus sinau lan nyuda risiko sing kita temokaké sawise rilis awal, asring kanthi cara sing ora bakal bisa ditindakake yèn boboté dhéwé dirilis. Contoné, bubar iki kita kerja bareng Microsoft kanggo ndeteksi, nyinaoni, lan ngganggu⁠ operasi saka sawatara aktor ancaman siber negara-bangsa sing nyalahgunakaké model GPT‑3.5‑Turbo lan GPT‑4 kita kanggo mbantu operasi serangan siber. Ngganggu aktor ancaman iki ora bakal bisa yèn bobot model tercanggih wektu kuwi dirilis amba, amarga aktor ancaman siber sing padha bisa nge-host model ing hardware dhéwé tanpa tau sesambungan karo pangembang asliné. Pendekatan iki wis ngidini kita terus nyebaraké mupangat AI kanthi amba, kalebu liwat layanan gratis lan murah sing kasedhiya jembar.

Pengalaman iki wis nggawe kita yakin yèn rilis bobot mbukak lan rilis adhedhasar API lan produk padha-padha dadi piranti kanggo nggayuh AI sing migunani, lan kita yakin ekosistem AI Amerika sing paling apik bakal nyakup kalorone.

Nggabungaké deployment iteratif karo Kerangka Kesiapan

Kaping bola-bali, ing rilis produk uga rilis bobot, kita wis ndelok mupangat luar biasa saka “deployment iteratif”: alon-alon nyelehake AI sing saya mumpuni menyang tangan wong supaya bisa digunakaké kanggo ningkataké uripé, lan mbantu masyarakat nyetel diri marang teknologi anyar iki. Kaya sing kita tulis⁠ ing 2023: “Kita kerja keras kanggo nyegah risiko sing bisa diramal sadurungé deployment, nanging ana watesan saka apa sing bisa kita sinau ing laboratorium. Senajan riset lan testing wis jembar, kita ora bisa prédhiksi kabèh cara migunani wong bakal nggunakaké teknologi kita, uga kabèh cara wong bakal nyalahgunakaké. Mula kita yakin yèn sinau saka panggunaan ing donya nyata iku komponen krusial kanggo nggawe lan ngrilis sistem AI sing saya aman saka wektu ke wektu.”

Nalika model AI dadi luwih kuat manèh lan mupangat uga risiko saka deployment utawa rilisé dadi luwih gedhé, penting uga supaya kita saya canggih nalika mutusaké apa model kudu dideploy lan kepriyé carané. Iki utamané bener yèn kapabilitas AI nduwé implikasi wigati kanggo keamanan umum utawa keamanan nasional. Anaé risiko “katastrofik” kaya mangkono saka sistem AI sing luwih maju ing mangsa ngarep sipaté mesthi ora pasti, lan ana béda panemu akademik babagan sepira kamungkinan lan sepira cepet risiko kuwi bakal muncul. Kita ora yakin yèn bukti sing cukup wis ana; kita ora bisa ngilangi kemungkinané, nanging uga ora bisa mesthèkaké yèn kuwi wis cedhak. Minangka pangembang sing nyurung frontier kapabilitas AI kanggo nggedhekaké mupangaté, kita nganggep mbangun ilmu babagan risiko teknologi iki (kalebu nglumpukaké bukti sing ana gandhengané karo risiko kasebut) minangka pérangan integral saka pakaryan kita.

Kanggo ngliwati ketidakpastian iki kanthi cara sing didorong bukti empiris, OpenAI ngluncuraké sacara umum Preparedness Framework⁠(mbukak ing jendhela anyar) kita, pendekatan adhedhasar ilmu kanggo terus ngevaluasi lan nyuda risiko katastrofik apa waé sing bisa ditimbulaké model AI kita. Kerangka Kesiapan nemtokaké carané kita ngevaluasi tingkat kapabilitas model AI kita ing sawetara domain berisiko dhuwur, kalebu keamanan siber, operasi otonom, persuasi individual, lan ancaman CBRN (Chemical, Biological, Radiological, and Nuclear). Kanggo conto kerangka iki nalika ditrapaké, delengen studi anyar⁠ kita sing nguji kemampuan GPT‑4 kanggo mbantu penciptaan ancaman biologis, sing nyimpulaké yèn kuwi ora nimbulaké risiko marginal sing signifikan.

Adhedhasar evaluasi iki, kita netepaké tingkat risiko model ing saben kategori dadi Low, Medium, High, utawa Critical. Sing wigati, miturut Kerangka Kesiapan kita, kita ora bakal ndeploy sistem AI sing nimbulaké tingkat risiko “High” utawa “Critical” ing taksonomi kita (lan malah ora bakal nglatih sing “Critical”, ndeleng tingkat risikoné), kajaba mitigasi kita bisa nurunké risiko sistem-sistem iki nganti paling dhuwur mung tingkat “Medium”. Kerangka Kesiapan penting amarga ngidini kita mbangun lan nuduhaké mupangat AI sing saya mumpuni kanthi amba, nalika nyiapaké kita kanggo ndeteksi lan nglindhungi saka risiko katastrofik sedini mungkin yèn pancèn muncul.

Praktik kanggo pangembang AI sing kapabilitasé dhuwur

Kita yakin manawa wong lan perusahaan kudu bisa melu ing AI miturut pilihané dhewe — sing bisa kalebu ngembangaké utawa nggunakaké AI sing nggambaraké nilai lan visi dhèwèké — supaya bisa nggayuh mupangat AI. Ing wektu sing padha, sistem AI sing nduwèni kapabilitas dhuwur kudu dibangun lan digunakaké kanthi aman, kanthi risiko katastrofik apa waé sing ditemokaké dimitigasi kanthi trep. Kapentingan-kapentingan iki kadhangkala bisa tegang siji lan sijiné, lan kudu dikelola kanthi tliti manut saben kasus supaya asil paling apik kanggo masyarakat bisa digayuh.

Ing kasus model pondasi sing kapabilitasé dhuwur lan mbutuhaké sumber daya gedhé kanggo nggawé (ing kisaran atusan yuta dolar utawa luwih), kita yakin para pangembang AI kudu netepaké potensi modelé kanggo nimbulaké risiko katastrofik, lan, yèn tingkat risikoné ditemokaké dhuwur, nerapaké mitigasi sing pas sadurungé nyebaraké utawa ngrilis. Iki menehi imbangan sing pas antarané manajemen risiko lan inovasi: model-model iki diprakirakaké bakal nduwèni kapabilitas paling gedhé⁠(mbukak ing jendhela anyar), déné biaya evaluasi mung dadi pérangan cilik saka biaya pangembangane. Evaluasi kaya mangkono masuk akal apa waé maksudé bobot model arep dirilis amba utawa liwat API.

Ing pucuk spektrum sijiné, kanggo model pondasi sing ora mbutuhaké sumber daya akèh, imbangan kapentingané béda. Adhedhasar bukti saiki, model kaya mangkono katon luwih cilik kamungkinané nimbulaké risiko katastrofik, sanajan ana kamajuan sing kamungkinan bakal kelakon ing finetuning lan tèknik modifikasi model. Ing wektu sing padha, evaluasi kanggo risiko katastrofik bisa nyedhot pérangan gedhé saka anggaran latihan skala cilik, sing bisa nimbulaké efek adhem marang inovasi lan kompetisi. Kita yakin evaluasi kaya mangkono kanggo risiko katastrofik ora kuduné diarepaké kanggo model-model iki, amarga ana nilai gedhé kanggo nglindhungi keragaman kemampuan para pangembang kanggo terus nginovasi ing kapabilitas AI anyar sing nyenengaké lan ngidini pasar gagasan lan produk bisa subur, lan ilmu nuduhaké yèn risiko model-model iki relatif cilik.

Protokol evaluasi kaya Kerangka Kesiapan iku piranti migunani kanggo ngevaluasi risiko ex ante saka jinis rilis model apa waé, kalebu rilis bobot model mbukak. Ana sawetara tetimbangan sing mligi kanggo carané nerapaké iki marang rilis bobot mbukak.

Salah siji tetimbangan kuwi yaiku yèn kahanan tes saenipun nggambaraké rentang cara para aktor hilir bisa ngowahi model. Salah siji sipat paling migunani saka model mbukak yaiku para aktor hilir bisa ngowahi model kanggo ngembangaké kapabilitas wiwitané lan nyetel marang aplikasi khusus pangembang. Nanging, iki uga tegesé pihak sing nduwé niyat ala bisa waé ningkataké kapabilitas mbebayani saka model kuwi. Mula, ngevaluasi kanthi ketat risiko saka rilis bobot mbukak kudu kalebu nguji rentang cara sing lumrah lan bisa ditindakaké pihak ala kanggo ngowahi model, kalebu liwat finetuning. OpenAI wis nindakaké sawatara tes modifikasi minangka pérangan saka Kerangka Kesiapan kita (kaya sing kita tindakaké ing evaluasi biorisiko⁠ kita).

Tetimbangan kunci liyané yaiku pangembang model mbukak bisa uga ora bisa gumantung marang perlindhungan tingkat sistem kanggo nyuda risiko penyalahgunaan modelé, amarga perlindhungan kuwi asring bisa dicopot déning pangguna hilir sing nduwé niyat ala lan nyekel bobot model. Dina iki, béda iki konsekuensiné isih winates, amarga malah model saiki sing paling mumpuni duwé kita uga durung dirating minangka utamané berisiko. Nanging, yèn ana model mangsa ngarep sing sacara ilmiah ditemtokaké nimbulaké risiko abot yèn dirilis, mula dalan kanggo nyuda risiko saka rilis bobot mbukak bisa gumantung marang nambah ketangguhan lingkungan njaba panggonan model kuwi dirilis.

Kabutuhan kanggo ketangguhan sosial tumrap penyalahgunaan AI luwih amba tinimbang keputusan rilis saka siji organisasi waé. Kanthi terus majuné lan nyebaré algoritma AI, lan akses komputasi sing saya amba (kalebu ing negara-negara sing dadi perhatian kanggo Amerika Serikat), kapabilitas AI tercanggih saiki — sing asring mung bisa diakses déning sawetara aktor nalika digawe — pungkasane bakal nyebar amba. Amerika Serikat, lan negara-negara ing saindenging jagad, uga nduwé kesempatan kanggo nandur modal lan mimpin ing mitigasi sing bakal matesi akibat saka penyalahgunaan, supaya imbangan asil bisa dadi sakpositif mungkin.

Contoné, nguataké ketangguhan marang risiko serangan siber sing dipercepat AI bisa kalebu menehi panyedhiya infrastruktur kritis akses awal marang model AI sing padha, supaya bisa digunakaké kanggo ningkataké pertahanan siber (kaya ing proyèk-proyèk awal sing wis kita danai minangka pérangan saka OpenAI Cybersecurity Grant Program⁠). Nguataké ketangguhan marang risiko penciptaan ancaman biologis sing dipercepat AI bisa kalebu solusi sing babar pisan ora ana gandhengané karo AI, kayata ningkataké mekanisme skrining sintesis asam nukleat (kaya sing dijaluk ing Executive Order 14110), utawa ningkataké kemampuan sistem kesehatan umum kanggo nyaring lan ngenali wabah patogen anyar. Yèn sawijining model AI wis dituduhaké kanthi ketat nimbulaké risiko abot kanggo keamanan umum utawa keamanan nasional, mula pangembang uga bisa nduwé peran penting kanggo mbangun kesadaran babagan kapabilitas anyar kasebut sadurungé dirilis amba (kayata kanthi ngabari panyedhiya infrastruktur utawa matesi penyebaran API), supaya ana wektu lan motivasi kanggo upaya ketangguhan sing pancèn mendesak. Iki nggambaraké norma “pengungkapan sing tanggung jawab” saka domain siber, ing ngendi panaliti keamanan bakal nundha sawatara wektu rilis kerentanan sing ditemokaké kanggo menehi wektu marang para pembéla supaya nambal sistemé, tanpa ngalemot riset keamanan luwih lanjut.

Kita butuh ilmu sing luwih apik babagan risiko AI

Sanajan kita yakin yèn ngevaluasi risiko model sing paling mumpuni iku penting, ilmu babagan evaluasi risiko AI isih awal. OpenAI lan komunitas AI sing luwih amba isih mbangun pondhasi kanggo cara ngevaluasi risiko AI, lan kita uga isih terus ngiterasi akèh rincian operasional ing Kerangka Kesiapan. Pamréntah nduwé peran penting kanggo mbantu ekosistem AI ngematengaké praktik evaluasi risiko lan kapabilitasé, kayata kanthi nglumpukaké para ahli saka donya keamanan siber ofensif, infrastruktur kritis, lan AI supaya sarujuk babagan sakumpulan model ancaman siber AI prioritas, lan mbangun testbed sing ketat lan empiris kanggo ngevaluasi. Kita ndhukung banget pendekatan sukarela sing ramah inovasi lan ngutamakaké ilmu sing lagi ditindakake déning USAISI.

Wiwit OpenAI ngadhepi pilihan babagan carané ngrilis GPT‑2 ing 2019 – milih ngrilis mung versi cilik saka model kuwi dhisik — temuan lan prastawa anyar terus-terusan ngowahi lanskap tetimbangan babagan rilis mbukak bobot model pondasi, kadhangkala saben sawetara sasi. Kita ngarep tren iki bakal terus. Sembarang pendekatan kabijakan pamréntah kudu luwes lan bisa adaptasi marang owah-owahan ing mangsa ngarep.