Pereiti prie pagrindinio turinio
OpenAI

Nepriklausomų DI suderinamumo tyrimų skatinimas

Skiriame 7,5 mln. JAV dolerių projektui „The Alignment Project“, kad finansuotume nepriklausomus tyrimus, kuriančius priemones, skirtas sumažinti saugos ir saugumo rizikas, kylančias dėl nesuderinto DI.

Įkeliama...

DI sistemoms tampant vis pajėgesnėms ir savarankiškesnėms, suderinamumo tyrimai turi ne tik neatsilikti, bet ir didinti įvairovę. Bendrovėje „OpenAI“ daug investuojame į priešakinius suderinamumo ir saugos tyrimus, nes tai itin svarbu mūsų misijai. Taip pat tikime, kad užtikrinti AGI saugą ir naudą visiems negali jokia atskira organizacija, todėl norime paremti nepriklausomus tyrimus ir koncepcinius metodus, kurie gali būti plėtojami už priešakinių laboratorijų ribų. Tikime, kad DI ateitis nesiklostys tiksliai taip, kaip yra prognozuojama, ir kad daug daugiau žmonių turėtų dalyvauti formuojant šį rezultatą.

Šiandien pranešame apie 7,5 mln. JAV dolerių dotaciją JK DI saugumo instituto (UK AISI) sukurtam pasauliniam nepriklausomų suderinamumo tyrimų fondui – projektui „The Alignment Project“(atsidaro naujame lange). Dotacijos administravimą palaiko organizacija „Renaissance Philanthropy“. Šis indėlis padeda paversti „The Alignment Project“ viena didžiausių iki šiol specializuoto finansavimo iniciatyvų, skirtų nepriklausomiems suderinamumo tyrimams, ir sustiprina platesnę nepriklausomą ekosistemą.

Priešakinės laboratorijos, tokios kaip ;OpenAI“, yra unikalioje padėtyje vykdyti suderinamumo tyrimus, kuriems reikalinga prieiga prie priešakinių modelių ir didelių skaičiavimo išteklių – tokį darbą nepriklausomiems tyrėjams dažnai atlikti yra sunku. Didelę dalį savo vidinių pastangų, susijusių su suderinamumu, skiriame mastelio keitimo metodams kurti, kad suderinamumo pažanga neatsiliktų nuo gebėjimų tobulėjimo. Tikime, kad iteracinis diegimas – laipsniškas gebėjimų didinimas kartu stiprinant apsaugos priemones – padeda anksti išaiškinti problemas ir suteikia konkrečių įrodymų apie tai, kas veikia praktikoje, o atsakingas kūrimas reikalauja didelio suderinamumo ir saugos darbo, glaudžiai integruoto su modelių kūrimu bei diegimu.

Tuo pat metu sritis gauna naudos iš nuolatinių investicijų į nepriklausomus, tiriamuosius darbus, galinčius išplėsti idėjų erdvę ir atskleisti naujų krypčių. Nepriklausomi tyrimai išlieka esminiai; atliekant daugelio rūšių naudingus tyrimus, laboratorijos neturi santykinio pranašumo. Sveika suderinamumo ekosistema priklauso nuo nepriklausomų komandų, tikrinančių įvairias prielaidas, kuriančių alternatyvias sistemas ir nagrinėjančių koncepcines, teorines bei novatoriškas idėjas, kurios gali ne visai atitikti kurios nors vienos organizacijos planus.

Kadangi pažanga AGI link galiausiai gali priklausyti nuo pamatinių proveržių, kurie pakeis suderinamumo problemos formą ir atsakys, kurie metodai yra naudingiausi, svarbu remti tyrimus, kurie būtų reikšmingi net ir tuo atveju, jei paaiškėtų, kad šiandienos dominuojančių metodų mastelį keisti nėra taip lengva, kaip tikimės. Tokiais atvejais tampa ypač svarbu turėti stiprią išorinę ekosistemą, atliekančią pamatinius, koncepcinius ir nekoreliuojančius darbus. DI suderinamumo ir saugos problema yra beprecedentės svarbos, todėl turime sutelkti visas jėgas, nes dar nežinome, kurie metodai pasirodys esą tvariausi toliau tobulėjant gebėjimams.

Mūsų dotacija – pagal dabartinius valiutų kursus siekianti apie 5,6 mln. svarų sterlingų – padės kartu finansuoti „The Alignment Project“(atsidaro naujame lange) drauge su kitais viešaisiais, filantropiniais ir pramonės rėmėjais. Bendras fondas viršija 27 mln. svarų sterlingų ir yra skirtas paremti platų suderinamumo tyrimų projektų portfelį visame pasaulyje, apimantį tokias įvairias temas kaip skaičiavimo sudėtingumo teorija, ekonomikos teorija ir žaidimų teorija, kognityvinis mokslas bei informacijos teorija ir kriptografija. Atskiri projektai paprastai finansuojami nuo 50 000 iki 1 mln. svarų sterlingų, jiems taip pat gali būti suteikiama pasirenkama prieiga prie skaičiavimo išteklių ir ekspertų palaikymas.

Mūsų finansavimas nesukuria naujos programos ar atrankos proceso ir nedaro įtakos esamam procesui; jis padidina jau patikrintų, aukštos kokybės projektų(atsidaro naujame lange), kurie gali būti finansuojami šiame etape, skaičių.

UK AISI yra tinkamoje padėtyje tokio masto ir aprėpties suderinamumo finansavimui nukreipti. Ji suburia nusistovėjusią tarpsektorinę koaliciją, apimančią vyriausybę, akademinę bendruomenę, filantropiją ir pramonę, kartu su jau veikiančiu dotacijų teikimo procesu ir daugybe pasiūlymų, kurie jau praėjo ekspertų vertinimą. Būdama Mokslo, inovacijų ir technologijų departamento (DSIT) JK vyriausybine tyrimų organizacija, ji taip pat turi mandatą, orientuotą į rimtas DI rizikas, ir patirties vykdant tyrimų finansavimo programas.

Kadangi DI ateitis nesiklostys tiksliai taip, kaip yra prognozuojama – ir gali progresuoti labai greitai – tikime, kad demokratizacija, „DI atsparumas“ ir iteracinis diegimas yra esminiai veiksniai. Nors toliau plėtojame priešakinius suderinamumo ir saugos tyrimus bendrovėje „OpenAI“, pažangai bus naudinga stipri, įvairiapusė ir nepriklausoma ekosistema, taikanti papildomus metodus tobulėjant gebėjimams. Ši dotacija yra vienas žingsnis šio tikslo link. Nekantraujame toliau bendradarbiauti su platesne tyrimų bendruomene šiai sričiai žengiant į priekį.