Коментар о NTIA политици одговорности у области AI
Позив Националне управе за телекомуникације и информације (NTIA) за достављање коментара о политици одговорности у области AI.
OpenAI са задовољством одговара на позив Националне управе за телекомуникације и информације (NTIA) од 13. априла 2023. за достављање коментара (RFC) о политици одговорности у области AI.
У овом коментару описујемо наше виђење одговорности у области AI на основу безбедносних пракси које примењујемо на услуге које данас пружамо, као и пракси које планирамо да примењујемо на услуге које очекујемо да ћемо нудити у будућности. Поздрављамо одлуку NTIA да ову расправу уоквири у терминима „екосистема“ одговорности у области AI. Као што RFC наводи, актери јавних политика истражују „спектар циљева поузданих AI система и контекста примене“.1 Политике и праксе осмишљене да обезбеде одговорност ће се сходно томе разликовати. Истовремено, конкретне мере одговорности мораће да коегзистирају једна с другом, а најважнији је њихов заједнички утицај.
Верујемо да ће зрел екосистем одговорности у области AI укључивати и хоризонталне и вертикалне елементе. То значи да очекујемо и елементе који се примењују на одређене AI системе у различитим доменима примене, као и елементе који су прилагођени појединачним доменима. Бавимо се развојем и применом веома способних основних модела — модела који уче из велике количине података како би могли да обављају широк спектар накнадних задатака. По нашем мишљењу, AI програмери попут нас морају поступати одговорно и примењивати пажљив приступ развоју и примени најнапреднијих способности, усмерен на безбедност. То важи без обзира на конкретне домене у којима се такви модели могу користити.
Широк спектар постојећих закона већ се примењује на AI — укључујући и наше производе — а правни оквир се брзо развија, уз законодавне иницијативе у Конгресу, AI Act који се развија у Европи, као и законодавне и политичке иницијативе широм света. Истовремено, дуго успостављени системи права, регулативе и других очекивања у областима као што су медицина, образовање и запошљавање већ се тумаче и прилагођавају на начине који ће обликовати улогу AI-ја у тим доменима. Ове секторски специфичне напоре, засноване на дубоком доменском знању, видимо као кључни део оквира одговорности у области AI.
Снажно подржавамо напоре да се ускладе новонастала очекивања у погледу одговорности за AI, укључујући напоре NIST AI Risk Management Framework-а, Савета за трговину и технологију САД-ЕУ и низа других глобалних иницијатива. Док ови напори настављају да напредују, па чак и пре него што нови закони буду у потпуности примењени, видимо улогу за нас и друге компаније да преузму добровољне обавезе по питањима као што су тестирање пре примене, порекло садржаја и поверење и безбедност.
Наш тренутни инжењерски приступ захтева јединствен обим рачунарских ресурса и то сматрамо обећавајућом основом за дефинисање додатних и посебних очекивања у погледу одговорности која би се односила на актере попут нас. Подржавамо пажљиво одређивање обима сваке нове регулативе за веома способне основне моделе како би се сачувала могућност свих актера да се правично такмиче и иновирају.
Одговорност има улогу током целог животног циклуса технологије. Наши напори да наше моделе учинимо безбедним и поузданим почињу пре самог почетка развоја, настављају се током примене и рада наших модела и односе се и на ствараоце и на кориснике веома способних основних модела. Програмерима пружамо водеће способности у свету за њихове апликације, а моћне способности директно пружамо милионима људи који сваког дана користе ChatGPT и наше друге услуге. Наше смернице за коришћење примењују се на све кориснике наших модела, алата и услуга.2 Поштујемо постојеће законе и захтевамо да их наши програмери и корисници поштују када користе наше услуге.
Преостали део овог коментара усмеравамо на наше тренутне приступе одговорности у области AI и описујемо важне области у којима ми и други радимо на јачању екосистема. Напомињемо да креатори политика у Сједињеним Државама и широм света разматрају широк спектар политика и мера намењених остваривању одговорности у области AI, укључујући законодавство, регулативе, међународне споразуме, програме саморегулације и обавезујуће техничке и друге стандарде. Ценимо ове напоре и спремни смо да сарађујемо са другим актерима на развоју и примени ефикасних приступа одговорности у области AI.
Усавршавамо своје праксе упоредо са широм јавном расправом која се развија. Овде дајемо детаље о неколико аспеката нашег приступа.
Транспарентност је важан елемент изградње одговорних AI система. Кључни део нашег приступа одговорности је објављивање документа који тренутно називамо системска картица, за нове AI системе које примењујемо. Наш приступ је инспирисан ранијим истраживањима о картицама модела и системским картицама.3 До сада је OpenAI објавио две системске картице: GPT‑4 системску картицу и DALL-E 2 системску картицу.4
Сматрамо да је у већини случајева важно да ови документи анализирају и описују утицаје система – уместо да се фокусирају искључиво на сам модел – јер утицаји система делимично зависе и од фактора који нису сам модел, укључујући случај употребе, контекст и интеракције у стварном свету. Слично томе, утицаји AI система зависе и од ублажавања ризика као што су смернице за коришћење, контроле приступа и праћење злоупотребе. Сматрамо да је разумно да спољни актери очекују информације о овим темама и да имају прилику да разумеју наш приступ.
Наше системске картице имају за циљ да читаоце информишу о кључним факторима који утичу на понашање система, посебно у областима важним за одговорно коришћење. Утврдили смо да вредност системских картица и сличних докумената не произлази само из прегледа проблема у перформансама модела који пружају, већ и из илустративних примера које нуде. Такви примери могу корисницима и програмерима да пруже утемељеније разумевање перформанси и ризика описаног система, као и корака које предузимамо да те ризике ублажимо. Припрема ових докумената такође помаже у обликовању наших интерних пракси и приказује те праксе другима који траже начине да одговорне приступе AI-ју примене у пракси.
Црвена команда је процес квалитативног тестирања наших модела и система у различитим доменима како бисмо створили целовитији увид у безбедносни профил наших модела. Црвену команду спроводимо интерно са сопственим особљем као део развоја модела, као и са људима који делују независно од тима који гради систем који се тестира. Поред испитивања способности и отпорности наше организације на нападе, црвени тимови користе и методе стрес-тестирања и тестирања граница, које су усмерене на откривање граничних случајева и других потенцијалних начина отказа који могу довести до штете.
Црвена команда допуњује аутоматизоване, квантитативне процене способности и ризика модела које такође спроводимо, а које описујемо у следећем одељку. Она може да расветли ризике који још нису квантификујући, или оне за које стандардизованије процене још нису развијене. Наш ранији рад на црвеној команди описан је у DALL-E 2 системској картици и GPT‑4 системској картици.
Наше активности црвене команде и тестирања углавном се спроводе током фазе развоја новог модела или система. Одвојено од сопственог интерног тестирања, ангажујемо тестере ван OpenAI-а и омогућавамо им рани приступ систему који је у развоју. Тестере бира OpenAI на основу претходног рада у доменима од интереса (истраживачка или практична стручност), а то су најчешће били академски истраживачи и стручњаци из индустрије (нпр. људи са радним искуством у окружењима Trust & Safety). Оцењујемо и потврђујемо резултате ових тестова и предузимамо кораке да прилагодимо систем и применимо ублажавања тамо где је то прикладно.
OpenAI наставља да предузима кораке како би побољшао квалитет, разноврсност и искуство спољних тестера за текуће и будуће процене.
Поред горе описане квалитативне црвене команде, креирамо аутоматизоване, квантитативне процене за различите способности и ризике усмерене на безбедност, укључујући ризике које откривамо методама као што је црвена команда. Ове процене нам омогућавају да међусобно упоређујемо различите верзије наших модела, унапређујемо истраживачке методологије које побољшавају безбедност и на крају служе као један од улаза у доношење одлука о томе које верзије модела ћемо изабрати за примену. Постојеће процене обухватају теме као што су еротски садржај, садржај мржње и садржај повезан са самоповређивањем, између осталог, и мере склоност модела да генеришу такав садржај.
OpenAI забрањује коришћење наших модела и алата за одређене активности и садржај, како је наведено у нашим смерницама за коришћење.5 Ове смернице су осмишљене тако да забране употребу наших модела и алата на начине који наносе штету појединцима или друштву. Ажурирамо ове смернице као одговор на нове ризике и ажуриране информације о томе како се наши модели користе. Приступ нашим моделима и њихово коришћење такође подлежу OpenAI-јевим Условима коришћења који, између осталог, забрањују коришћење наших услуга за нарушавање права људи и забрањују представљање излаза из наших услуга као да их је генерисао човек када то није случај.6
Предузимамо кораке да ограничимо употребу наших модела за штетне активности тако што моделе учимо да одбију да одговоре на одређене врсте захтева који могу довести до потенцијално штетних одговора. Поред тога, користимо комбинацију рецензената и аутоматизованих система да бисмо идентификовали и предузели мере против злоупотребе наших модела. Наши аутоматизовани системи укључују скуп детекција заснованих на машинском учењу и правилима, осмишљених да идентификују садржај који би могао да крши наше смернице. Када корисник више пута задаје нашим моделима садржај који крши смернице, предузимамо мере као што су издавање упозорења, привремена суспензија корисника или, у тежим случајевима, трајна забрана корисника.
Као што је размотрено у RFC-у, постоји много важних питања повезаних са одговорношћу у области AI која још нису решена. У одељцима који следе дајемо додатну перспективу о неколико од тих питања.
Веома способни основни модели имају и корисне способности, али и потенцијал да проузрокују штету. Како способности ових модела постају напредније, тако расту и обим и озбиљност ризика које могу представљати, нарочито ако делују по упутствима злонамерног актера или ако модел није правилно усклађен са људским вредностима.
Строго мерење напретка у потенцијално опасним способностима од суштинске је важности за ефикасну процену и управљање ризиком. Томе приступамо истраживањем и изградњом процена за потенцијално опасне способности које се крећу од једноставних, скалабилних и аутоматизованих алата до прилагођених, интензивних процена које спроводе људски стручњаци. Сарађујемо са академским и индустријским стручњацима и коначно нам је циљ да допринесемо развоју разноврсног скупа процена који може допринети формирању најбољих пракси за процену новонасталих ризика код веома способних основних модела. Верујемо да су процене опасних способности све важнији градивни елемент одговорности и управљања у развоју граничне AI.
Независне процене модела и система, укључујући и оне које спроводе треће стране, могу постајати све вредније како способности модела настављају да расту. Такве процене могу ојачати одговорност и транспарентност у погледу понашања и ризика AI система.
Неки облици процене могу се одвијати унутар једне организације, на пример када тим процењује сопствени рад или када један тим или део организације произведе модел, а други тим или део, делујући независно, тестира тај модел. Другачији приступ је да процену спроведе спољна трећа страна. Као што је горе описано, тренутно се ослањамо на комбинацију интерних и екстерних процена наших модела.
Процене трећих страна могу бити усмерене на конкретне примене, модел или систем у одређеном тренутку, праксе организационог управљања и управљања ризиком, конкретне примене модела или система, или неку њихову комбинацију. Размишљања и могући оквири који ће се користити у таквим проценама настављају да се брзо развијају, а ми пратимо тај развој и разматрамо сопствени приступ проценама.
За било коју процену треће стране, процес одабира ревизора/процењивача са одговарајућом стручношћу и структурама подстицаја имао би користи од додатне јасноће. Поред тога, избор одговарајућих очекивања у односу на која треба процењивати организације или моделе је отворена област истраживања која ће захтевати допринос различитих актера. На крају, биће важно да процене узму у обзир како системи могу да се мењају током времена и да то уграде у сам процес процене / ревизије.
Подржавамо развој захтева за регистрацију и лиценцирање будућих генерација најспособнијих основних модела. Такви модели могу имати довољно опасне способности да представљају значајне ризике по јавну безбедност; ако је то случај, сматрамо да треба да подлежу сразмерним захтевима у погледу одговорности.
Могло би бити прикладно размотрити очекивања у погледу обелодањивања и регистрације процеса обучавања за које се очекује да ће произвести веома способне основне моделе. Такво обелодањивање могло би помоћи креаторима политика да стекну неопходну видљивост за осмишљавање ефикасних регулаторних решења и да предухитре трендове на граници AI напретка. Од кључне је важности да сваки такав режим да приоритет безбедности обелодањених информација.
Од AI програмера би се могло захтевати да добију лиценцу за стварање веома способних основних модела за које је вероватно да ће се показати способнијим од модела који су раније показани као безбедни. Лиценцирање је уобичајено у безбедносно критичним и другим високоризичним контекстима, као што су авио-саобраћај, производња електричне енергије, производња лекова и банкарство. Од носилаца лиценце могло би се захтевати да спроводе процене ризика пре примене и усвоје најсавременије мере заштите безбедности и примене; заиста, многе праксе одговорности које ће NTIA разматрати могле би бити прикладни услови за лиценцирање. Увођење захтева за лиценцирање на нивоу пружалаца рачунарских ресурса такође би могло бити моћан допунски алат за спровођење.
И даље постоји много отворених питања у дизајну механизама регистрације и лиценцирања за постизање одговорности на граници AI развоја. Радујемо се сарадњи са креаторима политика у решавању ових питања.
Референце
- 1
- 2
- 3
- 4
- 5
- 6