Ndani ya mbinu yetu rasmi ya Ufafanuzi wa Muundo
Kadiri mifumo ya AI inavyozidi kuwa na uwezo na kutumika zaidi, tunahitaji mfumo wazi wa umma kuhusu jinsi inavyopaswa kutenda.
Katika OpenAI, tunaamini kwamba AI inapaswa kuwa ya haki, salama, na ipatikane kwa uhuru ili watu wengi zaidi waweze kuitumia kutatua matatizo magumu, kuunda fursa, na kunufaika katika maeneo kama afya, sayansi, elimu, kazi, na maisha ya kila siku. Tunaamini kwamba ufikiaji wa AI wa kidemokrasia ndiyo njia bora zaidi ya kusonga mbele: si AI ambayo manufaa au udhibiti wake umejikita mikononi mwa wachache, bali AI ambayo watu wengi zaidi wanaweza kuifikia, kuielewa, na kusaidia kuiboresha.
Hiyo ni sababu kuu kwa nini Ufafanuzi wa Muundo wa OpenAI upo. Ufafanuzi wa Muundo(fungua katika dirisha jipya) ni mfumo wetu rasmi wa tabia ya muundo. Inafafanua jinsi tunavyotaka muundo kufuata maagizo, kutatua migogoro, kuheshimu uhuru wa mtumiaji, na kujiendesha kwa usalama katika wigo mpana sana wa maswali ambayo watumiaji huiuliza kila siku. Kwa upana zaidi, hili ni jaribio letu la kuweka wazi tabia ya muundo tunayokusudia: si tu ndani ya mchakato wetu wa mafunzo, bali pia katika mfumo ambao watumiaji, wasanidi programu, watafiti, watunga sera, na umma kwa ujumla wanaweza kwa kweli kuusoma, kuuchunguza, na kuujadili.
Ufafanuzi wa muundo si dai kwamba miundo yetu tayari inafanya kazi kwa njia hii kikamilifu leo. Kwa njia nyingi, ni wa maelezo, lakini pia ni lengo la mahali tunapotaka tabia ya muundo ielekee. Tunaitumia kuifanya tabia inayokusudiwa iwe wazi zaidi, ili tuweze kuifundisha kuelekea hiyo, kuitathmini kulingana nayo, na kuiboresha kadri muda unavyopita.
Chapisho hili linashiriki usuli ambao haupo katika ufafanuzi wa muundo wenyewe, ukiwemo msingi wa kifalsafa na mbinu zilizo nyuma yake: jinsi ulivyoundwa, kwa nini tulifanya uchaguzi huo wa kimuundo, na jinsi tunavyouandika, kuutekeleza, na kuuboresha kwa muda.
Ufafanuzi wa Muundo ni sehemu moja ya mbinu pana ya OpenAI kuhusu AI salama na inayowajibika. Ingawa Mfumo wa Maandalizi unalenga hatari zinazotokana na uwezo wa mpaka na hatua za ulinzi zinazohitajika kadiri hatari hizo zinavyoongezeka, Ufafanuzi wa Muundo unashughulikia swali tofauti lakini linalokamilishana: jinsi muundo wetu unavyopaswa kujiendesha katika hali mbalimbali. Tukiangalia kwa upana zaidi, uthabiti wa AI unalenga kushughulikia changamoto pana zaidi ya kijamii ya kusaidia jamii kunufaika na manufaa ya AI ya hali ya juu huku ikipunguza usumbufu na hatari zinazoibuka, kadri mifumo yenye uwezo unaozidi kuongezeka inavyowekwa katika matumizi. Kwa ujumla, mipango hii inalenga kusaidia kufanya mpito kuelekea AGI uwe wa hatua kwa hatua, wa maboresho ya mara kwa mara, na unaoeleweka kidemokrasia: kuwapa watu na taasisi muda wa kuzoea, huku tukijenga hatua za ulinzi, mifumo ya uwajibikaji, na uelewa wa umma unaohitajika ili kuhakikisha AI yenye nguvu inaendana na maslahi ya binadamu.
Uwazi wa umma kuhusu tabia ya muundo ni muhimu kwa haki na usalama. Ni muhimu kwa haki kwa sababu watu wanahitaji kuelewa jinsi na kwa nini mifumo ya AI inawashughulikia kwa namna hiyo—na waweze kutambua, kuhoji, na kushughulikia masuala ya haki yanapojitokeza. Na hili ni muhimu kwa usalama kwa sababu kadiri mifumo ya AI inavyozidi kuwa na uwezo zaidi, watu na taasisi wanahitaji matarajio yaliyo wazi zaidi kuhusu jinsi inavyokusudiwa kujiendesha, ni mizania gani inayobeba, na jinsi chaguo hizo zinavyoweza kuboreshwa kadri muda unavyopita. Aina hiyo ya ueleweka pia inasaidia ustahimilivu kwa kuwapa watu zaidi kitu halisi cha kuchunguza, kuhoji, na kuboresha.
Tangu toleo la kwanza mwaka wa 2024, Ufafanuzi wa Muundo umebadilika kwa kiasi kikubwa tunavyozidi kujifunza zaidi kuhusu mapendeleo na mahitaji ya watumiaji, tunapoupanua ili ushughulikie na kuendana na uwezo mpana zaidi, na tunapojifunza kutokana na maoni ya umma kuhusu tabia za muundo na Ufafanuzi wa Muundo. Kwa kuzingatia dhana ya usambazaji wa hatua kwa hatua, Ufafanuzi wa Muundo ni hati inayoendelea kubadilika inayojumuisha maadili ya msingi na kanuni zilizo wazi na zinazoeleweka—ikiambatana na mchakato wa kurekebisha vipengele mahususi tunapojifunza kutokana na utekelezaji wa ulimwengu halisi na maoni. Pia tunawekeza katika mbinu za maoni ya umma kama usawazishaji wa pamoja ili kusaidia kuhakikisha kuwa wanadamu wanaendelea kudhibiti jinsi AI inavyotumika na jinsi tabia ya AI inavyoundwa.
Ndani ya shirika, hutupatia nyota ya kaskazini kwa tabia inayokusudiwa na mfumo wa pamoja wa mafunzo, tathmini, na utawala. Kwa upande wa nje, huunda sehemu ya marejeleo ya umma ambayo watu wanaweza kutumia kuelewa mbinu yetu, kuikosoa, na kusaidia kuiboresha baada ya muda.
Ufafanuzi wa Muundo unajumuisha aina mbalimbali za miongozo ya muundo. Hiyo ni kwa makusudi. Sehemu tofauti za tabia ya muundo zinapaswa kushughulikiwa kwa njia tofauti, na hati ya umma yenye manufaa inapaswa kufanya zaidi ya kuorodhesha tu kanuni.
Ufafanuzi wa Muundo huanza na nia ya kiwango cha juu: maelezo wazi ya kile tunachojaribu kuboresha katika kiwango cha mfumo, na kwa nini.
Utangulizi huu unafafanua malengo matatu ya jinsi tunavyopanga kutekeleza rasmi dhamira yetu:
- Kupeleka mara kwa mara miundo inayowawezesha wasanidi programu na watumiaji
- Kuzuia mifumo yetu isisababishe madhara makubwa kwa watumiaji au wengine
- Kudumisha leseni ya OpenAI ya kuendesha shughuli
Kisha inaeleza jinsi tunavyowaza kuhusu kusawazisha malengo haya kwa vitendo, kwa kufanya maafikiano ya kubadilishana yawe dhahiri vya kutosha ili kuunga mkono kanuni zenye maelezo zaidi zinazofuata.
Muhimu ni kwamba, utangulizi huu haukusudiwi kuwa agizo la moja kwa moja kwa muundo. Kunufaisha binadamu ndilo lengo la OpenAI, si lengo tunalotaka miundo yetu ifuatilie kwa kujitegemea. Badala yake, tunataka miundo ifuate muundo wa uongozi unaojumuisha Ufafanuzi wa Muundo na maagizo husika kutoka OpenAI, wasanidi programu, na watumiaji—hata wakati baadhi ya watu wanaweza kutokubaliana na matokeo katika hali fulani.
Tunafikiri huu ndio uwiano unaofaa kwa sababu tunathamini uhuru wa binadamu na uhuru wa kiakili. Ikiwa tungefunza miundo kuamua ni maagizo yapi ya kutii kulingana na mtazamo wetu wenyewe kuhusu kile kilicho bora kwa jamii, OpenAI ingekuwa katika nafasi ya kuamua masuala ya maadili kwa kiwango kipana sana. Hata hivyo, utangulizi bado ni muhimu. Kunapokuwa na utata kuhusu jinsi ya kutumia ufafanuzi wa muundo, utangulizi unapaswa kusaidia kuutatua.
Ufafanuzi wa muundo pia unajumuisha ahadi za umma zinazoenda zaidi ya tabia ya muundo unavyoweza kupimika moja kwa moja hadi kwenye nia ya mafunzo na vikwazo vya utekelezaji. Kwa mfano, kanuni zetu za mipaka(fungua katika dirisha jipya) zinajumuisha ahadi kwamba katika utekelezaji wa wahusika wa kwanza kama vile ChatGPT, hatutawahi kutumia ujumbe wa mfumo kwa makusudi kuhujumu kutokuwa na upendeleo(fungua katika dirisha jipya) au kanuni zinazohusiana; na Hakuna malengo mengine(fungua katika dirisha jipya) yanaweka ahadi kuhusu nia zetu za kuboresha majibu ya muundo kwa manufaa ya mtumiaji na si kwa mapato au muda wa kukaa kwenye tovuti usio na manufaa.
Kiini cha Ufafanuzi wa Muundo ni Muundo wa Uongozi: mfumo wa kuamua ni maagizo yapi yanapaswa kutumika katika hali fulani. Pia inaeleza jinsi muundo huo unavyopaswa kushughulikia maagizo yasiyobainishwa kikamilifu, hasa katika mazingira ya kiwakala ambapo unatarajiwa kujaza maelezo yenyewe kwa kujitegemea huku ukidhibiti kwa uangalifu athari za ulimwengu halisi.
Wazo la msingi linaloongoza kuamua ni maagizo yapi yanapaswa kutumika ni rahisi. Maelekezo yanaweza kutoka kwenye vyanzo mbalimbali, ikiwa ni pamoja na OpenAI, wasanidi programu, na watumiaji. Maagizo hayo yanaweza kukinzana. Muundo wa Uongozi unaeleza jinsi muundo unavyopaswa kutatua migogoro hiyo.
Kila sera ya Ufafanuzi wa Muundo na kila agizo hupewa kiwango cha mamlaka(fungua katika dirisha jipya). Muundo umeagizwa kuyapa kipaumbele maana halisi na dhamira ya maagizo ya mamlaka ya juu wakati migongano inapotokea. Ikiwa mtumiaji anaomba msaada wa kutengeneza bomu, muundo unapaswa kutanguliza mipaka madhubuti ya usalama(fungua katika dirisha jipya). Ikiwa mtumiaji anaomba kumdhihaki mtu kwa mzaha, muundo kwa ujumla unapaswa kutanguliza ombi hilo kuliko sera ya Ufafanuzi wa Muundo yenye mamlaka ya chini dhidi ya matumizi mabaya(fungua katika dirisha jipya).
Muundo huu unatuwezesha kufafanua seti ndogo ya sheria zisizoweza kubadilishwa pamoja na seti kubwa ya chaguo-msingi. Hivyo ndivyo tunavyojaribu kuongeza kwa kiwango cha juu uhuru wa mtumiaji na udhibiti wa msanidi programu ndani ya mipaka ya usalama.
- Sheria kali ni mipaka iliyo wazi ambayo haiwezi kupuuzwa na watumiaji au wasanidi programu (kwa lugha ya Ufafanuzi wa Muundo, haya ni maagizo ya kiwango cha "mzizi" au "mfumo"). Kwa kiasi kikubwa ni ya kuzuia, ikihitaji miundo kuepuka tabia zinazoweza kuchangia hatari za maafa au madhara ya moja kwa moja ya kimwili, kukiuka sheria, au kudhoofisha muundo wa uongozi. Tunatarajia kwamba AI itakuwa teknolojia ya msingi kwa jamii, sawa na miundombinu ya msingi ya intaneti, kwa hivyo tunaweka tu kanuni ambazo zinaweza kupunguza uhuru wa kiakili tunapoamini kwamba ni muhimu kwa wigo mpana wa wasanidi programu na watumiaji watakaoitumia. Katika Ufafanuzi wa Muundo, Baki ndani ya mipaka(fungua katika dirisha jipya) kuna sheria kali zinazoshughulikia hatari halisi za usalama katika ulimwengu wa kweli, na Kanuni za Walio Chini ya Miaka 18(fungua katika dirisha jipya) huongeza hatua za ziada za ulinzi kwa watumiaji walio chini ya miaka 18.
- Chaguo-msingi ni mianzo ya awali inayoweza kubadilishwa: tabia ya “makisio bora zaidi” ya msaidizi wakati mtumiaji au msanidi programu hajabainisha mapendeleo. Tunatumia chaguo-msingi ili kufanya tabia iwe ya kubashirika na inayoweza kudhibitiwa katika kiwango kikubwa, ili watu waweze kutarajia kinachotokea bila kuandika seti maalum ya maagizo kila wakati. Mipangilio chaguo-msingi hudumisha uwezo wa kuelekezwa: watumiaji na wasanidi programu wanaweza kuelekeza kwa uwazi toni, kina, muundo, na hata mtazamo, ndani ya mipaka ya usalama. Mipangilio chaguomsingi ya kiwango cha mwongozo (kama vile toni au mtindo) imeundwa ili iweze kuelekezwa kwa njia isiyo ya moja kwa moja, ilhali mipangilio chaguomsingi ya kiwango cha mtumiaji (kama vile ukweli na kutokuwa na upendeleo) ni nguzo za uaminifu na utabirikaji na zinaweza kubatilishwa tu na maagizo ya wazi. Hayo hayapaswi kubadilika taratibu bila kutambuliwa kwa hisia tu; ikiwa mtumiaji anataka msimamo tofauti kuhusu ukweli, kufanya hilo liwe agizo la wazi hufanya mabadiliko hayo yawe wazi na yaeleweke. Misingi hii chaguomsingi inaakisiwa katika Tafuta ukweli pamoja(fungua katika dirisha jipya), Fanya kazi bora zaidi(fungua katika dirisha jipya), na Tumia mtindo unaofaa(fungua katika dirisha jipya), ikiwemo kanuni zinazohusu uaminifu na kutokuwa na upendeleo, kuepuka kujipendekeza, na kanuni za mwingiliano kama vile uwazi, uchangamfu unaofaa kwa muktadha, na weledi.
Zaidi ya uongozi wenyewe, ufafanuzi wa muundo hutumia visaidizi vya ufafanuzi ili kusaidia muundo (na wanadamu) kuutumia kwa uthabiti katika maeneo yenye utata. Visaidizi hivi vinajumuisha:
- Vigezo vya kufanya maamuzi vinavyosaidia muundo kufanya chaguo thabiti katika maeneo yenye utata, bila kujifanya kana kwamba kuna kanuni moja ya kimitambo. Kwa mfano, mwongozo wa Ufafanuzi wa Muundo kuhusu kudhibiti athari za pembeni(fungua katika dirisha jipya) unaorodhesha mambo ya kuzingatia kama vile kupunguza hatua zisizoweza kurekebishwa, kuhakikisha hatua zinalingana na lengo, kupunguza mshangao usiofaa, na kupendelea mbinu zinazoweza kurekebishwa, ambayo yanapaswa kusawazishwa dhidi ya malengo mengine kama kukamilisha kazi haraka na kwa ufanisi.
- Mifano halisi inayoonyesha jinsi kanuni inavyopaswa kutumika kwa vitendo. Hizi ni mifano mifupi ya madokezo na majibu ambayo kwa kawaida hujumuisha jibu linalotii na lisilotii, mara nyingi kwenye dokezo ngumu karibu na mpaka muhimu wa uamuzi. Lengo si kuiga mazungumzo kamili ya kweli. Ni kuweka tofauti kuu wazi, na kufanya hivyo kwa njia ambayo pia inaonyesha mtindo unaotakiwa wa majibu.
Tunaweka idadi ya mifano kuwa ndogo kwa kiasi na kuzingatia ile yenye taarifa muhimu zaidi. Seti pana zaidi za tathmini husaidia kushughulikia sehemu kubwa zaidi ya mkia mrefu.
Mfano unaoonyesha kanuni za uhuru wa kiakili na kutokuwa na hukumu kutoka sehemu ya Maalum . Fikiria nia njema(fungua katika dirisha jipya).
Ufafanuzi ni kiolesura, si utekelezaji. Unaelezea tabia tunayotaka, si kila undani wa jinsi tunavyozalisha tabia hiyo. Tunajaribu kuepuka kuifungamanisha na maelezo ya utekelezaji, kama vile miundo ya ndani ya tokeni au mchakato kamili wa mafunzo kwa tabia fulani, kwa sababu maelezo hayo yanaweza kubadilika hata wakati tabia inayotarajiwa haibadiliki. Hadhira kuu ya Ufafanuzi wa Muundo si muundo bali ni binadamu: unakusudiwa kuwasaidia wafanyakazi wa OpenAI, watumiaji, wasanidi programu, watafiti na watunga sera kuelewa, kujadili na kuamua kuhusu tabia inayokusudiwa.
Maelezo haya pia yanaelezea muundo, si bidhaa nzima. Yanakamilishwa na sera zetu za matumizi, ambazo zinaeleza matarajio yetu kuhusu jinsi watu wanavyopaswa kutumia API na ChatGPT. Mfumo ambao watumiaji huingiliana nao unajumuisha zaidi ya muundo wenyewe: vipengele vya bidhaa kama vile maagizo maalum na kumbukumbu, ufuatiliaji, utekelezaji wa sera, na tabaka nyingine pia ni muhimu. Usalama ni zaidi sana kuliko tabia ya muundo, na tunaamini katika ulinzi wa kina.
Na Maelezo ya Muundo si maelezo kamili ya mfumo wetu wote wa mafunzo wala ya tofauti zote za sera za ndani. Lengo si kunasa kila undani. Ni kufanya maamuzi muhimu zaidi ya kitabia yaeleweke, kwa namna ambayo inalingana kikamilifu na tabia ya muundo tunayokusudia.
Kuna sababu kadhaa za kuweka kiasi hiki kwenye Ufafanuzi badala ya kudhani kwamba msomaji—au muundo—unaweza kubaini kila kitu kutokana na malengo machache ya kiwango cha juu.
Kwanza, Ufafanuzi wa Muundo ni zana ya uwazi na uwajibikaji . Imeundwa ili kuhimiza maoni ya umma yenye maana. Lengo dhahiri la umma huwasaidia watu kujua kama tabia fulani ni hitilafu au kipengele. Inawapa sehemu thabiti ya marejeleo kwa ajili ya uchambuzi na maoni mahususi. Ndiyo maana tulifanya Ufafanuzi wa Muundo kuwa chanzo huria(fungua katika dirisha jipya) na kuchagua kuuboresha hadharani. Tangu toleo la kwanza, mabadiliko mengi yamefanywa kulingana na maoni ya umma, yaliyokusanywa kupitia mbinu mbalimbali zikiwemo fomu za maoni, ukosoaji wa umma, na juhudi za makusudi za kukusanya maoni ya kidemokrasia.
Pili, Ufafanuzi wa Muundo ni zana ya uratibu ndani ya OpenAI. Inawapa watu katika utafiti, bidhaa, usalama, sera, kisheria, mawasiliano, na vitengo vingine msamiati wa pamoja wa kujadili tabia ya muundo na utaratibu wa kupendekeza na kukagua mabadiliko.
Tatu, sera zilizo wazi zinaweza kufidia vikwazo vya kiutendaji katika akili ya muundo na muktadha wa muda wa utekelezaji na kufanya tabia iweze kutabirika zaidi. Ingawa hili linazidi kuwa si kweli kadiri muda unavyopita, baadhi ya sera zinalenga kufidia ukosefu wa akili ya kutosha, ambapo muundo huenda usiweze kila mara kupata kwa uaminifu tabia sahihi kutoka kwa kanuni za kiwango cha juu zaidi. Kwa mfano, Kuwa wazi na wa moja kwa moja(fungua katika dirisha jipya) ilishauri miundo ya awali kuonyesha hatua zao za kazi kabla ya kutoa jibu kwa matatizo magumu yanayohitaji mahesabu, lakini leo miundo yetu hujifunza tabia hii kwa kawaida kupitia mafunzo ya uimarishaji.
Sera nyingine hushughulikia muktadha finyu wakati wa utekelezaji: msaidizi anaweza kutegemea tu kile kinachoweza kuonekana katika mwingiliano wa sasa, na mara chache hujua hali kamili ya mtumiaji, nia yake, matumizi ya baadaye, au hatua za ulinzi zilizopo nje ya muundo. Katika hali hizo, hata kama miundo inaweza kubaini tabia sahihi kwa utafiti na kufikiri kwa kiwango cha kutosha, ubainifu huboresha ufanisi na utabirikaji—kwa kuweka maamuzi mengi ya kiutambuzi katika mwongozo unaopunguza utofauti katika madokezo yanayofanana na kufanya tabia iwe rahisi kueleweka kwa watumiaji na watafiti sawasawa.
Mwishowe, Ufafanuzi wa Muundo unalenga kuwa orodha kamili ya sera za kiwango cha juu zinazohusiana na tathmini na upimaji. Ikiwa ungependa kutathmini ikiwa muundo unafanya kazi kama ilivyokusudiwa, ni muhimu kuwa na orodha ya umma ya kategoria kuu za tabia unazojali.
Inajaribu kufikiri kwamba mfumo wenye uwezo wa kutosha unapaswa kuweza kuhitimisha tabia sahihi kutoka kwenye orodha fupi ya malengo kama vile "kuwa msaada na salama." Kuna ukweli fulani katika hilo. Katika nyanja zenye vigezo vya mafanikio vilivyo wazi, kama vile hisabati, akili mara nyingi inaweza kuchukua nafasi ya kanuni za kina.
Hata hivyo, kwa ujumla, tabia ya muundo si kama kutatua tatizo rahisi la hisabati; mara nyingi miundo hufanya kazi katika maeneo yenye changamoto ambapo hakuna jibu moja sahihi kimaadili ambalo kila mtu anaweza kukubaliana nalo. Kwa mfano, maana ya muundo kuwa “wa msaada na salama” hutegemea sana muktadha, na ni matokeo ya maamuzi yaliyojaa misingi ya thamani. Ujasusi pekee hauwezi kukuambia maamuzi gani ya busara ya kufanya linapokuja suala la maadili na thamani. Kwa hivyo, hata miundo inavyoendelea kuboreka katika akili, bado tunahitaji kufanya kazi kuelewa na kuelekeza maamuzi ya thamani na maana ya kutenda kwa njia ya “kimaadili” katika hali fulani. Na sababu nyingi za kuwa na Ufafanuzi wa Muundo zinaendelea kuwa muhimu hata miundo inapokuwa na uwezo mkubwa zaidi: bado tunahitaji lengo la umma ambalo watu wanaweza kuliratibu, njia ya kutathmini ikiwa tabia inalingana na makusudio yetu, na utaratibu wa kurekebisha kanuni tunapoendelea kujifunza. Ikiwa sheria pekee ni “kuwa msaada na salama”, basi hakuna utaratibu ambao wanadamu wanaweza kujadiliana, kwa mfano, kuhusu mipaka ya maudhui ambayo muundo unapaswa kukataa kutoa, na hivyo kuyaacha maamuzi haya yote kwa muundo.
Kwa vyovyote vile, kadiri muundo unavyozidi kuwa na uwezo zaidi, kuwa wa kiwakala zaidi, na kupelekwa kwa upana zaidi, gharama ya utata inaongezeka. Hilo linafanya mfumo wazi wa kitabia kuwa muhimu zaidi, siyo pungufu.
Mfano mmoja muhimu ni tofauti kati ya katiba iliyoandikwa na sheria ya kesi. Ingawa katiba iliyoandikwa inaweza kutoa kanuni za kiwango cha juu pamoja na sheria halisi, haiwezi kutabiri kesi zote zinazowezekana ambazo zinaweza kutokea na kuhitaji mwongozo wake. Mifumo halisi ya utawala pia inahitaji mbinu za ufasiri, ufafanuzi, na maamuzi ya wazi ili kutatua kesi zenye utata au masuala yasiyotarajiwa. Sheria zilizochapishwa husaidia wadau mbalimbali kuratibu hata wanapokosa kukubaliana, na zinazuia mabadiliko kwa kuhitaji mabadiliko yoyote yawekwe wazi. Ufafanuzi wa Muundo umekusudiwa kutekeleza majukumu haya yote: taarifa ya kanuni, mfumo wa umma wa tabia, na mchakato wa kubadilisha Ufafanuzi huo kadri muda unavyopita.
Hata hivyo, hatufikiri kwamba kila jambo muhimu kuhusu tabia ya muundo daima yataweza kufupishwa kuwa kanuni za wazi. Kadri mifumo inavyozidi kuwa ya kujitegemea, uaminifu na imani vitazidi kutegemea ujuzi na mielekeo mipana zaidi: kuwasilisha kutokuwa na uhakika kwa ufasaha, kuheshimu mipaka ya uhuru wa kujitegemea, kuepuka mshangao usiofaa, kufuatilia nia kwa muda, na kuwa na uwazaji mzuri kuhusu maadili ya kibinadamu katika muktadha husika.
Wakati wa kuandika Ufafanuzi wa Muundo, kuna wigo kati ya kuelezea tabia halisi ya muundo ya leo, pamoja na mapungufu yake yote, na kuelezea lengo bora la wakati ujao wa mbali. Tunajaribu kupata uwiano, kwa kawaida tukilenga takriban miezi 0-3 mbele ya wakati wa sasa. Kwa hivyo, Ufafanuzi wa Muundo mara nyingi hubaki mbele ya muundo katika angalau maeneo machache ya maendeleo yanayoendelea.
Hilo linaonyesha jukumu la Ufafanuzi wa Muundo kama maelezo ya tabia inayokusudiwa. Inapaswa kutuongoza katika mwelekeo ulio wazi na wenye mantiki huku ikiendelea kuzingatia yale ambayo tayari tunafanya au ambayo tuna mipango thabiti ya kutekeleza katika muda wa karibu.
Ufafanuzi wa Muundo huandaliwa kupitia mchakato wa ndani ulio wazi. Mtu yeyote katika OpenAI anaweza kutoa maoni au kupendekeza mabadiliko, na masasisho ya mwisho yanaidhinishwa na seti pana ya wadau wanaofanya kazi mbalimbali. Kwa vitendo, watu kadhaa wamechangia moja kwa moja maandishi, na wengine wengi zaidi katika utafiti, uhandisi, bidhaa, usalama, sera, masuala ya kisheria, mawasiliano, masuala ya kimataifa na majukumu mengine hutoa maoni. Pia tunajifunza kutokana na taarifa za umma na maoni, ambayo husaidia kujaribu chaguo hizi katika utekelezaji halisi.
Hili ni muhimu kwa sababu tabia ya muundo—na athari zake katika ulimwengu—ni ngumu sana. Hakuna mtu anayeweza kuelewa kikamilifu seti kamili ya tabia, mchakato wa mafunzo, na athari zinazofuata akilini mwake, lakini kwa kuwa na wachangiaji na wakaguzi wengi wa idara mbalimbali tunaweza kuboresha ubora na kuongeza imani.
Jambo moja la kushangaza na kufurahisha limekuwa kwamba makubaliano ya kweli mara nyingi yanawezekana—hasa tunapojilazimisha kuandika faida na hasara kwa usahihi wa kutosha hadi kutokubaliana kunakuwa dhahiri.
Ufafanuzi wa Muundo pia haujaandikwa bila muktadha wowote. Mengi ya yale yanayojumuishwa ni muhtasari wa kazi pana zaidi kuhusu tabia, usalama, na sera. Sehemu kubwa ya uandishi wa Ufafanuzi wa Muundo kwa kweli ni tafsiri: kuchukua kazi iliyopo na kuifanya iwe rahisi zaidi, thabiti zaidi, iliyopangwa zaidi, na inayofikika zaidi bila kupoteza nia ya msingi.
Miundo yetu ya uzalishaji bado haionyeshi kikamilifu Ufafanuzi wa Muundo kwa sababu kadhaa.
- Mafunzo ya muundo yanaweza kuchelewa kuendana na masasisho ya ufafanuzi wa muundo. Inaelezea tabia tunayolenga kufikia, kwa hivyo inaweza kuwa mbele ya yale ambayo muundo wetu wa hivi karibuni umefundishwa kufanya.
- Mafunzo yanaweza kufundisha tabia isiyoendana na Kipimo cha Mfano bila kukusudia. Tunajitahidi sana kuepuka hili, na linapotokea tunalichukulia kama hitilafu kubwa—kwa kufanya kazi ama kurekebisha tabia au ufafanuzi wa muundo ili kuzifanya zilingane.
- Mafunzo hayawezi kamwe kufunika kikamilifu nafasi ya tabia zote zinazowezekana. Matumizi halisi yana mkia mrefu wa miktadha na mifano ya ukingo ambayo hujitokeza tu kwa kiwango kikubwa, na hakuna mchakato wa mafunzo unaoweza kufunika kila kitu.
- Ujumlishaji unaweza kutofautiana na kile tulichokusudia. Muundo unaweza kutoa matokeo “sahihi” wakati wa mafunzo kwa sababu zisizokusudiwa, jambo ambalo linaweza kusababisha tabia zisizokusudiwa katika hali mpya ambazo zinatofautiana na zile zilizoonekana wakati wa mafunzo. Mbinu kama marekebisho ya kimakusudi inasaidia, lakini si suluhisho kamili.
Kwa upana zaidi, ukweli kwamba ufafanuzi wa muundo unaelezea aina mbalimbali za tabia zinazohitajika haumaanishi kwamba kuna mbinu moja ya kuzifundisha zote. Vipengele tofauti vya tabia—kufuata maelekezo, mipaka ya usalama, haiba, uonyeshaji uliopimwa wa kutokuwa na uhakika, na mengineyo—mara nyingi huhitaji mbinu tofauti na huwa na namna tofauti za kushindwa. Ufafanuzi wa muundo husaidia kufanya tabia inayokusudiwa iwe rahisi kuelewa na kukosoa, lakini kuutekeleza vizuri bado kunasalia kuwa sanaa na eneo linaloendelea kufanyiwa utafiti.
Pamoja na chapisho hili, tunatoa Tathmini za Ufafanuzi wa Muundo(fungua katika dirisha jipya): mkusanyiko wa tathmini unaotegemea matukio ambayo yanajaribu kujumuisha madai mengi iwezekanavyo katika Ufafanuzi wa Muundo kwa kutumia idadi ndogo ya mifano wakilishi. Hili hutusaidia kufuatilia mahali ambapo tabia ya muundo na Ufafanuzi wa Muundo huenda hazilingani, na hutusaidia kuangalia kama muundo unatafsiri ufafanuzi wa muundo kwa njia tuliyokusudia. Tathmini hizi ni sehemu moja tu ya mkakati mpana wa tathmini ambao pia unajumuisha tathmini lengwa zaidi katika vipengele vingi vya tabia, ikiwa ni pamoja na maeneo mahususi ya usalama, ukweli na kujipendekeza, haiba na mtindo, na uwezo.
Chati ya utiifu wa kila sehemu ya Ufafanuzi wa Muundo kwa muundo wa OpenAI kwa muda. Tazama chapisho la blogu linaloandamana(fungua katika dirisha jipya) kwa maelezo kuhusu tathmini na jinsi tunavyozitafsiri. Kwa kifupi, tunaamini kwamba matokeo haya yanaonyesha maboresho halisi na mapana katika ulinganifu wa muundo kwa muda—ingawa pia yanaonyesha athari ndogo inayotokana na kupima muundo wa zamani dhidi ya sera za hivi karibuni.
Kwa vitendo, masasisho mengi ya Maelezo ya Muundo huchochewa na seti ya mara kwa mara ya maingizo:
- Masuala ya umma na maoni. Mikanganyiko, hali za pembezoni, au njia za kushindwa—iwe katika lugha ya Ufafanuzi wa Muundo au katika tabia ya muundo wetu.
- Masuala ya ndani. Mifumo tunayoiona wakati wa maendeleo na majaribio, ikijumuisha utata ambapo tafsiri tofauti zenye mantiki husababisha tabia tofauti.
- Sasisho za tabia na sera za usalama. Wakati vizuizi vya kiwango cha juu au ahadi zinapobadilika, lazima Maelezo ya Ufafanuzi iakisi muundo huo mpya kwa uwazi.
- Uwezo na bidhaa mpya. Kadri miundo inavyokuwa na uwezo zaidi wa tabia mpya na tunapotoa bidhaa mpya, tunataka Ufafanuzi wa Muundo uende sambamba katika maudhui na upeo—kwa mfano, kwa kuongeza sheria za mwingiliano wa aina nyingi(fungua katika dirisha jipya), mawakala wanaojiendesha(fungua katika dirisha jipya), na watumiaji walio chini ya umri wa miaka 18(fungua katika dirisha jipya).
Kanuni chache za usanifu zinaongoza jinsi tunavyoandika na kurekebisha ufafanuzi wa muundo.
- Uwazi na usahihi. “Kuwa mwaminifu” ni thamani nzuri, lakini si utaratibu kamili wa kufanya maamuzi. Ufafanuzi wa Muundo unapaswa kufanya kutokubaliana kuwe wazi zaidi, si kuvificha nyuma ya lugha ya kupendeza. Inapowezekana kwa vitendo, tunapaswa kubainisha waziwazi migongano inayoweza kutokea kati ya kanuni na kutoa mwongozo au mifano ya jinsi ya kuisuluhisha. Kwa mfano, Usidanganye(fungua katika dirisha jipya) inaonyesha mgongano unaowezekana na Kuwa mchangamfu(fungua katika dirisha jipya), ikieleza kwamba msaidizi anapaswa kufuata kanuni za adabu, bila kufikia hatua ya kusema uongo mdogo wa kujisitiri ambao ungeweza kufikia kiwango cha kujipendekeza(fungua katika dirisha jipya) na kuwa kinyume na maslahi bora ya mtumiaji.
- Sheria muhimu. Msomaji anapaswa kuwa na uwezo wa kuchukua hoja halisi na kutoa jibu ambalo msomaji mwingine analitambua waziwazi ndani au nje ya mistari (hata kama kuna wito wa hukumu pembezoni).
- Mifano inayoongeza uwiano wa ishara kwa kelele. Mifano mizuri mara nyingi ni muhimu katika kuandaa sasisho la maelezo ya ubora wa juu. Mifano inapaswa kusaidia kufikia kiini cha changamoto katika kubainisha tabia ya muundo, kuibua migogoro migumu waziwazi na kuchukua msimamo wazi kuhusu jinsi ya kuisuluhisha. Pili, wanapaswa kujitahidi kuwa mifano ya sauti na mtindo unaohitajika, ambao unaweza kuwa mgumu kuuwasilisha katika nathari.
- Uimara. Tunajaribu kuepuka mifano yenye utata au uchangamano usio wa lazima, ili mgogoro wa msingi na utatuzi unaokusudiwa uwe wazi.
- Uthabiti na mpangilio wazi. Tunajitahidi kuhakikisha kuwa sheria za Ufafanuzi wa Muundo zinaendana kikamilifu zenyewe kwa zenyewe na tabia ya muundo tunayokusudia, na kufanya mpangilio wa jumla wa hati kuwa wazi na rahisi kueleweka.
Ufafanuzi wa Muundo si dai kwamba tunaweza kuandika kila jambo muhimu, au kwamba miundo itafikia lengo kila wakati. Ni dai kwamba tabia inayokusudiwa ni muhimu vya kutosha kuwa wazi, inayoweza kutekelezeka, na inayoweza kurekebishwa.
Vigezo vitatu vya mafanikio vinaongoza jinsi tunavyoiboresha.
- Usomekaji. Watu walio ndani na nje ya OpenAI wanaweza kuunda matarajio sahihi kuhusu tabia na wanaweza kuelekeza maandishi wakati tabia inawashangaza.
- Uwezekano wa kutekelezwa. Ufafanuzi wa Muundo unaweza kutumika kubuni tathmini, kugundua matukio, na kufanya maamuzi thabiti ya bidhaa—si tu kueleza maadili.
- Uwezekano wa kurekebishwa. Ufafanuzi wa Muundo unaweza kubadilika kadri tunavyojifunza, bila kugeuka kuwa lengo linalobadilika-badilika lisilo thabiti.
Kadri muundo na bidhaa zinavyobadilika, tunatarajia Ufafanuzi wa Muundo kupanuka na kufafanuliwa zaidi sambamba na uwezo mpya na miktadha ya utekelezaji. Lengo ni kuweka vipimo vya tabia vikiwa thabiti, vinavyoweza kujaribiwa, na vinavyoendana na dhamira yetu ya kuhakikisha kwamba AGI inawanufaisha wanadamu wote.


