2024 ж. 8 қаңтар

OpenAI және журналистика

Біз журналистиканы қолдаймыз, жаңалық ұйымдарымен серіктесеміз және The New York Times шағымын негізсіз деп санаймыз.

Иллюстрация: Justin Jay Wang × DALL·E

Жүктелуде…

Біздің мақсатымыз — адамдарға мүмкіндік беретін⁠(жаңа терезеде ашылады), әйтпесе қолжетімсіз болатын мәселелерді шешуге көмектесетін AI құралдарын әзірлеу. Дүние жүзіндегі адамдар қазірдің өзінде біздің технологиямызды күнделікті өмірін жақсарту⁠(жаңа терезеде ашылады) үшін пайдаланып жүр. Бүгінде миллиондаған әзірлеуші және Fortune 500 компанияларының 92%-дан астамы біздің өнімдерге сүйеніп құрастыруда.

Біз The New York Times шағымындағы уәждермен келіспесек те, мұны бизнесімізді, ниетімізді және технологиямызды қалай жасайтынымызды түсіндіруге мүмкіндік деп көреміз. Біздің ұстанымды мына төрт тармақпен түйіндеуге болады, ал төменде оларды кеңірек ашып көрсетеміз:

Біз жаңалық ұйымдарымен ынтымақтасамыз және жаңа мүмкіндіктер жасап жатырмыз
Оқыту — fair use, бірақ біз бас тарту мүмкіндігін ұсынамыз, өйткені солай дұрыс
«Қайта шығару» — біз нөлге жеткізуге тырысып жатқан сирек қате
The New York Times бүкіл оқиғаны айтып отырған жоқ

1. Біз жаңалық ұйымдарымен ынтымақтасамыз және жаңа мүмкіндіктер жасап жатырмыз

Біз жаңалық ұйымдарын қолдау үшін технологиямызды жобалау үдерісінде көп күш жұмсаймыз. Мүмкіндіктерді зерттеу, олардың алаңдаушылықтарын талқылау және шешімдер ұсыну үшін ондаған ұйыммен, сондай-ақ News/Media Alliance сияқты жетекші салалық ұйымдармен кездестік. Біздің мақсатымыз — үйрену, түсіндіру, кері байланысты тыңдау және бейімделу.

Біздің мақсаттарымыз — сау жаңалық экожүйесін қолдау, жақсы серіктес болу және өзара пайдалы мүмкіндіктер жасау. Осыны ескере отырып, біз бұл міндеттерге жету үшін жаңалық ұйымдарымен мына бағыттарда серіктестік орнатуға ұмтылдық:

Көп көлемді ашық жазбаларды талдау және мақалаларды аудару сияқты уақытты көп алатын міндеттерге көмектесу арқылы тілшілер мен редакторларға пайда әкеліп, қолдау көрсету үшін өнімдерімізді енгізу.
Қосымша тарихи, көпшілікке қолжетімсіз контентпен оқыту арқылы AI модельдерімізге әлем туралы үйрету.
ChatGPT ішінде дереккөзді көрсете отырып нақты уақыттағы контентті көрсету және жаңалық шығарушыларына оқырмандармен байланысудың жаңа жолдарын ұсыну.

Associated Press⁠(жаңа терезеде ашылады), Axel Springer⁠(жаңа терезеде ашылады), American Journalism Project⁠(жаңа терезеде ашылады) және NYU⁠(жаңа терезеде ашылады)-мен алғашқы серіктестіктеріміз біздің тәсілімізге көз жүгіртеді.

2. Оқыту — fair use, бірақ біз бас тарту мүмкіндігін ұсынамыз, өйткені солай дұрыс

Жұртқа қолжетімді интернет материалдарын пайдаланып AI модельдерді оқыту — fair use, мұны бұрыннан қалыптасқан және кеңінен мойындалған прецеденттер қолдайды. Біз бұл қағидатты авторлар үшін әділ, жаңашылдар үшін қажет және АҚШ-тың бәсекеге қабілеттілігі үшін шешуші деп санаймыз.

Дегенмен, біз үшін заңды құқықтан гөрі жақсы азамат болу маңыздырақ. Біз баспагерлерге арналған, өз сайттарына құралдарымыздың кіруін болдырмайтын қарапайым бас тарту үдерісін⁠(жаңа терезеде ашылады) ұсынуда AI индустриясына жетекшілік еттік (The New York Times оны 2023 жылғы тамызда қабылдады).

3. «Қайта шығару» — біз нөлге жеткізуге тырысып жатқан сирек қате

Біздің модельдер оларды жаңа мәселелерге⁠ қолдану үшін ұғымдарды үйренетіндей етіп жасалып, оқытылды.

Жаттап алу — біз үздіксіз ілгерілеп азайтып жатқан оқу үдерісінің сирек ақауы, бірақ белгілі бір контент оқыту деректерінде бірнеше рет кездескенде, мысалы оның бөліктері көптеген түрлі ашық веб-сайттарда болған жағдайда, ол жиірек болады. Сондықтан бізде байқаусыз жаттап алуды шектеу және модель шығыстарында қайта шығаруды болдырмау шаралары бар. Сондай-ақ пайдаланушыларымыздың жауапкершілікпен әрекет еткенін күтеміз; модельдерімізді әдейі қайта шығаруға итермелеу — технологиямызды орынды пайдалану емес және Пайдалану шарттарына қайшы.

Адамдар жаңа мәселелерді шешуді үйрену үшін кең ауқымды білім алатыны сияқты, біз де AI модельдеріміз әлемдегі ақпараттың ауқымын, соның ішінде әрбір тілден, мәдениеттен және саладан, байқай алғанын қалаймыз. Модельдер адамзат білімінің орасан жиынтығынан үйренетіндіктен, кез келген бір сала — соның ішінде жаңалықтар да — жалпы оқыту деректерінің өте шағын бөлігі ғана, ал кез келген жеке дереккөз — соның ішінде The New York Times та — модельдің көзделген үйренуі үшін маңызды емес.

4. The New York Times бүкіл оқиғаны айтып отырған жоқ

19 желтоқсандағы соңғы байланысымызға дейін The New York Times-пен талқылауларымыз сындарлы түрде ілгерілеп жатқандай көрінген. Келіссөздер ChatGPT ішінде дереккөзді көрсете отырып, нақты уақыттағы көрсетілімге қатысты жоғары құнды серіктестікке бағытталды: соның арқасында The New York Times өзіндегі және жаңа оқырмандарымен байланысудың жаңа тәсіліне ие болар еді, ал біздің пайдаланушылар олардың журналистік материалдарына қол жеткізер еді. Біз The New York Times-қа кез келген жеке дереккөз сияқты, олардың контенті қолданыстағы модельдерімізді үйретуге елеулі үлес қоспағанын және болашақ оқытуға да жеткілікті ықпал етпейтінін түсіндірген едік. 27 желтоқсандағы олардың шағымы — біз оны The New York Times-ты оқып барып білдік — біз үшін тосын да көңіл көншітпейтін жағдай болды.

Осы аралықта олар өз контентінің кейбір қайталанып шығуын байқағанын айтқан, бірақ біз кез келген мәселені тексеріп, түзетуге міндеттенгенімізге қарамастан, бірнеше рет мысалдармен бөлісуден бас тартты. Біз мұны қаншалықты маңызды басымдық ретінде қарайтынымызды көрсеттік: мысалы, шілдеде ChatGPT мүмкіндіктерінің бірін алып тастадық⁠(жаңа терезеде ашылады), оны күтпеген түрде нақты уақыттағы контентті қайта шығара алатынын білген бойда.

Қызығы, The New York Times әдейі туындатқан бұл қайталаулар бірнеше⁠(жаңа терезеде ашылады) үшінші⁠(жаңа терезеде ашылады)-тарап⁠(жаңа терезеде ашылады) веб-сайттарда⁠(жаңа терезеде ашылады) кең тараған, бірнеше жыл бұрынғы мақалалардан шыққан сияқты. Олар модельді мазмұнды қайта шығаруға итермелеу үшін, көбіне мақалалардан ұзақ үзінділерді қоса отырып, көмексөздерді әдейі айламен құрастырғанға ұқсайды. Тіпті осындай көмексөздер қолданылғанның өзінде, біздің модельдер әдетте The New York Times тұспалдайтындай әрекет етпейді; бұл олардың не модельге әдейі қайта шығаруды тапсырғанын, не көптеген әрекеттің ішінен өздеріне ыңғайлы мысалдарды таңдап алғанын көрсетеді.

Олардың мәлімдемелеріне қарамастан, мұндай теріс пайдалану әдеттегі де, рұқсат етілген де пайдаланушы әрекеті емес және The New York Times-ты алмастырмайды. Қалай болғанда да, біз жүйелерімізді үйрету деректерін қайта шығаруға бағытталған қарсы шабуылдарға тұрақтырақ ету үстіндеміз және соңғы модельдерімізде бұл бағытта елеулі ілгерілеуге қол жеткіздік.

Біз The New York Times-тың шағымын негізсіз деп санаймыз. Соған қарамастан, The New York Times-пен сындарлы серіктестікке үміттіміз және оның 60 жылдан астам уақыт бұрын алғашқы жұмыс істейтін нейрондық желі⁠(жаңа терезеде ашылады) туралы хабарлауын және Бірінші түзету еркіндіктерін қорғауын қамтитын ұзақ тарихын құрметтейміз.

Біз AI-дың түрлендіруші әлеуетін жүзеге асыру арқылы сапалы журналистика өндіру қабілетін арттыруға көмектесіп, жаңалық ұйымдарымен ынтымақтастықты жалғастыруды асыға күтеміз.

Автор

OpenAI

Қатысты мақалалар

Барлығын қарау

Disrupting malicious uses of AI by state-affiliated threat actors

Қауіпсіздік2024 ж. 14 ақп.

Building an early warning system for LLM-aided biological threat creation

Жарияланым2024 ж. 31 қаң.

Democratic Inputs To AI Grant Program Update

Democratic inputs to AI grant program: lessons learned and implementation plans

Қауіпсіздік2024 ж. 16 қаң.