Пређите на главни садржај
OpenAI

8. јануар 2024.

Производ

OpenAI и новинарство

Подржавамо новинарство, сарађујемо са новинским организацијама и сматрамо да је тужба листа The New York Times неоснована.

OpenAI и новинарство

Илустрација: Justin Jay Wang × DALL·E

Учитавање…

Наш циљ је да развијамо AI алате који оснажују људе(отвара се у новом прозору) да решавају проблеме који су им иначе ван домашаја. Људи широм света већ користе нашу технологију да унапреде свакодневни живот(отвара се у новом прозору). Милиони програмера и више од 92% компанија са листе Fortune 500 данас граде на нашим производима.

Иако се не слажемо са тврдњама из тужбе листа The New York Times, на то гледамо као на прилику да разјаснимо наше пословање, наше намере и начин на који градимо нашу технологију. Наш став може да се сажме у ове четири тачке, које даље образлажемо у наставку:

  1. Сарађујемо са новинским организацијама и стварамо нове могућности
  2. Обучавање је дозвољена употреба, али омогућавамо изузеће јер је то исправно
  3. „Репродуковање“ је редак баг који настојимо да сведемо на нулу
  4. The New York Times не износи целу причу

1. Сарађујемо са новинским организацијама и стварамо нове могућности

У процесу осмишљавања наше технологије вредно радимо да подржимо новинске организације. Састали смо се са десетинама њих, као и са водећим индустријским организацијама као што је News/Media Alliance, како бисмо истражили могућности, разговарали о њиховим недоумицама и понудили решења. Тежимо томе да учимо, информишемо, слушамо повратне информације и прилагођавамо се.

Наши циљеви су да подржимо здрав новински екосистем, будемо добар партнер и створимо обострано корисне могућности. Имајући то у виду, остваривали смо партнерства са новинским организацијама како бисмо постигли следеће циљеве:

  1. Применимо наше производе тако да користе и подрже репортере и уреднике, помажући у задацима који одузимају много времена, као што су анализа обимне јавне документације и превођење прича.
  2. Подучимо наше AI моделе о свету обучавањем на додатном историјском садржају који није јавно доступан.
  3. Прикажемо садржај у реалном времену уз навођење извора у ChatGPT‑у, пружајући нове начине да се новински издавачи повежу са читаоцима.

Наша рана партнерства са Associated Press(отвара се у новом прозору), Axel Springer(отвара се у новом прозору), American Journalism Project(отвара се у новом прозору) и NYU(отвара се у новом прозору) дају увид у наш приступ.

2. Обучавање је дозвољена употреба, али омогућавамо изузеће јер је то исправно

Обучавање AI модела коришћењем јавно доступних материјала са интернета представља дозвољену употребу, што потврђују дугогодишњи и широко прихваћени преседани. Сматрамо да је овај принцип правичан према ствараоцима, неопходан за иноваторе и кључан за конкурентност САД.

Начело да је обучавање AI модела дозвољено као вид дозвољене употребе подржава широк спектар академика(отвара се у новом прозору), библиотечких удружења(отвара се у новом прозору), група(отвара се у новом прозору) цивилног(отвара се у новом прозору) друштва(отвара се у новом прозору), стартапа(отвара се у новом прозору), водећих(отвара се у новом прозору) америчких(отвара се у новом прозору) компанија(отвара се у новом прозору), стваралаца(отвара се у новом прозору), аутора(отвара се у новом прозору) и других(отвара се у новом прозору) који су недавно поднели коментаре Канцеларији САД за ауторска права. И друге регије и земље, укључујући Европску унију(отвара се у новом прозору), Јапан(отвара се у новом прозору)-,Article%2047%2D5,-(1)%E3%80%80A%20person), Сингапур(отвара се у новом прозору) и Израел(отвара се у новом прозору), такође имају законе који дозвољавају обучавање модела на ауторски заштићеном садржају — што представља предност за AI иновације, напредак и улагања.

Ипак, правно право нам је мање важно него да будемо одговорни чланови заједнице. Предводили смо AI индустрију у увођењу једноставног процеса(отвара се у новом прозору) изузимања за издаваче (који је The New York Times усвојио у августу 2023) како бисмо спречили нашим алатима приступ њиховим сајтовима.

3. „Репродуковање“ је редак баг који настојимо да сведемо на нулу

Наши модели су осмишљени и обучени да уче концепте како би их применили на нове проблеме.

Меморисање је редак неуспех процеса учења на чијем унапређењу непрестано радимо, али је чешће када се одређени садржај појављује више пута у подацима за обучавање, на пример ако се његови делови налазе на великом броју различитих јавних веб-сајтова. Зато имамо мере да ограничимо ненамерно меморисање и спречимо репродуковање у излазима модела. Такође очекујемо да наши корисници поступају одговорно; намерно навођење наших модела на репродуковање није примерена употреба наше технологије и противно је нашим Условима коришћења.

Као што људи стичу широко образовање да би научили како да решавају нове проблеме, желимо да наши AI модели обухвате распон светских информација, укључујући сваки језик, културу и индустрију. Пошто модели уче из огромног збира људског знања, било који један сектор — укључујући вести — представља мали део укупних података за обучавање, а било који појединачни извор података — укључујући The New York Times — није значајан за намеравано учење модела.

4. The New York Times не износи целу причу

Изгледало је да су наши разговори са The New York Times конструктивно напредовали до наше последње комуникације 19. децембра. Преговори су били усмерени на вредно партнерство око приказивања садржаја у реалном времену уз навођење извора у ChatGPT‑у, у оквиру којег би The New York Times добио нов начин да се повеже са постојећим и новим читаоцима, а наши корисници приступ њиховом извештавању. Објаснили смо The New York Times-у да, као и било који појединачни извор, њихов садржај није значајно допринео обучавању наших постојећих модела и да такође не би био довољно утицајан за будуће обучавање. Њихова тужба од 27. децембра — за коју смо сазнали читајући The New York Times — била је за нас изненађење и разочарање.

Успут су помињали да су видели извесно „репродуковање“ свог садржаја, али су више пута одбили да поделе било какве примере, упркос нашој посвећености да истражимо и отклонимо све проблеме. Показали смо колико ово озбиљно схватамо као приоритет, на пример у јулу, када смо одмах повукли једну функцију ChatGPT‑а(отвара се у новом прозору) чим смо сазнали да може да репродукује садржај у реалном времену на ненамераване начине.

Занимљиво је да „репродуковања“ до којих је The New York Times довео изгледа потичу из чланака старих више година који су се проширили на више(отвара се у новом прозору) сајтова(отвара се у новом прозору) трећих(отвара се у новом прозору)-страна(отвара се у новом прозору). Изгледа да су намерно манипулисали инструкцијама, често укључујући дугачке одломке чланака, како би навели наш модел да репродукује садржај. Чак и када се користе такве инструкције, наши модели се обично не понашају онако како The New York Times наговештава, што указује да су или упутили модел да репродукује садржај или су бирали примере који им одговарају из великог броја покушаја.

Упркос њиховим тврдњама, ова злоупотреба није уобичајена нити дозвољена активност корисника и није замена за The New York Times. Без обзира на то, непрестано чинимо наше системе отпорнијим на противничке нападе који имају за циљ репродукцију података за обучавање, а у нашим новијим моделима већ смо постигли значајан напредак.

Сматрамо да је тужба листа The New York Times неоснована. Ипак, надамо се конструктивном партнерству са The New York Times и поштујемо његову дугу историју, која укључује извештавање о првој функционалној неуронској мрежи(отвара се у новом прозору) пре више од 60 година и залагање за слободе из Првог амандмана.

Радујемо се наставку сарадње са новинским организацијама и помагању да унапреде своју способност да производе квалитетно новинарство остваривањем трансформативног потенцијала AI.