Sora 2 е тука
Нашиот најнов модел за генерирање видеа е физички попрецизен, пореалистичен и повеќе се контролира од претходните системи. Исто така, има синхронизиран дијалог и звучни ефекти. Креирај со него во новата апликација Sora.
Од 26.04.2026 г., производот Sora повеќе не е достапен.
Денес го објавуваме Sora 2, нашиот водечки модел за видео и аудио генерирање.
Оригиналниот модел Sora од февруари 2024 година беше на многу начини првиот момент на GPT‑1 за видео – првиот пат кога генерацијата на видео почна да изгледа како да функционира, а едноставните однесувања како постојаноста на објектот произлегоа од зголемувањето на пресметковната моќ пред обуката. Оттогаш, тимот на Sora е фокусиран на обука на модели со понапредни способности за симулација на светот. Веруваме дека ваквите системи ќе бидат од суштинско значење за обука на модели со вештачка интелигенција кои многу го разбираат физичкиот свет. Голема пресвртница за ова е совладување на работите пред обуката и по обуката на големи видео податоци кои се во своите почетоци во споредба со јазикот.
Prompt: figure skater performs a triple axle with a cat on her head
Со Sora 2, одиме директно на она што мислиме дека може да биде моментот за видео на GPT‑3.5. Sora 2 може да изведува работи кои се исклучително тешки – и во некои случаи сосема невозможни – за претходните модели за генерирање видео: олимписки гимнастички рутини, салта наназад на даска за веслање кои точно ја моделираат динамиката на пловност и цврстината, како и тројни оски додека мачка се држи за живот.
Prompt: a guy does a backflip
Претходните видеомодели се преоптимистични – тие ќе ги трансформираат објектите и ќе ја деформираат реалноста за успешно да извршат текстуален промпт. На пример, ако кошаркар промаши шут, топката може спонтано да се телепортира во кошот. Во Sora 2, ако кошаркар промаши шут, топката ќе отскокне од таблата. Интересно е што „грешките“ што ги прави моделот често изгледаат како грешки на внатрешниот агент што Sora 2 имплицитно го моделира; иако е сè уште несовршен, подобро ги почитува законите на физиката во споредба со претходните системи. Ова е исклучително важна способност за секој корисен светски симулатор – мораш да можеш да направиш модел кој нема да успее, а не само модели кои успеваат.
Моделот е исто така голем напредок во контролата, способен да следи сложени инструкции кои опфаќаат повеќе снимки додека прецизно ја одржува состојбата на светот. Одлично се истакнува во реалистични, кинематографски и аниме стилови.
Prompt: Vikings Go To War — North Sea Launch (10.0s, Winter cool daylight / early medieval)...
Како систем за генерирање на видео-аудио со општа намена, способен е да креира софистицирани звучни пејзажи во заднина, говор и звучни ефекти со висок степен на реализам.
Prompt: Two mountain explorers in bright technical shells, ice crusted faces, eyes narrowed with urgency shout in the snow, one at a time
Можеш исто така директно да вметнеш елементи од реалниот свет во Sora 2. На пример, со набљудување на видео од еден од нашите членови од тимот, моделот може да ги вметне во која било средина генерирана од Sora со точен приказ на изгледот и гласот. Оваа способност е многу општа и функционира за секое човечко суштество, животно или предмет.
Prompt: Bigfoot is really kind to him, a little too kind, like oddly kind. Bigfoot wants to hang out but he he wants to hang too much
Моделот е далеку од совршен и прави многу грешки, но тоа е потврда дека понатамошното зголемување на невронски мрежи на видео податоци ќе нè приближи до симулирање на реалноста.
На патот кон симулации за општа намена и системи за вештачка интелигенција кои можат да функционираат во физичкиот свет, мислиме дека луѓето можат многу да се забавуваат со моделите што ги создаваме со тек на време.
Првпат почнавме да си играме со оваа функција „постави сам“ пред неколку месеци во тимот на Sora и сите уживавме во неа. Се чувствуваше како природна еволуција на комуникацијата – од текстуални пораки до емотикони, до гласовни белешки, до ова.
Затоа, денес воведуваме нова социјална iOS апликација наречена „Sora“, базирана на Sora 2. Во апликацијата, можете да креирате, да ги ремиксувате генерациите на другите, да откривате нови видеа во прилагодливиот фид на Sora и да се вклучите себеси или вашите пријатели преку функција наречена „ликови“. Со ликови, можете веднаш да се вметнете во која било сцена на Sora со извонредна верност, откако ќе направите кратко, еднократно видео-аудио снимање во апликацијата за да се потврди вашиот идентитет и да се долови вашата сличност.
Минатата седмица, ја воведовме апликацијата интерно за целиот OpenAI. Веќе слушнавме од нашите колеги дека стекнуваат нови пријатели во компанијата поради оваа функција. Мислиме дека социјална апликација изградена околу оваа функција „ликови“ е најдобриот начин да се доживее магијата на Sora 2.
Загриженост за постојаното бесцелно листање негативни содржини, зависноста, изолацијата и фидовите прилагодени со учење од реалниот свет – еве што правиме во врска со тоа.
Им даваме на корисниците алатки и можност за избор за да имаат контрола врз тоа што го гледаат на фидот. Користејќи ги постоечките големи јазични модели на OpenAI, развивме нова класа на алгоритми за препораки кои можат да се подучуваат преку природен јазик. Имаме и вградени механизми за периодично анкетирање на корисниците за нивната благосостојба и проактивно да им дадеме опција да го прилагодат својот фид.
Стандардно, ви прикажуваме содржина која е значително пристрасна кон луѓето што ги следите или со кои комуницирате, а им даваме приоритет на видеата за кои моделот мисли дека најверојатно ќе ги користите како инспирација за вашите креации. Ние не го оптимизираме времето поминато во фидот и експлицитно ја дизајниравме апликацијата за да го максимизираме создавањето, а не потрошувачката. Можете да најдете повеќе детали во нашата „Филозофија на фидот“
Оваа апликација е направена да се користи со вашите пријатели. Убедливо најчестата повратна информација од тестерите е дека ликовите се она што го прави ова поинакво и забавно за користење – мора да го пробате за навистина да го сфатите, но тоа е нов и уникатен начин за комуникација со луѓето. Ја воведуваме оваа апликација базирана на покани за да бидете сигурни дека ќе дојдете со вашите пријатели. Во време кога сите главни платформи се оддалечуваат од социјалната графа, мислиме дека ликовите ќе ја зајакнат заедницата.
Заштитата на благосостојбата на тинејџерите е важна за нас. Воведуваме претходно поставени ограничувања за тоа колку генерации тинејџерите можат да видат дневно во фидот, а исто така воведуваме построги дозволи за ликови за оваа група. Покрај нашите автоматизирани безбедносни системи, ги зголемуваме тимовите на човечки модератори за брзо разгледување на случаи на малтретирање доколку се појават. Започнуваме со Sora родителски контроли преку ChatGPT за родителите да можат да ги надминат бесконечните ограничувања на скролање, да ја исклучат персонализацијата на алгоритмот, како и да управуваат со поставките за директни пораки.
Со ликовите, вие имате целосна контрола врз вашиот лик од почеток до крај со Sora. Само вие одлучувате кој може да го користи вашиот лик, а можете да го отповикате пристапот или да го отстраните кое било видео кое го вклучува вашиот лик во секое време. Видеата што го содржат вашиот лик, вклучувајќи нацрти креирани од други луѓе, можете да ги гледате во секое време.
Има многу безбедносни теми што ги обработивме со оваа апликација – согласност за користење на лик, потекло, спречување на создавање штетни содржини и многу повеќе. Погледнете ја нашата Sora 2 документација за безбедност за повеќе детали.
Многу проблеми со други апликации произлегуваат од моделот на монетизација кој ги поттикнува одлуките што се во спротивност со благосостојбата на корисниците. Транспарентно, нашиот единствен тековен план е на крајот да им дадеме на корисниците можност да платат одредена сума за да генерираат дополнително видео ако има премногу побарувачка во однос на достапните компјутерски капацитети. Како што се развива апликацијата, отворено ќе ги соопштуваме сите промени во нашиот пристап овде, додека продолжуваме да ја одржуваме благосостојбата на корисниците како наша главна цел.
На почетокот сме на ова патешествие, но со сите моќни начини за креирање и ремиксирање содржина со Sora 2, го гледаме ова како почеток на сосема нова ера за кокреативни искуства. Ние сме оптимисти дека ова ќе биде поздрава платформа за забава и креативност во споредба со она што е достапно во моментов. Се надеваме дека ќе си поминеш убаво :)
Апликацијата Sora за iOS(се отвора во нов прозорец) е достапна за преземање сега. Можете да се регистрирате во апликацијата за мобилно известување кога ќе се отвори пристапот за вашата сметка. Денес го започнуваме првичното воведување во САД и Канада со намера брзо да се прошириме во дополнителни земји. Откако ќе добиете покана, ќе можеш да пристапите до Sora 2 и преку sora.com(се отвора во нов прозорец). Sora 2 првично ќе биде достапна бесплатно, со дарежливи лимити за да можат луѓето слободно да ги истражи нејзините можности, иако тие сè уште подлежат на компјутерски ограничувања. Корисниците на ChatGPT Pro ќе можат да го користат и нашиот експериментален, поквалитетен модел Sora 2 Pro на sora.com(се отвора во нов прозорец) (а наскоро и во апликацијата Sora). Исто така, имаме план да ја објавиме Sora 2 во API. Sora 1 Turbo ќе остане достапна и сè што сте креирале ќе продолжи да биде достапно во вашата библиотека на sora.com(се отвора во нов прозорец).
Видео моделите стануваат многу добри, многу брзо. Симулациите за општа намена и роботските агенти суштински ќе го преобликуваат општеството и ќе го забрзаат развојот на човештвото. Sora 2 претставува значаен напредок кон таа цел. Во согласност со мисијата на OpenAI, важно е човештвото да има корист од овие модели додека се развиваат. Ние мислиме дека Sora ќе донесе многу радост, креативност и поврзаност во светот.
– напишано од тимот на Sora
Примарна цел и визуелни елементи
Прво читање: змеј што сече помеѓу забиести ледени шпицеви, воздушни струи од врвовите на крилата разнесуваат снег; второ читање: ледената глечерска плоча се распаѓа кон кобалтно синиот фјорд, со јантарно сонце што го бакнува мразот на лушпите; изразот на лицето/изгледот одразува пленувачка смиреност и лесна сила.
Формат и изглед
5,0 секунди; 4K резолуција; 180° затвор; симулација на голем дигитален сензор со остар микро-контраст; многу фино зрно; умерена светлосна ореола на блесоците од снегот; без треперење на сликата.
Леќи и филтрација
Главна камера: 50 мм сферична на нос-монтирана, жиро-стабилизирана воздушна платформа (паралелно следење со благо навалување навнатре). Филтрирање: црн Pro-Mist 1/8; кружен поларизатор поставен лесно за да се смири блесокот од снегот, додека се зачувува спектакуларниот сјај.
Тон/палета
Најважни нијанси: чиста ледено-бела со ладно пригушување; средни тонови: челично-сина боја на глечерот и светло синозеленао небо; сенки: шкрилец/тиркизна боја со зачувани детали од пукнатините; топол јантарен раб на змејските рабови за одвојување; одблесоци остри на мразот и лушпите.
Осветлување и атмосфера
Ниско сонце во доцните попладневни часови со осветлување од спротивни страни; катабатички ветер подига снежна прашина; тенка замрзната магла за создавање длабочина; повремени експлозии од ледена прашина во траекторијата; слабо видлив здив/парење од змејот при напор.
Локација и кадрирање
Високи ледени блокови и гребен со остри рабови; камерата се движи со иста брзина покрај змејот на средна височина, дијагоналите на глечерот водат назад кон фјордот; ледени перки во преден план минуваат блиску за ефект на паралакса; без човечки објекти.
Гардероба/реквизити/белешки за возила
Не е применливо (суштество). Површинско читање: гребени на Матерхорн, полуприсветливи лушпи со микро-мраз по должината на предните рабови.
Звук
Силен ветер на височина, грмотење на мембраната на крилото при секој замав, кристален звук од мразот на ледените блокови, далечен громогласен звук од пад на глечер; брзо издишување/татнеж од змејот: „Рррр–“ (помалку од 1 секунда). Без музика – чист звук од сцената, природно воодушевување.
Оптимизирана листа на кадри (1 кадар / 5,0 секунди)
0,0–5,0 – „Паралелна резба на гребен“ (50мм, воздушна камера монтирана на нос со благо навалување навнатре и микро-притисок)
Ние го следиме змејот додека тој нишка коридор од ледени врвови; вртлозите на врвовите на крилата се претвораат во ленти од снег; фрагмент од распаѓање паѓа далеку подолу, испраќајќи облак од прав; камерата се приближува – се гледаат лушпите, јантарниот раб се пламнува – потоа змејот се наведнува кон фјордот, со опашката како ножици, фрлајќи сенка врз глечерот.
Цел: прикажи митска големина со тактилна реалност во еден одлучен кадар – брзина, маса и елементарен студ.
Белешки за камерата (зошто изгледа вака)
50 мм го балансира присуството на суштеството и големината на пејзажот без да го минијатуризира; паралелното следење со лак навнатре го нагласува движењето и формата; микро-притисокот се синхронизира со најсилниот замав за нагласување на моќта; поларизаторот на светлина го контролира отсјајот, додека го зачувува сјајот; задното/светлината од заднина ја обликува силуетата; ледените перки што минуваат блиску даваат паралаксни знаци за брзина.
Финализација
Многу фино зрно (~15%); минимална светлосна ореола на блесоците од снегот; нежна имитација на печат за да се зачуваат веродостојни сини и богато црните тонови; мултибенд динамика за да се задржи ударот на крилата без да се прикрива громогласниот звук од падот на глечер; кадар за постер: змејот се наведнува над сончево осветлени ледени блокови, снегот се движи во ленти, а фјордот блеска во длабока сина боја во заднина.
Sora 2
Debbie Mesloh
Caroline Zhao
Објавено на 30 септември 2025 год.


