От 26 април 2026 г. продуктът Sora вече не се предлага.
Днес пускаме Sora 2, нашият водещ модел за генериране на видео и аудио.
Оригиналният модел Sora от февруари 2024 г. в много отношения беше моментът на GPT‑1 за видео – първият път, когато генерирането на видео започна да изглежда, че работи, а прости поведения като постоянство на обектите възникнаха от мащабирането на изчислителните ресурси преди обучението. Оттогава екипът на Sora се фокусира върху модели за обучение с по-модерни възможности за симулация на света. Ние вярваме, че такива системи ще бъдат от решаващо значение за обучението на модели с изкуствен интелект, които дълбоко разбират физическия свят. Основен етап за това е овладяването на предварителното и последващото обучение на широкомащабни видео данни, които са в начален стадий в сравнение с езика.
Prompt: figure skater performs a triple axle with a cat on her head
Със Sora 2 ние прескачаме направо към това, което смятаме, че може да бъде моментът GPT‑3.5 за видео. Sora 2 може да извършва неща, които са изключително трудни — и в някои случаи направо невъзможни — за предишни модели за генериране на видео: олимпийски гимнастически съчетания, задни салта на падълборд, които точно моделират динамиката на подвигателната сила и твърдостта, и тройни аксели, докато котка се държи за живота си.
Prompt: a guy does a backflip
Предишните видео модели са прекалено оптимистични - те ще променят обектите и ще деформират реалността, за да изпълнят успешно текстова подкана. Например, ако баскетболист пропусне изстрел, топката може спонтанно да се телепортира към коша. В Sora 2, ако баскетболист пропусне изстрел, топката ще отскочи от таблото. Интересното е, че „грешките“, които моделът прави, често изглеждат като грешки на вътрешния агент, който Sora 2 имплицитно моделира; макар и все още несъвършен, той по-добре спазва законите на физиката в сравнение с предишните системи. Това е изключително важна възможност за всеки полезен симулатор на света — трябва да можете да моделирате не само успеха, но и провала.
Моделът също така представлява голям напредък в управляемостта, способен да следва сложни инструкции, обхващащи множество стъпки, като същевременно точно запазва състоянието на света. Той се отличава с реалистични, кинематографични и аниме стилове.
Prompt: Vikings Go To War — North Sea Launch (10.0s, Winter cool daylight / early medieval)...
Като система за генериране на видео и аудио с общо предназначение, тя е способна да създава сложни фонови звукови пейзажи, реч и звукови ефекти с висока степен на реализъм.
Prompt: Two mountain explorers in bright technical shells, ice crusted faces, eyes narrowed with urgency shout in the snow, one at a time
Вие също така можете директно да инжектирате елементи от реалния свят в Sora 2. Например, като наблюдава видео на един от нашите съотборници, моделът може да го вмъкне във всяка среда, генерирана от Sora, с точно изобразяване на външния вид и гласа. Тази способност е много обща и работи за всеки човек, животно или предмет.
Prompt: Bigfoot is really kind to him, a little too kind, like oddly kind. Bigfoot wants to hang out but he he wants to hang too much
Моделът далеч не е перфектен и допуска много грешки, но това е потвърждение, че по-нататъшното мащабиране на невронните мрежи върху видео данни ще ни доближи до симулирането на реалността.
По пътя към симулации с общо предназначение и системи за изкуствен интелект, които могат да функционират във физическия свят, помисляме, че хората могат да се забавляват много с моделите, които изграждаме по пътя.
За първи път започнахме да експериментираме с функцията „качвам себе си“ преди няколко месеца в екипа на Sora и всички се забавлявахме с нея. Беше като естествена еволюция на комуникацията — от текстови съобщения през емотикони и гласови бележки до това.
Затова днес стартираме ново социално приложение за iOS, наречено „Sora“, задвижвано от Sora 2. В приложението можете да създавате, ремиксирате съдържание, генерирано от други, да откривате нови видеоклипове в персонализирана емисия на Sora и да включвате себе си или приятелите си чрез функция, наречена „персонажи“. С функцията „персонажи“ можете да се включите директно във всяка сцена на Sora с изключителна точност, след като направите кратък еднократен видео- и аудиозапис в приложението, за да потвърдите самоличността си и да заснемете своя образ.
Миналата седмица стартирахме приложението вътрешно за всички в OpenAI. Вече чухме от нашите колеги, че благодарение на функцията те създават нови приятелства в компанията. Смятаме, че социално приложение, изградено около функцията „персонажи“, е най-добрият начин да изпитате магията на Sora 2.
Притесненията относно doomscrolling, пристрастяването, изолацията и RL-sloptimized емисиите са на първо място — ето какво правим по въпроса.
Ние предоставяме на потребителите инструментите и възможността да контролират какво виждат в емисията. Използвайки съществуващите големи езикови модели на OpenAI, ние разработихме нов клас алгоритми за препоръки, които могат да бъдат инструктирани чрез естествен език. Също така разполагаме с вградени механизми за периодично анкетиране на потребителите относно тяхното благосъстояние и проактивно им предоставяме възможност да коригират своята емисията.
По подразбиране Ви показваме съдържание, което е силно насочено към хората, които следвате или с които взаимодействате, и даваме приоритет на видеоклипове, които моделът смята, че най-вероятно ще използвате като вдъхновение за собствените си творения. Ние не оптимизираме времето, прекарано в емисията, и изрично проектирахме приложението, за да увеличим максимално създаването, а не потреблението. Можете да намерите повече подробности в нашата Философия на емисията.
Това приложение е създадено да се използва с Вашите приятели. Преобладаващата обратна връзка от тестерите е, че персонажите са това, което го прави различно и забавно за използване – трябва да го опитате, за да го разберете наистина, но това е нов и уникален начин за комуникация с хората. Пускаме го като приложение, базирано на покани, за да сме сигурни, че влизате с приятелите си. Във време, когато всички основни платформи се отдалечават от социалната графика, смятаме, че персонажите ще подсилят общността.
Защитата на благосъстоянието на тийнейджърите е важна за нас. Въвеждаме ограничения по подразбиране за това колко публикации могат да виждат тийнейджърите на ден в емисията, а също така въвеждаме по-строги разрешения за персонажи за тази група. В допълнение към нашите автоматизирани системи за безопасност, ние разширяваме екипите от човешки модератори, които бързо да преглеждат случаи на тормоз, ако възникнат такива. Стартираме с родителски контрол на Sora чрез ChatGPT, така че родителите да могат да отменят ограниченията за безкрайно превъртане, да изключат персонализацията на алгоритъма, както и да управляват настройките за директни съобщения.
С персонажи Вие контролирате образа си от начало до край със Sora. Само Вие решавате кой може да използва Вашия персонаж и можете да отнемете достъпа или да премахнете всяко видео, което го включва, по всяко време. Видеоклиповете, съдържащи Ваш персонаж, включително чернови, създадени от други хора, могат да бъдат преглеждани от Вас по всяко време.
Има много теми за безопасност, които сме разгледали в това приложение – съгласие за използване на образ, произход, предотвратяване на генерирането на вредно съдържание и много други. Вижте нашия документ за безопасност на Sora 2 за повече подробности.
Много от проблемите с други приложения произтичат от модела на монетизация, който насърчава решения, противоречащи на благосъстоянието на потребителите. Прозрачно казано, единственият ни настоящ план е евентуално да дадем на потребителите възможност да платят известна сума за генериране на допълнително видео, ако има твърде голямо търсене спрямо наличния изчислителен ресурс. С развитието на приложението ще съобщаваме открито за всички промени в нашия подход тук, като същевременно продължаваме да поддържаме благосъстоянието на потребителите като наша основна цел.
Ние сме в началото на това пътуване, но с всички мощни начини за създаване и ремиксиране на съдържание със Sora 2, виждаме това като началото на напълно нова ера за съвместни творчески преживявания. Ние сме оптимисти, че това ще бъде по-здравословна платформа за забавление и творчество в сравнение с това, което е налично в момента. Надяваме се да си прекарате добре :)
Приложението Sora за iOS(отваря се в нов прозорец) е достъпно за изтегляне сега. Можете да се регистрирате в приложението, за да получите push известие, когато достъпът стане наличен за Вашия акаунт. Днес започваме първоначалното разпространение в САЩ и Канада с намерението бързо да разширим достъпа и в други държави. След като сте получили покана, ще можете също да получите достъп до Sora 2 чрез sora.com(отваря се в нов прозорец). Първоначално Sora 2 ще бъде на разположение безплатно, с щедри лимити в началото, така че потребителите да могат свободно да изследват възможностите ѝ, макар че те ще зависят от наличните изчислителни ресурси. Потребителите на ChatGPT Pro също ще могат да използват нашия експериментален, по-висококачествен модел Sora 2 Pro на sora.com(отваря се в нов прозорец) (а скоро и в приложението Sora). Също така планираме да пуснем Sora 2 в API. Sora 1 Turbo ще остане наличен и всичко, което сте създали, ще продължи да съществува във Вашата библиотека на sora.com(отваря се в нов прозорец).
Видео моделите стават много добри, много бързо. Симулаторите на света с общо предназначение и роботизираните агенти ще променят из основи обществото и ще ускорят хода на човешкия прогрес. Sora 2 представлява значителен напредък към тази цел. В съответствие с мисията на OpenAI е важно човечеството да се възползва от тези модели, докато се разработват. Смятаме, че Sora ще донесе много радост, креативност и връзка на света.
— Написано от екипа на Sora
Основна цел и визуални ефекти
Първо четене: дракон, който се плъзга покрай назъбени ледени върхове, вихрите на крилата му откъсват снежни вихрушки; второ четене: напуканата ледникова покривка се спуска към кобалтов фиорд, а кехлибареният слънчев ръб целува скреж по люспите; изражението чете хищно спокойствие / безпроблемна сила.
Формат и визия
5.0s; 4K; 180° затвор; емулация на широкоформатен цифров сензор с ясен микроконтраст; много фино зърно; сдържана халация при снежни отблясъци; без трептене на кадъра.
Обективи и филтриране
Основен: 50-милиметров сферичен обектив върху монтирана на носа жироскопично стабилизирана въздушна платформа (паралелно проследяване с лека дъга навътре). Филтрация: Black Pro-Mist 1/8; кръгов поляризатор с настройка за осветяване на снежните отблясъци, като същевременно запазва огледалния блясък.
Степен / палитра
Акценти: чисто ледено бяло с хладно отпечатък; Средни тонове: стоманеносин ледник и бледоцианов въздух; Сенки: шисти/тюркоаз с запазени детайли на пукнатините; топъл кехлибарен ръб по ръбовете на дракона за разделяне; огледални отблясъци, плътно прилепнали към скреж/люспи.
Осветление и атмосфера
Късно следобедно ниско слънце с кръстосано осветление; катабатичен вятър, който повдига снежни вихри; тънка замръзнала мъгла за дълбочина; периодични изблици на леден прах в следите; слаба пара от духа на дракона при усилие.
Местоположение и кадриране
Извисяващо се поле от сераци и ръбове като ножове; камерата следва дракона със същата скорост на средна височина, диагоналите на ледника се движат назад към фиорда; ледените перки на преден план преминават близо за паралакс; няма човешки структури.
Бележки за гардероб / реквизит / превозно средство
Няма информация (същество). Повърхностно четене: матови рогови ръбове, полупреливащи се люспести плочи с микрозамръзване по предните ръбове.
Звук
Срязване на вятъра във високите въздушни слоеве, тътен от мембраната на крилата при всеки удар надолу, кристален лед, който пука/скърца от сераците, далечен бум от откъсване на ледник; бързо издишване/тътен от дракона: "Ррр—" (под 1сек). Без оценка — чисто диегетично възхищение.
Оптимизиран списък с кадри (1 кадър / 5,0 сек)
0,0–5,0 — „Паралелно издълбаване на хребета“ (50 мм, носово монтирана антена с лека вътрешна дъга и микро натиск)
Ние следваме дракона, докато той се промъква пред коридор от ледени върхове; вихрите по върховете на крилете разкъсват финия лед на ленти; далеч долу пада откъснат фрагмент, изпращайки облак от прах; камерата се приближава — люспите се четат, кехлибареният ръб се разпалва — след това драконът се насочва към фиорда, опашката му се извива като ножица, хвърляйки широка сянка върху ледника.
Цел: Да се постигне митичен мащаб с тактилен реализъм в едно решително преминаване - скорост, маса и елементарен студ.
Бележки за камерата (защо се чете)
50 мм балансира присъствието на съществата и мащаба на пейзажа, без да ги миниатюризира; паралелната траектория + вътрешната дъга предава усещане за скорост и форма; времена на микро натиск с най-силния ход надолу за акцентиране на мощността; поляризаторът на светлината контролира отблясъците, като същевременно запазва блясъка; слънцето отзад/ръб извайва силуета; ледените перки, които почти пропускат обекта, осигуряват паралакс за скорост.
Довършителни работи
Много фино зърно (~15%); минимално халатиране на снежните отблясъци; нежна имитация на печат, за да се запази достоверността на синьото и наситеността на черното; многолентова динамика, за да се запази ударът на крилата, без да се прикрива гърма на откъсването; рамка на плаката: дракон, наклонен над осветен от слънцето серак, струи от снежен прах, фиорд, пламтящ в тъмносиньо отвъд.
Sora 2
Debbie Mesloh
Caroline Zhao
Публикувано на 30 септември 2025 г.


