Sora 2-ը այստեղ է
Մեր վերջին տեսանյութի գեներացման մոդելը ֆիզիկապես ավելի ճշգրիտ, իրատեսական և ավելի վերահսկելի է, քան նախորդ համակարգերը: Այն նաև առանձնանում է սինխրոնացված երկխոսությամբ և ձայնային էֆեկտներով։ Ստեղծեք դրա միջոցով նոր Sora հավելվածում։
26 ապրիլի, 2026 թ.-ից Sora արտադրանքն այլևս հասանելի չէ։
Այսօր մենք թողարկում ենք Sora 2-ը՝ մեր առաջատար տեսանյութի և ձայնային նյութի գեներացման մոդելը:
2024 թվականի փետրվարին ներկայացված Sora բնօրինակ մոդելը շատ առումներով GPT‑1 պահն էր տեսանյութերի համար՝ առաջին անգամ տեսանյութերի գեներացումը սկսեց թվալ, թե այն աշխատում է, և պարզ վարքագծեր, ինչպիսին է օբյեկտի մնայունությունը, ի հայտ եկան նախնական ուսուցման հաշվարկի ընդլայնումից։ Այդ ժամանակից ի վեր Sora Team-ն կենտրոնացած է համաշխարհային ավելի առաջադեմ սիմուլյացիայի հնարավորություններով մոդելների ուսուցման վրա։ Մենք վստահ ենք, որ նման համակարգերը կարևոր կլինեն ֆիզիկական աշխարհը խորապես հասկացող ԱԲ մոդելների ուսուցման համար: Այս ուղղությամբ հիմնական հանգրվան է նախուսուցման և հետուսուցման տիրապետումը մեծածավալ տեսանյութերի տվյալների վրա, որոնք լեզվի համեմատ գտնվում են իրենց զարգացման սկզբնական փուլում:
Prompt: figure skater performs a triple axle with a cat on her head
Sora 2-ի հետ մենք անմիջապես անցնում ենք այն, ինչ մենք կարծում ենք, կարող է լինել GPT‑3.5 պահը տեսանյութի համար։ Sora 2-ը կարող է անել այնպիսի բաներ, որոնք բացառիկ դժվար են, և որոշ դեպքերում բացահայտ անհնար են՝ տեսանյութերի նախորդ սերնդի մոդելների համար՝ օլիմպիական մարմնամարզության վարժություններ, թիավարատախտակի վրա հետադարձ պտույտներ, որոնք ճշգրիտ մոդելավորում են լողունակության և կոշտության դինամիկան, և եռակի աքսելներ, մինչդեռ կատուն պահում է իր կյանքը իր ձեռքերում:
Prompt: a guy does a backflip
Նախորդ տեսանյութերի մոդելները չափազանց լավատես են՝ դրանք կձևափոխեն օբյեկտները և կխեղաթյուրեն իրականությունը՝ հարցումը հաջողությամբ կատարելու համար: Օրինակ, եթե բասկետբոլիստը բաց թողնի նետումը, գնդակը կարող է ինքնաբուխ տեղափոխվել դեպի զամբյուղ: Sora 2-ում, եթե բասկետբոլիստը բաց թողնի նետումը, այն կվերադառնա վահանակից: Հետաքրքիր է, որ մոդելի «սխալները» հաճախ թվում են ներքին ագենտի սխալներ, որոնք Sora 2-ը անուղղակիորեն մոդելավորում է. չնայած դեռ անկատար է, այն ավելի լավ է ենթարկվում ֆիզիկայի օրենքներին՝ համեմատած նախորդ համակարգերի հետ: Սա չափազանց կարևոր հնարավորություն է ցանկացած օգտակար համաշխարհային սիմուլյատորի համար՝ դուք պետք է կարողանաք մոդելավորել ձախողումը, ոչ միայն հաջողությունը:
Մոդելը նաև մեծ առաջընթաց է վերահսկելիության մեջ, կարողանալով հետևել բարդ հրահանգներին, որոնք ընդգրկում են բազմաթիվ քայլեր, մինչդեռ ճշգրիտ պահպանելով համաշխարհային վիճակը: Այն գերազանցում է իրատեսական, կինեմատիկական և անիմե ոճերում։
Prompt: Vikings Go To War — North Sea Launch (10.0s, Winter cool daylight / early medieval)...
Որպես ընդհանուր նշանակության տեսա-լսանյութերի գեներացման համակարգ՝ այն ունակ է ստեղծել բարդ ֆոնային ձայնային պատկերներ, խոսքի և ձայնային էֆեկտներ՝ իրականության բարձր աստիճանով։
Prompt: Two mountain explorers in bright technical shells, ice crusted faces, eyes narrowed with urgency shout in the snow, one at a time
Դուք կարող եք նաև ուղղակիորեն ներարկել իրական աշխարհի տարրերը Sora 2-ի մեջ։ Օրինակ, դիտելով մեր թիմակիցներից մեկի տեսանյութը, մոդելը կարող է նրանց տեղադրել Sora-ի գեներացված ցանկացած միջավայրում՝ արտաքին տեսքի և ձայնի ճշգրիտ պատկերմամբ։ Այս ունակությունը շատ ընդհանուր է և գործում է ցանկացած մարդու, կենդանու կամ օբյեկտի համար։
Prompt: Bigfoot is really kind to him, a little too kind, like oddly kind. Bigfoot wants to hang out but he he wants to hang too much
Մոդելը հեռու է կատարյալ լինելուց և թույլ է տալիս բազմաթիվ սխալներ, բայց դա վկայում է, որ տեսանյութերի տվյալների վրա նեյրոնային ցանցերի հետագա ընդլայնումը մեզ ավելի կմոտեցնի իրականության նմանակմանը:
Ընդհանուր նշանակության սիմուլյացիայի և ԱԲ համակարգերի ճանապարհին, որոնք կարող են գործել ֆիզիկական աշխարհում, մենք կարծում ենք, որ մարդիկ կարող են շատ զվարճանալ այն մոդելներով, որոնք մենք ստեղծում ենք ճանապարհին:
Մենք առաջին անգամ սկսեցինք փորձարկել այս «վերբեռնել ինքներդ» հնարավորությունը մի քանի ամիս առաջ Sora Team-ում, և մենք բոլորս մեծ հաճույք ստացանք դրանից։ Դա կարծես հաղորդակցության բնական էվոլյուցիա էր՝ տեքստային հաղորդագրություններից մինչև էմոջիներ, ձայնային նշումներ և վերջապես՝ սա:
Այսպիսով, այսօր մենք գործարկում ենք նոր սոցիալական iOS հավելված, որը կոչվում է «Sora», և այն աշխատում է Sora 2-ի հիման վրա։ Հավելվածում Դուք կարող եք ստեղծել, վերամշակել միմյանց ստեղծագործությունները, հայտնաբերել նոր տեսանյութեր հարմարեցվող Sora հոսքում և Ձեզ կամ Ձեր ընկերներին ներգրավել «կերպարներ» կոչվող գործառույթի միջոցով։ Կերպարների միջոցով կարող եք անմիջապես հայտնվել Sora-ի ցանկացած տեսարանում՝ ուշագրավ ճշգրտությամբ, հավելվածում կարճ, մեկանգամյա տեսագրություն և աուդիոձայնագրություն կատարելուց հետո՝ Ձեր ինքնությունը հաստատելու և Ձեր նմանությունը գրանցելու համար։
Անցյալ շաբաթ մենք հավելվածը ներքին կարգով գործարկեցինք OpenAI-ի բոլոր աշխատակիցների համար։ Մենք արդեն լսել ենք մեր գործընկերներից, որ նրանք նոր ընկերներ են ձեռք բերում ընկերությունում այդ գործառույթի շնորհիվ։ Մենք կարծում ենք, որ այս «կերպարներ» գործառույթի շուրջ կառուցված սոցիալական հավելվածը լավագույն միջոցն է՝ զգալու Sora 2-ի կախարդանքը։
Մտահոգությունները doomscrolling-ի, կախվածության, մեկուսացման և RL-սլօպտիմիզացված հոսքերի վերաբերյալ առաջնային են՝ ահա թե ինչ ենք մենք անում դրա հետ կապված։
Մենք օգտատերերին տալիս ենք գործիքներ և ընտրության հնարավորություն, որպեսզի նրանք վերահսկեն այն, ինչ տեսնում են հոսքում։ Օգտագործելով OpenAI-ի առկա լեզվի մեծ մոդելները՝ մենք մշակել ենք առաջարկող ալգորիթմների նոր դաս, որոնք կարող են հրահանգվել բնական լեզվով: Մենք նաև ունենք ներկառուցված մեխանիզմներ՝ պարբերաբար հարցնելու օգտատերերին իրենց բարեկեցության մասին և պրոակտիվորեն տալու նրանց հնարավորություն՝ հարմարեցնելու իրենց թարմացումները։
Կանխադրված՝ մենք Ձեզ ցույց ենք տալիս բովանդակություն, որը խիստ կողմնակալ է այն մարդկանց նկատմամբ, որոնց հետևում եք կամ որոնց հետ շփվում եք, և առաջնահերթություն ենք տալիս այն տեսանյութերին, որոնք մոդելի կարծիքով ամենայն հավանականությամբ կօգտագործեք որպես ոգեշնչում Ձեր սեփական ստեղծագործությունների համար։ Մենք չենք օպտիմալացնում լրահոսում անցկացրած ժամանակը և հստակորեն մշակել ենք հավելվածը՝ առավելագույնի հասցնելու ստեղծումը, ոչ թե սպառումը։ Լրացուցիչ մանրամասներ կարող եք գտնել մեր Սննդի փիլիսոփայություն-ում։
Այս հավելվածը ստեղծված է ձեր ընկերների հետ օգտագործելու համար։ Փորձարկողների արձագանքների ճնշող մեծամասնությունն այն է, որ հենց կերպարներն են սա դարձնում տարբերվող և օգտագործման համար հաճելի. դուք պետք է փորձեք այն, որպեսզի իսկապես հասկանաք, բայց սա մարդկանց հետ շփվելու նոր և եզակի միջոց է։ Մենք սա ներկայացնում ենք որպես հրավերի վրա հիմնված հավելված՝ համոզվելու համար, որ դուք միանում եք ձեր ընկերների հետ։ Այն ժամանակ, երբ բոլոր խոշոր հարթակները հեռանում են սոցիալական գրաֆիկից, մենք կարծում ենք, որ կերպարները կուժեղացնեն համայնքի կապերը։
Դեռահասների բարեկեցության պաշտպանությունը մեզ համար կարևոր է։ Մենք սահմանում ենք կանխադրված սահմանափակումներ այն բանի վրա, թե օրական քանի գեներացիա կարող են դեռահասները տեսնել լրահոսում, և նաև ներդնում ենք կերպարների վերաբերյալ ավելի խիստ թույլտվություններ այս խմբի համար։ Բացի մեր ավտոմատացված անվտանգության համակարգերից, մենք ընդլայնում ենք մարդկային մոդերատորների թիմերը՝ արագորեն վերանայելու բուլինգի դեպքերը, եթե դրանք առաջանան։ Մենք Sora-ի համար գործարկում ենք ծնողական վերահսկողություն ChatGPT‑ի միջոցով, որպեսզի ծնողները կարողանան շրջանցել անսահման ոլորման սահմանափակումները, անջատել ալգորիթմական անհատականացումը, ինչպես նաև կառավարել ուղղակի հաղորդագրությունների կարգավորումները։
Կերպարների դեպքում Sora-ում դուք ամբողջությամբ վերահսկում եք ձեր նմանությունը ։ Միայն դուք եք որոշում, թե ով կարող է օգտագործել ձեր կերպարը, և դուք կարող եք ցանկացած պահի չեղարկել մուտքը կամ հեռացնել այն ներառող ցանկացած տեսանյութ։ Ձեր կերպարը պարունակող տեսանյութերը, այդ թվում՝ այլ մարդկանց կողմից ստեղծված սևագրերը, կարող եք դիտել ցանկացած պահի։
Այս հավելվածում մենք անդրադարձել ենք բազմաթիվ անվտանգության թեմաների. համաձայնություն նմանության օգտագործման, ծագման, վնասակար բովանդակության ստեղծման կանխարգելման և շատ ավելին: Մանրամասների համար տես մեր Sora 2 անվտանգության փաստաթուղթը ։
Շատ խնդիրներ այլ հավելվածների հետ կապված բխում են դրամայնացման մոդելից, որը խթանում է որոշումներ, որոնք հակասում են օգտատերերի բարեկեցությանը: Թափանցիկորեն, մեր միակ ընթացիկ պլանն այն է, որ ի վերջո օգտատերերին հնարավորություն տանք վճարել որոշակի գումար՝ լրացուցիչ տեսանյութ գեներացնելու համար, եթե առկա հաշվարկային հզորության համեմատ չափազանց մեծ պահանջարկ լինի։ Քանի որ հավելվածը զարգանում է, մենք բացահայտ կհաղորդենք մեր մոտեցման ցանկացած փոփոխության մասին այստեղ՝ շարունակելով պահպանել օգտատերերի բարեկեցությունը որպես մեր հիմնական նպատակ։
Մենք այս ճանապարհորդության սկզբում ենք, բայց Sora 2-ի հետ բովանդակություն ստեղծելու և ռեմիքսելու բոլոր հզոր եղանակներով մենք սա տեսնում ենք որպես համաստեղծագործական փորձառությունների բոլորովին նոր դարաշրջանի սկիզբ։ Մենք լավատես ենք, որ սա ավելի առողջ հարթակ կլինի զվարճանքի և ստեղծագործության համար՝ համեմատած այն ամենի հետ, ինչ հասանելի է հենց հիմա: Հուսով ենք՝ դուք լավ ժամանակ կանցկացնեք :)
Sora iOS հավելվածը(բացվում է նոր պատուհանում) այժմ հասանելի է ներբեռնման համար։ Դուք կարող եք հավելվածում գրանցվել push ծանուցում ստանալու համար, երբ ձեր հաշվի համար մուտքը բացվի։ Մենք այսօր սկսում ենք նախնական ներդրումը ԱՄՆ-ում և Կանադայում ՝ նպատակ ունենալով արագ ընդլայնվել դեպի այլ երկրներ։ Հրավեր ստանալուց հետո դուք կկարողանաք նաև մուտք գործել Sora 2 sora.com(բացվում է նոր պատուհանում)-ի միջոցով։ Sora 2-ը սկզբում հասանելի կլինի անվճար՝ մեկնարկի համար առատ սահմանաչափերով, որպեսզի մարդիկ կարողանան ազատորեն ուսումնասիրել դրա հնարավորությունները, թեև դրանք դեռևս ենթակա են հաշվարկային ռեսուրսների սահմանափակումների։ ChatGPT Pro-ի օգտատերերը կկարողանան նաև օգտագործել մեր փորձարարական, ավելի բարձր որակի Sora 2 Pro մոդելը sora.com(բացվում է նոր պատուհանում) -ում (և շուտով նաև Sora հավելվածում)։ Մենք նաև նախատեսում ենք թողարկել Sora 2-ը API-ում։ Sora 1 Turbo-ն կմնա հասանելի, և այն ամենը, ինչ դուք ստեղծել եք, կշարունակի պահպանվել ձեր sora.com(բացվում է նոր պատուհանում) գրադարանում։
Տեսանյութերի մոդելները ավելի լավն են դառնում, շատ արագ։ Ընդհանուր նշանակության համաշխարհային սիմուլյատորները և ռոբոտային ագենտները հիմնովին կվերաձևավորեն հասարակությունը և կարագացնեն մարդկային առաջընթացը: Sora 2-ը ներկայացնում է այդ նպատակին հասնելու զգալի առաջընթաց։ Համապատասխանելով OpenAI-ի առաքելությանը՝ կարևոր է, որ մարդկությունն օգտվի այս մոդելներից, երբ դրանք մշակվում են: Մենք կարծում ենք, որ Sora-ն կպարգևի շատ ուրախություն, ստեղծագործություն և հաղորդակցություն ամբողջ աշխարհին:
— Գրված է Sora Team-ի կողմից
Հիմնական թիրախ և վիզուալներ
Առաջին ընթերցում. վիշապը սահում է ատամնավոր սառցե գագաթների կողքով, թևերի ծայրերի հորձանուտները պոկում են սառցե փոշին: Երկրորդ ընթերցում. սառցադաշտի ճեղքված շերտը թափվում է դեպի կոբալտային ֆյորդ, իսկ սաթե արևի եզրը համբուրում է սառույցը թեփուկների վրա։ Արտահայտությունը կարդացվում է որպես գիշատիչ հանգստություն / ջանք չպահանջող ուժ։
Ֆորմատ և տեսք
5.0s; 4K, 180° կափարիչ, լայնաֆորմատ թվային սենսորի էմուլյացիա սուր միկրո-հակադրությամբ, շատ նուրբ հատիկ, զուսպ հալացիա ձյան փայլերի վրա; առանց դարպասի հյուսվածքի:
Ոսպնյակներ և ֆիլտրացիա
Հերոս: 50 մմ գնդաձև ոսպնյակ քթի վրա տեղադրված գիրո-կայունացված օդային հարթակի վրա (զուգահեռ հետևում փոքր ներսի աղեղով): Զտում. սև Pro-Mist 1/8, շրջանաձև բևեռացնողը կարգավորում է լույսը՝ մեղմելու ձյան փայլը՝ պահպանելով արտացոլող փայլը։
Աստիճան / ներկապնակ
Գունային շեշտադրումներ. մաքուր սառույցի սպիտակ՝ սառը անցումով: Միջիններ. պողպատե-կապույտ սառցադաշտ և գունատ ցիան օդ: Ստվերներ. սալաքար/թեյլ՝ պահպանված ճեղքվածքի մանրամասներով, տաք սաթի եզր վիշապի եզրերին՝ առանձնացման համար, փայլուն կետեր՝ ամուր կպած սառույցին/թեփուկներին:
Լուսավորություն և մթնոլորտ
Ուշ կեսօրին ցածր արևի խաչաձև լուսավորություն, կատաբատիկ քամու բարձրացրած ձյունափոշի, բարակ սառած մշուշ խորության համար, ընդհատվող սառույց-փոշու պայթյուններ հետագծում, վիշապի թեթև շնչառական գոլորշի ուժեղացման ժամանակ:
Գտնվելու վայրը և շրջանակումը
Բարձրացող սերակ դաշտ և դանակ-եզրերով լեռնաշղթա; տեսախցիկը համաարագությամբ հետևում է վիշապին միջին բարձրության վրա, սառցադաշտի անկյունագծերը հետ քշելով դեպի ֆյորդ, առաջին պլանի սառցե թևերը անցնում են մոտ՝ պառալաքսի համար, մարդկային կառույցներ չկան:
Զգեստապահարան/Պրոպս/Տրանսպորտային միջոցների նշումներ
N/A (արարած): Մակերեսային ընթերցում. փայլատ եղջյուրի կատարներ, կիսափայլուն թեփուկային թիթեղներ՝ առաջատար եզրերի երկայնքով միկրո-սառնամանիքով։
Ձայն
Բարձր օդային քամու ճղոց, , թևերի թաղանթի որոտ՝ յուրաքանչյուր ներքև հարվածի ժամանակ, սերակներից բյուրեղային սառույցի տկտկոց/ճռռոց, հեռավոր սառցադաշտի ճեղքման բում, վիշապի արագ արտաշնչում/աղմուկ. «Rrhh—» (ենթա-1վրկ)։ Ոչ մի գնահատական՝ մաքուր դիեգետիկ հիացմունք։
Օպտիմալացված կադրերի ցուցակ (1 կադր/ 5.0վ)
0.0–5.0 — «Զուգահեռ լեռնաշղթայի փորագրություն» (50 մմ, քթի-մոնտաժ օդային մի փոքր ներսի աղեղով և միկրո-հրում)
Մենք հետևում ենք վիշապին, երբ այն ոլորվում է սառցե սրածայրերի միջանցքում, թևի ծայրի հորձանուտները կլպում են սառցե փոշին ժապավենների մեջ, պոկված մի բեկոր ընկնում է շատ ներքև՝ արձակելով փոշու ամպ, տեսախցիկը դանդաղ մոտենում է՝ թեփուկները երևում են, սաթե եզրը բռնկվում է, ապա վիշապը թեքվում է դեպի ֆյորդը՝ պոչը թափահարելով՝ լայն ստվեր գցելով սառցադաշտի վրա։
Նպատակ. մեկ վճռական անցումով ապահովել առասպելական մասշտաբ՝ շոշափելի իրականությամբ՝ արագություն, զանգված և տարերային ցուրտ։
Տեսախցիկի նշումներ (ինչու է այն կարդացվում)
50մմ հավասարակշռում է արարածի ներկայությունը և լանդշաֆտի մասշտաբը՝ առանց մանրացնելու, զուգահեռ ուղին + ներսի աղեղը փոխանցում են արագությունն ու ձևը, միկրո-հրումներն ամենաուժեղ ներքևի հարվածի ժամանակ ապահովում են ուժային կետադրություն, լույսի բևեռացուցիչը վերահսկում է շողերը՝ պահպանելով փայլը, հետին/եզրային արևը ձևավորում է ուրվագիծը, մոտակա բաց թողնված սառցե թևերը ապահովում են պարալաքսային արագության հուշումներ:
Հարդարում
Շատ նուրբ հացահատիկի (~ 15%), նվազագույն հալացիա ձյան ցոլքերի վրա, նուրբ տպագրության մեղմ էմուլյացիա՝ արժանահավատ կապույտը և հարուստ սևը պահպանելու համար, բազմաշերտ դինամիկա՝ թևի հարվածը պահպանելու համար՝ առանց ծալքի բումը քողարկելու, պաստառի շրջանակ, վիշապը՝ արևի լույսով ամբողջությամբ լուսավորված, փրփրացող հոսք, ֆյորդը փայլում է մուգ կապույտով այն կողմում:
Sora 2
Debbie Mesloh
Caroline Zhao
Հրապարակված է 2025 թվականի սեպտեմբերի 30-ին․


