Që nga 26.4.2026, produkti Sora nuk është më i disponueshëm.
Sot po prezantojmë Sora 2, modelin tonë kryesor për gjenerime të videove dhe audiove.
Modeli origjinal Sora nga shkurti 2024 ishte në shumë mënyra momenti i GPT‑1 për video—hera e parë që gjenerimi i videove filloi të dukej sikur po funksiononte, dhe sjellje të thjeshta si qëndrueshmëria e objekteve u shfaqën nga rritja e kapacitetit të përgatitjes paraprake. Që atëherë, ekipi i Sora-s është fokusuar në trajnimin e modeleve me aftësi më të avancuara të simulimit të botës reale. Ne besojmë se sisteme të tilla do të jenë thelbësore për trajnimet e modeleve të IA-së që kuptojnë në thellësi botën fizike. Një arritje historike për këtë është zotërimi i trajnimit paraprak dhe pas-trajnimit mbi të dhëna video në shkallë të gjerë, të cilat janë në fillimet e tyre krahasuar me gjuhën.
Prompt: figure skater performs a triple axle with a cat on her head
Me Sora 2, po hidhemi drejt asaj që mendojmë se mund të jetë momenti GPT‑3.5 për videot. Sora 2 mund të bëjë gjëra që janë jashtëzakonisht të vështira - dhe në disa raste krejtësisht të pamundura - për modelet e mëparshme të gjenerimit të video-ve: rutinat e gjimnastikës olimpike, rrotullime mbrapsht në një dërrasë sërfi që modelojnë me saktësi dinamikën e ngritjes dhe ngurtësisë, dhe rrotullime të trefishtë ndërsa një mace mbahet fort për jetën e saj.
Prompt: a guy does a backflip
Modelet e mëparshme të videove janë tepër optimiste — ato do të transformojnë objektet dhe do të deformojnë realitetin për të ekzekutuar me sukses një mesazh teksti. Për shembull, nëse një basketbollist humbet një gjuajtje, topi mund të teleportohet në mënyrë spontane në kosh. Në Sora 2, nëse një basketbollist humbet një gjuajtje, topi do të rikthehet nga tabela pas përplasjes me të. Është interesante që “gabimet” që bën modeli shpesh duken si gabime të agjentit të brendshëm që Sora 2 po modelon në mënyrë të tërthortë; megjithëse ende jo i përsosur, i respekton më mirë ligjet e fizikës krahasuar me sistemet e mëparshme. Kjo është një aftësi jashtëzakonisht e rëndësishme për çdo simulues të dobishëm të botës reale - duhet të jesh në gjendje të modelosh dështimin, jo vetëm suksesin.
Modeli është gjithashtu një hap i madh përpara në kontrollueshmëri, i aftë të ndjekë udhëzime të ndërlikuara që përfshijnë shumë hapa ndërsa ruan me saktësi gjendjen e botës reale. Ai shkëlqen në stilet realiste, kinematografike dhe anime.
Prompt: Vikings Go To War — North Sea Launch (10.0s, Winter cool daylight / early medieval)...
Si një sistem gjenerimi video-audio me qëllim të përgjithshëm, është i aftë të krijojë peizazhe të sofistikuara zanore në sfond, të folur dhe efekte zanore me një shkallë të lartë realizmi.
Prompt: Two mountain explorers in bright technical shells, ice crusted faces, eyes narrowed with urgency shout in the snow, one at a time
Ti gjithashtu mund të injektosh drejtpërdrejt elementë të botës reale në Sora 2. Për shembull, duke vëzhguar një video të një prej shokëve tanë të skuadrës, modeli mund t'i fusë ata në çdo mjedis të gjeneruar nga Sora me një përshkrim të saktë të pamjes dhe zërit. Kjo aftësi është shumë e përgjithshme dhe funksionon për çdo njeri, kafshë apo objekt.
Prompt: Bigfoot is really kind to him, a little too kind, like oddly kind. Bigfoot wants to hang out but he he wants to hang too much
Modeli është larg të qenit i përsosur dhe bën shumë gabime, por kjo provon se zgjerimi i mëtejshëm i rrjeteve neurale mbi të dhënat video do të na afrojë më shumë me simulimin e realitetit.
Në rrugën drejt simulimit për qëllime të përgjithshme dhe sistemeve të IA që mund të funksionojnë në botën reale, mendojmë se njerëzit mund të argëtohen shumë me modelet që po ndërtojmë gjatë rrugës.
Ne filluam të luajmë për herë të parë me veçorinë "ngarko veten" disa muaj më parë në ekipin e Sora-s dhe të gjithë u kënaqëm shumë me të. Dukej si një evolucion i natyrshëm i komunikimit - nga mesazhet me tekst te emoji-t, te shënimet zanore, e deri te kjo.
Pra, sot, po prezantojmë një aplikacion të ri social për iOS të quajtur “Sora”, i mundësuar nga Sora 2. Brenda aplikacionit, mund të krijosh, të përziesh krijimet e njëri-tjetrit, të zbulosh video të reja në një burim të personalizueshëm të Sora-s dhe të përfshish veten ose miqtë e tu nëpërmjet një veçorie të quajtur “personazhe”. Me veçorinë e personazheve, mund të futesh direkt në çdo skenë të Sora-s me ngjashmëri të jashtëzakonshme pas një regjistrimi të shkurtër, një herë të vetëm, me video dhe audio në aplikacion për të verifikuar identitetin tënd dhe për të kapur tiparet e tua.
Javën e kaluar, e prezantuam aplikacionin brenda kompanisë për të gjithë OpenAI. Kemi dëgjuar tashmë nga kolegët tanë se po krijojnë miq të rinj në kompani falë kësaj veçorie. Mendojmë se një aplikacion social i krijuar rreth veçorisë “personazhet” është mënyra më e mirë për të përjetuar magjinë e Sora 2.
Shqetësimet për skrollimin e pafund, varësinë, izolimin dhe feed-e të optimizuara me mësim përforcues zënë vendin kryesor - ja çfarë po bëjmë për këtë.
Ne po u japim përdoruesve mjetet dhe opsionet për të qenë në kontroll të asaj që shohin në feed. Duke përdorur modelet ekzistuese të mëdha gjuhësore të OpenAI, kemi zhvilluar një klasë të re algoritmesh rekomanduese që mund të udhëzohen përmes gjuhës natyrore. Ne gjithashtu kemi mekanizma të integruar për të anketuar periodikisht përdoruesit për mirëqenien e tyre dhe për t'u dhënë atyre në mënyrë proaktive mundësinë për të rregulluar feed-in e tyre.
Si parazgjedhje, ne të tregojmë përmbajtje që është e njëanshme ndaj njerëzve që ndjek ose me të cilët ndërvepron, dhe u japim përparësi videove që modeli mendon se ka më shumë gjasa t'i përdorësh si frymëzim për krijimet e tua. Ne nuk po optimizojmë për kohën e kaluar në përmbajtje, dhe e kemi projektuar aplikacionin në mënyrë të qartë për të maksimizuar krijimin, jo konsumin. Mund të gjesh më shumë detaje te filozofia jonë e furnizimit
Ky aplikacion është krijuar për t'u përdorur me miqtë e tu. Përshtypjet dërrmuese nga testuesit janë se personazhet janë ato që e bëjnë këtë të ndihet ndryshe dhe argëtuese për t'u përdorur—duhet ta provosh për ta kuptuar vërtet, por është një mënyrë e re dhe unike për të komunikuar me njerëzit. Ne po e prezantojmë këtë si një aplikacion me ftesa për t'u siguruar që të vish me miqtë e tu. Në një kohë kur të gjitha platformat kryesore po largohen nga grafiku social, ne mendojmë se personazhet do të forcojnë komunitetin.
Mbrojtja e mirëqenies së adoleshentëve është e rëndësishme për ne. Po vendosim kufij të paracaktuar për numrin e krijimeve që adoleshentët mund të shohin në ditë në furnizimin e përmbajtjes dhe po prezantojmë gjithashtu leje më të rrepta për personazhet për këtë grup. Përveç sistemeve tona të automatizuara të sigurisë, ne po zgjerojmë ekipet e moderatorëve njerëz për të shqyrtuar shpejt rastet e bullizmit nëse shfaqen. Ne po fillojmë me kontrollet prindërore Sora përmes ChatGPT‑së që prindërit të mund të anashkalojnë kufijtë e pafund të lëvizjes, të çaktivizojnë personalizimin e algoritmit, si dhe të menaxhojnë cilësimet e mesazheve direkte.
Me personazhet, ti ke kontroll të plotë mbi ngjashmërinë e tua me Sora. Vetëm ti vendos se kush mund të përdorë personazhin tënd, dhe mund të revokosh aksesin ose të heqësh çdo video që e përfshin atë në çdo kohë. Videot që përmbajnë personazhin tënd, duke përfshirë draftet e krijuara nga të tjerët, mund të shikohen nga ti në çdo kohë.
Ka shumë tema sigurie që kemi trajtuar me këtë aplikacion—pëlqimi për përdorimin e ngjashmërisë, origjina, parandalimi i gjenerimit të përmbajtjes së dëmshme dhe shumë më tepër. Shiko dokumentin tonë të sigurisë Sora 2 për më shumë detaje.
Shumë probleme me aplikacionet e tjera rrjedhin nga modeli i monetizimit që nxit vendime që janë në kundërshtim me mirëqenien e përdoruesve. Në mënyrë transparente, plani ynë i vetëm aktual është që përfundimisht t'u japim përdoruesve mundësinë të paguajnë një shumë për të përftuar një video shtesë nëse ka shumë kërkesë në krahasim me kapacitetin e llogaritjes në dispozicion. Ndërsa aplikacioni evoluon, ne do të komunikojmë hapur çdo ndryshim në qasjen tonë këtu, duke vazhduar të ruajmë mirëqenien e përdoruesit si qëllimin tonë kryesor.
Jemi në fillim të këtij udhëtimi, por me të gjitha mënyrat e fuqishme për të krijuar dhe rimiksuar përmbajtje me Sora 2, e shohim këtë si fillimin e një epoke krejtësisht të re për përvojat bashkë-krijuese. Ne jemi optimistë që kjo do të jetë një platformë më e shëndetshme për argëtim dhe krijimtari krahasuar me atë që është në dispozicion tani. Shpresojmë që t'ia kalosh mirë :)
Aplikacioni Sora për iOS(hapet në një dritare të re) është i disponueshëm për shkarkim tani. Mund të regjistrohesh brenda aplikacionit për një njoftim automatik kur hapet qasja për llogarinë tënde. Po fillojmë shpërndarjen fillestare në SHBA dhe Kanada sot me synimin për t'u zgjeruar shpejt në vende të tjera. Pasi të kesh marrë një ftesë, do të kesh mundësi të hysh në Sora 2 edhe përmes sora.com(hapet në një dritare të re). Sora 2 fillimisht do të jetë falas, me kufizime të mëdha si fillim që njerëzit të mund të eksplorojnë lirshëm aftësitë e tij, megjithëse këto janë ende subjekt i kufizimeve të llogaritjes. Përdoruesit e ChatGPT Pro do të mund të përdorin gjithashtu modelin tonë eksperimental dhe me cilësi më të lartë Sora 2 Pro në sora.com(hapet në një dritare të re) (dhe së shpejti edhe në aplikacionin Sora). Ne gjithashtu planifikojmë të publikojmë Sora 2 në API. Sora 1 Turbo do të mbetet i disponueshëm, dhe gjithçka që ke krijuar do të vazhdojë të qëndrojë në bibliotekën tënde sora.com(hapet në një dritare të re).
Modelet video po përmirësohen shumë shpejt. Simulatorët botërorë me qëllim të përgjithshëm dhe agjentët robotikë do të riformësojnë thellësisht shoqërinë dhe do të përshpejtojnë harkun e progresit njerëzor. Sora 2 përfaqëson një përparim të rëndësishëm drejt atij qëllimi. Në përputhje me misionin e OpenAI, është e rëndësishme që njerëzimi të përfitojë nga këto modele ndërsa ato zhvillohen. Ne mendojmë se Sora do të sjellë shumë gëzim, krijimtari dhe lidhje në botë.
- Shkruar nga Ekipi i Sora
Objektivi kryesor & Vizuale
Leximi i parë: një dragua që kalon me shpejtësi pranë majave të akullit të dhëmbëzuara, me vorbulla ajri që shpërndajnë pluhur bore; leximi i dytë: fleta e thyer e akullnajës që bie në një fjord kobalti, me rrezen e diellit ngjyrë qelibar që puth akullin mbi luspa; shprehja tregon qetësi grabitqare / fuqi pa mundim.
Format & Pamje
5.0s; 4K; mbyllje 180°; emulim i sensorit dixhital me format të madh me mikro-kontrast të qartë; kokrriza shumë të imëta; shkëlqim i përmbajtur në pasqyrimet e borës; pa dridhje të filmit.
Lente & Filtrim
Kryesore: Lente sferike 50 mm në platformën ajrore të stabilizuar me xhiroskop montuar përpara (me ndjekje paralele me një hark të lehtë të brendshëm). Filtrimi: Black Pro-Mist 1/8; polarizuesi rrethor rregullon dritën për të zbutur shkëlqimin e borës duke ruajtur reflektimin.
Ngjyrimi / Paleta
Tonet: e bardhë akulli e pastër me rrokullisje të ftohtë; Tonet e mesme: akullnajë blu çeliku dhe ajër cian i zbehtë; Hijezimet: ngjyrë gri/kaltëroshe me detaje të ruajtura të çarjes; kornizë e ngrohtë qelibare në skajet e dragoit për ndarje; reflektimet të përqendruara në ngricë/luspa.
Ndriçimi & Atmosfera
Dielli i ulët pasdite me ndriçim të kryqëzuar; erë katabatike që ngre pluhur bore; mjegull e hollë e akullt për thellësi; shpërthime të herëpashershme pluhuri akulli që ndjekin pas dragoin; avull i lehtë i frymëmarrjes nga dragoi në përpjekje.
Vendndodhja & Kornizimi
Fushë madhështore e serakëve dhe vargmal me skaje të mprehta; kamera ndjek shpejtësinë e dragoit në lartësi mesatare, ndërsa diagonalet e akullnajave shkojnë prapa në fjord; pendë akulli në plan të parë kalojnë afër për paralaks; nuk ka struktura njerëzore.
Garderobë / Rekuizita / Shënime për Automjetet
N/A (krijesë). Leximi i sipërfaqes: kreshta briri mat, pllaka gjysmë të ylberta me mikro-ngrica përgjatë skajeve kryesore.
Tingulli
Erë e fortë në lartësi të mëdha, tingujt e membranës së krahëve në çdo rrahje të krahëve poshtë, kërcitje/krisje kristalore akulli nga serakët, jehonë e largët e shembjes së akullnajës; frymëmarrje e shpejtë/gjëmim i dragoit: “Rrhh—” (nën-1s). Pa vlerësim—mahnitje e pastër diegetike.
Lista e Optimizuar e të Xhirimeve (1 xhirim / 5.0 s)
0.0–5.0 — “Kthesë paralele mbi kreshtë” (50mm, kamera ajrore e montuar përpara me hark të lehtë të brendshëm & mikro-shtytje)
Ne ndjekim dragoin ndërsa kalon mes një korridori me kulla akulli; vorbullat e majave të krahëve shpërndajnë shirita me pluhur bore; një copë akulli që bie shumë poshtë, duke ngritur një re pluhuri; kamera afrohet më shumë—luspat bëhen të dallueshme, skajet qelibar ndriçojnë—pastaj dragoi kthehet drejt fjordit, me bishtin e mprehtë, duke hedhur një hije të gjerë mbi akullnajë.
Qëllimi: Të ofrohet një shkallë mitike me realizëm të prekshëm në një xhirim vendimtar—shpejtësi, masë dhe ftohtësi elementare.
Shënime për kamerën (Arsyet e funksionimit)
50 mm balancon praninë e krijesave dhe shkallën e peizazhit pa miniaturizim; pista paralele + harku i brendshëm përçojnë shpejtësi dhe formë; mikro-shtytjet inkronizohen me rrahjen më të fortë të krahëve për theksim të fuqisë; polarizuesi i dritës kontrollon shkëlqimin duke ruajtur pasqyrimin; dielli prapa/anash skicon siluetën; pendët e akullit që kalojnë afër japin ndjesinë e shpejtësisë përmes paralaksit.
Përfundimi
Kokrriza shumë të imëta (~15%); shkëlqim minimal në pasqyrimet e borës; imitim i butë i printimit për të ruajtur tonet blu të besueshme dhe ato të zeza të thella; dinamika me shumë banda për të ruajtur tingullin e rrahjes së krahëve pa mbuluar jehonën e shembjes së akullit; Korniza e posterit: Dragoi i anuar mbi një serak të ndriçuar nga dielli, stërkala uji, fjordi me një shkëlqim në blu të thellë përtej.
Sora 2
Debbie Mesloh
Caroline Zhao
Publikuar më 30 shtator 2025


