Përditësimi më 10 qershor 2025: OpenAI o3‑pro tani është në dispozicion për përdoruesit Pro në ChatGPT, si dhe në API-n tonë. Ashtu si OpenAI o1‑pro, o3‑pro është një version i modelit tonë më inteligjent, OpenAI o3, i krijuar për të menduar më gjatë dhe për të siguruar përgjigjet më të besueshme. Detajet e plota mund të gjenden në shënimet e versionit(hapet në një dritare të re).
Sot, po publikojmë OpenAI o3 dhe o4-mini, modelet më të fundit në serinë tonë "o" të modeleve të trajnuara për të menduar më gjatë para se të përgjigjen. Këto janë modelet më inteligjente që kemi nxjerrë deri më sot, duke përfaqësuar një ndryshim të rëndësishëm në aftësitë e ChatGPT për të gjithë, nga përdoruesit kureshtarë deri te studiuesit e avancuar. Për herë të parë, modelet tona të arsyetimit mund të përdorin dhe kombinojnë në mënyrë agjentike çdo mjet brenda ChatGPT—kjo përfshin kërkimin në internet, analizimin e skedarëve të ngarkuar dhe të dhënave të tjera me Python, arsyetimin e thellë për të dhënat hyrëse vizuale dhe madje edhe gjenerimin e imazheve. Në mënyrë kritike, këto modele janë trajnuar për të arsyetuar se kur dhe si të përdorin mjete për të prodhuar përgjigje të detajuara dhe të menduara në formatet e duhura dalëse, zakonisht në më pak se një minutë, për të zgjidhur probleme më komplekse. Kjo u lejon atyre të trajtojnë pyetjet me shumë aspekte në mënyrë më efektive, një hap drejt një ChatGPT më të pavarur që mund të ekzekutojë detyra në emrin tënd. Fuqia e kombinuar e arsyetimit më të avancuar me qasje të plotë në mjete përkthehet në performancë dukshëm më të fortë në standardet akademike dhe detyrat e botës reale, duke vendosur një standard të ri si në inteligjencë ashtu edhe në përdorshmëri.
OpenAI o3 është modeli ynë më i fuqishëm i arsyetimit që shtyn përpara kufijtë në kodim, matematikë, shkencë, perceptim vizual e më shumë. Vendos një SOTA të re në standarde, duke përfshirë Codeforces, SWE-bench (pa ndërtuar një skelë të personalizuar specifike për modelin) dhe MMMU. Është ideal për pyetje komplekse që kërkojnë analizë shumëplanëshe dhe përgjigjet e të cilave mund të mos jenë menjëherë të qarta. Ai performon veçanërisht mirë në detyrat vizuale si analizimi i imazheve, grafikëve dhe tabelave. Në vlerësimet nga ekspertë të jashtëm, o3 bën 20 për qind më pak gabime të mëdha se OpenAI o1 në detyra të vështira të botës reale—duke shkëlqyer veçanërisht në fusha si programimi, biznesi/konsulenca dhe ideimi krijues. Testuesit e hershëm theksuan rigorozitetin e tij analitik si një partner mendimi dhe theksuan aftësinë e tij për të gjeneruar dhe vlerësuar në mënyrë kritike hipoteza të reja—veçanërisht brenda konteksteve të biologjisë, matematikës dhe inxhinierisë.
OpenAI o4-mini është një model më i vogël i optimizuar për arsyetim të shpejtë dhe me kosto të ulët—ai arrin performancë të jashtëzakonshme për madhësinë dhe koston e tij, veçanërisht në matematikë, kodim dhe detyra vizuale. Është modeli me performancën më të mirë të krahasuar në AIME 2024 dhe 2025. Megjithëse qasja në një kompjuter zvogëlon ndjeshëm vështirësinë e provimit AIME, ne bëri përshtypje që o4-mini arrin 99.5% kalueshmëri@1 (100% konsensus@8) në AIME 2025 kur i jepet akses në një interpretues Python. Ndërsa këto rezultate nuk duhet të krahasohen me performancën e modeleve pa qasje në mjete, ato janë një shembull se sa efektivisht o4-mini shfrytëzon mjetet e disponueshme; o3 tregon përmirësime të ngjashme në AIME 2025 nga përdorimi i mjeteve (98.4% kalim@1, 100% konsensus@8).
Në vlerësimet e ekspertëve, o4-mini tejkalon gjithashtu paraardhësin e tij, o3‑mini, në detyrat jo-STEM, si dhe në domenet si shkenca e të dhënave. Falë efikasitetit të tij, o4-mini mbështet kufij përdorimi dukshëm më të lartë se o3, duke e bërë atë një opsion të fuqishëm për volum të lartë dhe kapacitet të lartë përpunimi për pyetjet që përfitojnë nga arsyetimi. Vlerësues ekspertë të jashtëm i vlerësuan të dy modelet si më efikasë në ndjekjen e udhëzimeve dhe dhënien e përgjigjeve më të dobishme dhe të verifikueshme në krahasim me paraardhësit e tyre, falë inteligjencës së përmirësuar dhe përfshirjes së burimeve nga interneti. Krahasuar me versionet e mëparshme të modeleve tona të arsyetimit, këto dy modele duhet të duken gjithashtu më natyrale dhe bisedore, veçanërisht kur i referohen kujtesës dhe bisedave të kaluara për t'i bërë përgjigjet më të personalizuara dhe përkatëse.
Multimodal
Kodimi
Të gjitha ekzekutimet e vlerësimit SWE-bench përdorin një nëngrup të fiksuar prej n=477 detyrash të verifikuara, të cilat janë konfirmuar në infrastrukturën tonë të brendshme.
Ndjekja e udhëzimeve dhe përdorimi i mjeteve agjentike
Të gjitha modelet vlerësohen me cilësime të larta të 'përpjekjes së arsyetimit'—ngjashëm me variante si 'o4-mini-high' në ChatGPT.
Gjatë gjithë zhvillimit të OpenAI o3, kemi vërejtur se të mësuarit përforcues në shkallë të gjerë shfaq të njëjtin trend “më shumë llogaritje = performancë më e mirë” të vërejtur në para-trajnimin e serisë GPT. Duke rikthyer rrugën e shkallëzimit—këtë herë në RL—kemi shtyrë një rend shtesë të madhësisë si në llogaritjen e trajnimit ashtu edhe në arsyetimin gjatë kohës së përfundimit, por ende shohim përfitime të qarta të performancës, duke vërtetuar se performanca e modeleve vazhdon të përmirësohet sa më shumë që u lejohet të mendojnë. Me vonesë dhe kosto të barabartë me OpenAI o1, o3 ofron performancë më të lartë në ChatGPT—dhe kemi vërtetuar se nëse e lëmë të mendojë më gjatë, performanca e tij vazhdon të rritet.
Gjithashtu, ne i trajnuam të dy modelet që të përdorin mjetet përmes të mësuarit përforcues—duke i mësuar jo vetëm si t’i përdorin mjetet, por edhe të arsyetojnë kur t’i përdorin ato. Aftësia e tyre për të përdorur mjete bazuar në rezultatet e dëshiruara i bën ata më të aftë në situata të hapura—veçanërisht ato që përfshijnë arsyetim vizual dhe flukse pune me shumë hapa. Ky përmirësim pasqyrohet si në standardet akademike ashtu edhe në detyrat e botës reale, siç raportojnë testuesit e hershëm.

Për herë të parë, këto modele mund të integrojnë imazhe drejtpërsëdrejti në zinxhirin e tyre të mendimit. Ata nuk shohin vetëm një imazh—ata mendojnë me të. Kjo hap një klasë të re të zgjidhjes së problemeve që kombinon arsyetimin vizual dhe tekstual, e cila reflektohet në performancën e tyre më të avancuar në standardet multimodale.
Njerëzit mund të ngarkojnë një foto të një tabele të bardhë, një diagram të një libri ose një skicë të vizatuar me dorë, dhe modeli mund ta interpretojë atë — edhe nëse imazhi është i paqartë, i përmbysur ose me cilësi të ulët. Me përdorimin e mjeteve, modelet mund të manipulojnë imazhet në çast—duke i rrotulluar, zmadhuar ose transformuar ato si pjesë e procesit të tyre të arsyetimit.
Këto modele ofrojnë saktësinë më të mirë në klasë në detyrat e perceptimit vizual, duke u mundësuar atyre të zgjidhin pyetjet që më parë ishin të paarritshme. Shiko blogun e kërkimit mbi arsyetimin vizual për të mësuar më shumë.
OpenAI o3 dhe o4-mini kanë qasje të plotë në mjetet brenda ChatGPT, si dhe në mjetet tuaja të personalizuara përmes thirrjes së funksioneve në API. Këto modele janë të trajnuara për të arsyetuar rreth mënyrës së zgjidhjes së problemeve, duke zgjedhur kur dhe si të përdoren mjetet për të prodhuar shpejt përgjigje të detajuara dhe të menduara mirë në formatet e duhura—zakonisht në më pak se një minutë.
Për shembull, një përdorues mund të pyesë: “Si do të krahasohet përdorimi i energjisë gjatë verës në Kaliforni me atë të vitit të kaluar?” Modeli mund të kërkojë në ueb për të dhëna të shërbimeve publike, të shkruajë kod Python për të ndërtuar një parashikim, të gjenerojë një grafik ose imazh dhe të shpjegojë faktorët kryesorë pas parashikimit, duke ndërthurur së bashku thirrje të shumta mjetesh. Arsyetimi u lejon modelet të reagojnë dhe të përshtaten sipas nevojës ndaj informacionit që hasin. Për shembull, ata mund të kërkojnë në internet disa herë me ndihmën e ofruesve të kërkimit, të shikojnë rezultatet dhe të provojnë kërkime të reja nëse kanë nevojë për më shumë informacion.
Kjo qasje fleksibël dhe strategjike u lejon modeleve të trajtojnë detyra që kërkojnë qasje në informacion të përditësuar përtej njohurive të integruara të modelit, arsyetimit të zgjeruar, sintezës dhe gjenerimit të daljeve në të gjitha modalitetet.
Të gjithë shembujt u plotësuan me OpenAI o3.
OpenAI o3
OpenAI o1
OpenAI o3 e merr përgjigjen saktë pa përdorur kërkimin, ndërsa o1 nuk arrin të japë një përgjigje të saktë.
Përmirësim i arsyetimit të efikasitetit të kostos
Kostoja kundrejt performancës: o3‑mini dhe o4-mini


Kostoja kundrejt performancës: o1 dhe o3


OpenAI o3 dhe o4-mini janë modelet më inteligjente që kemi prezantuar ndonjëherë, dhe janë gjithashtu shpesh më efikase se paraardhësit e tyre, OpenAI o1 dhe o3‑mini. Për shembull, në konkursin e matematikës AIME 2025, kufiri i kosto-performancës për o3 përmirësohet ndjeshëm ndaj o1, dhe në mënyrë të ngjashme, kufiri i o4-mini përmirësohet ndjeshëm ndaj o3‑mini. Në përgjithësi, presim që për shumicën e përdorimeve në botën reale, o3 dhe o4-mini të jenë gjithashtu më inteligjente dhe më të lira se o1 dhe o3‑mini, përkatësisht.
Çdo përmirësim në aftësitë e modelit kërkon përmirësime të përmasave të njëjta në siguri. Për OpenAI o3 dhe o4-mini, ne rindërtuam plotësisht të dhënat tona të trajnimit për sigurinë, duke shtuar kërkesa të reja refuzimi në fusha të tilla si kërcënimet biologjike (biorisku), gjenerimi i malware-it dhe jailbreak-eve. Këto të dhëna të rifreskuara kanë bërë që o3 dhe o4-mini të arrijnë performancë të fortë në standardet tona të brendshme të refuzimit (p.sh., hierarkia e udhëzimeve, jailbreaks). Përveç performancës së fortë për refuzimet e modelit, kemi zhvilluar gjithashtu masa zbutëse në nivel sistemi për të identifikuar kërkesat e rrezikshme në zonat me rrezik të lartë. Ngjashëm me punën tonë të mëparshme në gjenerimin e imazheve, ne trajnuam një monitor LLM për arsyetim që punon me specifikime sigurie të shkruara nga njerëzit dhe të interpretueshme. Kur aplikohet për biorisk, ky monitor identifikoi me sukses ~99% të bisedave në fushatën tonë të red-teaming njerëzor.
Ne i testuam të dy modelet me programin tonë më rigoroz të sigurisë deri më sot. Në përputhje me Kornizën tonë të përditësuar të Gatishmërisë, ne vlerësuam o3 dhe o4-mini në tre fushat e aftësive të ndjekura të mbuluara nga korniza: biologjike dhe kimike, siguria kibernetike dhe vetëpërmirësimi i inteligjencës artificiale. Bazuar në rezultatet e këtyre vlerësimeve, kemi përcaktuar se si o3 ashtu edhe o4‑mini mbeten nën pragun "i Lartë" të Kornizës në të tre kategoritë. Kemi publikuar rezultatet e detajuara nga këto vlerësime në kartën e sistemit shoqëruese.
Po ndajmë gjithashtu një eksperiment të ri: Codex CLI, një agjent kodimi i lehtë që mund ta ekzekutosh nga terminali yt. Ai funksionon drejtpërdrejt në kompjuterin tënd dhe është krijuar për të maksimizuar aftësitë e arsyetimit të modeleve si o3 dhe o4-mini, me mbështetje të ardhshme për modele shtesë API si GPT‑4.1.
Mund të përfitosh nga arsyetimi multimodal nga linja e komandës duke kaluar pamje nga ekrani ose skica me besueshmëri të ulët në model, të kombinuara me qasjen në kodin tënd në nivel lokal. Ne e mendojmë atë si një ndërfaqe minimale për të lidhur modelet tona me përdoruesit dhe kompjuterët e tyre. Codex CLI është plotësisht me burim të hapur në github.com/openai/codex(hapet në një dritare të re) sot.
Përveç kësaj, ne po nisim një iniciativë prej 1 milion dollarësh për mbështetje të projekteve që përdorin Codex CLI dhe modelet OpenAI. Ne do të vlerësojmë dhe pranojmë aplikimet për grante në shuma prej $25,000 USD në formën e kredive API. Propozimet mund të dorëzohen këtu.
Përdoruesit e ChatGPT Plus, Pro dhe Team do të shohin o3, o4-mini dhe o4-mini-high në përzgjedhësin e modelit duke filluar nga sot, duke zëvendësuar o1, o3‑mini dhe o3‑mini‑high. Përdoruesit e ChatGPT Enterprise dhe Edu do të kenë qasje pas një jave.0. Përdoruesit Free (pa pagesë) mund të provojnë o4-mini duke zgjedhur 'Mendo' në hartues, para se të dorëzojnë pyetjen e tyre. Kufizimet e çmimeve në të gjitha planet mbeten të pandryshuara nga grupi i mëparshëm i modeleve.
Ne presim të prezantojmë OpenAI o3‑pro brenda disa javësh me mbështetje të plotë për mjetet. Për momentin, përdoruesit Pro mund të vazhdojnë të kenë qasje në o1‑pro.
Të dy o3 dhe o4-mini janë gjithashtu të disponueshme për zhvilluesit sot përmes API-t të përfundimit të bisedave dhe API-t të përgjigjeve (disa zhvillues do të duhet të verifikojnë organizatat e tyre(hapet në një dritare të re) për të pasur qasje në këto modele). API e përgjigjeve mbështet përmbledhjet e arsyetimit, aftësinë për të ruajtur tokenat e arsyetimit rreth thirrjeve të funksioneve për performancë më të mirë dhe së shpejti do të mbështesë mjete të integruara si kërkimi në internet, kërkimi i skedarëve dhe Interpretuesi i kodeve brenda arsyetimit të modelit. Për të filluar, eksploro dokumentet tona(hapet në një dritare të re) dhe qëndro i informuar për më shumë përditësime.
Përditësimet e sotme pasqyrojnë drejtimin në të cilin po shkojnë modelet tona: po bashkojmë aftësitë e specializuara të arsyetimit të serisë O me aftësitë më natyrore të bisedës dhe përdorimin e mjeteve të serisë GPT. Duke unifikuar këto forca, modelet tona të ardhshme do të ofrojnë mbështetje për biseda të rrjedhshme dhe natyrale, së bashku me përdorimin proaktiv të mjeteve dhe zgjidhjen e avancuar të problemeve.
Përditësimi më 28 korrik 2025: Seti i të dhënave dhe rezultatet e SWE-Lancer të përditësuara që nga 17 korrik 2025, janë në dispozicion në: https://github.com/openai/preparedness(hapet në një dritare të re) dhe në kartat tona të sistemit. Ky përditësim zgjidh disa çështje që ndikonin në rezultatet e fituara në dollarë dhe heq kërkesën për lidhje interneti gjatë ekzekutimit, duke eliminuar një burim kryesor të ndryshueshmërisë në performancën e modelit.
Përditësimi më 16 prill 2025: rezultatet për o3 në Charxiv-r dhe Mathvista u përditësuan për të pasqyruar një ndryshim në kërkesën e sistemit që nuk ishte i pranishëm në vlerësimin origjinal.
Autor
Shënime në fund
* Numrat e vlerësimit të tau-bench janë mesatarizuar në 5 ekzekutime për të zvogëluar variancën dhe ekzekutohen pa ndonjë mjet ose kërkesë. Ne zbuluam se shpërndarjet me pakicë të tau-bench janë më të prirura ndaj gabimeve të modelit të përdoruesit. Numrat për shiritin e hijëzuar ekzekutohen me GPT-4.1 si model përdoruesi sepse është dukshëm më i mirë se GPT-4o në ndjekjen e udhëzimeve.
* SWE-bench përdor gjatësinë maksimale të kontekstit 256k, e cila përmirëson shkallën e zgjidhjes për o4-mini me rreth 3% dhe ndikon në shkallën e zgjidhjes për o3 me <1%. Ne përjashtojmë gjithashtu 23 mostra që nuk mund të ekzekutohen në infrastrukturën tonë të brendshme.
** Kur aktivizon shfletimin, modeli ndonjëherë mund të gjejë përgjigje të sakta në internet, për shembull, duke lexuar postime në blog me probleme shembull nga një grup të dhënash. Ne i ulim problemet e mashtrimit të modelit gjatë shfletimit me dy strategji:
Bllokojmë domenet nga të cilat kemi vënë re që modeli ka mashtruar në të kaluarën.
Përdorim një model arsyetimi si monitor për të shqyrtuar të gjitha tokenet në çdo përpjekje, me qëllim identifikimin e sjelljes së dyshimtë. Sjellja e dyshimtë përkufizohet si "një faqe, skedar, ose fragment, qëllimi kryesor i të cilit është të japë përgjigjen e saktë për këtë pyetje specifike—p.sh., një çelës zyrtar vlerësimi, thelbi i “zgjidhjeve” të rrjedhura, ose diskutim që citon përgjigjen e përfunduar fjalë për fjalë." Sjellja dashamirëse përkufizohet si "Çdo burim autoritar që një njeri i zellshëm mund të konsultojë (dokumentacion, manuale, dokumente shkencore, artikuj me reputacion) edhe nëse rastësisht përmban përgjigjen e saktë." Çdo përpjekje ku monitori e konsideron prezantimin të dyshimtë, llogaritet si e pasaktë. Shumica e mostrave që dështuan në këtë kontroll ishin probleme zgjidhja e saktë e të cilave ishte e disponueshme në burime të shumta interneti të palidhura me HLE.
Së fundi, vlerësimet tona me shfletimin mund të mos jenë të riprodhueshme në mënyrë të përkryer në OpenAI API për shkak të një ndryshimi në backend të motorëve të kërkimit midis ChatGPT dhe OpenAI API. Këto rezultate synojnë të jenë përfaqësuese të përvojës së përdoruesit të ChatGPT, por në varësi të kërkesës, konfigurimi i kërkimit mund të ndryshojë me kalimin e kohës.
Kontribuesit
Aaditya Singh, Aaron Schlesinger, Adam Fry, Adam Lerer, Adam Perelman, Adam Walker, Ahmed El-Kishky, Aidan Clark, Aidan McLaughlin, Aiden Low, Akila Welihinda, Akshay Nathan, Aleksander Madry, Aleksandra Spyra, Alex Karpenko, Alex Neitz, Alex Tachard Passos, Alex Wei, Alexander Prokofiev, Alexander Zielenski, Alexandra Barr, Alexey Ivanov, Alexi Christakis, Alfred Xue, Allison Tam, Ally Bennett, Ally Bennett , Amelia Liu, Amy McDonald Sandjideh, Ananya Kumar, Andre Saraiva, Andrea Vallone, Andrew Chen, Andrew Duberstein, Andrew Gibiansky, Andrew Kondrich, Andrew Tulloch, Andrey Mishchenko, Andy Applebaum, Andy Wang, Angela Baek, Annie Wei, Anting Shen, Antoine Pelisse, Anuj Saharan, Arun Vijayvergiya, Ashley Tyra, Ashvin Nair, Avi Nayak, Avital Oliver, Behrooz Ghorbani, Belinda Truong, Ben Sokolowsky, Beth Hoover, Bo Xu, Boaz Barak, Bohan Zhang, Borys Minaiev, Botao Hao, Bowen Baker, Bowen Cheng, Brandon McKinzie, Brandon Wang, Brian Hsu, Brian Yang, Brian Yu, Brian Zhang, Camillo Lugaresi, Carolina Paz, Carpus Chang, Cary Bassin , Cary Hudson, Casey Chu, Chak Li, Charles Zhao, Charlie Jatt, Charlotte Cole, Chelsea Voss, Chen Shen, Chengxu Zhuang, Chris Colby, Chris Hallacy , Chris Koch, Christina Kaplan, Christina Kim, Colin Reid, Colin Wei, Cristina Scheau, D. Sculley, Damien Deville, Dan Roberts, Dana Palmie, Dane Stuckey, Daniel Levine, David Hu, David Martin, David Robinson, David Sasaki, Davis Wu, Derek Chen, Dibya Bhattacharjee, Dimitris Tsipras, Dinghua Li, DJ Strouse, dmed Medina, Drew Hintz, Eddie Zhang, Edmund Wong, Elaine Ya Le, Eli Yani , Elizabeth Proehl, Emily Sokolova, Enoch Cheung, Eri Schwartz, Eric Mitchell, Eric Ning, Eric Sigler, Eric Wallace, Eugenio Panero, Evan Mays, Evgenii Nikishin, Fan Wang, Fangyuan Li, Filippo Raso, Foivos Tsimpourlas, Fouad Matin, Francis Song, Francis Zhang, Gary Yang, Gene Oden, Giambattista Parascandolo, Gildas Chabot, Grace Kim, Grace Zhao, Greg Brockman, Gregory Valiant, Guillaume Leclerc, Hadi Salman, Haitang Hu, Hannah Sheahan, Hao Sheng, Haoyu Wang, Henrique Ponde de Oliveira Pinto, Henry Aspegren, Heqing Yan, Hessam Bagherinezhad, Hongyu Ren, Hunter Lightman, Hyeonwoo Noh, Ian Kivlichan, Ian Sohl, Ignasi Clavera, Ikai Lan, Ilge Akkaya, Ilya Kostrikov, Irina Kofman, Isa Fulford, Jake Brill, Jakub Pachocki, James Betker, James Lee, James Qin, Jamie Kiros, Jason Ai, Jay Wang, Jean Harb, Jeff Mickey, Jeffrey Han, Jeffrey Wang, Jeremy Chen, Jerry Tworek, Jessica Liang, Jessica Shieh, Ji Lin, Jiahui Yu, Jianfeng Wang, Jie Tang, Jihan Yin, Jing Li, Joanne Jang, Joel Morris, Johannes Ferstad, Johannes Heidecke, John Fishbein, Jon Okun, Jonathan Gordon, Joost Huizinga, Jos Kraaijeveld, Joseph Mo, Josh Lawson , Josh Tobin, Junhua Mao, Kai Chen, Kai Hayashi, Karan Singhal, Karina Nguyen, Katy Shi, Kelly Stirman, Kenji Hata, Kenny Nguyen, Keren Gu-Lemberg, Kevin Gladstone, Kevin King, Kevin Liu, Kevin Lu, Kevin Park, Kevin Stone, Kevin Weil, Kevin Whinnery, Kevin Yu, Kote Mushegiani, Kristen Ying, Kristian Georgiev, Kshitij Gupta, Kyle Kosic, Lama Ahmad, Larry Lv, Lauren Itow, Lauren Yang, Lee Byron, Leo Chen, Leo Liu, Leon Maksin, Leyton Ho, Li Jing, Liang Xiong, Lin Yang, Linden Li, Lorenz Kuhn, Louis Feuvrier, Lu Zhang, Łukasz Kaiser, Mahmoud Eariby, Maja Trębacz, Manas Joglekar, Manoli Liodakis, Manuka Stratta, Mark Chen, Mark Hudnall, Mark Sun, Mark Wang, Martin Li, Marvin Zhang, Mateusz Litwin, Matt Jones, Matt Lim, Max Johnson, Max Schwarzer, Mayank Gupta, Meghan Shah, Mengqing Wang, Mengyuan Yan, Mia Glaese, Michael Bolin, Michael Lampe, Michael Malek, Michael Sharman, Michael Zhang, Michele Wang, Michelle Pokrass, Miguel Oom Temudo de Castro, Mihai Florian, Mike McClay, Mike Trpcic, Miki Habryn, Miles Wang, Ming Chen, Mingxuan Wang, Minnia Feng, Mitchell Gordon, Mo Bavarian, Mostafa Rohaninejad, Nacho Soto, Nakul Khanna, Nat McAleese, Natalie Staudacher, Natan LaFontaine, Neel Ajjarapu, Nick Felt, Nick Turley, Nikil Pancha, Nikita Mikhaylin, Niko Felix, Nikunj Handa, Ning Liu, Nishant Rai, Noah Jorgensen, Noam Brown, Oleg Boiko, Oleg Murk, Olivia Watkins, Olivier Godement, Oona Gleeson, Paul Ashbourne, Pavel Belov, Peter Flockhart, Peter Hoeschele, Peter Zhokhov, Philip Pronin, Phillip Guo, Phoebe Thacker, Prafulla Dhariwal, Prashanth R, Rachel Dias, Rahul Arora, Rajkumar Samuel, Rasmus Rygaard, Ravi Teja Mullapudi, Raymond Li, Raz Gaon, Reah Miyara, Reiichiro Nakano, Reimar Leike, Rennie Song, Rhythm Garg, RJ Marsan, Robert Xiong, Robin Brown, Roman Tsiupa, Rui Shu, Ruslan Nigmatullin, Saachi Jain, Saagar Patel, Sam Altman, Sam Toizer, Sam Toyer, Samir Ahmed, Samuel Miserendino, Samuel Wolrich , Sandhini Agarwal, Santiago Hernández, Sarah Dong, Savannah Heon, Scott Ethersmith, Scott Mayer McKinney, Sean Fitzgerald, Sever Banesiu, Shamez Hemani, Shengjia Zhao, Shengli Hu, Shibani Santurkar, Shreyas Krishnaswamy, Shuchao Bi, Shunyu Yao, Shuyuan Zhang, Simón Posada Fishman, Spencer Papay, Spug Golden, Srinivas Narayanan, Stanley Hsieh, Stephen Logsdon, Sundeep Tirumalareddy, Tal Stramer, Tao Wang, Tao Xin, Taylor Gordon, Tejal Patwardhan, Thibault Sottiaux, Tina Sriskandarajah, Tony Casparro, Tony Zhao, Trevor Creech, Uzair Navid Iftikhar, Valerie Qi, Vineet Kosaraju, Vishal Kuo, Vitchyr Pong, Vivek Verma, Vlad Petrov, Wenda Zhou, Wenlei Xie, Wenting Zhan, Will DePue, Will Ellsworth, William Sheu, Wyatt Thompson, Yaming Lin, Yann Dubois, Yaodong Yu, Yara Khakbaz, Yash Patil, Yifan Wu, Yilong Qin, Yining Chen, Yirui Zhang, Yo Shavit , Young Cha, Yunyun Wang, Yushi Wang, Zack Sultan, Zehao Dou, Zewei Chu, Zheng Shao, Zhigang Wang, Zhishuai Zhang, Zihao Zhang