Is iad OpenAI o3 agus o4-mini na samhlacha réasúnaíochta amhairc is déanaí inár sraith o. Don chéad uair, is féidir lenár samhlacha smaoineamh le híomhánna ina sraith smaointe—ní hamháin iad a fheiceáil.
Cosúil lenár samhail OpenAI o1 níos luaithe, cuirtear o3 agus o4-mini faoi oiliúint chun smaoineamh níos faide sula bhfreagraíonn siad—agus sraith smaointe fhada inmheánach a úsáid sula bhfreagraíonn siad don úsáideoir. Leathnaíonn o3 agus o4-mini an cumas seo tuilleadh trí smaoineamh le híomhánna ina sraith smaointe, rud a bhaintear amach trí íomhánna a uaslódálann úsáideoirí a athrú le huirlisí, rud a ligeann dóibh barr a ghearradh, zúmáil isteach, agus rothlú, chomh maith le teicnící eile simplí próiseála íomhá. Níos tábhachtaí fós, tagann na cumais seo go dúchasach, gan a bheith ag brath ar shamhlacha speisialaithe ar leith.
Cabhraíonn faisnéis amhairc fheabhsaithe ChatGPT leat fadhbanna níos deacra a réiteach trí íomhánna a anailísiú níos críochnúla, níos cruinne, agus níos iontaofa ná riamh cheana. Is féidir leis réasúnaíocht ardleibhéil a chomhcheangal gan stró le huirlisí amhail cuardach gréasáin agus ionramháil íomhá—ag zúmáil, ag gearradh, ag smeach, nó ag feabhsú d’íomhánna go huathoibríoch—chun léargais a bhaint fiú as grianghraif neamhfhoirfe. Mar shampla, is féidir leat grianghraf de shraith fadhbanna eacnamaíochta a uaslódáil chun míniúcháin céim ar chéim a fháil, nó gabháil scáileáin d’earráid thógála a roinnt chun anailís ar an mbunchúis a fháil go tapa.
Cuireann an cur chuige seo ais nua ar chumas scálaithe ríomha tástála ar fáil a chumascann réasúnaíocht amhairc agus théacsúil gan stró, mar a léirítear ina bhfeidhmíocht den scoth ar fud tagarmharcanna ilmhódúla, rud a léiríonn céim shuntasach i dtreo réasúnaíochta ilmhódúla.
Ligeann smaoineamh le híomhánna duit idirghníomhú le ChatGPT níos éasca. Is féidir leat ceisteanna a chur trí ghrianghraf a thógáil gan a bheith buartha faoi shuíomh na n-earraí—cibé an bhfuil an téacs bunoscionn nó an bhfuil ilfhadhbanna fisice in aon ghrianghraf amháin. Fiú mura bhfuil rudaí soiléir ar an gcéad amharc, ligeann réasúnaíocht amhairc don tsamhail zúmáil isteach chun iad a fheiceáil níos soiléire.
Cuireadh gach sampla i gcrích le OpenAI o3.
Oibríonn ár samhlacha réasúnaíochta amhairc is déanaí i gcomhar le huirlisí eile amhail anailís sonraí Python, cuardach gréasáin, agus giniúint íomhá chun fadhbanna níos casta a réiteach ar bhealach cruthaitheach agus éifeachtach, agus ár gcéad eispéireas gníomhaire ilmhódúil a thabhairt d’úsáideoirí.
Chun an feabhas ar réasúnaíocht amhairc a léiriú i gcomparáid lenár samhlacha ilmhódúla roimhe seo, rinneamar tástáil ar OpenAI o3 agus o4-mini ar shraith éagsúil scrúduithe daonna agus tagarmharcanna ML. Sáraíonn na samhlacha nua réasúnaíochta amhairc seo a réamhtheachtaithe go suntasach ar gach tasc ilmhódúil a thástáil muid.
Déantar gach samhail a mheas ag socruithe arda “iarrachta réasúnaíochta”—cosúil le leaganacha amhail “o4-mini-high” in ChatGPT.
Go háirithe, bíonn feabhsuithe suntasacha ar gach tagarmharc braite a mheasamar mar thoradh ar smaoineamh le híomhánna—gan brath ar bhrabhsáil. Leagann ár samhlacha caighdeán úr den scoth amach i bhfreagairt ceisteanna STEM (MMMU, MathVista), i léamh agus réasúnaíocht cairteacha (CharXiv), i mbunchlocha braite (VLMs are Blind), agus i gcuardach amhairc (V*). Ar V*, baineann ár gcur chuige réasúnaíochta amhairc cruinneas 95.7% amach, rud a réitíonn an tagarmharc den chuid is mó.
Tá na srianta seo a leanas ag baint le smaoineamh le híomhánna faoi láthair:
- Slabhraí réasúnaíochta rófhada: D’fhéadfadh samhlacha glaonna uirlise agus céimeanna ionramhála íomhá atá iomarcach nó gan ghá a dhéanamh, rud a fhágann sraith smaointe rófhada.
- Earráidí braite: Is féidir le samhlacha botúin bhunúsacha braite a dhéanamh fós. Fiú nuair a chuireann glaonna uirlise an próiseas réasúnaíochta chun cinn i gceart, d’fhéadfadh míléirmhínithe amhairc freagraí deiridh míchearta a chruthú.
- Iontaofacht: D’fhéadfadh samhlacha próisis éagsúla réasúnaíochta amhairc a thriail thar iarrachtaí iomadúla ar fhadhb, agus d’fhéadfadh torthaí míchearta a bheith mar thoradh ar chuid díobh.
Cuireann OpenAI o3 agus o4-mini cumais réasúnaíochta amhairc den scoth chun cinn go suntasach, rud a léiríonn céim thábhachtach i dtreo réasúnaíochta ilmhódúla níos leithne. Soláthraíonn na samhlacha seo cruinneas den scoth ina rang ar thascanna braite amhairc, rud a chuireann ar a gcumas ceisteanna a réiteach a bhí lasmuigh de bhaint amach roimhe seo.
Táimid ag mionchoigeartú cumais réasúnaíochta na samhlacha le híomhánna i gcónaí chun iad a dhéanamh níos gonta, níos lú athchleachtach, agus níos iontaofa. Táimid ar bís leanúint lenár dtaighde ar réasúnaíocht ilmhódúil, agus go bhféadfaidh daoine iniúchadh a dhéanamh ar an gcaoi ar féidir leis na feabhsuithe seo a gcuid oibre laethúla a fheabhsú.
Nuashonrú an 16 Aibreán: nuashonraíodh torthaí o3 ar Charxiv-r, Mathvista, agus vlmsareblind chun athrú i leid an chórais nach raibh i láthair sa mheasúnú bunaidh a léiriú.
Údair
Rannpháirtithe
Aditya Ramesh, Aidan Clark, Aleksandra Spyra, Alex Tachard Passos, Alexander Kirillov, Ali Kalami, Amy McDonald Sandjideh, Andrei Gheorghe, Andrew Gibiansky, Andrew Tulloch, Angela Baek, Anubha Srivastava, Avital Oliver, Behrooz Ghorbani, Ben Leimberger, Borys Minaiev, Bowen Cheng, Brandon McKinzie, Carpus Chang, Cary Hudson, Casey Chu, Charlotte Cole, Chen Shen, Dan Roberts, Dana Palmie, Daniel Kappler, David Medina, Edmund Wong, Eric Mitchell, Eric Ning, Freddie Sulit, Haiming Bao, Haitang Hu, Hongyu Ren, Hyeonwoo Noh, Jakub Pachocki, James Betker, James Qin, Jamie Kiros, Jason Ai, Jerry Tworek, Jessica Liang, Ji Lin, Jiahui Yu, Jianfeng Wang, Joseph Mo, Kenji Hata, Kevin King, Kristian Georgiev, Kshitij Gupta, Lauren Yang, Li Jing, Lin Yang, Linden Li, Mark Chen, Martin Li, Max Schwarzer, Mia Glaese, Michael Malek, Minnia Feng, Nacho Soto, Nat McAleese, Niko Felix, Peter Faiman, Prafulla Dhariwal, Rajkumar Samuel, Rapha Gontijo Lopes, Ravi Teja Mullapudi, Reiichiro Nakano, Rennie Song, Ricky Xu, Sam Altman, Sean Fitzgerald, Shengjia Zhao, Shengli Hu, Shuchao Bi, Spencer Papay, Szi-chieh Yu, Wenda Zhou, Yang Lu, Yara Khakbaz, Yunxing Dai, Zhishuai Zhang








