Aqbeż għall-kontenut prinċipali
OpenAI

Be My Eyes

Be My Eyes tuża GPT‑4 biex tittrasforma l-aċċessibbiltà viżiva.

Be My Eyes
Qed jillowdja…
BeMyEyes

Sa mill-2012, Be My Eyes ilha toħloq teknoloġija għall-komunità ta’ aktar minn 250 miljun persuna li huma għomja jew għandhom vista batuta. L-istartup Daniż jgħaqqad persuni li huma għomja jew b’vista batuta ma’ voluntiera biex jgħinuhom b’mijiet ta’ kompiti tal-ħajja ta’ kuljum bħall-identifikazzjoni ta’ prodott jew in-navigazzjoni f’ajruport.

Bil-kapaċità l-ġdida ta’ input viżiv ta’ GPT‑4 (fir-research preview), Be My Eyes bdiet tiżviluppa Virtual Volunteer™ imħaddem minn GPT‑4 fi ħdan l-app Be My Eyes li jista’ jiġġenera l-istess livell ta’ kuntest u fehim bħal voluntier uman.

“Fiż-żmien qasir li kellna aċċess, rajna prestazzjoni bla preċedent meta mqabbla ma’ kwalunkwe għodda oħra ta’ rikonoxximent ta’ oġġetti minn immaġni għal test,” jgħid Michael Buckley, CEO ta’ Be My Eyes. “L-implikazzjonijiet għall-aċċessibbiltà globali huma profondi. Fil-futur mhux daqshekk imbiegħed, il-komunità ta’ persuni għomja u b’vista batuta se tuża dawn l-għodod mhux biss għal għadd ta’ ħtiġijiet ta’ interpretazzjoni viżiva, iżda wkoll biex ikollha grad akbar ta’ indipendenza f’ħajjithom.”

F’daqqa waħda, l-immaġni li xi ħadd jibgħat ta’, ngħidu aħna, il-kontenut tal-friġġ tiegħu, it-teknoloġija GPT‑4 mhux biss tagħraf u ssemmi x’hemm ġewwa, iżda wkoll testrapola u tanalizza x’tista’ tipprepara b’dawk l-ingredjenti. Imbagħad tista’ titlobha riċetta tajba. Il-każijiet ta’ użu huma kważi bla limitu.

“Dak ibiddel il-logħba,” jgħid Buckley. “Fl-aħħar mill-aħħar, ikun xi jkun li jrid jew jeħtieġ l-utent, jista’ jerġa’ jagħti prompt lill-għodda biex jikseb aktar informazzjoni li tista’ tintuża, tkun ta’ benefiċċju u ta’ għajnuna, kważi minnufih.”

Fil-bidu ta’ Frar, il-kumpanija bdiet tittestja fil-beta l-assistent appoġġjat minn GPT ma’ grupp żgħir ta’ impjegati; ir-riżultati kienu tant pożittivi li l-funzjoni se tkun f’idejn l-utenti fi żmien ftit ġimgħat.

“Hemm potenzjal tassew inkredibbli għall-komunità tagħna,” jgħid Buckley. “It-testers tagħna tal-beta, inkluża Lucy Edwards, diġà jħobbu dak li jagħmel dan.”

Id-differenza bejn GPT‑4 u mudelli oħra tal-lingwa u ta’ machine learning, jispjega Jesper Hvirring Henriksen, CTO ta’ Be My Eyes, hija kemm il-kapaċità li jkollok konverżazzjoni kif ukoll il-livell akbar ta’ ħila analitika offruta mit-teknoloġija. “Applikazzjonijiet bażiċi ta’ rikonoxximent tal-immaġni jgħidulek biss x’hemm quddiemek”, jgħid hu. “Ma jistgħux ikollhom diskussjoni biex jifhmu jekk in-noodles għandhomx it-tip it-tajjeb ta’ ingredjenti jew jekk l-oġġett mal-art mhuwiex biss ballun, iżda periklu li tfixkel miegħu—u jikkomunikaw dan.”

“Id-differenza bejn GPT-4 u mudelli oħra tal-lingwa u ta’ machine learning hija kemm il-kapaċità li jkollok konverżazzjoni kif ukoll il-livell akbar ta’ ħila analitika offruta mit-teknoloġija.”
Jesper Hvirring Henriksen, CTO ta’ Be My Eyes

Diġà l-kumpanija għandha każ fejn utent seta’ jinnaviga s-sistema tal-ferroviji—xogħol li bla dubju huwa kważi impossibbli anke għal min jara—u mhux biss kiseb dettalji dwar fejn kien jinsab fuq mappa, iżda wkoll istruzzjonijiet pass pass dwar kif jasal b’mod sigur fejn ried imur.

Iżda li tgħaddi mid-dinja fiżika kumplessa hija biss nofs l-istorja. Li tifhem x’hemm fuq skrin jista’ jkun darbtejn aktar diffiċli għal persuna li ma tarax. Screen readers, inkorporati fil-biċċa l-kbira tas-sistemi operattivi moderni, jaqraw il-partijiet ta’ paġna web jew applikazzjoni desktop linja b’linja, sezzjoni b’sezzjoni, u jlissnu kull kelma. L-immaġnijiet, fil-qalba tal-komunikazzjoni fuq il-web, jistgħu jkunu saħansitra agħar.

Iżda, jgħid Henriksen, issa jistgħu juru lil GPT‑4 il-paġna web u s-sistema tkun taf—wara għadd kbir ta’ sigħat ta’ taħriġ fejn algoritmi ta’ apprendiment profond jibnu relazzjonijiet biex jifhmu l-parti “importanti” ta’ paġna web—liema parti għandha tinqara jew tiġi mqassra. Dan mhux biss jista’ jissimplifika kompiti bħall-qari tal-aħbarijiet online, iżda jagħti lil persuni li jeħtieġu assistenza viżiva aċċess għal xi wħud mill-aktar paġni mimlijin fuq il-web: siti ta’ xiri u e-commerce. GPT‑4 kapaċi tiġbor fil-qosor ir-riżultati tat-tfittxija bil-mod kif min jara jiskannjahom b’mod naturali—mingħajr ma taqra kull dettall żgħir ħafna iżda taqbeż bejn punti ta’ data importanti—u tgħin lil dawk li jeħtieġu appoġġ viżiv jagħmlu x-xiri t-tajjeb, f’ħin reali.

“Dan huwa żvilupp meraviljuż għall-umanità”, jgħid Buckley, “iżda jirrappreżenta wkoll opportunità kummerċjali enormi.”

Interessat titgħallem aktar dwar ChatGPT għan-negozju?