Үндсэн агуулга руу алгасах
OpenAI

Be My Eyes

Be My Eyes нь GPT‑4 ашиглан харааны хүртээмжийг өөрчилж байна.

Be My Eyes
Ачаалж байна…
BeMyEyes

2012 оноос хойш Be My Eyes нь сохор эсвэл хараа султай 250 сая гаруй хүний нийгэмлэгт зориулсан технологи бүтээсээр ирсэн. Данийн энэ стартап сохор эсвэл хараа султай хүмүүсийг бүтээгдэхүүн таних, нисэх буудал дотор чиг баримжаа олох зэрэг өдөр тутмын амьдралын олон зуун ажилд туслах сайн дурынхантай холбодог.

GPT‑4‑ийн шинэ харааны оролтын чадамжтай (судалгааны урьдчилсан хувилбар) болсноор Be My Eyes нь хүний сайн дурынхны түвшний адил нөхцөл байдал, ойлголтыг бий болгож чадах GPT‑4‑өөр ажилладаг Virtual Volunteer™-ийг Be My Eyes апп дотор хөгжүүлж эхэлсэн.

“Бид хандах боломжтой болсон энэ богино хугацаанд, зах зээл дээрх дүрсээс текст рүү хөрвүүлдэг ямар ч объект таних хэрэгслээс давсан гүйцэтгэлийг харлаа" гэж Be My Eyes-ийн гүйцэтгэх захирал Майкл Бакли хэлэв. “Дэлхийн хүртээмжид үзүүлэх нөлөө нь асар гүнзгий. Тийм ч холгүй ирээдүйд сохор болон хараа султай хүмүүсийн нийгэмлэг эдгээр хэрэгслийг зөвхөн олон төрлийн харааны тайлбарын хэрэгцээнд бус, мөн амьдралдаа илүү өндөр түвшний бие даасан байдлыг бий болгоход ашиглах болно.”  

Жишээ нь хэн нэгэн хөргөгчиндөө юу байгааг харуулсан зураг илгээхэд, GPT‑4 технологи дотор нь юу байгааг таньж нэрлэхээс гадна, тэдгээр орцоор юу хийж болохыг дүгнэж, шинжилдэг. Дараа нь та түүнээс тохирох жор асууж болно. Хэрэглэх тохиолдлууд бараг хязгааргүй.

“Энэ бол тоглоомын дүрмийг өөрчилнө” гэж Бакли хэлэв. “Эцэст нь хэрэглэгч юу хүсэж, юу хэрэгтэй байгаагаас үл хамааран, илүү их, хэрэглэхэд боломжтой, өгөөжтэй, тустай мэдээлэл авахын тулд хэрэгсэлд дахин өгөгдөл өгч, бараг шууд хариу авч чадна.”

Хоёрдугаар сарын эхээр тус компани GPT‑д суурилсан туслахыг цөөн тооны ажилтнуудын дунд бета туршилтад оруулсан; үр дүн нь маш эерэг байсан тул энэ боломж хэдхэн долоо хоногийн дараа хэрэглэгчдийн гарт очно.

“Манай нийгэмлэгийн хувьд үнэхээр гайхалтай боломж байна” гэж Бакли хэлэв. “Манай бета туршигчид, тэр дундаа Люси Эдвардс, үүний хийж буй зүйлийг аль хэдийн маш их таалж байна.”

GPT‑4 болон бусад хэлний болон машин сургалтын загваруудын ялгаа нь харилцан яриа өрнүүлэх чадвар болон энэ технологийн санал болгодог илүү өндөр түвшний шинжилгээний чадвар аль аль нь юм гэж Be My Eyes-ийн CTO Жеспер Хвирринг Хенриксен тайлбарлав. “Суурь дүрс таних аппликейшнууд зөвхөн таны өмнө юу байгааг л хэлдэг” гэж тэр хэлэв. “Тэд гоймон зөв төрлийн орцтой эсэх, эсвэл газар дээр байгаа зүйл зүгээр нэг бөмбөг биш, харин бүдрэх аюул мөн эсэхийг ойлгохын тулд хэлэлцэж чаддаггүй—тэгээд үүнийг дамжуулж ч чаддаггүй.”

“GPT-4 болон бусад хэлний болон машин сургалтын загваруудын ялгаа нь харилцан яриа өрнүүлэх чадвар болон технологийн санал болгодог илүү өндөр түвшний шинжилгээний чадвар аль аль нь юм.”
Be My Eyes-ийн CTO Жеспер Хвирринг Хенриксен

Компани аль хэдийн нэгэн хэрэглэгч төмөр замын систем дундуур чигээ олж чадсан тохиолдолтой болсон—энэ нь хараатай хүмүүст ч бараг боломжгүй даалгавар байж мэднэ—зөвхөн газрын зураг дээр хаана байгаагаа мэдээд зогсохгүй, хүссэн газартаа аюулгүй хүрэх алхам алхмын зааврыг ч авсан.

Гэхдээ төвөгтэй биет ертөнцөөр явах нь түүхийн ердөө тал нь юм. Дэлгэц дээр юу байгааг ойлгох нь хараагүй хүнд үүнээс хоёр дахин хэцүү байж болно. Орчин үеийн ихэнх үйлдлийн системд суулгагдсан screen reader-үүд вэб хуудас эсвэл ширээний аппликейшний хэсгүүдийг мөр мөрөөр, хэсэг хэсгээр нь уншиж, үг бүрийг дуугаргадаг. Вэб дээрх харилцааны гол цөм болох зургууд бүр ч хүндрэлтэй. 

Гэсэн ч одоо тэд GPT‑4‑т вэб хуудсыг үзүүлж чадна, тэгэхэд систем нь—гүний сургалт алгоритмууд вэб хуудасны “чухал” хэсгийг ойлгохын тулд холбоосуудыг бий болгодог тоо томшгүй олон сургалтын цагийн дараа—аль хэсгийг унших эсвэл хураангуйлахыг мэддэг болсон гэж Хенриксен хэлэв. Энэ нь зөвхөн онлайнаар мэдээ унших зэрэг ажлыг хялбаршуулаад зогсохгүй, харааны тусламж хэрэгтэй хүмүүст вэбийн хамгийн эмх замбараагүй хуудсуудын заримд нь, тухайлбал худалдаа болон цахим худалдааны сайтуудад хандах боломж олгодог. GPT‑4 нь хайлтын үр дүнг хараатай хүмүүсийн байгалиараа гүйлгэн хардаг байдлаар—жижиг сажиг бүх мэдээллийг нэгбүрчлэн уншихгүй, харин чухал өгөгдлийн цэгүүдийн хооронд шилжин—хураангуйлж, харааны дэмжлэг хэрэгтэй хүмүүст бодит цагт зөв худалдан авалт хийхэд тусалж чадна.

“Энэ бол хүн төрөлхтний хувьд гайхалтай хөгжил” гэж Бакли хэлэв, “гэхдээ энэ нь бас асар том арилжааны боломжийг илэрхийлж байна.”

Бизнесийн ChatGPT‑ийн талаар илүү ихийг мэдэх сонирхолтой байна уу?