OpenAI bashkëpunon me Cerebras
OpenAI po bashkëpunon me Cerebras për të shtuar 750MW kapacitet llogaritës të AI me vonesë ultra të ulët në platformën tonë.

Cerebras ndërton sisteme të krijuara posaçërisht për AI për të përshpejtuar prodhimin e gjatë nga modelet e AI. Shpejtësia e tij unike vjen nga kombinimi i fuqisë së madhe llogaritëse, memories dhe gjerësisë së brezit në një çip të vetëm gjigant dhe eliminimi i pengesave që ngadalësojnë inferencën në harduerin konvencional.
Integrimi i Cerebras në kombinimin tonë të zgjidhjeve kompjuterike ka për qëllim të bëjë që AI jonë të përgjigjet shumë më shpejt. Kur bën një pyetje të vështirë, gjeneron kod, krijon një imazh, ose ekzekuton një agjent AI, ka një cikël që ndodh prapa skenave: ti dërgon një kërkesë, modeli mendon dhe të dërgon diçka mbrapsht. Kur AI përgjigjet në kohë reale, përdoruesit bëjnë më shumë me të, qëndrojnë më gjatë dhe ekzekutojnë ngarkesa pune me vlerë më të lartë.
Ne do ta integrojmë këtë kapacitet me vonesë të ulët me stade në paketën tonë të inferencës, duke u zgjeruar nëpër ngarkesat e punës.
Strategjia llogaritëse e OpenAI është të ngrejë një katalog të qëndrueshëm që përputh sistemet e duhura me ngarkesat e duhura të punës. Cerebras shton një zgjidhje të dedikuar për inferencë me vonesë të ulët në platformën tonë. "Kjo do të thotë përgjigje më të shpejta, ndërveprime më të natyrshme dhe një bazë më të fortë për të shkallëzuar AI në kohë reale për shumë më tepër njerëz,” tha Sachin Katti i OpenAI.
“E kemi për kënaqësi të bashkëpunojmë me OpenAI, duke sjellë modelet kryesore të AI në botë te procesori më i shpejtë i AI në botë. Ashtu siç transformoi brezi i gjerë internetin, inferenca në kohë reale do të transformojë AI, duke mundësuar mënyra krejtësisht të reja për të ndërtuar dhe ndërvepruar me modelet e AI,” tha Andrew Feldman, bashkëthemelues dhe drejtor i përgjithshëm i Cerebras.
Opsioni do të vihet në zbatim me stade graduale deri në vitin 2028.


