OpenAI spolupracuje so spoločnosťou Cerebras
OpenAI spolupracuje so spoločnosťou Cerebras na pridaní 750 MW ultra nízkej latencie výpočtového výkonu umelej inteligencie do našej platformy.

Cerebras vytvára účelovo navrhnuté AI systémy na urýchlenie dlhých výstupov z AI modelov. Ich jedinečná rýchlosť pochádza zo spojenia masívneho výpočtového výkonu, pamäte a šírky pásma na jednom obrovskom čipe, a z odstránenia úzkych miest, ktoré spomaľujú inferenciu na konvenčnom hardvéri.
Integrácia Cerebras do nášho mixu výpočtových riešení je zameraná na to, aby naša umelá inteligencia reagovala oveľa rýchlejšie. Keď položíš ťažkú otázku, generuješ kód, vytvoríš obrázok alebo spustíš AI agenta, v pozadí prebieha slučka: odošleš požiadavku, model premýšľa a odošle niečo späť. Keď AI reaguje v reálnom čase, používatelia s ňou dokážu viac, zostávajú dlhšie a spúšťajú pracovné záťaže s vyššou hodnotou.
Túto kapacitu s nízkou latenciou budeme postupne integrovať do nášho inferenčného stacku, pričom ju budeme rozširovať naprieč pracovnými záťažami.
„Výpočtová stratégia OpenAI spočíva vo vybudovaní odolného portfólia, ktoré priraďuje správne systémy k správnym pracovným záťažiam.“ Cerebras pridáva do našej platformy špecializované riešenie inferencie s nízkou latenciou. To znamená rýchlejšie odpovede, prirodzenejšie interakcie a silnejší základ na rozšírenie umelej inteligencie v reálnom čase pre oveľa viac ľudí,” povedal Sachin Katti z OpenAI.
„Sme nadšení, že môžeme spolupracovať s OpenAI a priniesť popredné modely umelej inteligencie na najrýchlejší procesor umelej inteligencie na svete.“ Tak ako širokopásmové pripojenie transformovalo internet, inferencia v reálnom čase transformuje AI a umožní úplne nové spôsoby, ako vytvárať a interagovať s AI modelmi,“ povedal Andrew Feldman, spoluzakladateľ a výkonný riaditeľ spoločnosti Cerebras.
Kapacita bude uvedená do prevádzky vo viacerých fázach do roku 2028.


