OpenAI s’associa amb Cerebras
OpenAI s’associa amb Cerebras per afegir 750 MW de computació d’IA d’ultrabaixa latència a la nostra plataforma.

Cerebras construeix sistemes d’IA dissenyats específicament per accelerar les sortides llargues dels models d’IA. La seva velocitat única prové de reunir una enorme capacitat de càlcul, memòria i amplada de banda en un únic xip gegant i d’eliminar els colls d’ampolla que alenteixen la inferència en el maquinari convencional.
La integració de Cerebras en el nostre conjunt de solucions de computació té com a objectiu fer que la nostra IA respongui molt més ràpid. Quan fas una pregunta difícil, generes codi, crees una imatge o executes un agent d’IA, es produeix un bucle entre bastidors: envies una sol·licitud, el model pensa i et retorna una resposta. Quan la IA respon en temps real, els usuaris en fan més, s’hi queden més temps i executen càrregues de treball de més valor.
Integraren aquesta capacitat de baixa latència a la nostra pila d’inferència per fases, ampliant-la a totes les càrregues de treball.
«L’estratègia de computació d’OpenAI és construir una cartera resilient que assigni els sistemes adequats a les càrregues de treball adequades. Cerebras afegeix una solució d’inferència de baixa latència dedicada a la nostra plataforma. Això significa respostes més ràpides, interaccions més naturals i una base més sòlida per escalar la IA en temps real a moltes més persones», va dir Sachin Katti d’OpenAI.
«Ens complau associar-nos amb OpenAI i portar els principals models d’IA del món al processador d’IA més ràpid del món. De la mateixa manera que la banda ampla va transformar internet, la inferència en temps real transformarà la IA i permetrà maneres completament noves de construir i interactuar amb models d’IA», va dir Andrew Feldman, cofundador i CEO de Cerebras.
La capacitat entrarà en funcionament en diversos trams fins al 2028.


