OpenAI se asocia con Cerebras
OpenAI inicia una colaboración con Cerebras para integrar 750 MW de computación de IA de latencia ultrabaja a nuestra plataforma.

Cerebras desarrolla sistemas de IA diseñados específicamente para acelerar salidas largas de los modelos de IA. Su velocidad única proviene de combinar una gran capacidad de computación, memoria y ancho de banda en un solo chip gigante, eliminando los cuellos de botella que ralentizan la inferencia en el hardware convencional.
La integración de Cerebras en nuestro conjunto de soluciones de computación implica que nuestro proceso de respuesta de IA sea mucho más rápido. Cuando haces una pregunta difícil, generas código, creas una imagen o ejecutas un agente de IA, se inicia un proceso en bucle en segundo plano: tú envías una solicitud, el modelo piensa y luego te devuelve algo. Cuando la IA responde en tiempo real, los usuarios suelen operar más con ella, se quedan más tiempo y ejecutan cargas de trabajo de mayor valor.
Integraremos esta capacidad de baja latencia en nuestra pila de inferencia por fases, expandiéndola por las diferentes cargas de trabajo.
«La estrategia de computación de OpenAI es construir un portafolio resiliente que asigne los sistemas adecuados a las cargas de trabajo correctas. Cerebras añade una solución de inferencia dedicada de baja latencia a nuestra plataforma, lo cual implica respuestas más rápidas, interacciones más naturales y una base más sólida para escalar la IA en tiempo real a muchas más personas», señaló Sachin Katti, de OpenAI.
«Estamos encantados de colaborar con OpenAI, llevando los modelos de IA líderes del mundo al procesador de IA más rápido del mundo. Al igual que la banda ancha transformó internet, la inferencia en tiempo real transformará la IA, permitiendo formas completamente nuevas de crear e interactuar con modelos de IA», comentó Andrew Feldman, cofundador y director general (CEO) de Cerebras.
La capacidad se activará en distintas fases hasta 2028.


