OpenAI s’associe à Cerebras
OpenAI s’associe à Cerebras pour ajouter 750 MW de puissance de calcul d’IA à ultra-faible latence à sa plateforme.

Cerebras conçoit des systèmes d’IA sur mesure destinés à accélérer la génération de contenus longs par les modèles d’IA. Sa vitesse unique provient de l’intégration d’une puissance de calcul, d’une mémoire et d’une bande passante massives sur une seule puce géante. Cela permet de supprimer les goulots d’étranglement qui ralentissent l’inférence sur le matériel classique.
L’intégration de Cerebras à notre éventail de solutions de calcul vise avant tout à accélérer de manière significative le temps de réponse de notre IA. Lorsque vous posez une question complexe, générez du code, créez une image ou sollicitez un agent d’IA, une boucle s’active en coulisses : vous envoyez une requête, le modèle réfléchit, puis il transmet une réponse. Avec une IA qui répond en temps réel, on gagne en productivité, l’engagement se prolonge et les charges de travail exécutées affichent une plus forte valeur ajoutée.
Nous intégrerons cette capacité à faible latence dans notre pile d’inférence par étapes, pour une extension progressive à l’ensemble des charges de travail.
« La stratégie de calcul d’OpenAI consiste à constituer un portefeuille résilient, le but étant d’associer les systèmes les mieux adaptés à chaque type de charge de travail. » Cerebras ajoute à notre plateforme une solution d’inférence dédiée qui présente une faible latence. Cela permet des réponses plus rapides, des interactions plus naturelles et une base plus solide pour étendre l’IA en temps réel à un plus grand nombre de personnes », déclare Sachin Katti d’OpenAI.
« Nous nous réjouissons de nous associer à OpenAI afin de déployer les modèles d’IA les plus performants du marché sur le processeur d’IA le plus rapide au monde. Tout comme le haut débit a transformé Internet, l’inférence en temps réel transformera l’IA et ouvrira des perspectives totalement inédites pour concevoir les modèles d’IA et interagir avec eux », déclare Andrew Feldman, cofondateur et PDG de Cerebras.
La capacité sera mise en service par paliers successifs d’ici la fin de l’année 2028.


