14 janvier 2026

OpenAI s’associe à Cerebras

OpenAI s’associe à Cerebras pour ajouter 750 MW de puissance de calcul d’IA à ultra-faible latence à sa plateforme.

Logos d’OpenAI et de Cerebras affichés côte à côte, séparés par une ligne verticale sur un fond à dégradé bleu-vert.

Cerebras conçoit des systèmes d’IA sur mesure destinés à accélérer la génération de contenus longs par les modèles d’IA. Sa vitesse unique provient de l’intégration d’une puissance de calcul, d’une mémoire et d’une bande passante massives sur une seule puce géante. Cela permet de supprimer les goulots d’étranglement qui ralentissent l’inférence sur le matériel classique.

L’intégration de Cerebras à notre éventail de solutions de calcul vise avant tout à accélérer de manière significative le temps de réponse de notre IA. Lorsque vous posez une question complexe, générez du code, créez une image ou sollicitez un agent d’IA, une boucle s’active en coulisses : vous envoyez une requête, le modèle réfléchit, puis il transmet une réponse. Avec une IA qui répond en temps réel, on gagne en productivité, l’engagement se prolonge et les charges de travail exécutées affichent une plus forte valeur ajoutée.

Nous intégrerons cette capacité à faible latence dans notre pile d’inférence par étapes, pour une extension progressive à l’ensemble des charges de travail.

« La stratégie de calcul d’OpenAI consiste à constituer un portefeuille résilient, le but étant d’associer les systèmes les mieux adaptés à chaque type de charge de travail. » Cerebras ajoute à notre plateforme une solution d’inférence dédiée qui présente une faible latence. Cela permet des réponses plus rapides, des interactions plus naturelles et une base plus solide pour étendre l’IA en temps réel à un plus grand nombre de personnes », déclare Sachin Katti d’OpenAI.

« Nous nous réjouissons de nous associer à OpenAI afin de déployer les modèles d’IA les plus performants du marché sur le processeur d’IA le plus rapide au monde. Tout comme le haut débit a transformé Internet, l’inférence en temps réel transformera l’IA et ouvrira des perspectives totalement inédites pour concevoir les modèles d’IA et interagir avec eux », déclare Andrew Feldman, cofondateur et PDG de Cerebras.

La capacité sera mise en service par paliers successifs d’ici la fin de l’année 2028.

Poursuivez votre lecture

Tout afficher

Bâtir une infrastructure d’IA avec la communauté d’Effingham

Affaires internationales22 juil. 2026

Advancing the next era of national science card image

Faire entrer la science américaine dans une nouvelle ère

Affaires internationales22 juil. 2026

Helping build shared standards for advanced AI - card image

Les États-Unis font progresser la sécurité de l’IA par l’action des États et du fédéral

Affaires internationales15 juil. 2026