Passer au contenu principal
OpenAI

OpenAI s'associe à Cerebras

OpenAI s’associe à Cerebras pour ajouter 750 MW de capacité de calcul d’IA à très faible latence à notre plateforme.

Logos d’OpenAI et de Cerebras affichés côte à côte, séparés par une ligne verticale, sur un fond en dégradé bleu-vert.

Cerebras développe des systèmes d'IA spécialement conçus pour accélérer les longues sorties des modèles d'IA. Sa vitesse unique résulte de l'intégration d'une puissance de calcul, d'une mémoire et d'une bande passante massives sur une seule puce géante, éliminant ainsi les goulots d'étranglement qui ralentissent l'inférence sur le matériel conventionnel. 

 L’intégration de Cerebras à notre gamme de solutions de calcul a pour objectif principal d’accélérer la réactivité de notre IA. Lorsque vous posez une question difficile, générez du code, créez une image ou exécutez un agent IA, une boucle se produit en coulisses : vous envoyez une demande, le modèle réfléchit, et il renvoie quelque chose en retour. Lorsque l’IA répond en temps réel, les utilisateurs en font plus, restent plus longtemps et exécutent des charges de travail de plus grande valeur.

Nous intégrerons cette capacité à faible latence dans notre pile d’inférence par étapes, en l'étendant à l'ensemble des charges de travail.  

« La stratégie de calcul d’OpenAI est de bâtir un portefeuille résilient qui associe les systèmes appropriés aux charges de travail adéquates. Cerebras ajoute une solution d’inférence dédiée à faible latence à notre plateforme. Cela signifie des réponses plus rapides, des interactions plus naturelles et une base plus solide pour déployer l’IA en temps réel auprès de beaucoup plus de personnes », a déclaré Sachin Katti d’OpenAI.

« Nous sommes ravis de nous associer à OpenAI pour apporter les modèles d’IA les plus avancés au processeur d’IA le plus rapide au monde. Tout comme le haut débit a transformé Internet, l’inférence en temps réel transformera l’IA, permettant des façons entièrement nouvelles de créer et d’interagir avec des modèles d’IA », a déclaré Andrew Feldman, cofondateur et chef de la direction (PDG) de Cerebras. 

La capacité sera mise en ligne en plusieurs tranches d'ici 2028.