OpenAI bermitra dengan Cerebras
OpenAI bermitra dengan Cerebras untuk menambahkan 750MW komputasi AI dengan latensi ultra rendah ke platform kami.

Cerebras membangun sistem AI yang dirancang khusus untuk mempercepat keluaran panjang dari model AI. Kecepatan uniknya berasal dari penggabungan komputasi, memori, dan bandwidth yang masif pada satu chip raksasa tunggal serta menghilangkan hambatan yang memperlambat proses inferensi pada perangkat keras konvensional.
Integrasikan Cerebras ke dalam perpaduan solusi komputasi kami bertujuan untuk membuat AI kami merespons jauh lebih cepat. Ketika Anda mengajukan pertanyaan sulit, membuat kode, membuat gambar, atau menjalankan agen AI, ada sebuah siklus yang terjadi di balik layar: Anda mengirim permintaan, model memikirkannya, dan model mengirimkan sesuatu kembali. Ketika AI merespons secara real-time, para pengguna dapat melakukan lebih banyak hal, bertahan lebih lama, dan menjalankan beban kerja dengan nilai lebih tinggi.
Kami akan mengintegrasikan kapasitas latensi rendah ini ke dalam tumpukan inferensi kami secara bertahap, memperluasnya di seluruh beban kerja.
“Strategi komputasi OpenAI adalah membangun portofolio yang tangguh yang mencocokkan sistem yang tepat untuk beban kerja yang tepat. Cerebras menambahkan solusi inferensi berlatensi rendah yang khusus ke platform kami. Itu berarti respons yang lebih cepat, interaksi yang lebih alami, dan fondasi yang lebih kuat untuk meningkatkan skala AI real-time kepada lebih banyak orang,” kata Sachin Katti dari OpenAI.
“Kami sangat senang dapat bermitra dengan OpenAI, menghadirkan model AI terdepan di dunia ke prosesor AI tercepat di dunia. Seperti halnya broadband mengubah internet, inferensi real-time akan mengubah AI, memungkinkan cara-cara baru untuk membangun dan berinteraksi dengan model AI,” kata Andrew Feldman, salah satu pendiri dan CEO Cerebras.
Kapasitas ini akan mulai beroperasi dalam beberapa tahap hingga tahun 2028.


