12 September 2024

Memperkenalkan OpenAI o1‑preview

Serangkaian model penalaran baru untuk memecahkan masalah yang sulit. Tersedia sekarang.

Memuat…

Pembaruan pada tanggal 17 September 2024: Batasan kecepatan sekarang adalah 50 kueri per minggu untuk o1‑preview dan 50 kueri per hari untuk o1‑mini.

Kami telah mengembangkan serangkaian model AI baru yang dirancang untuk menghabiskan lebih banyak waktu berpikir sebelum memberikan respons. Model ini dapat bernalar melalui tugas kompleks dan menyelesaikan masalah yang lebih sulit dibandingkan model sebelumnya dalam bidang sains, pemrograman, dan matematika.

Hari ini, kami sedang meluncurkan seri pertama ini di ChatGPT dan API kami. Ini adalah pratinjau serta kami mengharapkan pembaruan dan peningkatan berkala. Bersama dengan rilis ini, kami juga menyertakan evaluasi untuk pembaruan berikutnya, yang saat ini dalam tahap pengembangan.

Cara kerjanya

Kami melatih model-model ini untuk menggunakan lebih banyak waktu memikirkan masalah sebelum merespons, seperti dilakukan manusia. Melalui pelatihan, mereka belajar menyempurnakan proses berpikir, mencoba berbagai strategi, dan mengenali kesalahan mereka.

Dalam tes kami, pembaruan model selanjutnya memiliki kinerja yang sama dengan mahasiswa PhD dalam mengerjakan tugas tolok ukur yang menantang dalam bidang fisika, kimia, dan biologi. Kami juga menemukan bahwa model tersebut unggul dalam matematika dan pemrograman. Dalam ujian kualifikasi untuk Olimpiade Matematika Internasional (International Mathematics Olympiad, IMO), GPT‑4o hanya menyelesaikan 13% soal dengan benar, sedangkan model penalaran mendapat skor 83%. Kemampuan pemrograman mereka dievaluasi dalam kontes dan mencapai persentil ke-89 dalam kompetisi Codeforces. Anda dapat membaca selengkapnya tentang ini di postingan riset teknis kami.

Sebagai model awal, aplikasi ini belum memiliki banyak fitur sehingga membuat ChatGPT berguna, seperti menjelajah web untuk mencari informasi dan mengunggah file dan gambar. Untuk banyak kasus umum, GPT‑4o akan lebih mampu dalam jangka waktu dekat.

Namun, untuk tugas penalaran yang rumit, ini merupakan kemajuan yang signifikan dan mewakili tingkat baru kemampuan AI. Mengingat hal ini, kami akan mengatur ulang penghitung kembali ke 1 dan menamai seri ini OpenAI o1.

Keselamatan

Sebagai bagian dari pengembangan model baru ini, kami telah menemukan pendekatan pelatihan keselamatan baru yang memanfaatkan kemampuan penalaran mereka agar mereka mematuhi pedoman keselamatan dan penyelarasan. Dengan mampu memahami aturan keselamatan dalam konteksnya, model dapat menerapkan aturan tersebut dengan lebih efektif.

Salah satu cara kami mengukur keselamatan adalah dengan menguji seberapa baik model kami terus mengikuti aturan keselamatan jika pengguna mencoba menerobosnya (dikenal sebagai "jailbreaking"). Pada salah satu tes jailbreaking terberat kami, GPT‑4o memperoleh skor 22 (pada skala 0-100) sedangkan model o1‑preview kami memperoleh skor 84. Anda dapat membaca selengkapnya tentang ini di kartu sistem dan postingan riset kami.

Untuk mengimbangi kemampuan baru model-model ini, kami telah memperkuat pekerjaan keselamatan, tata kelola internal, dan kolaborasi dengan pemerintah federal. Ini termasuk pengujian dan evaluasi ketat menggunakan Kerangka Kerja Kesiapan⁠(terbuka di jendela baru) kami, red-teaming terbaik di kelasnya, dan proses peninjauan tingkat dewan, termasuk oleh Komite Keselamatan & Keamanan kami.

Untuk memajukan komitmen kami terhadap keselamatan AI, kami baru-baru ini meresmikan perjanjian dengan AS dan Inggris Raya. Institut Keselamatan AI. Kami telah mulai mengoperasionalkan perjanjian ini, termasuk memberikan kepada lembaga akses awal ke versi riset model ini. Ini adalah langkah pertama yang penting dalam kemitraan kami, yang membantu menetapkan proses riset, evaluasi, dan pengujian model di masa mendatang sebelum dan sesudah dirilis ke publik.

Untuk siapa ini

Kemampuan penalaran yang ditingkatkan ini dapat sangat berguna jika Anda menangani masalah rumit dalam bidang sains, pemrograman, matematika, dan bidang serupa. Misalnya, o1 dapat digunakan oleh peneliti layanan kesehatan untuk memberi anotasi pada data pengurutan sel, oleh pakar fisika untuk menghasilkan rumus matematika rumit yang dibutuhkan untuk optik kuantum, dan oleh pengembang di semua bidang untuk membangun dan menjalankan alur kerja multi-langkah.

OpenAI o1-mini

Seri o1 unggul dalam menghasilkan dan merunut kode yang rumit secara akurat. Untuk menawarkan solusi yang lebih efisien bagi pengembang, kami juga meluncurkan OpenAI o1‑mini, model penalaran yang lebih cepat, lebih murah, dan sangat efektif dalam pemrograman. Sebagai model yang lebih kecil, o1‑mini 80% lebih murah dari o1‑preview, menjadikannya model yang kuat dan hemat biaya untuk aplikasi yang memerlukan penalaran tetapi tidak memerlukan pengetahuan dunia yang luas.

Cara menggunakan OpenAI o1

Pengguna ChatGPT Plus dan Team akan dapat mengakses model o1 di ChatGPT mulai hari ini. Baik o1‑preview maupun o1‑mini dapat dipilih secara manual di pemilih model, dan saat peluncuran, batas tingkat mingguan akan menjadi 30 pesan untuk o1‑preview dan 50 untuk o1‑mini. Kami sedang mengupayakan untuk meningkatkan tingkat tersebut dan memungkinkan ChatGPT untuk secara otomatis memilih model yang tepat untuk prompt tertentu.

Gambar tarik-turun ChatGPT baru yang menampilkan opsi model "o1-preview" baru di atas latar belakang abstrak kuning dan biru cerah

Pengguna ChatGPT Enterprise dan Edu akan mendapatkan akses ke kedua model mulai minggu depan.

Pengembang yang memenuhi syarat untuk penggunaan API tingkat 5⁠(terbuka di jendela baru) dapat mulai membuat purwarupa dengan kedua model di API hari ini dengan batas kecepatan 20 RPM. Kami sedang mengupayakan untuk meningkatkan batasan ini setelah pengujian tambahan. API untuk model ini saat ini tidak menyertakan pemanggilan fungsi, streaming, dukungan untuk pesan sistem, dan fitur lainnya. Untuk memulai, periksa dokumentasi API⁠(terbuka di jendela baru).

Kami juga sedang berencana untuk menyediakan akses o1‑mini bagi semua pengguna ChatGPT Gratis.

Selanjutnya

Ini adalah pratinjau awal model penalaran di ChatGPT dan API. Selain pembaruan model, kami berencana untuk menambahkan fitur penjelajahan, pengunggahan file dan gambar, serta fitur lainnya agar lebih bermanfaat bagi semua orang.

Kami juga berencana untuk terus mengembangkan dan meluncurkan model dalam seri GPT kami, selain seri OpenAI o1 yang baru.

Penulis

OpenAI