25 Januari 2024

New embedding models and API updates

Lagi dimuat…

Kita ngluncurake model anyar, nyuda rega kanggo GPT‑3.5 Turbo, lan ngenalake cara anyar supaya para pangembang bisa ngatur API key lan mangerteni panggunaan API. Model anyar kasebut kalebu:

Loro model embedding anyar
Model pratayang GPT‑4 Turbo sing dianyari
Model GPT‑3.5 Turbo sing dianyari
Model moderasi teks sing dianyari

Kanthi gawan, data sing dikirim menyang OpenAI API ora bakal digunakake kanggo nglatih utawa ningkatake model OpenAI.

Model embedding anyar kanthi rega luwih murah

Kita ngenalake loro model embedding anyar: model text-embedding-3-small sing luwih cilik lan efisien banget, lan model text-embedding-3-large sing luwih gedhe lan luwih kuat.

Embedding⁠ yaiku runtutan angka sing makili konsep ing njero konten kayata basa alami utawa kode. Embeddings nggampangake model machine learning lan algoritma liyane kanggo mangerteni hubungan antarane konten lan nindakake tugas kaya clustering utawa retrieval. Iki ndhukung aplikasi kaya retrieval kawruh ing ChatGPT lan Assistants API, uga akeh piranti pangembang retrieval augmented generation (RAG).

Lagi dimuat...

Model embedding teks cilik anyar

text-embedding-3-small yaiku model embedding anyar kita sing efisien banget lan menehi peningkatan gedhe tinimbang pendhulele, model text-embedding-ada-002 sing dirilis ing Desember 2022⁠.

Performa luwih kuwat. Yen mbandhingake text-embedding-ada-002 karo text-embedding-3-small, skor rata-rata ing benchmark sing umum digunakake kanggo retrieval multibasa (MIRACL⁠(mbukak ing jendhela anyar)) mundhak saka 31.4% dadi 44.0%, dene skor rata-rata ing benchmark sing umum digunakake kanggo tugas basa Inggris (MTEB⁠(mbukak ing jendhela anyar)) mundhak saka 61.0% dadi 62.3%.

Rega luwih murah. text-embedding-3-small uga luwih efisien banget tinimbang model generasi sadurunge kita text-embedding-ada-002. Mula, rega kanggo text-embedding-3-small wis dikurangi 5X dibandhingake karo text-embedding-ada-002, saka rega saben 1k token $0.0001 dadi $0.00002.

Kita ora bakal mungkasi text-embedding-ada-002, dadi sanajan kita nyaranake model sing luwih anyar, pelanggan tetep dipersilakan terus nggunakake model generasi sadurunge.

Model embedding teks gedhe anyar: text-embedding-3-large

text-embedding-3-large yaiku model embedding gedhe generasi sabanjure anyar kita lan nggawe embedding nganti 3072 dimensi.

Performa luwih kuwat. text-embedding-3-large yaiku model kanthi performa paling apik anyar kita. Yen mbandhingake text-embedding-ada-002 karo text-embedding-3-large: ing MIRACL, skor rata-rata mundhak saka 31.4% dadi 54.9%, dene ing MTEB, skor rata-rata mundhak saka 61.0% dadi 64.6%.

Benchmark eval	ada v2	text-embedding-3-small	text-embedding-3-large
Rata-rata MIRACL	31.4	44.0	54.9
Rata-rata MTEB	61.0	62.3	64.6

text-embedding-3-large bakal diregani $0.00013 / 1k token.

Sampeyan bisa sinau luwih lengkap babagan nggunakake model embedding anyar ing pandhuan Embeddings⁠(mbukak ing jendhela anyar) kita.

Dhukungan native kanggo nyepetake embedding

Nggunakake embedding sing luwih gedhe, contone nyimpen ing vector store kanggo retrieval, umume mbutuhake biaya luwih gedhe lan nggunakake komputasi, memori, lan panyimpenan luwih akeh tinimbang nggunakake embedding sing luwih cilik.

Loro model embedding anyar kita dilatih nganggo teknik^A sing ngidini para pangembang ngimbangi performa lan biaya panggunaan embedding. Mligi, para pangembang bisa nyepetake embedding (yaiku mbusak sawetara angka saka mburi runtutan) tanpa embedding kelangan sifat makili konsep kanthi ngirim parameter API dimensions. Contone, ing benchmark MTEB, embedding text-embedding-3-large bisa dicekak dadi ukuran 256 nanging isih ngluwihi performa embedding text-embedding-ada-002 sing ora dicekak kanthi ukuran 1536.

Lagi dimuat...

Iki ndadekake panggunaan dadi fleksibel banget. Contone, nalika nggunakake vector data store sing mung ndhukung embedding nganti dawane 1024 dimensi, para pangembang saiki isih bisa nggunakake model embedding paling apik kita text-embedding-3-large lan nemtokake nilai 1024 kanggo parameter API dimensions, sing bakal nyepetake embedding saka 3072 dimensi, kanthi ngorbanake sithik akurasi minangka ijol-ijolan kanggo ukuran vektor sing luwih cilik.

Model anyar liyane lan rega luwih murah

Model GPT-3.5 Turbo sing dianyari lan rega luwih murah

Minggu ngarep kita ngenalake model GPT‑3.5 Turbo anyar, gpt-3.5-turbo-0125, lan kanggo kaping telune sajrone setaun kepungkur, kita bakal nurunake rega GPT‑3.5 Turbo kanggo mbantu pelanggan kita ngembangake skala. Rega input kanggo model anyar iki dikurangi 50% dadi $0.0005 /1K token lan rega output dikurangi 25% dadi $0.0015 /1K token. Model iki uga bakal nduweni macem-macem peningkatan kalebu akurasi sing luwih dhuwur nalika nanggapi ing format sing dijaluk lan perbaikan kanggo bug⁠(mbukak ing jendhela anyar) sing nyebabake masalah enkoding teks kanggo function call basa non-Inggris.

Pelanggan sing nggunakake alias model gpt-3.5-turbo sing ora dipin bakal dianyari kanthi otomatis saka gpt-3.5-turbo-0613 dadi gpt-3.5-turbo-0125 rong minggu sawisé model iki diluncurake.

Pratayang GPT-4 Turbo sing dianyari

Luwih saka 70% panjalukan saka pelanggan API GPT‑4 wis pindhah menyang GPT‑4 Turbo wiwit dirilis, amarga para pangembang nggunakke kauntungan saka wates kawruh sing dianyari, jendhela konteks 128k sing luwih gedhe, lan rega sing luwih murah.

Dina iki, kita ngluncurake model pratayang GPT‑4 Turbo sing dianyari, gpt-4-0125-preview. Model iki ngrampungake tugas kaya ngasilake kode kanthi luwih tuntas tinimbang model pratayang sadurunge lan ditujokake kanggo nyuda kasus “kesed” nalika model ora ngrampungake tugas. Model anyar iki uga kalebu perbaikan kanggo bug sing mengaruhi generasi UTF-8 non-Inggris.

Kanggo sing pengin dianyari kanthi otomatis menyang versi pratayang GPT‑4 Turbo anyar, kita uga ngenalake alias jeneng model anyar gpt-4-turbo-preview, sing bakal tansah nuding menyang model pratayang GPT‑4 Turbo paling anyar.

Kita ngrancang ngluncurake GPT‑4 Turbo kanthi vision kanggo kasedhiyan umum ing sawetara wulan ngarep.

Model moderasi sing dianyari

Moderation API gratis ngidini para pangembang ngenali teks sing duweni potensi mbebayani. Minangka bagean saka karya keamanan sing terus lumaku, kita ngluncurake text-moderation-007, model moderasi kita sing paling tangguh nganti saiki. Alias text-moderation-latest lan text-moderation-stable wis dianyari supaya nuding menyang model iki. Sampeyan bisa sinau luwih akeh babagan mbangun sistem AI sing aman liwat pandhuan praktik terbaik keamanan⁠(mbukak ing jendhela anyar) kita.

Cara anyar kanggo mangerteni panggunaan API lan ngatur API key

Kita ngluncurake rong perbaikan platform kanggo menehi para pangembang visibilitas luwih gedhe babagan panggunaan lan kontrol marang API key.

Kaping pisanan, para pangembang saiki bisa menehi idin marang API key saka kaca API keys⁠(mbukak ing jendhela anyar). Contone, sawijining key bisa diwenehi akses mung maca kanggo ndhukung dasbor pelacakan internal, utawa diwatesi mung kanggo ngakses titik pungkasan tartamtu.

Kapindho, dasbor panggunaan lan fungsi ekspor panggunaan saiki nampilake metrik ing level API key sawisé nguripake pelacakan⁠(mbukak ing jendhela anyar). Iki ndadekake gampang kanggo ndeleng panggunaan saben fitur, tim, produk, utawa proyek, mung kanthi nduweni API key kapisah kanggo saben-saben.

Ing sawetara wulan ngarep, kita ngrancang luwih ningkatake kemampuan supaya para pangembang bisa ndeleng panggunaan API lan ngatur API key, mligine ing organisasi sing luwih gedhe.

Kanggo kabar paling anyar babagan API OpenAI, tindakna kita ing X ing @OpenAIDevs⁠(mbukak ing jendhela anyar).

Cathetan sikil

A
Pembelajaran Representasi Matryoshka⁠(mbukak ing jendhela anyar)

Panulis

OpenAI

Ucapan matur nuwun

Juntang Zhuang, Paul Baltescu, Joy Jiao, Arvind Neelakantan, Andrew Braunstein, Jeff Harris, Logan Kilpatrick, Leher Pathak, Enoch Cheung, Ted Sanders, Yutian Liu, Anushree Agrawal, Andrew Peng, Ian Kivlichan, Mehmet Yatbaz, Madelaine Boyd, Anna-Luisa Brakman, Florencia Leoni Aleman, Henry Head, Molly Lin, Meghan Shah, Chelsea Carlson, Sam Toizer, Ryan Greene, Alison Harmon, Denny Jin, Karolis Kosas, Marie Inuzuka, Peter Bakkum, Barret Zoph, Luke Metz, Jiayi Weng, Randall Lin, Yash Patil, Mianna Chen, Andrew Kondrich, Brydon Eastman, Liam Fedus, John Schulman, Vlad Fomenko, Andrej Karpathy, Aidan Clark, Owen Campbell-Moore