18. heinäkuuta 2024

GPT‑4o mini: kustannustehokkaan älykkyyden edistäminen

Esittelyssä kustannustehokkain pieni mallimme

Ladataan...

OpenAI on sitoutunut saattamaan älyn mahdollisimman laajasti saataville. Tänään julkistamme GPT‑4o mini-version, kustannustehokkaimman pienikokoisen mallimme. Odotamme, että GPT‑4o mini laajentaa merkittävästi tekoälyn avulla rakennettujen sovellusten valikoimaa tekemällä älykkyydestä paljon edullisempaa. GPT‑4o mini saa 82 % MMLU:ssa ja on tällä hetkellä GPT‑4:ää¹ parempi keskusteluasetuksissa LMSYS-tulostaulukossa⁠(avautuu uudessa ikkunassa). Sen hinta on 15 senttiä miljoonaa syötetunnistetta kohden ja 60 senttiä miljoonaa tuotostunnistetta kohden, mikä on moninkertaisesti edullisempi kuin aiemmat kehitysmallit ja yli 60 % halvempi kuin GPT‑3.5 Turbo.

GPT‑4o mini mahdollistaa laajan valikoiman tehtäviä alhaisilla kustannuksillaan ja viiveellään. Tällaisia ovat esimerkiksi sovellukset, jotka ketjuttavat tai rinnakkaistavat useita mallikutsuja (esim. kutsuvat useita API-rajapintoja), välittävät suuren määrän kontekstia mallille (esim. koko koodikanta tai keskusteluhistoria) tai ovat vuorovaikutuksessa asiakkaiden kanssa nopeiden, reaaliaikaisten tekstivastausten avulla (esim. asiakastuen keskustelubotit).

Nykyään GPT‑4o mini tukee tekstiä ja näköä API:ssa, ja tulevaisuudessa on tulossa tuki teksti-, kuva-, video- ja äänisyötteille ja -tuotoksille. Mallin konteksti-ikkuna on 128 000 tunnistetta, se tukee jopa 16 000 tuotostunnistetta pyyntöä kohden ja sillä on tietoja lokakuuhun 2023 asti. GPT‑4o:n kanssa jaetun parannetun tunnistetoimijan ansiosta muun kuin englanninkielisen tekstin käsittely on nyt entistä kustannustehokkaampaa.

Pieni malli, jolla on ylivoimainen tekstiäly ja multimodaalinen päättelykyky

GPT‑4o mini ylittää GPT‑3.5 Turbon ja muut pienet mallit akateemisissa vertailuissa sekä tekstiälyn että multimodaalisen päättelyn osalta ja tukee samaa kielivalikoimaa kuin GPT‑4o. Se osoittaa myös vahvaa suorituskykyä funktioiden kutsumisessa, mikä voi mahdollistaa kehittäjille sovellusten rakentamisen, jotka hakevat tietoja tai suorittavat toimintoja ulkoisten järjestelmien kanssa. Lisäksi sen pitkän kontekstin suorituskykyä on parannettu verrattuna GPT‑3.5 Turboon.

GPT‑4o miniä on arvioitu useiden keskeisten vertailuarvojen avulla².

Päättelytehtävät: GPT‑4o mini on parempi kuin muut pienet mallit sekä tekstiä että näköä sisältävissä päättelytehtävissä. Se sai 82,0 % MMLU:sta, joka on tekstuaalisen älykkyyden ja päättelyn vertailuarvo. Vertailun vuoksi Gemini Flash sai 77,9 % ja Claude Haiku 73,8 %.

Matematiikan ja koodauksen taitotaso: GPT‑4o mini loistaa matemaattisissa päättely- ja koodaustehtävissä ja on suorituskyvyltään parempi kuin markkinoilla olleet aiemmat pienet mallit. MGSM:ssä matemaattista päättelykykyä mittaavassa testissä GPT‑4o mini sai 87,0 %, kun Gemini Flash sai 75,5 % ja Claude Haiku 71,7 %. GPT‑4o mini sai 87,2 % koodaussuorituskykyä mittaavassa HumanEvalissa, kun Gemini Flash sai 71,5 % ja Claude Haiku 75,9 %.

Multimodaalinen päättely: GPT‑4o mini suoriutuu myös hyvin MMMU:ssa, multimodaalisessa päättelytestissä, pistein 59,4 %, kun Gemini Flash sai 56,1 % ja Claude Haiku 50,2 %.

Mallin arviointipisteet

Osana mallinkehitysprosessiamme työskentelimme useiden luotettavien kumppaneiden kanssa ymmärtääksemme paremmin GPT‑4o minin käyttötapauksia ja rajoituksia. Teimme yhteistyötä yritysten kanssa, kuten Ramp⁠(avautuu uudessa ikkunassa) ja Superhuman⁠(avautuu uudessa ikkunassa), jotka havaitsivat GPT‑4o minin toimivan huomattavasti paremmin kuin GPT‑3.5 Turbo esimerkiksi tehtävissä, kuten strukturoidun tiedon poimimisessa kuittitiedostoista tai korkealaatuisten sähköpostivastausten luomisessa, kun keskusteluhistoria on saatavilla.

Sisäänrakennetut turvatoimet

Turvallisuus on sisäänrakennettu malleihimme alusta alkaen, ja sitä vahvistetaan kehitysprosessimme jokaisessa vaiheessa. Esikoulutuksessa⁠(avautuu uudessa ikkunassa) suodatamme pois tiedot, joista emme halua malliemme oppivan tai tuottavan, kuten vihapuheen, aikuisille suunnatun sisällön, sivustot, jotka ensisijaisesti kokoavat henkilötietoja, ja roskapostin. Jälkikoulutuksessa mukautamme mallin käyttäytymisen käytäntöihimme käyttämällä tekniikoita, kuten vahvistusoppimista ihmisen palautteen avulla (RLHF)⁠, parantaaksemme mallien vastausten tarkkuutta ja luotettavuutta.

GPT‑4o minissä on samat turvallisuusriskien lieventämistoimet kuin GPT‑4o:ssa⁠, jotka olemme arvioineet huolellisesti sekä automaattisten että ihmisten tekemien arviointien avulla valmiusviitekehyksemme⁠ mukaisesti ja vapaaehtoisten sitoumuksiemme⁠ mukaisesti. Yli 70 ulkopuolista asiantuntijaa esimerkiksi sosiaalipsykologian ja misinformaation aloilla testasi GPT‑4o:ta tunnistaakseen mahdolliset riskit. Olemme käsitelleet näitä riskejä ja aiomme jakaa niiden yksityiskohdat tulevassa GPT‑4o‑järjestelmäkortissa ja valmiuspistekortissa. Näistä asiantuntija-arvioinneista saadut näkemykset ovat auttaneet parantamaan sekä GPT‑4o:n että GPT‑4o minin turvallisuutta.

Näiden oppien pohjalta tiimimme työskentelivät myös parantaakseen GPT‑4o minin turvallisuutta käyttämällä tutkimukseemme perustuvia uusia tekniikoita. GPT‑4o mini API:ssa on ensimmäinen malli, joka soveltaa käskyhierarkian⁠(avautuu uudessa ikkunassa) menetelmäämme. Se auttaa parantamaan mallin kykyä vastustaa suojauksen murtohyökkäyksiä, kehotteiden injektioita ja järjestelmäkehotteiden poistoja. Se tekee mallin vastauksista luotettavampia ja auttaa tekemään sen käytöstä turvallisempaa laaja-alaisissa sovelluksissa.

Jatkamme GPT‑4o minin käytön seurantaa ja parannamme mallin turvallisuutta tunnistaessamme uusia riskejä.

Saatavuus ja hinnoittelu

GPT‑4o mini on nyt saatavilla teksti- ja näkömallina Assistants API:ssa, Chat Completions API:ssa ja Batch API:ssa. Kehittäjät maksavat 15 senttiä miljoonasta syötetunnisteesta ja 60 senttiä miljoonasta tuotostunnisteesta (noin 2 500 sivua vastaava määrä tavallisessa kirjassa). Aiomme julkaista GPT‑4o minin hienosäädön lähipäivinä.

ChatGPT:ssä Free-, Plus- ja Team-käyttäjät voivat käyttää GPT‑4o miniä tästä päivästä alkaen GPT‑3.5:n sijaan. Myös Enterprise-käyttäjillä on pääsy palveluun ensi viikosta alkaen, mikä on linjassa tavoitteemme kanssa tuoda tekoälyn edut kaikkien saataville.

Mitä seuraavaksi?

Viime vuosina olemme nähneet merkittäviä edistysaskeleita tekoälyn alalla yhdistettynä huomattaviin kustannussäästöihin. Esimerkiksi GPT‑4o minin tunnisteiden hinta on laskenut 99 % sitten text-davinci-003:n. Se on vähemmän kyvykäs malli, joka esiteltiin vuonna 2022. Olemme sitoutuneet jatkamaan tätä kustannusten alentamista samalla kun parannamme mallien ominaisuuksia.

Näemme tulevaisuuden, jossa mallit integroituvat saumattomasti jokaiseen sovellukseen ja jokaiselle verkkosivustolle. GPT‑4o mini tasoittaa tietä kehittäjille rakentaa ja skaalata tehokkaita tekoälysovelluksia tehokkaammin ja edullisemmin. Tekoäly on tulossa helpommin saavutettavaksi, luotettavammaksi ja osaksi päivittäisiä digitaalisia kokemuksia, ja meistä on hienoa jatkaa tämän edelläkävijänä.

Tekijä

OpenAI

Kiitokset

Vastuuhenkilöt: Jacob Menick, Kevin Lu, Shengjia Zhao, Eric Wallace, Hongyu Ren, Haitang Hu, Nick Stathas, Felipe Petroski Such

Ohjelman johtaja: Mianna Chen

Osallisuudet on esitetty osoitteessa https://openai.com/gpt-4o-contributions/⁠

Alaviitteet

1
18. heinäkuuta 2024 lähtien GPT-4o minin aiempi versio on suoriutunut paremmin kuin GPT-4T 01-25.
2
GPT-4o minin arviointiluvut lasketaan käyttämällä yksinkertaisten arviointien⁠(avautuu uudessa ikkunassa) säilöämme API-avustajajärjestelmän viestikehotteella. Kilpailijoiden mallien kohdalla otamme heidän ilmoittamansa lukumäärän (jos saatavilla), HELM⁠(avautuu uudessa ikkunassa)-tulostaulukon ja oman yksinkertaisten arviointien lukumäärän sijaan enimmäismäärän.