
Esittelemme Canvaksen, uuden käyttöliittymän ChatGPT:lle. Se tukee kirjoittamista ja koodausprojekteja yksinkertaista keskustelua pidemmälle. Canvas avautuu erilliseen ikkunaan, jolloin sinä ja ChatGPT voitte tehdä yhteistyötä projektin parissa. Tämä varhainen beetaversio esittelee uuden tavan työskennellä yhdessä – ei vain keskustelemalla, vaan luomalla ja jalostamalla ideoita rinnakkain.
Canvas rakennettiin GPT‑4o:lla, ja se voidaan valita manuaalisesti mallinvalitsimessa beetaversiossa. Tästä lähtien otamme Canvaksen käyttöön ChatGPT Plus- ja Team-käyttäjille maailmanlaajuisesti. Enterprise- ja Edu-käyttäjät saavat käyttöoikeuden ensi viikolla. Suunnittelemme Canvaksen tarjoamista kaikille maksuttoman ChatGPT:n käyttäjille, kun sen beetaversio on päättynyt.
Ihmiset käyttävät ChatGPT:tä joka päivä saadakseen apua kirjoittamiseen ja koodaukseen. Vaikka keskustelukäyttöliittymä on helppokäyttöinen ja toimii hyvin monissa tehtävissä, sen mahdollisuudet ovat rajalliset, kun haluat työskennellä projekteissa, jotka edellyttävät muokkausta ja tarkistuksia. Canvas tarjoaa uuden käyttöliittymän tällaiseen työskentelyyn.
Canvaksen avulla ChatGPT ymmärtää paremmin, mitä yrität saavuttaa ja millaisessa kontekstissa työskentelet. Voit korostaa tiettyjä osioita osoittaaksesi, mihin haluat ChatGPT:n keskittyvän. Se voi antaa riviväliin sijoitettua palautetta ja ehdotuksia koko projektin kannalta, kuten oikolukija tai koodin tarkastaja.
Canvaksessa projekti on hallinnassasi. Voit muokata tekstiä tai koodia suoraan. Valikossa on pikanäppäimiä, joilla voit pyytää ChatGPT:tä säätämään kirjoituksen pituutta, poistamaan virheet koodista ja suorittamaan nopeasti muita hyödyllisiä toimintoja. Voit myös palauttaa aiemmat versiot työstäsi käyttämällä Canvaksen takaisin-painiketta.
Canvas avautuu automaattisesti, kun ChatGPT havaitsee tilanteen, jossa siitä voisi olla apua. Voit myös lisätä kehotteeseen “käytä Canvasta“, jolloin voit avata Canvaksen ja käyttää sitä olemassa olevan projektin työstämiseen.
Kirjoittamisen pikanäppäimet sisältävät:
- Ehdottaa muokkauksia ChatGPT tarjoaa rivinsisäisiä ehdotuksia ja palautetta.
- Säätää pituutta: Muokkaa asiakirjan pituutta lyhyemmäksi tai pidemmäksi.
- Vaihtaa lukutasoa: Säätää lukutason lastentarhasta korkeakouluun.
- Lisää lopullisen viimeistelyn: Tarkistaa kieliopin, selkeyden ja johdonmukaisuuden.
- Lisää emojeita: Lisää asiaankuuluvia hymiöitä painotuksen ja värin lisäämiseksi.
Koodaus on iteratiivinen prosessi, ja voi olla vaikeaa seurata kaikkia koodin tarkistuksia keskustelussa. Canvas helpottaa ChatGPT:n muutosten seuraamista ja ymmärtämistä, ja aiomme jatkaa tällaisten muutosten läpinäkyvyyden parantamista.
Koodaamisen pikanäppäimiä ovat mm:
- Esikatselee koodia: ChatGPT tarjoaa rivinsisäisiä ehdotuksia koodisi parantamiseksi.
- Lisää lokeja: Lisää tulostuskomentoja, jotka auttavat sinua korjaamaan virheet ja ymmärtämään koodia.
- Lisää kommentteja: Lisää koodiin kommentteja, jotta sitä olisi helpompi ymmärtää.
- Korjaa virheet: Havaitsee ongelmallisen koodin ja kirjoittaa sen uudelleen virheiden korjaamiseksi.
- Siirtää toiseen kieleen: Kääntää koodisi JavaScriptiksi, TypeScriptiksi, Pythoniksi, Javaksi, C++:ksi tai PHP:ksi.
Koulutimme GPT‑4o:n tekemään yhteistyötä luovana kumppanina. Malli tietää, milloin Canvaksen voi avata, tehdä kohdennettuja muokkauksia ja kirjoittaa kokonaan uudelleen. Se ymmärtää myös laajemman kontekstin ja antaa tarkkaa palautetta ja ehdotuksia.
Tämän tueksi tutkimusryhmämme kehitti seuraavat keskeiset toimintatavat:
- Kirjoittamisen ja koodaamisen käynnistäminen Canvakselle
- Erilaisten sisältötyyppien luominen
- Kohdennettujen muokkausten tekeminen
- Asiakirjojen uudelleenkirjoittaminen
- Rivinsisäisen kritiikin antaminen
Mittasimme edistymistä yli 20 automatisoidulla sisäisellä arvioinnilla. Käytimme uusia synteettisten tietojen luontimenetelmiä, kuten OpenAI o1‑esikatselu‑mallin tulosten analysointia, mallin jälkikoulutukseen sen ydinominaisuuksiin. Lähestymistavan ansiosta pystyimme nopeasti käsittelemään kirjoituksen laatua ja uusia käyttäjien vuorovaikutustilanteita ilman, että tarvitsimme ihmisten tuottamaa tietoa.
Keskeinen haaste oli määritellä, milloin Canvaksen käyttö aloitetaan. Mallia on opetettu avaamaan Canvas kehotuksille, kuten “Kirjoita blogikirjoitus kahvipapujen historiasta”, samalla välttäen liiallista aktivoitumista yleisissä kysymys-vastaus-tehtävissä, kuten “Auta kokkaamaan uusi resepti päivälliselle.” Kirjoitustehtävissä priorisoimme “oikeiden käynnistysten” parantamista (oikeiden ei-käynnistysten kustannuksella) saavuttaen 83 % verrattuna lähtötason zero-shot GPT‑4o -malliin kehotetuilla ohjeilla.
Kannattaa pitää mielessä, että tällaisten perustasojen tarkkuus riippuu vahvasti käytetystä kehotteesta. Erilaisilla kehotuksilla perustaso voi yhä suoriutua huonosti, mutta eri tavoin – esimerkiksi olemalla tasaisen epätarkka koodaus- ja kirjoitustehtävissä, mikä johtaa erilaiseen virhejakautumaan ja vaihtoehtoisiin epäoptimaalisen suorituksen muotoihin. Koodauksen osalta suuntasimme mallin tarkoituksellisesti pois liiallisesta käynnistymisestä, jotta emme häiritsisi tehokäyttäjiämme. Jatkamme tätä parantamista käyttäjien palautteen perusteella.
Pohjan päätösrajan käynnistin – kirjoittaminen ja koodaus
Kirjoitus- ja koodaustehtävissä paransimme Canvaksen oikeaa käynnistymistä päätösrajalla, ja se saavutti vastaavasti 83 % ja 94 % verrattuna lähtötason zero-shot GPT‑4o -malliin kehotetuilla ohjeilla.
Toisena haasteena oli mallin muokkauskäyttäytymisen säätäminen, kun Canvas oli käynnistetty – erityisesti sen päättäminen, milloin tehdään kohdennettu muokkaus ja milloin koko sisältö kirjoitetaan uudelleen. Koulutimme mallin suorittamaan kohdennettuja muokkauksia silloin, kun käyttäjät selvästi valitsevat tekstiä käyttöliittymän kautta, ja muuten suosimaan uudelleenkirjoittamista. Tämä käyttäytyminen kehittyy edelleen mallin tarkentuessa.
Pohjan muokkausraja – kirjoittaminen ja koodaus
Kirjoitus- ja koodaustehtävissä keskityimme Canvaksen kohdistettujen muokkausten parantamiseen. GPT‑4o yhdessä Canvaksen kanssa suoriutuu 18 % paremmin kuin lähtötason kehotettu GPT‑4o.
Mallin kouluttaminen laadukkaiden kommenttien tuottamiseen vaati huolellista iterointia. Toisin kuin kahdessa ensimmäisessä tapauksessa, jotka voidaan helposti arvioida automatisoidusti tarkoilla manuaalisilla tarkistuksilla, laadun mittaaminen automatisoidusti on hyvin haastavaa. Siksi käytimme ihmisten tekemiä arviointeja kommenttien laadun ja tarkkuuden arviointiin. Integroitu Canvas-mallimme suoriutuu paremmin kuin zero-shot GPT‑4o kehotetuilla ohjeilla ja saavuttaa 30 % paremman tarkkuuden ja 16 % korkeamman laadun. Tämä osoittaa, että synteettinen koulutus parantaa selvästi vastausten laatua ja mallin toimintaa verrattuna zero-shot-kehotteisiin yksityiskohtaisten ohjeiden pohjalta.
Canvas Suggested Comments
Inhimillisissä arvioinneissa arvioitiin Canvaksen kommenttien laatua ja tarkkuutta. Canvas-mallimme on 30 prosenttia tarkempi ja 16 prosenttia laadukkaampi kuin zero-shot GPT‑4o kehotetuilla ohjeilla.
Tekoälyn käytettävyyden ja saavutettavuuden parantaminen edellyttää uudenlaista ajattelutapaa sen kanssa toimittaessa. Canvas edustaa uutta tapaa käyttää ChatGPT:tä ja on suurin visuaalinen päivitys palveluun kahden vuoden sisällä sen julkaisusta.
Canvas on varhaisessa beetavaiheessa, ja suunnittelemme sen ominaisuuksien nopeaa kehittämistä.
Tekijä
Tutkimusjohtaja
Karina Nguyen
Ydintutkimus
Kai Chen, Michael Wu, Tarun Gogineni
Ydinsuunnittelu, tuotekehitys, suunnittelu
Alexi Christakis, Bryan Ashley, Bryant Jow, Chris Haugli, Daniel Levine, Eric Jiang, Gabriel Peal, Lee Byron, Lukas Gross, Matt Lim, Sara Culver, Thomas Dimson
Tukijat
Andrew Gibiansky, Andrew Howell, Arianna McClain, David Li, Doug Li, Ilya Kostrikov, Katy Shi, Noah Deutsch, Randall Lin, Sara Culver, Sean Fitzgerald, Shuaiqi Xia, Spencer Papay, Thomas Shadwell, Valerie Qi, Xiaolin Hao, Yilei Qian
Tukenut johtajisto
Akshay Nathan, Barret Zoph, Ian Silber, Joanne Jang, John Schulman, Kevin Weil, Mia Glaese, Mira Murati, Nick Turley, Sam Altman, Sulman Choudhry