3. oktober 2024

Vi presenterer canvas

En ny måte å skrive og kode med ChatGPT på

Bildet viser en vertikal verktøylinje med fem ikoner arrangert i en kolonne på en myk pastellbakgrunn. Det tredje ikonet fra toppen, som viser en åpen bok, er uthevet med en etikett ved siden av med teksten «Lesenivå».

Laster inn …

Vi presenterer canvas, et nytt grensesnitt for å jobbe med ChatGPT på skrive- og kodingsprosjekter som er mer kompliserte enn en enkel chat. Canvas åpnes i et separat vindu, slik at du og ChatGPT kan samarbeide om et prosjekt. Denne tidlige betaversjonen introduserer en ny måte å samarbeide på – ikke bare gjennom samtaler, men ved å skape og finjustere ideer side om side.

Canvas ble bygd med GPT‑4o og kan velges manuelt i modellvelgeren mens den er i betaversjon. Fra og med i dag lanserer vi canvas for ChatGPT Plus- og Team-brukere over hele verden. Enterprise- og Edu-brukere får tilgang i løpet av neste uke. Vi planlegger også å gjøre canvas tilgjengelig for alle ChatGPT Free-brukere når den er ute av betaversjonen.

Bedre samarbeid med ChatGPT

Folk bruker ChatGPT hver dag for å få hjelp med å skrive og lage kode. Selv om chat-grensesnittet er enkelt å bruke og fungerer godt for mange oppgaver, er det begrenset hvis du skal jobbe med prosjekter som krever redigering og revisjoner. Canvas tilbyr et nytt grensesnitt for denne typen arbeid.

Med canvas forstår ChatGPT bedre konteksten for det du forsøker å oppnå. Du kan utheve bestemte deler for å angi nøyaktig hva du vil at ChatGPT skal fokusere på. I likhet med en tekstredaktør eller kodeevaluerer kan den gi direkte tilbakemeldinger og forslag med hele prosjektet i tankene.

Du kontrollerer prosjektet i canvas. Du kan redigere tekst eller lage kode direkte. Det finnes en meny med snarveier som du kan bruke til å be ChatGPT om å justere lengden på teksten, feilsøke koden og raskt utføre andre nyttige handlinger. Du kan også gjenopprette tidligere versjoner av arbeidet ditt ved å bruke Tilbake-knappen i canvas.

Canvas åpnes automatisk når ChatGPT oppdager en situasjon der det kan være nyttig. Du kan også inkludere «bruk canvas» i meldingen for å åpne canvas og bruke det til å jobbe med et eksisterende prosjekt.

Skrivesnarveier inkluderer:

Foreslå redigeringer: ChatGPT tilbyr forslag og tilbakemeldinger direkte i teksten.
Juster lengden: Redigerer lengden på dokumentet for å gjøre det lengre eller kortere.
Endre lesenivå: Justerer lesenivået, fra barnehage- til universitets-/høyskolenivå.
Legg til en siste finpuss: Sjekker grammatikk, klarhet og konsekvens.
Legg til emojier: Legger til relevante emojier for vektlegging og farge.

Koding i canvas

Koding er en iterativ prosess, og det kan være vanskelig å følge alle endringene i koden din i chatten. Canvas gjør det enklere å spore og forstå endringene i ChatGPT, og vi planlegger å fortsette å forbedre åpenheten rundt denne typen endringer.

Kodingssnarveier inkluderer:

Forhåndsvis kode: ChatGPT gir forslag til forbedring av koden direkte i koden.
Legg til logger: Setter inn printsetninger som hjelper deg med å feilsøke og forstå koden din.
Legg til kommentarer: Legger til kommentarer i koden for å gjøre den enklere å forstå.
Fiks feil: Oppdager og omskriver problematisk kode for å løse feil.
Porter til et språk: Oversetter koden din til JavaScript, TypeScript, Python, Java, C++ eller PHP.

Opplæring av modellen til å bli en samarbeidspartner

Vi lærte GPT‑4 å samarbeide som en kreativ partner. Modellen vet når den skal åpne et canvas, gjøre målrettede endringer og skrive om alt. Den forstår også bredere sammenhenger for å gi presise tilbakemeldinger og forslag.

For å støtte dette har researchteamet vårt utviklet følgende kjerneoppførsel:

utløse canvas for å skrive og lage kode
generere ulike typer innhold
gjøre målrettede endringer
skrive om dokumenter
komme med vurderinger i teksten

Vi målte fremgangen med over 20 automatiserte interne evalueringer. Vi brukte nye teknikker for generering av syntetiske data, for eksempel sammenfatting av utdata fra OpenAI o1‑preview, for å etteropplære modellen for dens kjerneoppførsler. Denne tilnærmingen gjorde det mulig for oss å raskt ta tak i skrivekvaliteten og nye brukerinteraksjoner uten å være avhengig av menneskegenererte data.

En stor utfordring var å definere når et canvas skulle utløses. Vi lærte modellen å åpne et canvas for meldinger som «Skriv et blogginnlegg om historien til kaffebønner», samtidig som den unngikk å utløse generelle spørsmål og svar-oppgaver som «Hjelp meg å lage en ny rett til middag». For skriveoppgaver prioriterte vi å forbedre «korrekte utløsere» (på bekostning av «korrekte ikke-utløsere»), og vi nådde 83 % sammenlignet med en grunnlinjebasert zero-shot GPT‑4o med meldingsinstruksjoner.

Det er verdt å merke seg at kvaliteten på slike grunnlinjer er svært følsom for den spesifikke meldingen som brukes. Med forskjellige meldinger kan grunnlinjen fortsatt gi dårlige resultater, men på en annen måte – for eksempel ved å være jevnt unøyaktig på tvers av kodings- og skriveoppgaver, noe som resulterer i en annen fordeling av feil og alternative former for ytelse som ikke er optimal. For koding har vi bevisst innstilt modellen mot utløsing for å unngå å forstyrre de mest aktive brukerne våre. Vi fortsetter å finjustere dette basert på tilbakemeldinger fra brukerne.

Utløser for beslutningsgrense i canvas – skriving og koding

For skrive- og kodingsoppgaver forbedret vi korrekt utløsing av beslutningsgrensen for canvas og nådde henholdsvis 83 % og 94 % sammenlignet med en grunnlinjebasert zero-shot GPT‑4o med meldingsinstruksjoner.

En annen utfordring var å justere modellens redigeringsoppførsel når canvas ble utløst – nærmere bestemt å avgjøre når det var riktig å foreta en målrettet redigering kontra når det var riktig å skrive om hele innholdet. Vi lærte modellen opp til å utføre målrettede redigeringer når brukerne eksplisitt velger tekst gjennom grensesnittet, ellers ble omskrivninger foretrukket. Denne oppførselen fortsetter å utvikle seg etter hvert som vi finjusterer modellen.

Redigeringsgrense i canvas – skriving og koding

For skrive- og kodingsoppgaver prioriterte vi å forbedre målrettede redigeringer på canvas. GPT‑4o med canvas presterer 18 % bedre enn en grunnlinjebasert GPT‑4o med meldinger.

Til slutt krevde det nøye iterasjon å lære opp modellen til å generere kommentarer av høy kvalitet. I motsetning til de to første tilfellene, som lett kan tilpasses automatisert evaluering med grundige manuelle gjennomganger, er det særlig utfordrende å måle kvalitet på en automatisert måte. Vi brukte derfor menneskelige evalueringer for å vurdere kvaliteten på og nøyaktigheten til kommentarene. Modellen vår med integrert canvas overgår zero-shot GPT‑4o med meldingsinstruksjoner med 30 % når det gjelder nøyaktighet og 16 % for kvalitet, noe som viser at syntetisk opplæring forbedrer svarkvaliteten og oppførselen betydelig sammenlignet med zero-shot-meldinger med detaljerte instruksjoner.

Canvas Suggested Comments

Menneskelige evalueringer vurderte kvaliteten på kommentarer i og nøyaktighetsfunksjonaliteten til canvas. Canvas-modellen vår overgår zero-shot GPT‑4o med meldingsinstruksjoner med 30 % når det gjelder nøyaktighet og 16 % for kvalitet.

Hva skjer videre?

For å gjøre AI mer nyttig og tilgjengelig må vi tenke nytt om hvordan vi samhandler med den. Canvas er en ny tilnærming og den første store oppdateringen av ChatGPTs visuelle grensesnitt siden vi lanserte det for to år siden.

Canvas er i en tidlig betaversjon, og vi planlegger å raskt forbedre modellens funksjoner.

Forfatter

OpenAI

Research-leder

Karina Nguyen

Kjerneresearch

Kai Chen, Michael Wu, Tarun Gogineni

Kjerneteknikk, produkt, design

Alexi Christakis, Bryan Ashley, Bryant Jow, Chris Haugli, Daniel Levine, Eric Jiang, Gabriel Peal, Lee Byron, Lukas Gross, Matt Lim, Sara Culver, Thomas Dimson

Bidragsytere

Andrew Gibiansky, Andrew Howell, Arianna McClain, David Li, Doug Li, Ilya Kostrikov, Katy Shi, Noah Deutsch, Randall Lin, Sara Culver, Sean Fitzgerald, Shuaiqi Xia, Spencer Papay, Thomas Shadwell, Valerie Qi, Xiaolin Hao, Yilei Qian

Støttende ledelse

Akshay Nathan, Barret Zoph, Ian Silber, Joanne Jang, John Schulman, Kevin Weil, Mia Glaese, Mira Murati, Nick Turley, Sam Altman, Sulman Choudhry