3. oktober 2024

Vi introducerer canvas

En ny måde at arbejde på med ChatGPT på for at skrive og programmere

Billedet viser en lodret værktøjslinje med fem ikoner, der er arrangeret i en kolonne på en blød pastelfarvet baggrund. Det tredje ikon oppefra, der afbilder en åben bog, er fremhævet med en etiket ved siden af, hvor der står "Læseniveau".

Indlæser ...

Vi introducerer canvas, en ny brugerflade til at arbejde med ChatGPT på skrive- og programmeringsprojekter, der går ud over en simpel chat. Canvas åbnes i et separat vindue og giver dig og ChatGPT mulighed for at samarbejde på et projekt. Denne tidlige beta-version introducerer en ny måde at samarbejde på – ikke kun gennem samtale, men ved at oprette og finjustere ideer side om side.

Canvas blev bygget med GPT‑4o og kan manuelt vælges i modelvælgeren i beta-versionen. Fra og med i dag begynder vi at lancere canvas til ChatGPT Plus- og Team-brugere globalt. Enterprise- og Edu-brugere får adgang næste uge. Vi planlægger også at gøre canvas tilgængelig for alle ChatGPT Free-brugere, når den ikke længere er beta.

Bedre samarbejde med ChatGPT

Folk bruger ChatGPT hver dag til at få hjælp til at skrive og programmere. Selvom chatbrugerfladen er nem at bruge og fungerer godt til mange opgaver, så er den begrænset, hvis du vil arbejde på projekter, der kræver redigering og revisioner. Canvas tilbyder en ny brugerflade til denne slags arbejde.

Med canvas kan ChatGPT bedre forstå konteksten af det, du forsøger at opnå. Du kan fremhæve specifikke afsnit for at angive lige præcis det, du ønsker, at ChatGPT fokuserer på. På samme måde som ved tekstredigering eller kodegennemgang kan den give indbygget feedback og forslag med hele projektet in mente.

Du styrer projektet i canvas. Du kan redigere tekst eller kode direkte. Der er en genvejsmenu, så du kan bede ChatGPT om at justere skrivelængden, foretage fejlsøgning af din kode og hurtigt foretage andre nyttige handlinger. Du kan også gendanne tidligere versioner af dit arbejde ved at bruge tilbage-knappen i canvas.

Canvas åbner automatisk, hvis ChatGPT registrerer et scenarie, hvor den kan være nyttigt. Du kan også inkludere "brug canvas" i din forespørgsel for at åbne canvas og bruge den til at arbejde på et eksisterende projekt.

Skrivning af genveje inkluderer:

Foreslå ændringer: ChatGPT tilbyder indbyggede forslag og indbygget feedback.
Tilpasning af længden: Ændrer dokumentlængden, så den bliver kortere eller længere.
Ændring af læseniveau: Justerer læseniveauet fra børnehave til universitet.
Tilføjelse af den sidste finpudsning: Kontrollerer grammatik, klarhed og sammenhæng.
Tilføjelse af emojier: Tilføjer relevante emojier til fremhævelse og farve.

Kodning i canvas

Kodning er en iterativ proces, og det kan være svært at følge alle revisionerne af din kode i chat. Canvas gør det nemmere at spore og forstå ChatGPT’s ændringer, og vi planlægger at fortsætte med at forbedre gennemsigtigheden i denne slags redigeringer.

Kodning af genveje inkluderer:

Gennemgang af kode: ChatGPT tilbyder indbyggede forslag for at forbedre din kode.
Tilføjelse af logfiler: Indsætter print-erklæringer for at hjælpe dig med at fejlsøge og forstå din kode.
Tilføjelse af kommentarer: Føjer kommentarer til koden for at gøre den nemmere at forstå.
Korrektion af fejl: Registrerer og omskriver problematisk kode for at løse fejl.
Port til et sprog: Oversætter din kode til JavaScript, TypeScript, Python, Java, C++ eller PHP.

Træning af modellen til at blive en samarbejdspartner

Vi har trænet GPT‑4o til at samarbejde som en kreativ partner. Modellen ved, hvornår den skal åbne et canvas, foretage målrettede redigeringer og lave fuld omskrivning. Den forstår også bredere kontekst for at give præcis feedback og forslag.

For at understøtte dette har vores forskningsteam udviklet følgende kerneadfærd:

Udløsning af canvas til skrivning og kodning
Generering af forskellige indholdstyper
Foretage målrettede redigeringer
Omskrivning af dokumenter
Levere indbygget kritik

Vi har målt fremgangen med mere end 20 automatiserede interne evalueringer. Vi har brugt nye syntetiske datagenereringsteknikker som f.eks. destillering af resultater fra OpenAI o1‑forhåndsvisning til efterfølgende træning af modellen for dens kerneadfærd. Denne tilgang har givet os mulighed for hurtigt at gøre noget ved skrivekvaliteten og nye brugerinteraktioner – alt sammen uden at være afhængig af menneskegenererede data.

En nøgleudfordring var at definere, hvornår et canvas skal udløses. Vi har lært modellen at åbne et canvas til forespørgsler som f.eks. "Skriv et blogopslag om historien bag kaffebønner", og samtidig undgå overudløsninger til generelle spørgsmål og svar-opgaver som f.eks. "Hjælp mig med at forberede en ny opskrift til aftensmad". For skriveopgaver har vi prioriteret forbedring af "korrekte udløsere" (på bekostning af "korrekte ikke-udløsere") og nået 83 % sammenlignet med en zero-shot GPT‑4o‑baseline med promptede instruktioner.

Det er værd at bemærke, at kvaliteten af sådanne baselines er yderst følsom over for den specifikke forespørgsler, der anvendes. Med forskellige forespørgsler kan baseline stadig klare sig dårligt, men på en anden måde, f.eks. ved at være jævnt upræcis på tværs af kodnings- og skriveopgaver, hvilket resulterer i en anden distribution af fejl og alternative former for suboptimal ydeevne. Til kodning har vi bevidst gjort modellen forhåndsindtaget over for udløsning for at undgå at afbryde vores avancerede brugere. Vi vil fortsætte med at finjustere dette baseret på brugerfeedback.

Udløser for beslutningsgrænse i canvas – Skrivning og kodning

Til skrive- og kodningsopgaver har vi forbedret korrekt udløsning af grænsen for canvas-beslutning, som nåede henholdsvis 83 % og 94 % sammenlignet med en zero-shot GPT‑4o‑baseline med promptede instruktioner.

En anden udfordring involverede justering af modellens redigeringsadfærd, når først canvas var udløst – mere specifikt ved at afgøre, hvornår der skulle foretages en målrettet redigering i forhold til at omskrive hele indholdet. Vi har trænet modellen til at foretage målrettede redigeringer, når brugere tydeligt vælger tekst gennem brugerfladen, og ellers foretrækkes omskrivninger. Denne adfærd udvikler sig fortsat, efterhånden som vi finjusterer modellen.

Redigeringsgrænse i canvas – Skrivning og kodning

For skrive- og kodningsopgaver har vi prioriteret forbedring af canvas-målrettede redigeringer. GPT‑4o med canvas klarer sig 18 % bedre end en baseline-promptet GPT‑4o.

Endelig krævede træning af modellen en omhyggelig iteration for at generere kommentarer af høj kvalitet. I modsætning til de første to tilfælde, som nemt kan tilpasses automatiseret evaluering med grundige manuelle gennemgange, så er måling af kvalitet på en automatiseret måde særligt udfordrende. Derfor brugte vi menneskelige evalueringer til at evaluere kommentarkvaliteten og -nøjagtigheden. Vores integrerede canvas-model klarer sig bedre end zero-shot GPT‑4o med promptede instruktioner med 30 % i nøjagtighed og 16 % i kvalitet, hvilket viser, at syntetisk træning i væsentlig grad forbedrer kvaliteten af responser og adfærden sammenlignet med zero-shot-prompting med detaljerede instruktioner.

Canvas Suggested Comments

Menneskelige evalueringer bedømte canvas' kommentarkvalitet og nøjagtighedsfunktion. Vores canvas-model klarer sig bedre end zero-shot GPT‑4o med promptede instruktioner med 30 % i nøjagtighed og 16 % i kvalitet.

Kommende tiltag

At gøre AI mere nyttig og tilgængelig kræver revurdering af, hvordan vi interagerer med den. Canvas er en ny tilgang og den første større opdatering af ChatGPT’s visuelle brugerflade, siden den blev lanceret for to år siden.

Canvas er stadig i den tidlige beta-fase, og vi planlægger hurtigt at forbedre dens funktioner.

Skrevet af

OpenAI

Leder af research

Karina Nguyen

Kerneresearch

Kai Chen, Michael Wu, Tarun Gogineni

Kerneingeniørarbejde, produkt, design

Alexi Christakis, Bryan Ashley, Bryant Jow, Chris Haugli, Daniel Levine, Eric Jiang, Gabriel Peal, Lee Byron, Lukas Gross, Matt Lim, Sara Culver, Thomas Dimson

Bidragydere

Andrew Gibiansky, Andrew Howell, Arianna McClain, David Li, Doug Li, Ilya Kostrikov, Katy Shi, Noah Deutsch, Randall Lin, Sara Culver, Sean Fitzgerald, Shuaiqi Xia, Spencer Papay, Thomas Shadwell, Valerie Qi, Xiaolin Hao, Yilei Qian

Understøttende ledelse

Akshay Nathan, Barret Zoph, Ian Silber, Joanne Jang, John Schulman, Kevin Weil, Mia Glaese, Mira Murati, Nick Turley, Sam Altman, Sulman Choudhry