Hopp til hovedinnhold
OpenAI

23. januar 2025

Produkt

Vi presenterer Operator

En forskningsversjon av en agent som bruker sin egen nettleser til å løse oppgaver for deg. Tilgjengelig for Pro-brukere i USA

The image shows a user request to find and book the highest-rated one-day tour of Rome on TripAdvisor. It includes a search process summary and a TripAdvisor webpage displaying a "Best Seller" tour: "Rome: Colosseum, Roman Forum and Palatine Hill."
Laster inn …

Oppdatering 17. juli 2025: Operator er nå fullt integrert i ChatGPT som ChatGPT agent. For å få tilgang til disse oppdaterte funksjonene velger du “agentmodus” fra rullegardinmenyen i meldingsfeltet og skriver spørringen din direkte i ChatGPT. Som resultat vil det selvstendige Operator-nettstedet (operator.chatgpt.com) avvikles i løpet av de neste ukene.


I dag lanserer vi Operator(åpnes i et nytt vindu), en agent som kan gå på nettet for å utføre oppgaver for deg. Ved å bruke sin egen nettleser kan den se på en nettside og samhandle med den ved å skrive, klikke og bla. Det er for øyeblikket en forskningsversjon, noe som betyr at den har begrensninger og vil utvikle seg basert på tilbakemeldinger fra brukerne. Operator er en av våre første agenter (KI som er i stand til å gjøre oppgaver for deg selvstendig). Du gir den en oppgave som den deretter utfører.

Operator kan bli bedt om å håndtere et bredt spekter av repeterende nettleseroppgaver, som å fylle ut skjemaer, bestille dagligvarer og til og med lage memes. Evnen til å bruke de samme grensesnittene og verktøyene som mennesker benytter i hverdagen utvider nytteverdien av KI. Det hjelper folk med å spare tid på daglige oppgaver, samtidig som det gir nye muligheter for engasjement for bedrifter.

For å sikre en trygg og iterativ utrulling starter vi i det små. Fra og med i dag er Operator tilgjengelig for Pro(åpnes i et nytt vindu)-brukere i USA på operator.chatgpt.com(åpnes i et nytt vindu). Denne forskningsversjonen gjør det mulig å lære av brukerne våre og det bredere økosystemet, for å forbedre og videreutvikle tjenesten underveis. Planen vår er å utvide til Plus-, Team- og Enterprise-brukere og integrere disse funksjonene i ChatGPT i fremtiden.

Slik fungerer Operator

Operator drives av en ny modell kalt Computer-Using Agent (CUA). Ved å kombinere GPT‑4o sine visuelle evner med avansert resonnering gjennom forsterkende læring, er CUA trent opp til å samhandle med grafiske brukergrensesnitt (GUI-er) – knappene, menyene og tekstfeltene brukere ser på en skjerm.

Operator kan «se» (gjennom skjermbilder) og «samhandle» (ved å bruke alle handlingene en mus og et tastatur tillater) med en nettleser, slik at den kan utføre handlinger på nettet uten å kreve tilpassede API-integrasjoner.

Hvis den støter på utfordringer eller gjør feil, kan Operator bruke resonneringsevnene sine til å rette opp selv. Når den står fast og trenger hjelp gir den enkelt kontrollen tilbake til brukeren, noe som gir en smidig samarbeidsopplevelse.

Selv om CUA fortsatt er i en tidlig fase og har begrensninger, setter den nye toppresultater i WebArena og WebVoyager, to viktige referansetester for nettleserbruk. Les mer om evalueringer og forskning bak Operator i blogginnlegget om forskning.

Slik bruker du den

For å komme i gang, beskriv oppgaven du ønsker utført, så tar Operator seg av resten. Brukere kan velge å overta kontrollen over den eksterne nettleseren når som helst, og Operator er opplært til å proaktivt be brukeren om å ta over for oppgaver som krever innlogging, betalingsinformasjon eller ved løsing av CAPTCHA-er.

Brukere kan tilpasse arbeidsflytene sine i Operator ved å legge til egne instruksjoner, enten for alle nettsteder eller for spesifikke, for eksempel ved å sette preferanser for flyselskaper på Booking.com. Operator lar brukere lagre forhåndsinnstilte kommandoer for rask tilgang på hjemmesiden. Dette er ideelt for gjentatte oppgaver som å fylle på dagligvarer på Instacart. Tilsvarende å bruke flere faner i en nettleser, kan brukere la Operator kjøre flere oppgaver samtidig ved å opprette nye samtaler. På den måten kan man bestille et personlig krus på Etsy samtidig som man reserverer en campingplass på Hipcamp.

Øksystem og brukere

Operator(åpnes i et nytt vindu) forvandler KI fra et passivt verktøy til en aktiv deltaker i det digitale økosystemet. Den vil effektivisere oppgaver for brukerne og gi bedrifter tilgang til fordelene med agenter, for bedre kundeopplevelser og høyere konverteringsrate. Vi samarbeider med selskaper som DoorDash, Instacart, OpenTable, Priceline, StubHub, Thumbtack, Uber og andre for å sikre at Operator imøtekommer reelle behov samtidig som etablerte normer respekteres. I tillegg til disse samarbeidsprosjektene ser vi stort potensial for å forbedre tilgjengeligheten og effektiviteten i enkelte arbeidsflyter, spesielt i offentlig sektor. For å utforske disse bruksområdene videre, samarbeider vi med organisasjoner som City of Stockton(åpnes i et nytt vindu) for å gjøre det enklere å melde seg på byens tjenester og programmer.

«Etter hvert som vi lærer mer om Operator gjennom forskningsversjonen, vil vi være bedre rustet til å finne måter KI kan gjøre samfunnsengasjement enda enklere for innbyggerne våre.»
Jamil Niazi, Director of Information Technology i City of Stockton

Ved å først lansere Operator til et begrenset publikum, har vi som mål å lære raskt og forbedre funksjonene basert på tilbakemeldinger fra virkelige brukere, samtidig som vi sikrer en balanse mellom innovasjon, tillit og sikkerhet. Denne samarbeidsorienterte tilnærmingen bidrar til å sikre at Operator gir meningsfull verdi til brukere, skapere, bedrifter og offentlige organisasjoner samtidig.

«OpenAIs Operator er et teknologisk gjennombrudd som gjør prosesser som bestilling av matvarer utrolig enkelt.»
Daniel Danker, Chief Product Officer i Instacart

Sikkerhet og personvern

Å sikre at Operator er trygt å bruke er en høy prioritet, og vi bruker tre sikkerhetslag for å forhindre misbruk og sørge for at brukerne har full kontroll. 

For det første er Operator opplært til å sikre at personen som bruker den alltid har kontroll, og den ber om innspill på viktige punkter.

  • Overtakelsesmodus: Operator ber brukeren om å ta over når den legger inn sensitiv informasjon i nettleseren, for eksempel påloggingsinformasjon eller betalingsinformasjon. Når Operator er i overtakelsesmodus, samler den ikke inn og tar ikke skjermbilder av informasjon som brukeren legger inn. 
  • Brukerbekreftelser: Før en betydelig handling utføres, som å sende inn en bestilling eller sende en e-post, skal Operator be om godkjenning.
  • Oppgavebegrensninger: Operator er opplært til å avslå visse sensitive oppgaver, for eksempel banktransaksjoner eller oppgaver som krever viktige beslutninger, som å ta en avgjørelse om en jobbsøknad.
  • Overvåkingsmodus: På spesielt sensitive nettsteder, som e-postplattformer eller finansielle tjenester, krever Operator tett overvåking av handlingene sine, slik at brukerne direkte kan oppdage eventuelle feil.

Videre har vi gjort det enkelt å administrere personvern i Operator. 

  • Velge bort opplæring: Hvis du slår av «Forbedre modellen for alle» i ChatGPT‑innstillingene, betyr det at data i Operator heller ikke vil bli brukt til å lære opp modellene våre. 
  • Åpen databehandling: Brukere kan slette all nettleserdata og logge ut av alle nettsteder med ett klikk under Personvern-delen i Operator-innstillingene. Tidligere samtaler i Operator kan også slettes med ett klikk.

Til slutt har vi bygget forsvar mot ondsinnede nettsteder som kan prøve å villede Operator gjennom skjulte kommandoer, skadelig kode eller phishing-forsøk:

  • Varsom navigering: Operator er designet for å oppdage og ignorere prompt injections.
  • Overvåking: En dedikert «overvåkingsmodell» følger med på mistenkelig oppførsel og kan sette oppgaven på pause hvis noe virker unormalt.
  • Deteksjonsprosess: Automatiserte og manuelle gjennomgangsprosesser identifiserer kontinuerlig nye trusler og oppdaterer sikkerhetstiltak raskt.

Vi vet at aktører med onde hensikter kan forsøke å misbruke denne teknologien. Derfor har vi designet Operator til å avslå skadelige forespørsler og blokkere ulovlig innhold. Moderasjonssystemene våre kan gi advarsler eller til og med tilbakekalle tilgang ved gjentatte brudd, og vi har integrert ekstra gjennomgangsprosesser for å oppdage og håndtere misbruk. Vi gir også veiledning om hvordan du bruker Operator for å overholde våre retningslinjer for bruk.

Selv om Operator er designet med disse sikkerhetstiltakene, er ingen systemer feilfrie. Dette er fortsatt en forskningsversjon, og vi er forpliktet til kontinuerlig forbedring gjennom tilbakemeldinger fra virkeligheten og grundig testing. For mer informasjon om vår tilnærming, se sikkerhetsdelen av research-bloggen til Operator.

Begrensninger

Operator er for øyeblikket i en tidlig forskningsversjon, og selv om den allerede kan håndtere et bredt spekter av oppgaver, er den fortsatt i lærings- og utviklingsfasen og kan gjøre feil. For eksempel møter den for tiden utfordringer med komplekse grensesnitt, som å lage lysbildefremvisninger eller administrere kalendere. Tidlige tilbakemeldinger fra brukere vil spille en viktig rolle i å forbedre nøyaktigheten, påliteligheten og sikkerheten, og hjelpe oss med å gjøre Operator bedre for alle.

Hva skjer videre

CUA i API-en: Vi planlegger å eksponere modellen som driver Operator, CUA, i API-en snart, slik at brukere kan bruke den til å bygge sine egne databrukende agenter. 

Forbedrede funksjoner: Vi vil fortsette å forbedre Operators evne til å håndtere lengre og mer komplekse arbeidsflyter.

Utvidet tilgang: Vi planlegger å utvide Operator(åpnes i et nytt vindu) til Plus-, Team- og Enterprise-brukere, og integrere funksjonaliteten direkte i ChatGPT i fremtiden, når vi er sikre på at den er trygg og brukervennlig i stor skala. Dette vil åpne for sømløs utførelse av oppgaver i sanntid og asynkront.

Forfattere

OpenAI

Grunnleggende bidragsytere til research

Casey Chu, David Medina, Hyeonwoo Noh, Noah Jorgensen, Reiichiro Nakano, Sarah Yoo

Kjerne

Andrew Howell, Aaron Schlesinger, Baishen Xu, Ben Newhouse, Bobby Stocker, Devashish Tyagi, Dibyo Majumdar, Eugenio Panero, Fereshte Khani, Geoffrey Iyer, Jiahui Yu, Nick Fiacco, Patrick Goethe, Sam Jau, Shunyu Yao, Stephan Casas, Yash Kumar, Yilong Qin

XFN-bidragsytere

Abby Fanlo Susk, Aleah Houze, Alex Beutel, Alexander Prokofiev, Andrea Vallone, Andrea Chan, Christina Lim, Derek Chen, Duke Kim, Grace Zhao, Heather Whitney, Houda Nait El Barj, Jake Brill, Jeremy Fine, Joe Fireman, Kelly Stirman, Lauren Yang, Lindsay McCallum, Leo Liu, Mike Starr, Minnia Feng, Mostafa Rohaninejad, Oleg Boiko, Owen Campbell-Moore, Paul Ashbourne, Stephen Imm, Taylor Gordon, Tina Sriskandarajah, Winston Howes

Ledere

Aaron Schlesinger (infrastruktur), Casey Chu (sikkerhet og modellklarhet), David Medina (infrastruktur for research), Hyeonwoo Noh (samlet research), Reiichiro Nakano (samlet research), Yash Kumar

Bidragsytere

Adam Brandon, Adam Koppel, Adele Li, Ahmed El-Kishky, Akila Welihinda, Alex Karpenko, Alex Nawar, Alex Tachard Passos, Amelia Liu, Andrei Gheorghe, Andrew Duberstein, Andrey Mishchenko, Angela Baek, Ankush Agarwal, Anting Shen, Antoni Baum, Ari Seff, Ashley Tyra, Behrooz Ghorbani, Bo Xu, Brandon McKinzie, Bryan Brandow, Carolina Paz, Cary Hudson, Chak Li, Chelsea Voss, Chen Shen, Chris Koch, Christian Gibson, Christina Kim, Christine McLeavey, Claudia Fischer, Cory Decareaux, Daniel Jacobowitz, Daniel Wolf, David Kjelkerud, David Li, Ehsan Asdar, Elaine Kim, Emilee Goo, Eric Antonow, Eric Hunter, Eric Wallace, Felipe Torres, Fotis Chantzis, Freddie Sulit, Giambattista Parascandolo, Hadi Salman, Haiming Bao, Haoyu Wang, Henry Aspegren, Hyung Won Chung, Ian O’Connell, Ian Sohl, Isabella Fulford, Jake McNeil, James Donovan, Jamie Kiros, Jason Ai, Jason Fedor, Jason Wei, Jay Dixit, Jeffrey Han, Jeffrey Sabin-Matsumoto, Jennifer Griffith-Delgado, Jeramy Han, Jeremiah Currier, Ji Lin, Jiajia Han, Jiaming Zhang, Jiayi Weng, Jieqi Yu, Joanne Jang, Joyce Ruffell, Kai Chen, Kai Xiao, Kevin Button, Kevin King, Kevin Liu, Kristian Georgiev, Kyle Miller, Lama Ahmad, Laurance Fauconnet, Leonard Bogdonoff, Long Ouyang, Louis Feuvrier, Madelaine Boyd, Mamie Rheingold, Matt Jones, Michael Sharman, Miles Wang, Mingxuan Wang, Nick Cooper, Niko Felix, Nikunj Handa, Noel Bundick, Pedro Aguilar, Peter Faiman, Peter Hoeschele, Pranav Deshpande, Raul Puri, Raz Gaon, Reid Gustin, Robin Brown, Rob Honsby, Saachi Jain, Sandhini Agarwal, Scott Ethersmith, Scott Lessans, Shauna O’Brien, Spencer Papay, Steve Coffey, Tal Stramer, Tao Wang, Teddy Lee, Tejal Patwardhan, Thomas Degry, Tomo Hiratsuka, Troy Peterson, Wenda Zhou, William Butler, Wyatt Thompson, Yao Zhou, Yaodong Yu, Yi Cheng, Yinghai Lu, Younghoon Kim, Yu-Ann Wang Madan, Yushi Wang, Zhiqing Sun

Lederskap

Anna Makanju, Greg Brockman, Hannah Wong, Jerry Tworek, Liam Fedus, Mark Chen, Peter Welinder, Sam Altman, Wojciech Zaremba