23. januar 2025

Vi introducerer Operator

En forhåndsvisning af en agent, der kan bruge sin egen browser til at løse opgaver for dig. Tilgængelig for Pro-brugere i USA

Gå til Operator

Billedet viser en brugeranmodning om at finde og booke den bedst bedømte endagstur til Rom på TripAdvisor. Den indeholder en oversigt over søgeprocessen og en TripAdvisor-webside, der viser en "Best Seller"-tur: "Rom: Colosseum, Forum Romanum og Palatinerhøjen."

Indlæser ...

Opdatering den 17. juli 2025: Operator er nu fuldt integreret i ChatGPT som ChatGPT agent. For at få adgang til de opdaterede funktioner skal du blot vælge “agent-tilstand” fra rullemenuen i composer og indtaste din forespørgsel direkte i ChatGPT. Som følge heraf vil den selvstændige Operator-side (operator.chatgpt.com) lukke ned i løbet af de kommende uger.

I dag lancerer vi Operator⁠(åbner i et nyt vindue), en agent, der kan gå på nettet og udføre opgaver for dig. Ved at bruge sin egen browser kan den se på en internetside og interagere med den ved at skrive, klikke og scrolle. Det er foreløbigt en forhåndsvisning til research, hvilket betyder, at den har begrænsninger og at den vil udvikle sig baseret på brugerfeedback. Operator er en af vores første agenter, som er AI og i stand til at udføre arbejde for dig på egen hånd – du giver den en opgave, og så udføres den.

Operator kan blive bedt om at håndtere en lang række gentagne browseropgaver som f.eks. at udfylde formularer, bestille dagligvarer og endda lave memes. Muligheden for at bruge de samme brugerflader og værktøjer, som mennesker interagerer med til daglig, udvider AI's anvendelighed og hjælper mennesker med at spare tid på hverdagsopgaver, samtidig med at det åbner nye muligheder for engagement for virksomheder.

For at sikre en sikker og iterativ lancering starter vi i det små. Fra i dag er Operator tilgængelig for Pro⁠(åbner i et nyt vindue)-brugere i USA på operator.chatgpt.com⁠(åbner i et nyt vindue). Denne forhåndsvisning til research giver os mulighed for at lære af vores brugere og det bredere økosystem, så vi kan finjustere og forbedre os undervejs. Vores plan er at udvide til Plus-, Team- og Enterprise-brugere og på sigt integrere disse funktioner i ChatGPT.

Sådan fungerer Operator

Operator er drevet af en ny model kaldet Computer-Using Agent (CUA). Ved at kombinere GPT‑4o's synsfunktioner med avanceret tænkning gennem forstærkende læring trænes CUA til at interagere med grafiske brugerflader (GUI'er) – de knapper, menuer og tekstfelter, som folk ser på en skærm.

Operator kan "se" (gennem skærmbilleder) og "interagere" (ved hjælp af alle de handlinger, en mus og et tastatur tillader) med en browser, så den kan foretage handlinger på nettet uden at kræve tilpassede API-integrationer.

Hvis den støder på udfordringer eller begår fejl, kan Operator bruge sine tænkeevner til at korrigere sig selv. Når den sidder fast og har brug for assistance, giver den bare kontrollen tilbage til brugeren, hvilket sikrer en let og samarbejdsvillig oplevelse.

Selv om CUA stadig er på et tidligt stadie og har sine begrænsninger, sætter den nye state-of-the-art benchmark-resultater i WebArena og WebVoyager, to vigtige benchmarks for browserbrug. Læs mere om vores evalueringer og researchen bag Operator i vores blogindlæg om research.

Sådan fungerer det

For at komme i gang skal du blot beskrive den opgave, du gerne vil have udført, så klarer Operator resten. Brugerne kan til enhver tid vælge at tage kontrollen over fjernbrowseren, og Operator er trænet til selv at bede brugeren om at overtage opgaver, der kræver login, betalingsoplysninger eller løsning af CAPTCHA'er.

Brugerne kan tilpasse deres arbejdsgange i Operator ved at tilføje brugerdefinerede instruktioner, enten for alle sider eller for specifikke sider, som f.eks. at indstille præferencer for flyselskaber på Booking.com. Operator giver brugerne mulighed for at gemme forespørgsler til hurtig adgang på hjemmesiden, hvilket er ideelt til gentagne opgaver som f.eks. at fylde varer op på Instacart. På samme måde som man bruger flere faner i en browser, kan brugerne få Operator til at køre flere opgaver samtidig ved at oprette nye samtaler, som f.eks. at bestille et personligt emaljekrus på Etsy, mens man booker en campingplads på Hipcamp.

Økosystem og brugere

Operator⁠(åbner i et nyt vindue) forandrer AI fra et passivt værktøj til en aktiv deltager i det digitale økosystem. Det vil effektivisere opgaver for brugerne og levere fordelene ved agenter til virksomheder, der ønsker innovative kundeoplevelser og højere konverteringsrater. Vi samarbejder med virksomheder som DoorDash, Instacart, OpenTable, Priceline, StubHub, Thumbtack, Uber og andre for at sikre, at Operator imødekommer behov i den virkelige verden og samtidig respekterer etablerede normer. Ud over disse samarbejder ser vi et stort potentiale for at forbedre tilgængelighed og effektivitet af visse arbejdsgange, især i den offentlige sektor. For at udforske disse use cases arbejder vi sammen med organisationer som City of Stockton⁠(åbner i et nyt vindue), så det bliver nemmere at tilmelde sig byens tjenester og programmer.

"Efterhånden som vi lærer mere om Operator i løbet af forhåndsvisningen, vil vi blive bedre rustet til at se, hvordan AI kan gøre civilt engagementet endnu nemmere for vores borgere."

Jamil Niazi, direktør for informationsteknologi hos City of Stockton

Ved i første omgang at lancere Operator til en begrænset målgruppe er det vores mål at lære hurtigt og finjustere dens funktioner baseret på feedback fra den virkelige verden, så vi sikrer, at der er balance mellem innovation, tillid og sikkerhed. Denne samarbejdstilgang er med til at sikre, at Operator leverer meningsfuld værdi til både brugere, skabere, virksomheder og organisationer i den offentlige sektor.

"OpenAI's Operator er et teknologisk gennembrud, der gør processer som bestilling af dagligvarer utroligt nemme."

Daniel Danker, Chief Product Officer hos Instacart

Sikkerhed og privatliv

Det er vores højeste prioritet at sikre, at Operator er sikker at bruge, med tre lag af sikkerhedsforanstaltninger for at forhindre misbrug og sikre, at brugerne har fuld kontrol.

Først trænes Operator i at sikre, at den person, der bruger den, altid har kontrollen, og at den skal bede om input ved kritiske punkter.

Overtagelsesfunktion: Operator beder brugeren om at tage over, når der indtastes følsomme oplysninger i browseren, f.eks. login- eller betalingsoplysninger. I overtagelsestilstand indsamler eller tager operatøren ikke skærmbilleder af oplysninger, som brugeren har indtastet.
Brugerbekræftelse: Før du afslutter en vigtig handling, som f.eks. at sende en ordre eller en e-mail, skal Operator bede om godkendelse.
Opgavebegrænsninger: Operator er trænet til at afvise visse følsomme opgaver, som f.eks. banktransaktioner eller opgaver, der kræver beslutninger med stor betydning, som f.eks. at tage stilling til en jobansøgning.
Bevågenhed: På særligt følsomme websteder, som f.eks. e-mail eller finansielle tjenester, kræver Operator nøje overvågning af sine handlinger, så brugerne kan fange potentielle fejl.

Dernæst har vi gjort det nemt at håndtere databeskyttelse i Operator.

Fravalg af træning: Hvis du slår "Gør modellen bedre for alle" fra i ChatGPT‑indstillingerne, betyder det, at data i Operator heller ikke vil blive brugt til at træne vores AI-modeller.
Gennemsigtig datahåndtering: Brugerne kan slette al browserdata og logge ud af alle websteder med et enkelt klik under afsnittet Privatliv i Operator-indstillingerne. Tidligere samtaler i Operator kan også slettes med et enkelt klik.

Endelig har vi opbygget forsvar mod fjendtlige hjemmesider, der kan forsøge at vildlede Operator gennem skjulte forespørgsler, skadelig kode eller phishing-forsøg:

Varsom navigation: Operator er designet til at opdage og ignorere udefrakommende forsøg på forespørgsler.
Monitorering: En dedikeret "monitormodel" holder øje med mistænkelig adfærd og kan sætte opgaven på pause, hvis noget virker forkert.
Opsporing: Automatiserede og menneskelige gennemsynsprocesser identificerer løbende nye trusler og opdaterer hurtigt sikkerhedsforanstaltningerne.

Vi er opmærksomme på, at dårlige aktører kan forsøge at misbruge vores teknologi. Derfor har vi designet Operator til at afvise skadelige anmodninger og blokere indhold, der ikke er tilladt. Vores moderatorsystemer kan udstede advarsler og endda tilbagekalde brugeradgang ved gentagne overtrædelser, og vi har integreret yderligere gennemsynsprocesser for at opspore og håndtere misbrug. Vi giver også vejledning i, hvordan man interagerer med Operator i overensstemmelse med vores Brugspolitikker.

Selvom Operator er designet med sikkerhedsforanstaltninger, er intet system fejlfrit, og denne lancering er stadig en forskningsmæssig forhåndsvisning. Vi er dedikerede til løbende at forbedre os gennem feedback fra den virkelige verden og grundig testning. Du kan læse mere om vores fremgangsmåde i sikkerhedsafsnittet på research-bloggen for Operator.

Begrænsninger

Operator er foreløbigt i en tidlig researchfase, og selv om den allerede er i stand til at håndtere en lang række opgaver, er den stadig i gang med at lære og udvikle sig og kan derfor begå fejl. For eksempel støder den for tiden på udfordringer med komplekse brugerflader som at lave slideshows eller styre kalendere. Tidlig brugerfeedback kommer til at spille en vigtig rolle i forbedringen af dens nøjagtighed, pålidelighed og sikkerhed og hjælper os med at gøre Operator bedre for alle.

Kommende tiltag

CUA i API'en: Vi har planer om snart at eksponere modellen bag Operator, CUA , i API'en, så udviklere kan bruge den til at bygge deres egne Computer-Using Agenter.

Forbedrede evner: Vi vil fortsat arbejde på at forbedre Operators evne til at håndtere længere og mere komplekse arbejdsgange.

Bredere adgang: Vi planlægger at udvide Operator⁠(åbner i et nyt vindue) til Plus-, Team- og Enterprise-brugere og integrere dens funktioner direkte i ChatGPT i fremtiden, når vi er sikre på dens sikkerhed og anvendelighed i stor skala, hvilket åbner op for problemfri udførelse af opgaver i realtid og asynkront.

Skrevet af

OpenAI

Bidragydere til grundforskning

Casey Chu, David Medina, Hyeonwoo Noh, Noah Jorgensen, Reiichiro Nakano, Sarah Yoo

Kerne

Andrew Howell, Aaron Schlesinger, Baishen Xu, Ben Newhouse, Bobby Stocker, Devashish Tyagi, Dibyo Majumdar, Eugenio Panero, Fereshte Khani, Geoffrey Iyer, Jiahui Yu, Nick Fiacco, Patrick Goethe, Sam Jau, Shunyu Yao, Stephan Casas, Yash Kumar, Yilong Qin

XFN-bidragydere

Abby Fanlo Susk, Aleah Houze, Alex Beutel, Alexander Prokofiev, Andrea Vallone, Andrea Chan, Christina Lim, Derek Chen, Duke Kim, Grace Zhao, Heather Whitney, Houda Nait El Barj, Jake Brill, Jeremy Fine, Joe Fireman, Kelly Stirman, Lauren Yang, Lindsay McCallum, Leo Liu, Mike Starr, Minnia Feng, Mostafa Rohaninejad, Oleg Boiko, Owen Campbell-Moore, Paul Ashbourne, Stephen Imm, Taylor Gordon, Tina Sriskandarajah, Winston Howes

Ansvarlige

Aaron Schlesinger (infrastruktur), Casey Chu (sikkerhed og modelparathed), David Medina (forskningsinfrastruktur), Hyeonwoo Noh (overordnet forskning), Reiichiro Nakano (overordnet forskning), Yash Kumar

Bidragydere

Adam Brandon, Adam Koppel, Adele Li, Ahmed El-Kishky, Akila Welihinda, Alex Karpenko, Alex Nawar, Alex Tachard Passos, Amelia Liu, Andrei Gheorghe, Andrew Duberstein, Andrey Mishchenko, Angela Baek, Ankush Agarwal, Anting Shen, Antoni Baum, Ari Seff, Ashley Tyra, Behrooz Ghorbani, Bo Xu, Brandon McKinzie, Bryan Brandow, Carolina Paz, Cary Hudson, Chak Li, Chelsea Voss, Chen Shen, Chris Koch, Christian Gibson, Christina Kim, Christine McLeavey, Claudia Fischer, Cory Decareaux, Daniel Jacobowitz, Daniel Wolf, David Kjelkerud, David Li, Ehsan Asdar, Elaine Kim, Emilee Goo, Eric Antonow, Eric Hunter, Eric Wallace, Felipe Torres, Fotis Chantzis, Freddie Sulit, Giambattista Parascandolo, Hadi Salman, Haiming Bao, Haoyu Wang, Henry Aspegren, Hyung Won Chung, Ian O’Connell, Ian Sohl, Isabella Fulford, Jake McNeil, James Donovan, Jamie Kiros, Jason Ai, Jason Fedor, Jason Wei, Jay Dixit, Jeffrey Han, Jeffrey Sabin-Matsumoto, Jennifer Griffith-Delgado, Jeramy Han, Jeremiah Currier, Ji Lin, Jiajia Han, Jiaming Zhang, Jiayi Weng, Jieqi Yu, Joanne Jang, Joyce Ruffell, Kai Chen, Kai Xiao, Kevin Button, Kevin King, Kevin Liu, Kristian Georgiev, Kyle Miller, Lama Ahmad, Laurance Fauconnet, Leonard Bogdonoff, Long Ouyang, Louis Feuvrier, Madelaine Boyd, Mamie Rheingold, Matt Jones, Michael Sharman, Miles Wang, Mingxuan Wang, Nick Cooper, Niko Felix, Nikunj Handa, Noel Bundick, Pedro Aguilar, Peter Faiman, Peter Hoeschele, Pranav Deshpande, Raul Puri, Raz Gaon, Reid Gustin, Robin Brown, Rob Honsby, Saachi Jain, Sandhini Agarwal, Scott Ethersmith, Scott Lessans, Shauna O’Brien, Spencer Papay, Steve Coffey, Tal Stramer, Tao Wang, Teddy Lee, Tejal Patwardhan, Thomas Degry, Tomo Hiratsuka, Troy Peterson, Wenda Zhou, William Butler, Wyatt Thompson, Yao Zhou, Yaodong Yu, Yi Cheng, Yinghai Lu, Younghoon Kim, Yu-Ann Wang Madan, Yushi Wang, Zhiqing Sun

Ledelse

Anna Makanju, Greg Brockman, Hannah Wong, Jerry Tworek, Liam Fedus, Mark Chen, Peter Welinder, Sam Altman, Wojciech Zaremba