23. tammikuuta 2025

Esittelyssä Operator

Tämä on esikatseluversio toimijasta, joka voi käyttää omaa selaintaan antamiesi tehtävien suorittamiseen. Saatavilla Pro-käyttäjille Yhdysvalloissa.

Siirry Operatoriin

Kuvassa näkyy käyttäjän pyyntö löytää ja varata TripAdvisorissa parhaiten arvioitu päivän mittainen kierros Roomassa. Se sisältää hakuprosessin yhteenvedon ja TripAdvisor-verkkosivun, jossa näkyy "Myydyin"-kierros: "Rooma: Colosseum, Forum Romanum ja Palatinus-kukkula."

Ladataan...

Päivitys 17. heinäkuuta 2025: Operator on nyt täysin integroitu ChatGPT:hen ChatGPT‑agenttina. Voit käyttää näitä päivitettyjä ominaisuuksia valitsemalla vain muokkaimen valikosta ”agenttitila”ja kirjoittamalla kyselysi suoraan ChatGPT:hen. Tästä johtuen erillinen Operator-sivusto (operator.chatgpt.com) poistuu käytöstä tulevina viikkoina.

Tänään julkaisemme Operator⁠(avautuu uudessa ikkunassa)-agentin, joka voi suorittaa tehtäviä puolestasi verkossa. Oman selaimensa avulla se voi tarkastella verkkosivuja ja olla vuorovaikutuksessa niiden kanssa kirjoittamalla, napsauttamalla ja vierittämällä. Se on tällä hetkellä esikatseluvaiheessa, mikä tarkoittaa, että siinä on rajoituksia ja sitä kehitetään käyttäjien palautteen perusteella. Operator on yksi ensimmäisistä tekoälyagenteistamme, joka pystyy itsenäisesti tekemään työtä puolestasi – annat sille tehtävän ja se suorittaa sen.

Operatoria voi pyytää hoitamaan monenlaisia toistuvia selaintehtäviä, kuten lomakkeiden täyttämistä, päivittäistavaroiden tilaamista ja jopa meemien luomista. Mahdollisuus käyttää samoja käyttöliittymiä ja työkaluja, joiden kanssa ihmiset ovat vuorovaikutuksessa päivittäin, laajentaa tekoälyn hyödyllisyyttä, auttaa ihmisiä säästämään aikaa jokapäiväisissä tehtävissä ja avaa uusia vuorovaikutusmahdollisuuksia yrityksille.

Turvallisen ja toistuvan käyttöönoton varmistamiseksi aloitamme pienestä. Operator on saatavana tänään alkaen Pro⁠(avautuu uudessa ikkunassa)-käyttäjistä Yhdysvalloissa osoitteessa operator.chatgpt.com⁠(avautuu uudessa ikkunassa). Tämä tutkimuksen esikatseluversio antaa meille mahdollisuuden oppia käyttäjiltämme ja laajemmalta ekosysteemiltä sekä jalostaa ja parantaa toimintaamme matkan varrella. Suunnitelmamme on laajentaa Plus-, Team- ja Enterprise-käyttäjille ja integroida nämä ominaisuudet ChatGPT:hen tulevaisuudessa.

Miten Operator toimii

Operatorin toiminta perustuu uuteen malliin nimeltä Computer-Using Agent (CUA). CUA yhdistää GPT‑4o:n näkökyvyn edistyneeseen päättelyyn vahvistusoppimisen avulla, ja se on koulutettu vuorovaikutukseen graafisten käyttöliittymien (GUI) painikkeiden, valikoiden ja tekstikenttien kanssa.

Operator voi "nähdä" (kuvakaappausten kautta) ja "olla vuorovaikutuksessa" (käyttäen kaikkia hiiren ja näppäimistön mahdollistamia toimintoja) selaimen kanssa, mikä mahdollistaa sen toiminnan verkossa ilman mukautettuja API-integraatioita.

Jos Operator kohtaa haasteita tai tekee virheitä, se voi hyödyntää päättelykykyään korjatakseen ne itse. Kun se jumiutuu ja tarvitsee apua, se yksinkertaisesti luovuttaa ohjauksen takaisin käyttäjälle. Näin varmistetaan sujuva ja yhteistyöhön perustuva kokemus.

Vaikka CUA on vielä alkuvaiheessa ja siinä on rajoituksia, se saavuttaa uusia huippuluokan WebArena- ja WebVoyager-vertailutuloksia, jotka ovat kaksi keskeistä selainten käytön vertailuarvoa. Lue lisää arviointimetodeista ja Operatorin taustalla olevasta tutkimuksesta tutkimusblogistamme.

Kuinka käytetään

Aloita kuvailemalla haluamasi tehtävä, niin Operator hoitaa loput. Käyttäjät voivat ottaa etäselaimen hallinnan milloin tahansa, ja Operator on koulutettu pyytämään käyttäjää ennakoivasti ottamaan selaimen haltuunsa tehtävissä, jotka vaativat kirjautumista, maksutietoja tai CAPTCHA-kyselyiden ratkaisemista.

Käyttäjät voivat mukauttaa työnkulkujaan Operatorissa lisäämällä mukautettuja ohjeita joko kaikille sivustoille tai tietyille sivustoille, kuten asettamalla lentoyhtiöiden asetuksia Booking.comissa. Operator antaa käyttäjien tallentaa kehotteita nopeaa käyttöä varten kotisivulla, mikä on ihanteellista toistuviin tehtäviin, kuten Instacart-ruokaostosten täydentämiseen. Samoin kuin käytettäessä useita välilehtiä selaimessa käyttäjät voivat antaa Operatorin suorittaa useita tehtäviä samanaikaisesti luomalla uusia keskusteluja, kuten tilaamalla henkilökohtaisen emalimukin Etsyssä ja samalla varaamalla leirintäalueen Hipcampissa.

Ekosysteemi ja käyttäjät

Operator⁠(avautuu uudessa ikkunassa) muuttaa tekoälyn passiivisesta työkalusta aktiiviseksi osallistujaksi digitaalisessa ekosysteemissä. Se virtaviivaistaa käyttäjien tehtäviä ja tuo asiakaspalvelijoiden edut yrityksille, jotka haluavat innovatiivisia asiakaskokemuksia ja korkeampia konversioasteita. Teemme yhteistyötä sellaisten yritysten kanssa kuin DoorDash, Instacart, OpenTable, Priceline, StubHub, Thumbtack, Uber ja muut varmistaaksemme, että Operator vastaa tosielämän tarpeisiin ja noudattaa vakiintuneita normeja. Näiden yhteistyöhankkeiden lisäksi näemme paljon potentiaalia parantaa tiettyjen työnkulkujen saavutettavuutta ja tehokkuutta, erityisesti julkisen sektorin sovelluksissa. Tutkiaksemme näitä käyttötapauksia tarkemmin teemme yhteistyötä organisaatioiden, kuten Stocktonin kaupungin⁠(avautuu uudessa ikkunassa), kanssa helpottaaksemme ilmoittautumista kaupungin tarjoamiin palveluihin ja ohjelmiin.

“Kun opimme lisää Operatorista sen esikatseluversion aikana, pystymme paremmin tunnistamaan tapoja, joilla tekoäly voi helpottaa asukkaidemme osallistumista yhteiskunnallisesti entisestään.”

Jamil Niazi, Director of Information Technology, City of Stockton

Julkaisemalla Operatorin aluksi rajoitetulle yleisölle pyrimme oppimaan nopeasti ja hiomaan sen ominaisuuksia reaalimaailman palautteen perusteella varmistaen, että tasapainotamme innovaatiota luottamuksen ja turvallisuuden kanssa. Tämä yhteistyöhön perustuva lähestymistapa auttaa varmistamaan, että Operator tarjoaa merkityksellistä arvoa käyttäjille, sisällöntuottajille, yrityksille ja julkisen sektorin organisaatioille.

“OpenAI:n Operator on teknologinen läpimurto, joka tekee prosesseista, kuten ruokaostosten tilaamisesta, uskomattoman helppoja.”

Daniel Danker, Chief Product Officer, Instacart

Turvallisuus ja tietoturva

Käyttäjän turvallisuuden varmistaminen on etusijalla. Kolmikerroksiset suojatoimet estävät väärinkäytökset ja varmistavat, että käyttäjät hallitsevat tilannetta.

Ensinnäkin Operator koulutetaan varmistamaan, että hallinta on aina käyttäjällä, ja pyytämään palautetta kriittisissä kohdissa.

Haltuunottotila: Operator pyytää käyttäjää ottamaan ohjat käsiinsä, kun hän syöttää selaimeen arkaluonteisia tietoja, kuten kirjautumistietoja tai maksutietoja. Haltuunottotilassa Operator ei kerää eikä ota kuvakaappauksia käyttäjän syöttämistä tiedoista.
Käyttäjän vahvistukset: Ennen mitään merkittävää toimenpidettä, kuten tilauksen tai sähköpostin lähettämistä, Operatorin tulee pyytää siihen hyväksyntä.
Tehtävärajoitukset: Operator on koulutettu kieltäytymään tietyistä arkaluontoisista tehtävistä, kuten pankkitapahtumista tai sellaisista, jotka vaativat hyvin tärkeitä päätöksiä, kuten työhakemuksen jättämisestä.
Valvontatila: Erityisen arkaluontoisilla sivustoilla, kuten sähköpostissa tai rahoituspalveluissa, Operator vaatii toiminnan tarkkaa valvontaa, jotta käyttäjät voivat havaita mahdolliset virheet suoraan.

Seuraavaksi olemme helpottaneet tietosuojan hallintaa Operatorissa.

Kieltäytyminen koulutuksesta: Jos ChatGPT‑asetuksissa poistetaan käytöstä ”Paranna mallia kaikille”, Operaattorin tietoja ei myöskään käytetä malliemme kouluttamiseen.
Läpinäkyvä tiedonhallinta: Käyttäjät voivat poistaa kaikki selaustiedot ja kirjautua ulos kaikilta sivustoilta yhdellä napsautuksella Operator-asetusten tietosuojaosiossa. Myös aiemmat keskustelut Operatorissa voidaan poistaa yhdellä napsautuksella.

Lopuksi olemme rakentaneet puolustuskeinoja haitallisia verkkosivustoja vastaan, jotka saattavat yrittää johtaa Operatoria harhaan piilotettujen kehotteiden, haitallisen koodin tai tietojenkalasteluyritysten avulla:

Varovainen navigointi: Operator on suunniteltu havaitsemaan ja jättämään huomiotta hakkereiden kehotteet.
Seuranta: Erillinen ”valvontamalli” tarkkailee epäilyttävää toimintaa ja voi keskeyttää tehtävän, jos jokin vaikuttaa poikkeavalta.
Havaitsemisprosessi: Automatisoidut ja ihmisten suorittamat tarkastusprosessit tunnistavat jatkuvasti uusia uhkia ja päivittävät suojatoimia nopeasti.

Tiedämme, että pahantahtoiset toimijat yrittävät väärinkäyttää tätä teknologiaa. Siksi olemme suunnitelleet Operatorin hylkäämään haitalliset pyynnöt ja estämään luvattoman sisällön. Moderointijärjestelmämme voivat antaa varoituksia tai jopa peruuttaa käyttöoikeuden toistuvista rikkomuksista, ja olemme integroineet lisätarkastusprosesseja väärinkäytösten havaitsemiseksi ja käsittelemiseksi. Annamme myös ohjeita siitä, miten Operatorin kanssa tulee olla vuorovaikutuksessa käyttöehtojemme mukaisesti.

Vaikka Operator on suunniteltu näitä turvatoimia silmällä pitäen, mikään järjestelmä ei ole virheetön, ja se on edelleen esikatseluversiossa. Olemme sitoutuneet jatkuvaan parantamiseen reaalimaailman palautteen ja tiukan testauksen avulla. Lisätietoja lähestymistavastamme on Operator-tutkimusblogin turvallisuusosiossa.

Rajoitukset

Operator on tällä hetkellä varhaisessa esikatseluversiossa, ja vaikka se pystyy jo käsittelemään monenlaisia tehtäviä, se oppii ja kehittyy edelleen ja saattaa tehdä virheitä. Esimerkiksi se kohtaa tällä hetkellä haasteita monimutkaisten käyttöliittymien, kuten diaesitysten luomisen tai kalentereiden hallinnan kanssa. Varhainen käyttäjäpalaute on keskeisessä roolissa sen tarkkuuden, luotettavuuden ja turvallisuuden parantamisessa, mikä auttaa meitä tekemään Operatorista paremman kaikille.

Mitä seuraavaksi

CUA API-rajapinnassa: Aiomme lähitulevaisuudessa julkaista Operatoria eli CUA:ta pyörittävän mallin API-rajapinnassa, jotta kehittäjät voivat käyttää sitä omien tietokoneita käyttävien agenttiensa rakentamiseen.

Kehittyneet ominaisuudet: Jatkamme Operatorin kyvykkyyden parantamista pidempien ja monimutkaisempien työnkulkujen käsittelyssä.

Laajempi käyttö: Aiomme laajentaa Operator⁠(avautuu uudessa ikkunassa)-käyttöä Plus-, Team- ja Enterprise-käyttäjille ja integroida sen ominaisuudet suoraan ChatGPT:hen tulevaisuudessa, kun olemme varmoja sen turvallisuudesta ja käytettävyydestä skaalautuvasti, mikä mahdollistaa saumattoman reaaliaikaisen ja asynkronisen tehtävien suorittamisen.

Tekijät

OpenAI

Perustutkimuksen tukijat

Casey Chu, David Medina, Hyeonwoo Noh, Noah Jorgensen, Reiichiro Nakano, Sarah Yoo

Ydin

Andrew Howell, Aaron Schlesinger, Baishen Xu, Ben Newhouse, Bobby Stocker, Devashish Tyagi, Dibyo Majumdar, Eugenio Panero, Fereshte Khani, Geoffrey Iyer, Jiahui Yu, Nick Fiacco, Patrick Goethe, Sam Jau, Shunyu Yao, Stephan Casas, Yash Kumar, Yilong Qin

XFN-tukijat

Abby Fanlo Susk, Aleah Houze, Alex Beutel, Alexander Prokofiev, Andrea Vallone, Andrea Chan, Christina Lim, Derek Chen, Duke Kim, Grace Zhao, Heather Whitney, Houda Nait El Barj, Jake Brill, Jeremy Fine, Joe Fireman, Kelly Stirman, Lauren Yang, Lindsay McCallum, Leo Liu, Mike Starr, Minnia Feng, Mostafa Rohaninejad, Oleg Boiko, Owen Campbell-Moore, Paul Ashbourne, Stephen Imm, Taylor Gordon, Tina Sriskandarajah, Winston Howes

Vastuuhenkilöt

Aaron Schlesinger (Infrastruktuuri), Casey Chu (Turvallisuus ja mallivalmius), David Medina (Tutkimusinfrastruktuuri), Hyeonwoo Noh (Yleinen tutkimus), Reiichiro Nakano (Yleinen tutkimus), Yash Kumar

Tukijat

Adam Brandon, Adam Koppel, Adele Li, Ahmed El-Kishky, Akila Welihinda, Alex Karpenko, Alex Nawar, Alex Tachard Passos, Amelia Liu, Andrei Gheorghe, Andrew Duberstein, Andrey Mishchenko, Angela Baek, Ankush Agarwal, Anting Shen, Antoni Baum, Ari Seff, Ashley Tyra, Behrooz Ghorbani, Bo Xu, Brandon McKinzie, Bryan Brandow, Carolina Paz, Cary Hudson, Chak Li, Chelsea Voss, Chen Shen, Chris Koch, Christian Gibson, Christina Kim, Christine McLeavey, Claudia Fischer, Cory Decareaux, Daniel Jacobowitz, Daniel Wolf, David Kjelkerud, David Li, Ehsan Asdar, Elaine Kim, Emilee Goo, Eric Antonow, Eric Hunter, Eric Wallace, Felipe Torres, Fotis Chantzis, Freddie Sulit, Giambattista Parascandolo, Hadi Salman, Haiming Bao, Haoyu Wang, Henry Aspegren, Hyung Won Chung, Ian O’Connell, Ian Sohl, Isabella Fulford, Jake McNeil, James Donovan, Jamie Kiros, Jason Ai, Jason Fedor, Jason Wei, Jay Dixit, Jeffrey Han, Jeffrey Sabin-Matsumoto, Jennifer Griffith-Delgado, Jeramy Han, Jeremiah Currier, Ji Lin, Jiajia Han, Jiaming Zhang, Jiayi Weng, Jieqi Yu, Joanne Jang, Joyce Ruffell, Kai Chen, Kai Xiao, Kevin Button, Kevin King, Kevin Liu, Kristian Georgiev, Kyle Miller, Lama Ahmad, Laurance Fauconnet, Leonard Bogdonoff, Long Ouyang, Louis Feuvrier, Madelaine Boyd, Mamie Rheingold, Matt Jones, Michael Sharman, Miles Wang, Mingxuan Wang, Nick Cooper, Niko Felix, Nikunj Handa, Noel Bundick, Pedro Aguilar, Peter Faiman, Peter Hoeschele, Pranav Deshpande, Raul Puri, Raz Gaon, Reid Gustin, Robin Brown, Rob Honsby, Saachi Jain, Sandhini Agarwal, Scott Ethersmith, Scott Lessans, Shauna O’Brien, Spencer Papay, Steve Coffey, Tal Stramer, Tao Wang, Teddy Lee, Tejal Patwardhan, Thomas Degry, Tomo Hiratsuka, Troy Peterson, Wenda Zhou, William Butler, Wyatt Thompson, Yao Zhou, Yaodong Yu, Yi Cheng, Yinghai Lu, Younghoon Kim, Yu-Ann Wang Madan, Yushi Wang, Zhiqing Sun

Johtoryhmä

Anna Makanju, Greg Brockman, Hannah Wong, Jerry Tworek, Liam Fedus, Mark Chen, Peter Welinder, Sam Altman, Wojciech Zaremba