Vai al contenuto principale
OpenAI

23 gennaio 2025

Prodotto

Ti presentiamo Operator

Un'anteprima sperimentale di un agente in grado di utilizzare il proprio browser per eseguire attività al tuo posto. Disponibile per gli utenti Pro negli Stati Uniti

L'immagine mostra la richiesta di un utente di trovare e prenotare il miglior tour di un giorno a Roma su TripAdvisor. Include un riepilogo del processo di ricerca e una pagina web di TripAdvisor che mostra un tour contrassegnato come "best seller": "Rome: Colosseum, Roman Forum and Palatine Hill."
Caricamento in corso...

Aggiornamento del 17 luglio 2025: Operator è ora completamente integrato in ChatGPT come agente ChatGPT. Per accedere a queste funzionalità aggiornate basta selezionare “modalità agente” dall'elenco a discesa nel composer e inserire la query direttamente in ChatGPT. Di conseguenza, il sito indipendente di Operator (operator.chatgpt.com) cesserà di esistere nelle prossime settimane.


Oggi rilasciamo Operator(si apre in una nuova finestra), un agente in grado di navigare sul web per svolgere attività al tuo posto. Grazie al suo browser integrato, può esplorare una pagina web e interagire con essa digitando, facendo clic e scorrendone il contenuto. Attualmente è una versione di anteprima sperimentale, il che significa che presenta delle limitazioni e si evolverà in base al feedback degli utenti. Operator è uno dei nostri primi agenti, ovvero intelligenze artificiali in grado di svolgere attività in autonomia: tu gli assegni un compito e lui lo porta a termine.

Operator può occuparsi di una vasta gamma di attività ripetitive nel browser, come compilare moduli, ordinare la spesa o persino creare meme. La sua capacità di utilizzare le stesse interfacce e strumenti impiegati ogni giorno dagli esseri umani permettono di risparmiare tempo in attività quotidiane e offrire nuove opportunità di coinvolgimento per le aziende.

Per garantire un rilascio sicuro e graduale, abbiamo deciso di partire in piccolo. A partire da oggi, Operator è disponibile per gli utenti Pro(si apre in una nuova finestra) negli Stati Uniti all'indirizzo operator.chatgpt.com(si apre in una nuova finestra). Questa versione di anteprima ci permette di apprendere dagli utenti e dall'intero ecosistema e di migliorare passo dopo passo. Il nostro obiettivo è estendere la disponibilità agli utenti Plus, Team ed Enterprise e integrare queste funzionalità direttamente in ChatGPT in futuro.

Come funziona Operator

Operator si basa su un nuovo modello chiamato operatore che utilizza il computer (Computer-Using Agent, CUA). Grazie all’unione delle capacità visive di GPT‑4o e del ragionamento avanzato ottenuto attraverso l’apprendimento per rinforzo, il CUA è stato istruito a interagire con interfacce grafiche utente (GUI), ovvero pulsanti, menu e campi di testo presenti sullo schermo.

Operator è in grado di "vedere" (tramite screenshot) e "interagire" (mediante tutte le azioni consentite da mouse e tastiera) con un browser e può quindi agire sul web senza bisogno di integrazioni API personalizzate.

In caso di difficoltà o errori, Operator può sfruttare le sue capacità di ragionamento per correggersi autonomamente. Quando si trova in una situazione di stallo e ha bisogno di aiuto, restituisce semplicemente il controllo all’utente, garantendo così un’esperienza continua e collaborativa.

Sebbene il modello CUA sia ancora in una fase iniziale e presenti alcune limitazioni, ha già stabilito nuovi record in WebArena e WebVoyager, due benchmark chiave per l’utilizzo del browser. Scopri di più sulle valutazioni e sulla ricerca alla base di Operator nel nostro post sul blog dedicato alla ricerca.

Come utilizzarlo

Per iniziare, basta descrivere l'attività da svolgere e Operator si occuperà del resto. Gli utenti possono riprendere il controllo del browser remoto in qualsiasi momento. Inoltre, Operator è stato addestrato a richiedere proattivamente l’intervento dell’utente per attività che necessitano di credenziali di accesso, dati di pagamento o risoluzione di CAPTCHA.

Gli utenti possono personalizzare i flussi di lavoro in Operator aggiungendo istruzioni personalizzate per tutti i siti o per siti specifici, ad esempio impostando preferenze per le compagnie aeree su Booking.com. Operator consente anche di salvare i prompt per accedervi rapidamente dalla homepage, ideale per attività ricorrenti come riacquistare prodotti alimentari su Instacart. Proprio come con le schede di un browser, è possibile eseguire più attività contemporaneamente aprendo nuove conversazioni, ad esempio ordinare una tazza smaltata personalizzata su Etsy e prenotare al contempo un posto in campeggio su Hipcamp.

Ecosistema e utenti

Operator(si apre in una nuova finestra) trasforma l'IA da strumento passivo a partecipante attivo nell’ecosistema digitale. Semplificherà le attività per gli utenti e permetterà alle aziende di offrire esperienze innovative e ottenere un aumento dei tassi di conversione. Collaboriamo con realtà quali DoorDash, Instacart, OpenTable, Priceline, StubHub, Thumbtack, Uber e molte altre per garantire che Operator risponda a esigenze concrete, nel rispetto delle norme già consolidate. Oltre a queste collaborazioni, crediamo esista un grande margine di miglioramento dell’accessibilità e dell’efficienza di determinati flussi di lavoro, in particolare nel settore pubblico. Per approfondire questi casi d’uso, collaboriamo con organizzazioni come City of Stockton(si apre in una nuova finestra) per semplificare l’accesso a servizi e programmi pubblici.

"Con l’avanzare della versione sperimentale di Operator, avremo strumenti migliori per capire in che modo l'IA possa facilitare ulteriormente il coinvolgimento dei nostri residenti."
Jamil Niazi, direttore del dipartimento informatico presso City of Stockton

Il rilascio di Operator a un gruppo ristretto di utenti ci permette di raccogliere rapidamente feedback reali e migliorarne le funzionalità, garantendo al tempo stesso un giusto equilibrio tra innovazione, affidabilità e sicurezza. Questo approccio collaborativo aiuta a far sì che Operator offra un valore concreto a utenti, autori, imprese ed enti pubblici.

"Operator di OpenAI è una svolta tecnologica che rende attività come ordinare la spesa incredibilmente semplici."
Daniel Danker, Chief Product Officer presso Instacart

Sicurezza e privacy

Garantire che Operator sia sicuro da utilizzare è una priorità assoluta, con tre livelli di protezione per prevenire abusi e assicurare che gli utenti mantengano sempre il pieno controllo. 

Innanzitutto, Operator è addestrato per richiedere input nei momenti critici e assicurarsi che l'utente sia sempre al comando.

  • Modalità controllo: Operator chiede all’utente di prendere il controllo quando deve inserire informazioni sensibili nel browser, come credenziali di accesso o dati di pagamento. In modalità controllo, Operator non raccoglie né acquisisce screenshot delle informazioni inserite dall’utente. 
  • Conferme da parte dell’utente: prima di completare qualsiasi azione importante, come effettuare un ordine o inviare un'e-mail, Operator chiede l’approvazione dell’utente.
  • Limiti alle attività: Operator è addestrato a rifiutare determinate attività sensibili, ad esempio transazioni bancarie o decisioni di grande responsabilità, come decisioni in merito a candidature di lavoro.
  • Modalità supervisione: su siti particolarmente sensibili, come di servizi finanziari o posta elettronica, Operator richiede una supervisione attenta delle sue azioni e permette agli utenti di intervenire direttamente in caso di errore.

In secondo luogo, abbiamo semplificato la gestione della privacy dei dati all’interno di Operator. 

  • Disattivazione dell'addestramento: disattivando l’opzione "Migliora il modello per tutti" nelle impostazioni di ChatGPT, i dati di Operator non saranno utilizzati per l’addestramento dei nostri modelli. 
  • Gestione dei dati trasparente: gli utenti possono eliminare con un solo clic tutti i dati di navigazione e disconnettersi da tutti i siti nella sezione Privacy delle impostazioni di Operator. Anche le conversazioni passate in Operator possono essere eliminate con un solo clic.

Infine, abbiamo sviluppato protezioni contro siti web ostili che potrebbero cercare di ingannare Operator tramite prompt nascosti, codice maligno o tentativi di phishing:

  • Navigazione prudente: Operator è progettato per rilevare e ignorare le iniezioni di prompt.
  • Monitoraggio: un "modello di monitoraggio" dedicato verifica eventuali comportamenti sospetti e può interrompere l’attività se rileva anomalie.
  • Processo di rilevamento: delle procedure di revisione automatica e umana individuano costantemente nuove minacce e aggiornano rapidamente le misure di sicurezza.

Sappiamo bene che soggetti malintenzionati potrebbero cercare di abusare di questa tecnologia. Per questo motivo abbiamo progettato Operator in modo che rifiuti richieste dannose e blocchi contenuti non consentiti. I nostri sistemi di moderazione possono emettere avvertimenti o addirittura revocare l’accesso in caso di violazioni ripetute e abbiamo integrato ulteriori processi di revisione per individuare e gestire gli usi impropri. Forniamo inoltre indicazioni su come interagire con Operator nel rispetto delle nostre Politiche di utilizzo.

Sebbene Operator sia progettato con tali misure di sicurezza, nessun sistema è infallibile e il modello si trova ancora in una fase di anteprima sperimentale. Ci impegniamo ad apportare continui miglioramenti grazie a feedback reali e test rigorosi. Per saperne di più sul nostro approccio, visita la sezione relativa alla sicurezza del post sul blog sulla ricerca alla base di Operator.

Limiti

Operator si trova al momento in una prima fase di anteprima sperimentale e, pur essendo capace di svolgere numerose attività, è ancora in fase di apprendimento ed evoluzione e può pertanto commettere errori. Ad esempio, attualmente riscontra difficoltà con interfacce complesse come la creazione di presentazioni o la gestione del calendario. Il feedback dei primi utenti ci aiuterà ad affinarne precisione, affidabilità e sicurezza e a rendere Operator più efficiente per tutti.

Novità

CUA nell'API: prevediamo di rendere presto disponibile tramite API il modello alla base di Operator, CUA, in modo che gli sviluppatori possano utilizzarlo per creare i propri operatori che utilizzano il computer. 

Funzionalità ottimizzate: continueremo a migliorare la capacità di Operator di gestire flussi di lavoro più lunghi e complessi.

Accesso più ampio: abbiamo in programma di estendere Operator(si apre in una nuova finestra) agli utenti Plus, Team ed Enterprise e di integrare le sue funzionalità direttamente in ChatGPT in futuro, una volta certi della sua sicurezza e usabilità su larga scala, in modo da permettere un’esecuzione continua di attività in tempo reale e asincrone.

Autori

OpenAI

Collaboratori alla ricerca di base

Casey Chu, David Medina, Hyeonwoo Noh, Noah Jorgensen, Reiichiro Nakano, Sarah Yoo

Team principale

Andrew Howell, Aaron Schlesinger, Baishen Xu, Ben Newhouse, Bobby Stocker, Devashish Tyagi, Dibyo Majumdar, Eugenio Panero, Fereshte Khani, Geoffrey Iyer, Jiahui Yu, Nick Fiacco, Patrick Goethe, Sam Jau, Shunyu Yao, Stephan Casas, Yash Kumar, Yilong Qin

Collaboratori interfunzionali

Abby Fanlo Susk, Aleah Houze, Alex Beutel, Alexander Prokofiev, Andrea Vallone, Andrea Chan, Christina Lim, Derek Chen, Duke Kim, Grace Zhao, Heather Whitney, Houda Nait El Barj, Jake Brill, Jeremy Fine, Joe Fireman, Kelly Stirman, Lauren Yang, Lindsay McCallum, Leo Liu, Mike Starr, Minnia Feng, Mostafa Rohaninejad, Oleg Boiko, Owen Campbell-Moore, Paul Ashbourne, Stephen Imm, Taylor Gordon, Tina Sriskandarajah, Winston Howes

Responsabili

Aaron Schlesinger (Infrastruttura), Casey Chu (Sicurezza e preparazione del modello), David Medina (Infrastruttura di ricerca), Hyeonwoo Noh (Ricerca generale), Reiichiro Nakano (Ricerca generale), Yash Kumar

Collaboratori

Adam Brandon, Adam Koppel, Adele Li, Ahmed El-Kishky, Akila Welihinda, Alex Karpenko, Alex Nawar, Alex Tachard Passos, Amelia Liu, Andrei Gheorghe, Andrew Duberstein, Andrey Mishchenko, Angela Baek, Ankush Agarwal, Anting Shen, Antoni Baum, Ari Seff, Ashley Tyra, Behrooz Ghorbani, Bo Xu, Brandon McKinzie, Bryan Brandow, Carolina Paz, Cary Hudson, Chak Li, Chelsea Voss, Chen Shen, Chris Koch, Christian Gibson, Christina Kim, Christine McLeavey, Claudia Fischer, Cory Decareaux, Daniel Jacobowitz, Daniel Wolf, David Kjelkerud, David Li, Ehsan Asdar, Elaine Kim, Emilee Goo, Eric Antonow, Eric Hunter, Eric Wallace, Felipe Torres, Fotis Chantzis, Freddie Sulit, Giambattista Parascandolo, Hadi Salman, Haiming Bao, Haoyu Wang, Henry Aspegren, Hyung Won Chung, Ian O’Connell, Ian Sohl, Isabella Fulford, Jake McNeil, James Donovan, Jamie Kiros, Jason Ai, Jason Fedor, Jason Wei, Jay Dixit, Jeffrey Han, Jeffrey Sabin-Matsumoto, Jennifer Griffith-Delgado, Jeramy Han, Jeremiah Currier, Ji Lin, Jiajia Han, Jiaming Zhang, Jiayi Weng, Jieqi Yu, Joanne Jang, Joyce Ruffell, Kai Chen, Kai Xiao, Kevin Button, Kevin King, Kevin Liu, Kristian Georgiev, Kyle Miller, Lama Ahmad, Laurance Fauconnet, Leonard Bogdonoff, Long Ouyang, Louis Feuvrier, Madelaine Boyd, Mamie Rheingold, Matt Jones, Michael Sharman, Miles Wang, Mingxuan Wang, Nick Cooper, Niko Felix, Nikunj Handa, Noel Bundick, Pedro Aguilar, Peter Faiman, Peter Hoeschele, Pranav Deshpande, Raul Puri, Raz Gaon, Reid Gustin, Robin Brown, Rob Honsby, Saachi Jain, Sandhini Agarwal, Scott Ethersmith, Scott Lessans, Shauna O’Brien, Spencer Papay, Steve Coffey, Tal Stramer, Tao Wang, Teddy Lee, Tejal Patwardhan, Thomas Degry, Tomo Hiratsuka, Troy Peterson, Wenda Zhou, William Butler, Wyatt Thompson, Yao Zhou, Yaodong Yu, Yi Cheng, Yinghai Lu, Younghoon Kim, Yu-Ann Wang Madan, Yushi Wang, Zhiqing Sun

Direttivo

Anna Makanju, Greg Brockman, Hannah Wong, Jerry Tworek, Liam Fedus, Mark Chen, Peter Welinder, Sam Altman, Wojciech Zaremba