Vai al contenuto principale
OpenAI

16 dicembre 2025

RicercaPubblicazione

L’impatto dell’IA sull’accelerazione della ricerca biologica nel laboratorio umido

GPT‑5 ha introdotto miglioramenti innovativi nei protocolli di laboratorio umido, ottimizzando l’efficienza di un protocollo di clonazione molecolare di 79 volte.

Grafica in stile collage con sfumature delicate blu-arancione, un diagramma di assemblaggio del DNA e testo in grassetto con la dicitura “Biology Research”, etichettata sotto “OpenAI for Science”.
Caricamento in corso...

Accelerare il progresso scientifico è uno dei modi più preziosi in cui l'IA può apportare benefici all'umanità. Con GPT‑5 stiamo iniziando a osservare i primi segnali di questo progresso: non solo nell’aiutare i ricercatori a orientarsi più rapidamente nella letteratura scientifica, ma anche nel supportare nuove forme di ragionamento scientifico, come far emergere connessioni inaspettate, proporre strategie di dimostrazione o suggerire meccanismi plausibili che gli esperti possono valutare e testare.

I progressi fino ad oggi sono stati più evidenti in campi come la matematica, la fisica teorica e l'informatica teorica, dove le idee possono essere rigorosamente verificate senza esperimenti fisici. La biologia è diversa: la maggior parte dei progressi dipende dall'esecuzione sperimentale, dall'iterazione e dalla convalida empirica in laboratorio.

Per aiutare a comprendere come si comportano i modelli di frontiera in questi contesti, abbiamo collaborato con Red Queen Bio, una start-up di biosicurezza, per sviluppare un quadro di valutazione che testa come un modello propone, analizza e itera sulle idee nel laboratorio sperimentale. Abbiamo allestito un semplice sistema sperimentale di biologia molecolare e abbiamo utilizzato GPT‑5 per ottimizzare un protocollo di clonazione molecolare per migliorarne l'efficienza.

Dopo diversi cicli di sperimentazione, GPT‑5 ha introdotto un meccanismo innovativo che ha migliorato l'efficienza della clonazione di 79 volte. La clonazione è uno strumento fondamentale della biologia molecolare. L’efficienza dei metodi di clonazione è fondamentale per creare librerie grandi e complesse, centrali per l'ingegneria delle proteine(si apre in una nuova finestra), gli screening genetici(si apre in una nuova finestra) e l'ingegneria dei ceppi di organismi(si apre in una nuova finestra). Questo progetto mostra come l'IA possa collaborare fianco a fianco con i biologi per accelerare la ricerca. Migliorare i metodi sperimentali aiuterà i ricercatori a lavorare più velocemente, ridurre i costi e tradurre le scoperte in un impatto concreto nel mondo.

Poiché i progressi nel ragionamento biologico comportano implicazioni per la biosicurezza, abbiamo condotto questo lavoro in un ambiente strettamente controllato, utilizzando un sistema sperimentale benigno, limitando l’ambito dell’attività e valutando il comportamento del modello per informare le nostre valutazioni del rischio di biosicurezza e lo sviluppo di salvaguardie a livello di modello e di sistema, come delineato nel nostro Preparedness Framework(si apre in una nuova finestra).

Risultati sperimentali

In questa configurazione, GPT‑5 ha ragionato in modo autonomo sul protocollo di clonazione, ha proposto modifiche e ha incorporato dati provenienti da nuovi esperimenti per suggerire ulteriori miglioramenti. L'unico intervento umano è stato quello di far eseguire agli scienziati il protocollo modificato e caricare i dati sperimentali.

Nel corso di più cicli, GPT‑5 ha ottimizzato la procedura di clonazione migliorandone l’efficienza di oltre 79 volte: a parità di quantità di DNA di input, abbiamo recuperato 79 volte più cloni verificati rispetto al protocollo di base. In particolare, ha introdotto due enzimi che costituiscono un meccanismo innovativo: la ricombinasi RecA di E. coli e la proteina legante il DNA a singolo filamento del gene 32 del fago T4 (gp32). Lavorando in tandem, gp32 stabilizza e districa le estremità libere del DNA, mentre RecA guida ciascun filamento verso la sua corrispondenza corretta.

Gli screening iniziali e gli esperimenti secondari hanno identificato il RecA-Assisted Pair-and-Finish HiFi Assembly (RAPF) e la Transformation 7 (T7) come i principali protocolli enzimatici e di trasformazione, rispettivamente. Sia l'assemblaggio RAPF che la trasformazione T7 hanno migliorato indipendentemente l'efficienza del clonaggio rispetto al protocollo di clonazione di base HiFi, rispettivamente di 2,6 volte e 36 volte; combinati, hanno fornito un miglioramento additivo delle prestazioni di 79 volte. Tutti i cloni sono stati confermati mediante sequenziamento. (Barre di errore: DS di n. 3 esperimenti di validazione indipendenti)

Anche se preliminari, questi risultati sono incoraggianti. I miglioramenti sono specifici della particolare configurazione di clonazione utilizzata nel nostro sistema modello e richiedono ancora che gli scienziati preparino ed eseguano i protocolli. Tuttavia, questi esperimenti dimostrano che i sistemi di intelligenza artificiale possono assistere in modo significativo il lavoro reale in laboratorio e potrebbero accelerare gli scienziati in futuro.

È importante notare che il ciclo del laboratorio di IA è stato eseguito con prompt fisso e senza alcun intervento umano. Questa struttura ha contribuito a rivelare la capacità del modello di proporre cambiamenti di protocollo realmente nuovi e indipendenti dalla guida umana, ma ha anche vincolato il sistema alla fase di esplorazione, limitandone la capacità di massimizzare le prestazioni delle idee appena scoperte. Un miglior equilibrio dinamico tra esplorazione e sfruttamento probabilmente porterebbe a guadagni maggiori, poiché sia i miglioramenti enzimatici che quelli di trasformazione hanno un ampio margine di perfezionamento. Ci aspettiamo che i progressi nella pianificazione e nel ragionamento sull’orizzonte delle attività migliorino la capacità dei prompt fissi più semplici di supportare sia la scoperta sia l’ottimizzazione successiva.

Un quadro evolutivo per ottimizzare i protocolli del mondo reale

La reazione di assemblaggio Gibson(si apre in una nuova finestra) è stata un metodo di clonazione primario sin dalla sua invenzione nel 2009, con un'adozione diffusa in tutta la biologia molecolare. L’assemblaggio Gibson consente ai biologi molecolari di “incollare” frammenti di DNA fondendo brevemente le loro estremità, in modo che le sequenze corrispondenti possano essere unite in una singola molecola. Una delle principali caratteristiche per cui l'assemblaggio Gibson fa appello è la sua semplicità: tutto avviene in un unico tubo a una sola temperatura. Questi vincoli lasciano naturalmente spazio per miglioramenti. Inoltre, le seguenti proprietà lo rendono particolarmente adatto a valutare la capacità dei modelli di IA di migliorare le tecniche di laboratorio umido:

  • Ben definito e con componenti controllati, a differenza di un sistema basato su cellule
  • Ha una funzione di ottimizzazione ben definita: DNA circolarizzato trasformabile ottenuto da una quantità fissa di DNA lineare
  • Cicli sperimentali relativamente rapidi (1-2 giorni)
  • Spazio di progettazione ad alta dimensionalità che richiede un ragionamento meccanicistico per essere migliorato: tamponi, reagenti e temperature ottimali sono tutti interdipendenti

Abbiamo usato HiFi assembly(si apre in una nuova finestra), un sistema enzimatico proprietario sviluppato da New England Biolabs e basato sull'assemblaggio Gibson, come punto di partenza per l'ottimizzazione. Abbiamo esplorato se un’IA potesse innovare e apprendere dal feedback sperimentale una volta rimossi i vincoli del singolo passaggio e dell’isotermicità, identificando così miglioramenti del protocollo in questo scenario.

Nello specifico, abbiamo eseguito una reazione di clonaggio a due componenti utilizzando un gene per la proteina fluorescente verde (GFP) e il plasmide pUC19, ampiamente utilizzato come veicolo standard di DNA per il trasferimento e la replicazione dei geni nei batteri. L'obiettivo era aumentare il numero di colonie riuscite.

Abbiamo ottimizzato la reazione di clonazione introducendo un quadro evolutivo per iterare sulle proposte, permettendo al modello di apprendere “online” dai suoi esperimenti passati. In ogni ciclo, GPT‑5 proponeva un gruppo di 8-10 reazioni diverse, rinviando ai cicli successivi quelle che richiedevano reagenti personalizzati non immediatamente disponibili in laboratorio. Gli scienziati hanno quindi eseguito le reazioni e misurato il numero di colonie rispetto all'assemblaggio HiFi Gibson di riferimento in uno screening iniziale. I dati con le migliori prestazioni del ciclo precedente sono stati poi inseriti nel ciclo successivo. La sollecitazione è stata standardizzata e priva di interventi umani, ad eccezione di chiarimenti, consentendo di attribuire i nuovi contributi meccanicistici all’IA piuttosto che alla guida umana. 

Abbiamo riesaminato le otto reazioni principali della serie di ottimizzazione completa utilizzando una gamma più ampia di diluizioni di DNA e abbiamo scoperto che molte mostravano effetti minori rispetto allo screening iniziale; alla fine, il candidato più forte convalidato è stato una reazione del quinto round che ha riprodotto le sue prestazioni originali. Molti dei protocolli con le prestazioni migliori appartenevano alla famiglia ligase-polish, che risulta particolarmente sensibile a lievi variazioni nello stato delle cellule competenti e nella gestione del DNA dopo la reazione. Poiché queste reazioni hanno utilizzato un breve passaggio HiFi, ipotizziamo che molti prodotti probabilmente entrino in E. coli con solo una giunzione sigillata e l'altra mantenuta dall'annealing, lasciando il recupero a valle ai percorsi di riparazione cellulare. Questo genera un’elevata varianza e una dinamica da «jackpot»: anche se nella maggior parte dei casi le varianti di questa reazione non offrono prestazioni superiori, un singolo outlier particolarmente efficace può portare l’intera famiglia nei cicli successivi. 

Mentre ci siamo concentrati sull'ottimizzazione della reazione di clonazione nel corso dei cicli a causa della sua complessità meccanicistica, parallelamente abbiamo ottimizzato la procedura di trasformazione utilizzando un singolo ciclo «one-shot» in cui il modello ha proposto molti cambiamenti indipendenti, e abbiamo selezionato la reazione con le migliori prestazioni.

Schermate iniziali di ottimizzazione del flusso di lavoro di clonazione in due fasi: assemblaggio enzimatico e trasformazione. (Sinistra) Ottimizzazione iterativa dell’assemblaggio enzimatico su cinque cicli (44 reazioni totali). Partendo dalla base di assemblaggio HiFi, GPT‑5 ha proposto da 8 a 10 varianti di protocollo di assemblaggio per ogni round; i dati dei risultati migliori sono stati incorporati nei prompt successivi. A ogni turno, tracciamo la reazione con le migliori prestazioni finora (inclusi i turni precedenti). (Destra) Ottimizzazione one-shot delle condizioni di trasformazione testando 13 diversi protocolli. Per entrambe le schermate di ottimizzazione, i dati rappresentano misurazioni singole (n. 1) per condizione; la validazione replicata è stata eseguita separatamente per i candidati migliori.

Utilizzando prompt standardizzati senza input umano, GPT‑5 ha migliorato di 79 volte l’efficienza end-to-end della clonazione, come confermato su più repliche sperimentali.

In particolare, il modello ha proposto una nuova procedura enzimatica, denominata RecA-Assisted Pair-and-Finish HiFi Assembly (RAPF-HiFi), che aggiunge due nuove proteine alla reazione: la ricombinasi RecA da E. coli e la proteina legante il DNA a singolo filamento del gene 32 del fago T4 (gp32). Inoltre, il modello ha apportato modifiche deliberate alla temperatura e alla durata di incubazione, nonché alla tempistica delle aggiunte enzimatiche: ha proposto di aggiungere RecA e gp32 dopo una reazione HiFi iniziale a 50 °C, lasciando agire queste proteine a 37 °C, per poi tornare a 50 °C e completare l’assemblaggio. Nel complesso, queste nuove modifiche hanno aumentato l’efficienza di oltre 2,5 volte. È importante notare che questo rappresenta le prestazioni iniziali senza un'ottimizzazione iterativa delle condizioni di reazione e dei tempi.

20 uL reaction volume
100 ng pUC19 vector, HindIII/KpnI-digested
64.3 ng Monster GFP insert, DpnI-digested PCR amplicon
10 μL NEBuilder 2x HiFi DNA Assembly Master Mix
50C - 30 min; 4C hold

Dal lato della trasformazione, la modifica più efficace si è rivelata inaspettatamente semplice: pelletizzare le cellule (centrifugandole in modo che si raccolgano sul fondo del tubo), rimuovere metà del volume fornito e risospendere le cellule prima di aggiungere il DNA, il tutto a 4 °C. Sebbene le cellule chimicamente competenti ad alta efficienza siano generalmente considerate fragili, le cellule hanno tollerato bene la concentrazione e l'aumento delle collisioni molecolari ha incrementato notevolmente l'efficienza di trasformazione (>30 volte nella validazione finale). 

Un'innovazione nella clonazione basata sull'omologia

Diagramma che mostra le fasi dell’assemblaggio del DNA HiFi assistito da RecA, con stadi etichettati per l’esonucleasi T5, GP32, RecA, la polimerasi e la ligasi che agiscono in sequenza sui filamenti di DNA.

L'esonucleasi T5 crea estremità 3′ sporgenti che gp32 stabilizza sopprimendo la struttura secondaria. RecA quindi invade dalle estremità 3′, spostando gp32 e promuovendo la ricerca di omologia e l'annealing. Il riscaldamento a 50 °C provoca il distacco di entrambe le proteine, consentendo alla polimerasi di colmare il gap e alla ligasi di completare la reazione.

L’assemblaggio Gibson consente ai frammenti di DNA di unirsi grazie a estremità coesive complementari, che permettono il loro riconoscimento e l’assemblaggio in una singola molecola. La reazione utilizza due enzimi diversi (una polimerasi e una ligasi) per sigillare i pezzi uniti. In RAPF-HiFi, sono state introdotte due proteine per migliorare il funzionamento della fase di abbinamento. Il primo, gp32, funziona come un pettine che liscia e districa le estremità libere del DNA. Il secondo, RecA, funge da guida che cerca il partner corretto per ogni filamento e riunisce i pezzi corrispondenti. Una temperatura più alta fa sì che entrambi gli assistenti si stacchino dal DNA, permettendo agli enzimi Gibson normali di completare la reazione.

In sintesi, ipotizziamo che il miglioramento delle prestazioni sia mediato dal seguente meccanismo:

  • Gp32 riveste le estremità di DNA a singolo filamento (ssDNA) non appaiate, rimuovendo la struttura secondaria
  • RecA, normalmente inibito dalla struttura, invade a partire dall’estremità 3’ e sposta il filamento di gp32
  • RecA media una ricerca di omologia ssDNA:ssDNA(si apre in una nuova finestra), favorendo l'annealing
  • Un ritorno a 50 °C sposta sia i filamenti di RecA sia quelli di gp32, permettendo alla polimerasi e alla ligasi di completare la reazione.

Per verificare se i nuovi enzimi fossero funzionali e per escludere che il miglioramento delle prestazioni sia dovuto esclusivamente a cambiamenti nei passaggi termici o nei tamponi, abbiamo testato le prestazioni di RAPF-HiFi senza RecA e senza sia RecA sia gp32. Le prestazioni di entrambe le reazioni sono state ridotte rispetto a RAPF-HiFi, il che suggerisce che entrambe le proteine siano necessarie per il meccanismo d'azione di RAPF-HiFi.

Per testare il meccanismo sottostante, separiamo i due nuovi enzimi nella reazione: RecA e gp32. Dimostriamo che ciascuno di questi da solo riduce l'efficienza rispetto al riferimento di base HiFi. Insieme, superano il punto di riferimento con un aumento di efficienza di 2,6 volte. (Barre di errore: DS di n. 3 esperimenti indipendenti)

Lo sviluppo di RAPF-HiFi suggerisce che GPT‑5 sia in grado di un ragionamento complesso e multidimensionale:

Per quanto risulta dalle informazioni, RecA e gp32 non sono stati utilizzati insieme in modo funzionale nei metodi di biologia molecolare. Come per molte tecniche innovative di biologia molecolare, le attività biochimiche sottostanti erano già state studiate, ma il loro impiego come metodo pratico e generalizzabile rappresenta un progresso.

Ad esempio, l'interazione tra RecA e gp32 è stata studiata in saggi di ricostituzione meccanicistica in vitro: negli studi sulla formazione del D-loop, è stato dimostrato che gp32(si apre in una nuova finestra) è in grado di potenziare l'attività di RecA. Gp32 è stato utilizzato in combinazione con il suo partner naturale di ricombinazione del fago T4, UvsX, e con il fattore di caricamento della ricombinasi UvsY nell'amplificazione polimerasica della ricombinasi (RPA)(si apre in una nuova finestra). Sebbene una specifica di brevetto RPA affermi(si apre in una nuova finestra) che reazioni RPA efficaci siano state dimostrate utilizzando E. coli RecA in un sistema eterologo con una proteina gp32 compromessa (cioè, ingegnerizzata, non di tipo selvatico), questa affermazione appare solo come un'osservazione marginale in alcune divulgazioni di brevetti e, a nostre informazioni, non è stata supportata da dati pubblicati né adottata come un sistema RPA robusto basato su RecA. Un metodo di clonazione chiamato SLiCE(si apre in una nuova finestra) utilizza un estratto cellulare intero da E. coli contenente il sistema di ricombinazione λ Red, dove Red beta può svolgere ruoli doppi sia come proteina legante il DNA che come ricombinasi (anche se abbiamo esplicitamente vietato l'uso di estratti cellulari nel nostro prompt). In un'altra applicazione, Ferrin & Camerini-Otero(si apre in una nuova finestra) hanno utilizzato RecA da solo per catturare selettivamente molecole di DNA in base a sequenze corrispondenti. Separatamente, gp32 è stato usato come additivo(si apre in una nuova finestra) in un processo di amplificazione del DNA chiamato PCR per ridurre la struttura secondaria. È stato dimostrato che l'amplificazione NABSA(si apre in una nuova finestra) è potenziata sia da RecA sia da gp32, sebbene ciascuno migliori la reazione in modo indipendente e non sia stata identificata alcuna sinergia. Più in generale, i miglioramenti riportati nelle reazioni di assemblaggio del DNA di base in stile Gibson sono stati limitati; l’esempio più rilevante è una proteina legante il DNA termostabile (ET SSB) che aumenta l'efficienza dell'assemblaggio di circa 2,5 volte(si apre in una nuova finestra)

Per la maggior parte delle applicazioni, non ci aspettiamo che RAPF-HiFi possa competere con la semplicità e la robustezza della clonazione HiFi/Gibson. Tuttavia, l'emergere di un percorso di assemblaggio meccanicamente distinto è degno di nota: GPT‑5 ha trovato una soluzione che include una combinazione insolita di proteine di ricombinazione e dinamiche di reazione. Il meccanismo sottostante potrebbe rivelarsi modulare, offrendo componenti che possono essere riutilizzati o ricombinati in altri flussi di lavoro molecolari. Stiamo continuando a esplorare miglioramenti per RAPF-HiFi. Le temperature di reazione e le durate dei passaggi possono essere regolate per bilanciare l'attività di RecA e gp32 contro l'eccessiva digestione da parte dell'esonucleasi, e le quantità di entrambe le proteine devono ancora essere ottimizzate. GPT‑5 ha proposto anche una variante iperattiva di RecA, che stiamo attualmente purificando.

Per quanto riguarda il protocollo di trasformazione, le condizioni di ottimizzazione riuscite hanno incluso una gamma di additivi e perturbazioni termiche mirate a migliorare l’efficienza dello shock termico delle cellule 10-beta competent(si apre in una nuova finestra) commerciali. Tra le 13 trasformazioni one-shot generate dall’IA e testate, la modifica più efficace, la Trasformazione 7 (T7), prevedeva la pelletizzazione delle cellule, la rimozione di metà del volume e la loro risospensione prima dell’aggiunta del DNA, il tutto a 4 °C. Le cellule chimicamente competenti ad alta efficienza sono generalmente considerate fragili, e tali passaggi di manipolazione vengono generalmente evitati. Ciononostante, le cellule hanno tollerato bene la concentrazione. Gli effetti combinati di un'esposizione aumentata del DNA per cellula e di un tampone inibitorio ridotto, che porta a uno shock termico più netto, hanno prodotto un aumento sostanziale dell'efficienza di trasformazione (oltre 30 volte). 

Questo protocollo di trasformazione è nuovo, anche se è stato segnalato un approccio simile dal punto di vista concettuale(si apre in una nuova finestra) in cui le cellule vengono concentrate in una fase precedente. In particolare, il metodo sviluppato qui da GPT‑5 è compatibile con cellule chimicamente competenti disponibili in commercio, eliminando la necessità di preparare le cellule internamente e superando i guadagni di efficienza riportati da approcci simili su ceppi cellulari comparabili.

Sistema robotico

Per aumentare la produttività di questo modello di sistema sperimentale, Robot on Rails e Red Queen Bio hanno collaborato per costruire un sistema robotico che accetta un protocollo di clonazione in linguaggio naturale e lo esegue nel laboratorio umido.

Il sistema combina tre componenti: 1) un LLM da umano a robot che converte l'inglese semplice nelle azioni del robot; 2) un sistema di visione che identifica e localizza il materiale di laboratorio in tempo reale; e 3) un pianificatore di percorsi robotico che determina come eseguire ogni azione in modo sicuro e accurato. Il risultato è un robot da laboratorio flessibile e generalizzato, ulteriormente ottimizzato per le varianti del protocollo di clonazione Gibson.

Abbiamo verificato se il robot autonomo fosse in grado di eseguire un esperimento di clonazione completo eseguendo due protocolli contemporaneamente: il metodo standard HiFi e R8, il protocollo modificato dall'IA con le migliori prestazioni dal primo ciclo di ottimizzazione.

Abbiamo confrontato il lavoro del robot con gli esperimenti condotti dagli esseri umani a ogni fase. Il robot ha gestito con successo il processo di trasformazione, che richiedeva diverse operazioni fisiche: trasferire e miscelare liquidi, spostare tubi campione, applicare calore controllato alle cellule e distribuire le cellule su piastre di crescita. Quando confrontato direttamente con trasformazioni eseguite da esseri umani, il robot ha generato dati di qualità simile con miglioramenti equivalenti rispetto al punto di riferimento, mostrando un potenziale iniziale per automatizzare e accelerare l'ottimizzazione degli esperimenti biologici.

Sebbene le variazioni osservate tra gli esperimenti eseguiti dal robot e quelli condotti da operatori umani fossero comparabili, i conteggi assoluti delle colonie ottenuti dal robot risultavano circa dieci volte inferiori rispetto all’esecuzione manuale, evidenziando margini di miglioramento nella precisione della gestione dei liquidi, nella calibrazione del controllo della temperatura e nella riproduzione delle tecniche manuali di manipolazione delle cellule.

Sia il metodo standard HiFi (baseline) che il metodo migliorato R8 sono stati eseguiti da ricercatori umani e dal robot autonomo, con le efficienze di trasformazione normalizzate rispetto ai controlli di base HiFi (impostati su 1,0). L'R8 eseguito dall'uomo ha mostrato un miglioramento di 2,39 volte; l'R8 eseguito dal robot ha ottenuto un miglioramento di 2,13 volte (89% delle prestazioni umane), dimostrando un ranking del protocollo comparabile nonostante i rendimenti assoluti inferiori.

Il futuro

Riteniamo che questi esperimenti offrano un’istantanea di come apparirà la scienza accelerata dall’IA in futuro: modelli che apprendono continuamente e interagiscono con il mondo reale. Sebbene i nostri esperimenti abbiano escluso l'intervento umano per misurare esclusivamente le capacità del modello, siamo particolarmente entusiasti di come l'IA possa aiutare gli scienziati umani a progettare esperimenti e contribuire a scoperte scientifiche.


Mentre ci impegniamo ad accelerare il progresso scientifico in modo sicuro e responsabile, ci proponiamo anche di valutare e ridurre i rischi, in particolare quelli legati alla biosicurezza. Questi risultati di valutazione mostrano che i modelli possono ragionare nel laboratorio umido per migliorare i protocolli e potrebbero avere implicazioni per la biosicurezza, come descritto nel nostro
Preparedness Framework(si apre in una nuova finestra). Siamo impegnati a costruire salvaguardie necessarie e sfumate a livello di modello e di sistema per ridurre questi rischi, oltre a sviluppare valutazioni per monitorare i livelli attuali.