Ti presentiamo GPT‑Rosalind, pensato per la ricerca nelle scienze della vita
Un nuovo modello progettato specificamente per accelerare la ricerca scientifica e la scoperta di farmaci.
Oggi presentiamo GPT‑Rosalind, il nostro modello di ragionamento di frontiera progettato per supportare la ricerca in biologia, nella scoperta di farmaci e nella medicina traslazionale. La serie di modelli per le scienze della vita è ottimizzata per i flussi di lavoro scientifici, combinando un uso più avanzato degli strumenti con una comprensione più profonda di chimica, ingegneria proteica e genomica.
In media, occorrono circa 10–15 anni per passare dall’identificazione di un target all’approvazione normativa di un nuovo farmaco negli Stati Uniti. I progressi compiuti nelle primissime fasi della scoperta si amplificano lungo la pipeline, portando a una migliore selezione dei target, ipotesi biologiche più solide ed esperimenti di qualità superiore. Il progresso nelle scienze della vita è limitato non solo dalla complessità della scienza sottostante, ma anche dalla complessità dei flussi di lavoro della ricerca. Gli scienziati devono lavorare su grandi volumi di letteratura, database specializzati, dati sperimentali e ipotesi in evoluzione per generare e valutare nuove idee. Questi flussi di lavoro sono spesso dispendiosi in termini di tempo, frammentati e difficili da scalare.
Crediamo che i sistemi di IA avanzati possano aiutare i ricercatori a muoversi più rapidamente in questi flussi di lavoro, non solo rendendo più efficiente il lavoro esistente, ma anche aiutando gli scienziati a esplorare più possibilità, far emergere connessioni che altrimenti potrebbero sfuggire e arrivare prima a ipotesi migliori. Supportando la sintesi delle evidenze, la generazione di ipotesi, la pianificazione sperimentale e altre attività di ricerca multi-step, questo modello è progettato per accelerare le fasi iniziali della scoperta. Nel tempo, questi sistemi potrebbero consentire alle organizzazioni nelle scienze della vita di realizzare scoperte rivoluzionarie altrimenti impossibili, con un tasso di successo molto più elevato.
GPT‑Rosalind è ora disponibile come anteprima di ricerca in ChatGPT, Codex e nell’API per i clienti qualificati tramite il nostro programma di accesso controllato. Stiamo inoltre introducendo un plugin di ricerca per le scienze della vita per Codex, liberamente accessibile, che aiuta gli scienziati a collegare i modelli a oltre 50 strumenti scientifici e fonti di dati. Collaboriamo con clienti come Amgen, Moderna, l’Allen Institute e Thermo Fisher Scientific per applicare GPT‑Rosalind a flussi di lavoro che accelerano ricerca e scoperta.
Il modello prende il nome da Rosalind Franklin, la cui ricerca rigorosa ha contribuito a rivelare la struttura del DNA e a porre le basi della biologia molecolare moderna.
Dai dati grezzi alle decisioni di scoperta basate su evidenze, scopri come il nostro modello progettato ad hoc accelera i flussi di lavoro di ricerca.
La serie di modelli GPT‑Rosalind per le scienze della vita è progettata per il lavoro scientifico moderno, che integra evidenze pubblicate, dati, strumenti ed esperimenti. Nelle nostre valutazioni, offre prestazioni superiori nelle attività che richiedono ragionamento su molecole, proteine, geni, pathway e biologia rilevante per le malattie, risultando inoltre più efficace nell’uso di strumenti e database scientifici in flussi di lavoro multi-step come revisione della letteratura, interpretazione sequenza-funzione, pianificazione sperimentale e analisi dei dati.
Questo è il primo rilascio della nostra serie di modelli GPT‑Rosalind per le scienze della vita e continueremo ad ampliare le capacità di ragionamento biochimico del modello nei flussi di lavoro scientifici di lungo periodo e ad alto utilizzo di strumenti. L’infrastruttura di calcolo di OpenAI ci consente di continuare ad addestrare, valutare e migliorare modelli di dominio sempre più avanzati su task scientifici reali, rendendo questi sistemi sempre più utili man mano che i flussi di lavoro diventano più complessi.
Dagli insight di scoperta basati su evidenze agli esperimenti ad alto impatto, scopri come la nostra suite di soluzioni si traduce in miglioramenti misurabili nei flussi di lavoro di ricerca.
Collaboriamo con importanti realtà dei settori farmaceutico, biotecnologico e della ricerca, nonché con organizzazioni tecnologiche nel campo delle scienze della vita, per applicare GPT‑Rosalind a flussi di lavoro che guidano la scoperta.
"Il settore delle scienze della vita richiede precisione in ogni fase. Le domande sono estremamente complesse, i dati altamente specifici e la posta in gioco incredibilmente elevata. La nostra collaborazione con OpenAI ci consente di applicare le sue capacità e i suoi strumenti più avanzati in modi nuovi e innovativi, con il potenziale di accelerare lo sviluppo e la distribuzione dei farmaci ai pazienti."
Abbiamo valutato GPT‑Rosalind su una gamma di capacità fondamentali per la scoperta scientifica e la ricerca industriale. Queste valutazioni misurano il ragionamento di base in diversi sottodomini scientifici, tra cui meccanismi di reazione chimica; struttura delle proteine, effetti delle mutazioni e interazioni; e interpretazione filogenetica delle sequenze di DNA. Valutano inoltre se i modelli sono in grado di supportare flussi di lavoro reali interpretando risultati sperimentali, individuando pattern rilevanti per gli esperti e sintetizzando informazioni esterne per progettare esperimenti successivi. Infine, verificano la capacità dei modelli di selezionare e utilizzare strumenti computazionali, database e funzionalità specifiche di dominio per potenziare il proprio ragionamento. Nel complesso, queste valutazioni evidenziano progressi lungo l’intero processo end-to-end della ricerca scientifica e indicano una maggiore capacità di supportare i ricercatori nelle attività di scoperta più complesse.
Abbiamo valutato GPT‑Rosalind su una serie di benchmark pubblici. In BixBench, un benchmark basato su scenari reali di bioinformatica e analisi dei dati, GPT‑Rosalind ha ottenuto prestazioni leader tra i modelli con risultati pubblicati.
Su LABBench2, un benchmark che misura le prestazioni su una gamma di attività di ricerca come il recupero della letteratura, l’accesso ai database, la manipolazione di sequenze e la progettazione di protocolli, GPT‑Rosalind supera GPT‑5.4 in 6 attività su 11. Il miglioramento più significativo deriva da CloningQA, che richiede la progettazione end-to-end di reagenti di DNA ed enzimi per protocolli di clonazione molecolare.
Abbiamo inoltre collaborato con Dyno Therapeutics, azienda pioniera nelle terapie geniche progettate con l’IA, per valutare il modello su un task di previsione e generazione della relazione sequenza-funzione dell’RNA, utilizzando sequenze inedite e non contaminate. Le prestazioni sono state confrontate con 57 punteggi storici di esperti umani nel campo dell’AI-bio. Quando valutati direttamente nell’app Codex, i migliori dieci risultati del modello si collocano oltre il 95º percentile degli esperti umani nel task di previsione e intorno all’84º percentile nel task di generazione di sequenze.
Queste valutazioni forniscono un segnale significativo delle prestazioni nei flussi di lavoro su cui gli scienziati fanno affidamento ogni giorno per generare evidenze, analizzare dati complessi e giungere a conclusioni biologiche solide e difendibili.
Gli scienziati possono usare il nostro nuovo plugin di ricerca per le Scienze della vita(si apre in una nuova finestra) per Codex, disponibile da oggi in GitHub. Questo pacchetto include un ampio insieme di competenze modulari per i flussi di lavoro di ricerca più comuni, progettate per supportare attività nei campi della genetica umana, genomica funzionale, struttura proteica, biochimica, evidenze cliniche e individuazione di studi pubblici.

Queste competenze fungono da livello di orchestrazione che aiuta gli scienziati ad affrontare in modo più efficace quesiti ampi, ambigui e multi-step. Forniscono accesso a oltre 50 database pubblici multi-omics, fonti bibliografiche e strumenti di biologia, offrendo un punto di partenza flessibile per flussi di lavoro comuni e ripetibili come ricerca di strutture proteiche, ricerca di sequenze, revisione della letteratura e individuazione di dataset pubblici.
Gli utenti Enterprise idonei possono sfruttare questo plugin nei flussi di lavoro di ricerca con GPT‑Rosalind per un ragionamento biologico più avanzato, mentre tutti gli utenti possono utilizzare il pacchetto di plugin con i nostri modelli principali.
Vogliamo rendere queste funzionalità disponibili agli scienziati e alle organizzazioni di ricerca meglio posizionati per promuovere la salute umana, mantenendo al contempo solide misure di salvaguardia contro l’uso improprio in ambito biologico. Il modello Life Sciences viene inizialmente distribuito tramite una struttura di accesso controllato per clienti Enterprise idonei negli Stati Uniti, con controlli su idoneità, gestione degli accessi e governance organizzativa. Allo stesso tempo, rendiamo disponibili più ampiamente una serie di connettori e il plugin di ricerca per le scienze della vita, così che i ricercatori possano utilizzare i nostri modelli principali in modo più efficace per le attività di ricerca.
Il modello Life Sciences è stato sviluppato con controlli di sicurezza di livello enterprise più rigorosi e una gestione degli accessi rafforzata, consentendo un utilizzo scientifico professionale in ambienti di ricerca regolamentati. Valutiamo l’accesso in base a tre principi fondamentali: uso responsabile, solida governance e supervisione della sicurezza, e accesso controllato con sicurezza di livello enterprise. In pratica, ciò significa che le organizzazioni partecipanti devono condurre attività di ricerca scientifica legittima con un chiaro beneficio pubblico; mantenere adeguati controlli di governance, conformità e prevenzione degli abusi; e limitare l’accesso agli utenti autorizzati all’interno di ambienti sicuri e ben gestiti. Le organizzazioni devono inoltre accettare i termini dell’anteprima di ricerca Life Sciences e rispettare le policy di utilizzo di OpenAI; potremmo inoltre richiedere informazioni aggiuntive durante l’onboarding o la partecipazione continuativa.
Le organizzazioni possono richiedere l'accesso attraverso il nostro processo di qualifica e revisione della sicurezza.
Durante l’anteprima di ricerca, l’utilizzo di questo modello non consumerà crediti o token esistenti, nel rispetto delle misure di protezione contro gli abusi. Condivideremo maggiori dettagli su prezzi e disponibilità man mano che il programma si espande.
Il modello Life Sciences è progettato per aiutare le organizzazioni scientifiche a svolgere un lavoro di qualità superiore, più rapidamente, in ambienti che richiedono sia capacità tecniche sia controllo operativo. Il nostro team dedicato alle Life Sciences, insieme ai partner di consulenza tra cui McKinsey & Company, Boston Consulting Group (BCG) e Bain & Company, supporta le organizzazioni nell’identificazione di casi d’uso ad alto impatto, nell’integrazione del modello negli ambienti aziendali e nel conseguimento di risultati misurabili. Se desideri esplorare i modi in cui OpenAI per le scienze della vita può supportare il tuo lavoro, puoi contattare il nostro team dedicato alle scienze della vita.
Questo è il primo rilascio della nostra serie di modelli Life Sciences e lo consideriamo l’inizio di un impegno a lungo termine per sviluppare un’IA in grado di accelerare la scoperta scientifica in ambiti di grande rilevanza per la società, dalla salute umana alla più ampia ricerca biologica. Continueremo a migliorare il ragionamento biologico del modello, ad ampliare il supporto per flussi di lavoro di ricerca ad alto utilizzo di strumenti e di lungo periodo e a collaborare strettamente con le principali istituzioni scientifiche per valutarne l’impatto nel mondo reale. Ciò include partnership in corso con laboratori nazionali come il Los Alamos National Laboratory, dove stiamo esplorando la progettazione di proteine e catalizzatori guidata dall’IA, inclusa la capacità dei sistemi di IA di modificare strutture biologiche preservando o migliorando proprietà funzionali chiave.
Con il tempo, ci aspettiamo che questi sistemi diventino partner sempre più capaci nella scoperta, aiutando gli scienziati a passare più rapidamente dalle domande alle evidenze, dalle evidenze alle intuizioni e dalle intuizioni a nuovi trattamenti per i pazienti.


