Memperkenalkan kemampuan baru untuk GPT‑Rosalind
Menghadirkan kecerdasan lebih besar yang berpijak pada alur kerja ilmiah nyata untuk industri ilmu hayati.
Kami memperkenalkan pembaruan model baru untuk seri GPT‑Rosalind kami yang dirancang khusus untuk riset ilmu hayati pada skala perusahaan. Model ini menggabungkan kemampuan pengodean agentik dan penggunaan alat GPT‑5.5 dengan kecerdasan model yang lebih kuat dalam domain inti penemuan obat seperti kimia medisinal dan genomika, sekaligus meningkatkan kinerja di analisis, desain, dan alur kerja eksperimen ilmu hayati yang lebih luas.
Kemajuan dalam ilmu hayati bergantung pada sintesis data dan bukti lintas skala dan modalitas: molekul, gen, jalur, dan sistem hidup. Dalam evaluasi kami, GPT‑Rosalind yang diperbarui menunjukkan peningkatan kinerja luas pada tugas riset dari pakar biologi, kueri kimia medisinal yang kompleks, biologi kuantitatif, dan pemecahan masalah wet lab.
GPT‑Rosalind kini tersedia dalam pratinjau riset bagi organisasi yang memenuhi syarat secara global melalui struktur deployment akses tepercaya kami.
Untuk mengukur dan terus meningkatkan dampak nyata GPT‑Rosalind, kami merancang LifeSciBench, benchmark yang dinilai pakar eksternal dan berfokus pada aspek fondasional dalam riset ilmu hayati. Tidak seperti benchmark yang ada yang mengevaluasi satu komponen kinerja model atau domain biologis secara terpisah, LifeSciBench mengambil pandangan end-to-end atas pekerjaan yang bernilai ilmiah dengan mengambil tugas dari enam area alur kerja yang penting bagi riset ilmu hayati: penanganan bukti, analisis, desain dan optimisasi, penalaran ilmiah, validasi dan operasi, serta translasi dan komunikasi. Kami menggunakan benchmark ini untuk menyelaraskan kemajuan dengan kebutuhan dan realitas riset ilmu hayati.
GPT‑Rosalind memimpin kinerja di berbagai tugas bernilai ilmiah yang diidentifikasi oleh pakar industri dan akademik.
Mengekstraksi, merekonsiliasi, dan mengaudit bukti ilmiah dari makalah, gambar, tabel, dan catatan eksperimen.
Contoh Eval
We’re preparing for a Type B FDA meeting on AAV9-microDys-X, an AAV9-based micro-dystrophin gene therapy for Duchenne muscular dystrophy that expresses a 138 kDa construct from an MCK promoter, and we want a hard-nosed critique of whether our current package really supports accelerated approval on micro-dystrophin expression as a surrogate endpoint reasonably likely to predict clinical benefit.
Study context: open-label Phase 1b/2 in 12 ambulatory boys age 4–7 with confirmed DMD and out-of-frame rod-domain deletions. The package is:
- Pre-treatment vastus lateralis biopsies: 0–3% of healthy-control dystrophin by quantitative Western blot using MANEX1A against the N-terminal actin-binding domain.
- 12-week post-treatment contralateral vastus lateralis biopsies: mean micro-dystrophin 38% of healthy control (range 18–61%) by the same Western blot, normalized to total protein by Coomassie staining.
- Post-treatment immunofluorescence: sarcolemmal signal in 75–95% of fibers using a polyclonal anti-dystrophin C-terminal antibody.
- 48-week function: mean NSAA change +1.4 points from baseline versus −0.6 in an external published natural-history registry cohort (p = 0.03 by unpaired t-test).
- Safety: transient transaminitis in 8/12 patients managed with steroid taper; one resolved myocarditis; no deaths.
- Biodistribution/persistence: AAV9 vector genomes detectable in muscle at 12 weeks at a mean of 2.3 vector genomes per nucleus.
- Eligibility: no baseline anti-AAV9 neutralizing antibodies (titer <1:400) and no exon-44 deletions.
Please pressure-test this package item by item: where would FDA or a skeptical reviewer say the evidence, as presented, fails to support our conclusion, and what additional data, analyses, or design changes would be needed to close those gaps if possible? For anything not specified, assume what is known from other clinical-grade 138 kDa micro-dystrophin programs and relevant clinical trials through December 31, 2025 also applies.
Respons Kandidat
Intinya: Seperti yang disajikan, paket ini belum cukup kuat untuk mendukung persetujuan dipercepat berdasarkan ekspresi micro-dystrophin sebagai endpoint surrogate yang secara wajar mungkin memprediksi manfaat klinis. Peninjau FDA yang skeptis kemungkinan akan menilai bukti biomarker, fungsional, durabilitas, keamanan, dan generalisasi sebagai kurang didukung secara material.
Item Paket | Mode Kegagalan Utama | Yang Diperlukan |
|---|---|---|
Kuantifikasi Western blot | MANEX1A mengikat epitope N-terminal yang dimiliki bersama oleh dystrophin full-length endogen dan transgen micro-dystrophin, sehingga assay tidak membedakan transgen dari dystrophin residual/revertant secara bersih. Mengkuantifikasi micro-dystrophin 138 kDa terhadap standar dystrophin full-length sehat juga tidak valid. | Gunakan standar micro-dystrophin rekombinan dan metode ortogonal yang membedakan transgen dari dystrophin endogen, seperti spektrometri massa tertarget atau assay spesifik transgen/epitope. |
Imunofluoresensi | Antibodi poliklonal C-terminal kurang cocok karena konstruk 138 kDa tidak memiliki domain C-terminal. Banyak pasien DMD memiliki serat revertant, dan dystrophin revertant dapat mempertahankan epitope C-terminal. Serat revertant dapat berkembang secara klonal seiring usia, membiaskan sinyal IF, terutama pada anak laki-laki yang lebih tua. | Ulangi IF dengan antibodi terhadap epitope yang ada dalam transgen tetapi tidak ada pada dystrophin revertant. Kuantifikasi serat positif transgen secara terpisah dari serat revertant. |
Validitas endpoint surrogate | Paket ini mencampuradukkan jumlah protein dengan fungsi klinis. “38% dari massa protein kontrol sehat” tidak berarti 38% fungsi dystrophin normal karena micro-dystrophin terpotong secara struktural. | Validasi secara empiris hubungan antara persen massa micro-dystrophin, lokalisasi sarkolemal, pemulihan fungsi downstream, dan manfaat klinis sebelum memperlakukan ekspresi sebagai endpoint surrogate. |
Desain biopsi | Biopsi vastus lateralis kontralateral pra- dan pascaperlakuan memperkenalkan variabilitas kiri-kanan dan spasial intramuskular. Progresi penyakit dan penggantian fibro-lemak juga dapat mengubah sinyal yang dinormalisasi terhadap total protein. | Standarkan lokasi biopsi menggunakan penanda anatomi yang konsisten, normalisasi terhadap protein spesifik otot, dan ukur komposisi fibro-lemak secara paralel. |
Pembanding/statistik NSAA | Kohort natural-history eksternal bukan kontrol konkuren acak. Kelayakan uji, perawatan suportif, efek partisipasi, NSAA baseline, regimen steroid, usia, dan kelas ekson semuanya dapat membiaskan perbandingan. Uji t tidak berpasangan tidak memadai. Selain itu, perubahan NSAA +1,4 berada dalam variabilitas test-retest untuk kelompok usia ini. | Jalankan studi acak konkuren terkontrol plasebo, atau minimal gunakan analisis tersesuaikan yang memperhitungkan NSAA baseline, usia, regimen steroid, kelas ekson, dan confounder lain. |
Perancu jendela usia | Anak laki-laki usia 4–7 berada dalam jendela perkembangan ketika pasien DMD ambulatory tanpa terapi dapat memperoleh fungsi motorik sebelum penurunan mendominasi. Perubahan NSAA 48 minggu mencampur kenaikan perkembangan, progresi penyakit, dan kemungkinan efek pengobatan. | Gunakan kontrol acak konkuren dengan stratifikasi usia untuk memisahkan trajektori perkembangan dari efek pengobatan. |
Preseden klinis sebelumnya | Sinyal fungsional micro-dystrophin label terbuka belum secara andal memprediksi manfaat konfirmatori; preseden terbitan mencakup uji konfirmatori terapi gen micro-dystrophin yang gagal mereproduksi peningkatan NSAA label terbuka. | Jangan mengandalkan perubahan NSAA label terbuka sebagai dukungan penentu. Wajibkan bukti fungsional terkontrol. |
Batas struktural konstruksi | Konstruksi 138 kDa menghapus pengulangan spectrin R16/17, yang mengandung situs pengikatan nNOS. Hilangnya rekrutmen nNOS dapat mengganggu sympatholysis fungsional dan perlindungan iskemia selama latihan, menciptakan plafon mekanistik pada rescue yang independen dari tingkat ekspresi. | Tambahkan studi mekanistik yang menunjukkan apakah konstruksi spesifik ini memulihkan fungsi kompleks terkait dystrophin yang relevan, lokalisasi nNOS, fisiologi latihan, dan perlindungan otot. |
Durabilitas AAV | Genom vektor pada 12 minggu tidak menetapkan ekspresi yang tahan lama. Genom AAV9 sebagian besar berupa episom non-integrasi dan dapat menurun seiring waktu. Persistensi genom vektor tidak sama dengan ekspresi protein persisten. | Ukur ekspresi protein transgen longitudinal dan durabilitas biomarker fungsional setelah 12 minggu. |
Profil imun/keamanan | Transaminitis pada 8/12 pasien konsisten dengan respons imun terhadap sel yang ditransduksi AAV, tetapi mekanismenya belum ditetapkan. Satu kasus miokarditis mengkhawatirkan mengingat tropisme jantung AAV9. | Berikan pemantauan imun yang lebih mendalam, karakterisasi keamanan hati/jantung, dan tindak lanjut jantung yang diintensifkan. |
Seleksi pasien/generalisasi | Mengecualikan pasien positif antibodi penetral anti-AAV9 membatasi generalisasi. Mengecualikan delesi ekson-44 membatasi penerapan pada subkelompok DMD tersebut. n=12 terlalu kecil untuk mengarakterisasi keamanan dan efikasi di seluruh populasi DMD yang lebih luas. | Perluas kelayakan bila memungkinkan atau pra-spesifikasikan analisis terstratifikasi menurut status antibodi, genotipe/kelas ekson, usia, dan fungsi baseline sebelum menggunakan hasil untuk mendukung persetujuan luas. |
Kesimpulan regulatori: Paket ini mungkin menunjukkan aktivitas biologis, tetapi belum menetapkan bahwa ekspresi micro-dystrophin yang diukur adalah surrogate andal yang secara wajar mungkin memprediksi manfaat klinis. Kendala utamanya adalah spesifisitas assay, standar kuantifikasi tidak valid, kemungkinan perancu serat revertant, kurangnya kontrol acak, perancu NSAA terkait usia, durabilitas tidak pasti, dan masalah keamanan/generalisasi yang belum terselesaikan.
Untuk mengatasi kendala tersebut, program ini memerlukan desain klinis terkontrol dan terstratifikasi usia dengan assay ekspresi spesifik transgen, kuantifikasi protein ortogonal, kontrol komposisi jaringan, data durabilitas longitudinal, assay fungsional mekanistik untuk konstruk terpotong, dan pemantauan keamanan yang lebih kuat, terutama hati dan jantung.
Peringkat & Kriteria Rubrik
GPT‑Rosalind mencapai kinerja terdepan di industri dalam kimia medisinal, bidang yang berfokus mengubah molekul menjadi obat yang bermanfaat. Kami merancang MedChemBench untuk mencerminkan alur kerja kimia medisinal yang realistis, mengevaluasi pemahaman struktur kimia multimodal; hubungan struktur-aktivitas (SAR); prediksi potensi obat, toksisitas, serta absorpsi, distribusi, metabolisme, ekskresi (ADME); pengambilan keputusan optimisasi lead multiparameter; dan retrosintesis. GPT‑Rosalind mengungguli GPT‑5.5 sebesar 27,5% vs. 25,1% pada MedChemBench, sambil menggunakan token 7,2% lebih sedikit.
GPT‑Rosalind menunjukkan sintesis multimodal dan penalaran mekanistik yang lebih baik dalam kimia medisinal.
Pada GeneBench, evaluasi agentik kami untuk analisis end-to-end jangka panjang dalam genomika dan biologi kuantitatif, GPT‑Rosalind menggunakan token 31% lebih sedikit daripada GPT‑5.5 sekaligus mencapai akurasi lebih tinggi, 21,6% vs. 20,4%. GeneBench menilai kinerja agentik pada tugas kuantitatif jangka panjang: berdasarkan data ilmiah realistis, dapatkah agen merencanakan analisis, QC, pemodelan, dan koreksi yang valid untuk menghasilkan jawaban yang relevan dengan keputusan? Masalah yang disertakan mencakup beragam domain, termasuk genomika fungsional, transkriptomika spasial, proteomika, epigenomika, dan genetika terapan.
GPT‑Rosalind menggunakan token 31% lebih sedikit daripada GPT‑5.5 sambil meningkatkan akurasi.
Kami memperkenalkan evaluasi baru untuk menguji kemampuan GPT‑Rosalind dalam membantu ilmuwan yang melakukan pekerjaan lab di dunia nyata. LabWorkBench menguji kemampuan model untuk menghubungkan perturbasi dengan hasil eksperimen dalam protokol wet lab nyata yang digunakan ilmuwan, untuk tujuan mulai dari pemecahan masalah hingga optimisasi. Data yang digunakan LabWorkBench bersifat proprietary sehingga tidak terkontaminasi. GPT‑Rosalind mencetak skor 63,2% vs. GPT‑5.5 sebesar 55,8%, sambil menggunakan token 5,3% lebih sedikit.
Pada bantuan protokol wet lab nyata, GPT‑Rosalind menunjukkan peningkatan signifikan dibanding GPT‑5.5 sekaligus meningkatkan efisiensi token.
Kami membangun plugin Life Sciences Research(terbuka di jendela baru) dan Life Sciences NGS Analysis(terbuka di jendela baru) untuk memperluas peningkatan kecerdasan GPT‑Rosalind dengan lapisan eksekusi praktis bagi alur kerja ilmiah yang dapat diulang. Bersama-sama, plugin ini menghadirkan pengambilan bukti bersumber, interpretasi biologis, dan eksekusi bioinformatika ke dalam workspace yang sama, membantu peneliti menghubungkan bukti eksternal dengan analisis omics internal sambil mempertahankan artefak dan asal-usul data. Semua pengguna kini dapat mengakses kedua plugin melalui Codex. Pengguna enterprise GPT‑Rosalind yang memenuhi syarat juga dapat menggunakan GPT‑Rosalind untuk mendukung plugin ini.
Untuk memanfaatkan Codex dengan lebih baik sebagai workbench dinamis bagi ilmuwan, kami menambahkan viewer interaktif untuk jenis file yang umum digunakan dalam biologi. Set awal viewer sekuens, alignment, dan struktur dirancang agar ilmuwan tetap dekat dengan bukti saat GPT‑Rosalind bernalar sepanjang alur kerja dan langsung menjawab pertanyaan lanjutan menggunakan viewer aktif dalam konteks.
Demo di atas menunjukkan kemampuan ini beraksi, diorkestrasi oleh GPT‑Rosalind. Kami mengikuti seorang ilmuwan yang menyelidiki biopsi tumor cair untuk mengidentifikasi mutasi dan perubahan molekuler lain yang dapat menginformasikan pengobatan. Plugin Life Sciences NGS Analysis mengubah peninjauan catatan ctDNA yang telah diproses menjadi notebook interaktif, menampilkan perubahan berulang, panggilan frekuensi rendah, dan trajektori sampel yang memfokuskan investigasi pada KRAS G12C. Dari sana, plugin Life Sciences Research menambahkan konteks target, inhibitor, dan resistensi bersumber, sementara viewer sekuens, alignment, dan struktur native memungkinkan ilmuwan memeriksa residu mutan 12, konservasinya di keluarga RAS, dan kantong terikat inhibitor secara langsung. Alur kerja berakhir dengan menerjemahkan bukti tersebut menjadi opsi tindak lanjut konkret, dengan setiap langkah dan artefak tersedia untuk tinjauan pakar.

Plugin Life Sciences NGS Analysis
QC & Anotasi scRNA-seq

Ubah bundel matriks bergaya 10x menjadi artefak single-cell yang difilter QC, anotasi, dan UMAP yang dapat Anda inspeksi dan revisi di Codex. Plugin Life Sciences NGS Analysis merutekan permintaan ke scrna-seq-qc, memilih ambang QC dari data, mempertahankan provenance seputar penyaringan dan anotasi, serta menampilkan penghambat seperti dependensi deteksi doublet yang hilang.
QC FASTQ RNA-seq bulk

Ubah lembar sampel RNA-seq bulk, bundel FASTQ, dan file referensi menjadi bundel hitungan yang ditinjau QC dan dapat Anda inspeksi serta gunakan kembali di Codex. Plugin Life Sciences NGS Analysis merutekan permintaan, memvalidasi input, dan mengembalikan run envelope yang dapat diaudit dengan MultiQC, matriks Salmon, provenance, dan catatan kehati-hatian eksplisit.
Kami memperluas akses ke seri GPT‑Rosalind bagi organisasi yang memenuhi syarat secara global. GPT‑Rosalind akan tersedia dalam pratinjau riset melalui struktur deployment akses tepercaya kami untuk organisasi yang menjalankan riset ilmiah sah dengan manfaat publik yang jelas, memiliki tata kelola dan pengawasan keselamatan yang kuat, serta akses terkendali dengan keamanan tingkat enterprise.
Sebagai bagian dari ekspansi global ini, kami senang dapat membantu mendukung misi Novo Nordisk menghadirkan opsi pengobatan inovatif kepada pasien lebih cepat dengan membantu menskalakan riset medis mereka menggunakan GPT‑Rosalind. Novo Nordisk memanfaatkan kemampuan AI frontier untuk membantu peneliti menganalisis dataset kompleks, mengungkap pola yang berguna, dan menguji hipotesis lebih cepat. Pemahaman biologis GPT‑Rosalind yang lebih kuat akan membantu tim menghubungkan bukti lintas literatur, genomika, transkriptomika, sekuens, struktur, dan hasil eksperimen, sehingga lebih mudah bergerak dari data menuju keputusan riset yang lebih jelas.
“Riset ilmu hayati itu kompleks, kaya data, dan interdisipliner. Untuk memberikan nilai bermakna bagi peneliti, model AI tingkat lanjut harus berpijak pada data ilmiah tepercaya, terhubung ke alat tervalidasi, dan terintegrasi ke dalam alur kerja dunia nyata yang digunakan peneliti setiap hari. Kami senang dengan kemitraan kami bersama OpenAI dan kesempatan untuk mengeksplorasi bagaimana GPT‑Rosalind dapat mendukung pendekatan yang lebih ketat dan praktis dalam penemuan obat.”
Mishal Patel, Wakil Presiden Grup, AI & Inovasi Digital, Litbang - Novo Nordisk
Kami juga kini menawarkan workspace yang dikelola OpenAI bagi organisasi yang memenuhi syarat tanpa akun Enterprise.
GPT‑Rosalind yang diperbarui adalah langkah berikutnya dalam komitmen kami yang lebih luas untuk membangun sistem AI yang dapat membantu mempercepat penemuan ilmiah sekaligus memastikan kemampuan biologis tingkat lanjut diterapkan dengan perlindungan yang sesuai. Kami akan terus meningkatkan penalaran biologis model, memperluas dukungan untuk alur kerja riset yang banyak menggunakan alat dan berjangka panjang, serta bekerja dengan organisasi yang memenuhi syarat di berbagai wilayah untuk mengevaluasi dampak dunia nyata.
Ini juga berarti menerapkan AI ilmu hayati pada pekerjaan berdampak tinggi untuk manfaat publik, mulai dari penemuan obat dan kedokteran translasi hingga kesehatan masyarakat, kesiapsiagaan, dan biodefense. Melalui Rosalind Biodefense dan model deployment akses tepercaya kami, kami bertujuan menempatkan kemampuan biologis frontier di tangan para peneliti, institusi, dan pembela yang bekerja untuk meningkatkan kesehatan manusia dan memperkuat ketahanan sosial.
Kami akan terus membangun GPT‑Rosalind agar menjadi mitra yang lebih mampu di seluruh siklus hidup riset ilmiah, membantu ilmuwan bergerak lebih cepat dari pertanyaan yang tepat ke bukti yang lebih jelas, eksperimen yang lebih baik, dan pada akhirnya pengobatan baru bagi pasien.


