
Mempercepat kemajuan ilmiah adalah salah satu cara paling berharga di mana AI dapat memberikan manfaat bagi umat manusia. Dengan GPT‑5, kami mulai melihat tanda-tanda awal dari hal ini—tidak hanya dalam membantu para peneliti lebih cepat dalam menelusuri literatur ilmiah, tetapi juga dalam mendukung bentuk-bentuk baru penalaran ilmiah, seperti menampilkan koneksi yang tidak terduga, mengusulkan strategi pembuktian, atau menyarankan mekanisme yang masuk akal yang dapat dievaluasi dan diuji oleh para ahli.
Kemajuan hingga saat ini paling terlihat di bidang seperti matematika, fisika teoretis, dan ilmu komputer teoretis, di mana ide-ide dapat diperiksa secara ketat tanpa eksperimen fisik. Biologi berbeda: sebagian besar kemajuan bergantung pada pelaksanaan eksperimen, iterasi, dan validasi empiris di laboratorium.
Untuk membantu memahami bagaimana model frontier berperilaku dalam lingkungan ini, kami bekerja sama dengan Red Queen Bio, sebuah perusahaan rintisan biosekuriti, untuk membangun kerangka evaluasi yang menguji bagaimana sebuah model mengusulkan, menganalisis, dan mengiterasikan gagasan dalam lingkungan laboratorium basah. Kami menyiapkan sistem eksperimental biologi molekuler yang sederhana dan meminta GPT‑5 untuk mengoptimalkan protokol kloning molekuler demi efisiensi.
Melalui beberapa putaran eksperimen, GPT‑5 memperkenalkan mekanisme baru yang meningkatkan efisiensi kloning hingga 79 kali lipat. Kloning adalah alat mendasar dalam biologi molekuler. Efisiensi metode kloning sangat penting untuk membuat perpustakaan besar dan kompleks yang menjadi pusat rekayasa protein(terbuka di jendela baru), skrining genetik(terbuka di jendela baru), dan rekayasa strain organisme(terbuka di jendela baru). Proyek ini memberikan gambaran tentang bagaimana AI dapat bekerja berdampingan dengan ahli biologi untuk mempercepat penelitian. Meningkatkan metode eksperimental akan membantu para peneliti manusia bergerak lebih cepat, menekan biaya, dan menerjemahkan penemuan menjadi dampak nyata di dunia.
Karena kemajuan dalam penalaran biologis memiliki implikasi pada biosekuriti, kami melakukan pekerjaan ini dalam lingkungan yang sangat terkontrol—menggunakan sistem eksperimental yang tidak berbahaya, membatasi ruang lingkup tugas, dan mengevaluasi perilaku model untuk menginformasikan penilaian risiko biosekuriti kami serta pengembangan perlindungan pada tingkat model dan sistem, seperti yang diuraikan dalam Kerangka Kerja Kesiapan(terbuka di jendela baru) kami.
Dalam pengaturan ini, GPT‑5 secara mandiri melakukan penalaran tentang protokol kloning, mengusulkan modifikasi, dan menggabungkan data dari eksperimen baru untuk menyarankan perbaikan lebih lanjut. Satu-satunya intervensi manusia adalah para ilmuwan melaksanakan protokol yang telah dimodifikasi dan mengunggah data eksperimen.
Melalui beberapa putaran, GPT‑5 mengoptimalkan prosedur kloning untuk meningkatkan efisiensi lebih dari 79 kali lipat—artinya untuk jumlah input DNA yang tetap, kami mendapatkan 79 kali lebih banyak klon yang telah diverifikasikan urutannya dibandingkan dengan protokol dasar. Yang paling menonjol, ini memperkenalkan dua enzim yang membentuk mekanisme baru: rekombinase RecA dari E. coli, dan protein pengikat DNA untai tunggal gen 32 dari fag T4 (gp32). Bekerja secara tandem, gp32 meluruskan dan mengurai ujung-ujung DNA yang longgar, dan RecA kemudian membimbing setiap untai ke pasangan yang tepat.
Skrining awal dan eksperimen sekunder mengidentifikasi RecA-Assisted Pair-and-Finish HiFi Assembly (RAPF) dan Transformasi 7 (T7) sebagai protokol enzimatik dan transformasi teratas, secara berturut-turut. Baik perakitan RAPF maupun transformasi T7 secara independen meningkatkan efisiensi kloning dibandingkan protokol kloning reaksi HiFi dasar, masing-masing 2,6 kali lipat dan 36 kali lipat; dan jika digabungkan memberikan peningkatan kinerja secara aditif sebesar 79 kali lipat. Semua klon telah dikonfirmasi melalui pengurutan. (Batang kesalahan: SD dari n=3 eksperimen validasi independen).
Meskipun masih awal, hasil ini menggembirakan. Peningkatan ini khusus untuk pengaturan kloning tertentu yang digunakan dalam sistem model kami, dan masih memerlukan ilmuwan manusia untuk menyiapkan dan menjalankan protokol. Meskipun demikian, eksperimen ini menunjukkan bahwa sistem AI dapat secara signifikan membantu pekerjaan laboratorium sesungguhnya dan mungkin mempercepat kerja ilmuwan manusia di masa depan.
Perlu dicatat bahwa proses kerja laboratorium AI tersebut dijalankan dengan perintah tetap dan tanpa campur tangan manusia. Struktur pendukung ini membantu mengungkap kapasitas model untuk mengusulkan perubahan protokol yang benar-benar baru secara independen dari panduan manusia, tetapi juga mengunci sistem ke dalam eksplorasi dan membatasi kemampuannya yang terbatas untuk memaksimalkan kinerja ide-ide baru yang ditemukan. Keseimbangan dinamis yang lebih baik antara eksplorasi dan eksploitasi kemungkinan besar akan menghasilkan keuntungan yang lebih besar, karena baik peningkatan enzimatik maupun transformasi memiliki ruang yang cukup besar untuk penyempurnaan. Kami memperkirakan kemajuan dalam perencanaan dan penalaran dengan cakupan tugas yang lebih luas akan meningkatkan kemampuan prompt tetap sederhana untuk mendukung baik penemuan maupun optimisasi berikutnya.
Reaksi Gibson assembly(terbuka di jendela baru) telah menjadi metode kloning utama sejak ditemukan pada tahun 2009, dengan adopsi yang meluas di seluruh bidang biologi molekuler. Gibson assembly memungkinkan ahli biologi molekuler untuk "merekatkan" potongan DNA dengan melelehkan ujungnya secara singkat sehingga urutan yang cocok dapat disegel menjadi satu molekul. Salah satu daya tarik utama dari Gibson assembly adalah kesederhanaannya: semuanya terjadi dalam satu tabung pada satu suhu. Batasan-batasan tersebut secara alami memberikan ruang untuk perbaikan. Selain itu, properti berikut membuatnya sangat cocok untuk mengevaluasi kemampuan model AI dalam meningkatkan teknik laboratorium basah:
- Terdefinisi dengan baik dengan komponen yang terkontrol, tidak seperti sistem berbasis sel
- Memiliki fungsi optimisasi yang jelas: DNA sirkular yang dapat ditransformasikan yang dibuat dari jumlah tetap input DNA linier
- Siklus eksperimen yang relatif cepat (1-2 hari)
- Ruang desain berdimensi tinggi yang memerlukan penalaran mekanistik untuk meningkatkan: larutan penyangga, reagen, dan suhu optimal yang semuanya saling bergantung.
Kami menggunakan HiFi assembly(terbuka di jendela baru), sebuah sistem enzim milik New England Biolabs yang dikembangkan berdasarkan Gibson assembly, sebagai titik awal optimisasi. Kami mengeksplorasi apakah AI dapat berinovasi dan belajar dari umpan balik eksperimen setelah batasan satu langkah dan isotermal dihilangkan, sehingga dapat mengidentifikasi perbaikan protokol dalam skenario ini.
Secara khusus, kami melakukan reaksi kloning dua fragmen menggunakan gen untuk protein fluoresen hijau (GFP) dan plasmid pUC19 yang banyak digunakan, sebuah “kendaraan” DNA standar yang digunakan untuk membawa gen ke dalam bakteri agar dapat diperbanyak. Tujuannya adalah untuk meningkatkan jumlah koloni yang sukses.
Kami mengoptimalkan reaksi kloning dengan memperkenalkan kerangka evolusioner untuk mengiterasikan usulan, sehingga memungkinkan model belajar secara “online” dari eksperimen-eksperimen sebelumnya. Dalam setiap putaran, GPT‑5 mengusulkan serangkaian 8-10 reaksi berbeda, dengan reaksi yang ditunda ke putaran berikutnya jika memerlukan reagen khusus yang tidak tersedia di laboratorium. Para ilmuwan manusia kemudian melakukan reaksi dan mengukur jumlah koloni relatif terhadap HiFi garis dasar Gibson assembly dalam skrining awal. Data dengan kinerja terbaik dari putaran sebelumnya kemudian dimasukkan ke putaran selanjutnya. Yang terpenting, prompting distandardisasi tanpa input manusia selain pertanyaan klarifikasi, sehingga kami dapat mengatribusikan wawasan mekanistik baru secara langsung kepada AI, bukan pada panduan manusia.
Kami menguji ulang delapan reaksi teratas dari seri optimisasi penuh menggunakan rentang pengenceran DNA yang lebih luas, dan menemukan bahwa banyak yang menunjukkan efek lebih kecil dibandingkan dengan skrining awal; pada akhirnya, kandidat terkuat yang divalidasi adalah reaksi dari putaran ke-5 yang mereproduksi kinerja aslinya. Banyak reaksi dengan kinerja tinggi termasuk dalam keluarga ligase-polish, yang tampaknya sangat sensitif terhadap variasi kecil pada kondisi sel kompeten dan/atau penanganan DNA pascareaksi. Karena reaksi-reaksi ini menggunakan langkah HiFi yang singkat, kami berhipotesis bahwa banyak produk kemungkinan masuk ke dalam E. coli dengan hanya satu sambungan yang tertutup dan yang lainnya tertahan oleh penempelan (annealing), sehingga perbaikan selanjutnya diserahkan pada jalur perbaikan seluler. Hal ini membuat varians tinggi dan dinamika 'jackpot': meskipun sebagian besar waktu varian dari reaksi ini tidak unggul, satu outlier yang kuat dapat membawa keluarganya ke putaran berikutnya.
Meskipun kami memfokuskan diri pada optimisasi reaksi kloning melalui beberapa putaran karena kompleksitas mekanistiknya, secara paralel kami mengoptimalkan prosedur transformasi menggunakan satu putaran “sekali jalan” di mana model mengusulkan banyak perubahan independen, dan kami memilih reaksi dengan kinerja terbaik.
Skrining optimisasi awal dari alur kerja kloning dua langkah: perakitan enzimatik dan transformasi. (Kiri) optimisasi iteratif dari perakitan enzimatik selama lima putaran (44 reaksi total). Dimulai dari garis dasar perakitan HiFi, GPT‑5 mengusulkan 8-10 varian protokol perakitan per putaran; data dari hasil berkinerja terbaik dimasukkan ke dalam prompt berikutnya. Pada setiap putaran, kami memplot reaksi dengan performa terbaik sejauh ini (termasuk putaran-putaran sebelumnya). (Kanan) Optimalisasi sekali jalan dari kondisi transformasi yang menguji 13 protokol berbeda. Untuk kedua skrining optimisasi, data mewakili pengukuran tunggal (n=1) per kondisi; validasi yang direplikasi dilakukan secara terpisah untuk kandidat teratas.
Dengan menggunakan prompt yang distandarisasi tanpa input manusia, GPT5 meningkatkan efisiensi kloning dari awal hingga akhir sebanyak 79 kali lipat, yang dikonfirmasi di seluruh replikasi eksperimental.
Secara khusus, model tersebut mengusulkan prosedur enzimatik baru yang disebut RecA-Assisted Pair-and-Finish HiFi Assembly (RAPF-HiFi), yang menambahkan dua protein baru ke dalam reaksi: rekombinase RecA dari E. coli, dan protein pengikat DNA untai tunggal gen 32 dari fag T4 (gp32). Lebih lanjut, model membuat modifikasi yang disengaja pada suhu dan waktu inkubasi, serta waktu penambahan enzim: model ini mengusulkan untuk menambahkan RecA dan gp32 setelah reaksi HiFi awal pada suhu 50°C, membiarkan protein ini bekerja pada suhu 37°C, dan kemudian kembali ke 50°C untuk menyelesaikan assembly. Secara keseluruhan, modifikasi baru ini meningkatkan efisiensi lebih dari 2,5 kali lipat. Perlu dicatat bahwa ini mewakili kinerja awal tanpa optimisasi iteratif dari kondisi dan waktu reaksi.
Di sisi transformasi, modifikasi yang paling efektif ternyata sangat sederhana: mempeletkan sel (memutarnya dalam sentrifuge sehingga mereka terkumpul di dasar tabung), hapus setengah dari volume yang disediakan, dan mensuspensikan kembali sel sebelum menambahkan DNA, semuanya pada suhu 4°C. Meskipun sel yang secara kimiawi kompeten dengan efisiensi tinggi biasanya dianggap rapuh, sel-sel tersebut dapat mentoleransi konsentrasi dengan baik dan peningkatan tumbukan molekuler secara signifikan meningkatkan efisiensi transformasi (>30 kali lipat pada validasi akhir).

T5 eksonuklease membuat ujung 3′ yang menonjol yang distabilkan oleh gp32 dengan menekan struktur sekunder. RecA kemudian menginvasi dari ujung 3′, menggantikan gp32 dan mendorong pencarian homologi dan penyambungan. Pemanasan hingga 50 °C menghilangkan kedua protein, memungkinkan pengisian celah polimerase dan ligasi.
Gibson assembly bekerja dengan menyediakan potongan DNA yang memiliki ujung “lengket” yang saling cocok, sehingga potongan-potongan tersebut dapat saling menemukan dan bergabung. Reaksi ini menggunakan dua enzim yang berbeda (polimerase dan ligase) untuk menyegel potongan-potongan yang digabungkan. Dalam RAPF-HiFi, dua protein diperkenalkan untuk membuat tahap pencocokan berjalan lebih baik. Yang pertama, gp32, berfungsi seperti sisir yang merapikan dan mengurai ujung-ujung DNA yang longgar. Yang kedua, RecA, berfungsi seperti pemandu yang mencari pasangan yang tepat untuk setiap untai dan menarik bagian yang cocok bersama-sama. Suhu yang lebih tinggi menyebabkan kedua pembantu terlepas dari DNA, memungkinkan enzim Gibson yang normal untuk menyelesaikan reaksi.
Singkatnya, kami berhipotesis bahwa peningkatan kinerja dimediasi melalui mekanisme berikut:
- Gp32 melapisi ujung DNA untai tunggal (ssDNA) yang belum menempel, sehingga menghilangkan struktur sekunder
- RecA, yang biasanya dihambat oleh struktur, menginvasi dari 3’ dan menggantikan filamen gp32
- RecA memediasi pencarian homologi ssDNA:ssDNA(terbuka di jendela baru), mendorong penyatuan
- Kembalinya suhu ke 50°C akan menggantikan filamen RecA dan gp32, sehingga memungkinkan polimerase dan ligase menyelesaikan reaksi.
Untuk menguji apakah enzim baru tersebut berfungsi, dan untuk memastikan bahwa peningkatan kinerja tidak semata-mata disebabkan oleh perubahan pada langkah termal atau larutan penyangga, kami menguji kinerja RAPF-HiFi tanpa RecA, dan tanpa RecA serta gp32. Kinerja kedua reaksi berkurang dibandingkan dengan RAPF-HiFi, menunjukkan bahwa kedua protein diperlukan untuk mekanisme tindakan RAPF-HiFi.
Untuk menguji mekanisme yang mendasarinya, kami memisahkan dua enzim baru dalam reaksi: RecA dan gp32. Kami menunjukkan bahwa salah satu dari ini saja mengurangi efisiensi relatif terhadap HiFi garis dasar. Ketika bersama, mereka mengungguli garis dasar dengan peningkatan efisiensi 2,6 kali. (Batang kesalahan: SD dari n=3 eksperimen independen)
Pengembangan RAPF-HiFi menunjukkan bahwa GPT‑5 mampu melakukan penalaran yang kompleks dan multi-dimensi:
- RecA dihambat oleh struktur DNA(terbuka di jendela baru), dan penting untuk dicatat bahwa model ini memperkenalkan dua modifikasi sinergis sekaligus: menambahkan RecA, dan melengkapinya dengan gp32 untuk menghilangkan struktur sekunder DNA.
- Pasangan alami untuk RecA E. coli adalah protein pengikat untai tunggal E. coli (SSB). SSB menjalankan peran yang serupa dengan gp32 selama replikasi, rekombinasi, dan perbaikan genom. Namun, E. coli SSB tidak terlepas secara spontan dari DNA dengan cukup cepat untuk pertumbuhan filamen RecA, sementara kompleks RecFOR mempromosikan nukleasi RecA pada filamen SSB in vivo(terbuka di jendela baru). SSB mengikat sebagai tetramer stabil dengan laju lepas yang sangat lambat(terbuka di jendela baru). Sebaliknya, filamen gp32 lebih dinamis(terbuka di jendela baru), memungkinkan pemindahan RecA.
Sejauh yang kami ketahui, RecA dan gp32 belum pernah digunakan secara fungsional bersama dalam metode biologi molekuler. Seperti banyak teknik biologi molekuler baru, aktivitas biokimia yang mendasarinya sudah dipelajari, tetapi penggunaannya sebagai metode praktis dan yang dapat digeneralisasi merupakan kemajuan.
Sebagai contoh, interaksi antara RecA dan gp32 telah dipelajari dalam uji rekonstitusi mekanistik in vitro: dalam studi pembentukan D loop, gp32 terbukti(terbuka di jendela baru) mampu meningkatkan aktivitas RecA. Gp32 telah digunakan bersama dengan pasangan rekombinase alami T4, UvsX, dan faktor pemuatan rekombinase uvsY dalam recombinase polymerase amplification (RPA)(terbuka di jendela baru). Meskipun spesifikasi paten RPA menyatakan(terbuka di jendela baru) bahwa reaksi RPA yang efektif telah didemonstrasikan menggunakanRecA E. coli dalam sistem heterolog dengan protein gp32 yang telah dimodifikasi (yaitu, direkayasa, bukan tipe liar), pernyataan ini hanya muncul sebagai tambahan dalam beberapa pengungkapan paten dan, sejauh pengetahuan kami, belum didukung oleh data yang dipublikasikan atau diadopsi sebagai sistem RPA berbasis RecA yang kuat. Salah satu metode kloning yang disebut SLiCE(terbuka di jendela baru) menggunakan ekstrak sel utuh dari E. coli yang mengandung sistem rekombinasi λ Red, di mana Red beta dapat menjalankan peran ganda sebagai protein pengikat DNA dan rekombinase (meskipun kami secara eksplisit melarang penggunaan ekstrak sel dalam prompt kami). Dalam aplikasi yang berbeda, Ferrin & Camerini-Otero(terbuka di jendela baru) menggunakan RecA saja untuk menangkap molekul DNA secara selektif berdasarkan urutan yang cocok. Secara terpisah, gp32 telah digunakan sebagai aditif(terbuka di jendela baru) dalam proses amplifikasi DNA yang disebut PCR untuk mengurangi struktur sekunder. Amplifikasi NABSA terbukti(terbuka di jendela baru) dapat ditingkatkan oleh RecA dan gp32, meskipun masing-masing dapat meningkatkan reaksi secara terpisah dan tidak ada sinergi yang teridentifikasi. Secara lebih luas, perbaikan yang dilaporkan pada reaksi perakitan DNA gaya Gibson dasar jarang terjadi, dengan contoh paling menonjol adalah protein pengikat DNA tahan panas (ET SSB) yang meningkatkan efisiensi perakitan sekitar 2,5 kali lipat(terbuka di jendela baru).
Untuk sebagian besar aplikasi, kami tidak mengharapkan RAPF-HiFi dapat menyaingi kesederhanaan dan ketahanan dari kloning HiFi/Gibson. Namun, munculnya jalur perakitan yang secara mekanisme berbeda patut diperhatikan: GPT‑5 menghasilkan solusi yang menggabungkan kombinasi protein rekombinasi dan dinamika reaksi yang belum familiar. Mekanisme yang mendasari mungkin terbukti modular, menyediakan komponen yang dapat digunakan kembali atau dikombinasikan ulang dalam alur kerja molekuler lainnya. Kami juga terus mengeksplorasi perbaikan pada RAPF-HiFi. Suhu reaksi dan durasi langkah dapat disesuaikan untuk menyeimbangkan aktivitas RecA dan gp32 terhadap pencernaan berlebih oleh eksonuklease, dan jumlah kedua protein tersebut masih perlu dioptimalkan. GPT‑5 juga telah mengusulkan varian RecA yang hiperaktif, yang saat ini sedang kami murnikan.
Sehubungan dengan protokol transformasi, kondisi optimisasi yang berhasil mencakup berbagai aditif dan gangguan termal yang dimaksudkan untuk meningkatkan efisiensi heat-shock dari 10-beta competent cells(terbuka di jendela baru) komersial. Dari 13 transformasi sekali jalan yang dibuat oleh AI yang telah diuji, modifikasi yang paling efektif, Transformasi 7 (T7), memadatkan sel, menghapus setengah dari volume yang disediakan, dan mensuspensi ulang sel sebelum menambahkan DNA, semuanya pada suhu 4°C. Sel-sel kompeten kimiawi dengan efisiensi tinggi biasanya dianggap rapuh, dan langkah-langkah penanganan semacam itu umumnya dihindari. Meskipun demikian, sel-sel menoleransi konsentrasi dengan baik. Efek gabungan dari peningkatan paparan DNA per sel dan pengurangan buffer penghambat yang menyebabkan kejutan panas yang lebih tajam menghasilkan peningkatan efisiensi transformasi yang substansial (>30 kali lipat).
Protokol transformasi ini baru, meskipun secara konseptual pendekatan yang serupa(terbuka di jendela baru) di mana sel-sel dikonsentrasikan pada langkah sebelumnya telah dilaporkan. Perlu dicatat, metode yang dikembangkan di sini oleh GPT‑5 kompatibel dengan sel-sel kompeten kimia siap pakai, menghilangkan kebutuhan untuk menyiapkan sel di laboratorium, sekaligus melampaui peningkatan efisiensi yang dilaporkan dari pendekatan serupa pada strain sel yang sebanding.
Untuk meningkatkan throughput sistem model eksperimental ini, Robot on Rails dan Red Queen Bio berkolaborasi untuk membangun sistem robotik yang menerima protokol kloning dalam bahasa alami dan menjalankannya di laboratorium basah.
Sistem ini menggabungkan tiga komponen: 1) LLM manusia-ke-robot yang mengubah bahasa Inggris biasa menjadi tindakan robot; 2) sistem penglihatan yang mengidentifikasi dan melokalisasi peralatan laboratorium secara real-time; dan 3) perencana jalur robotik yang menentukan cara melaksanakan setiap tindakan dengan aman dan akurat. Hasilnya adalah robot laboratorium yang fleksibel dan umum yang dioptimalkan lebih lanjut untuk varian dari protokol kloning Gibson.
Kami menguji apakah robot otonom dapat melaksanakan eksperimen kloning lengkap dengan menjalankan dua protokol secara bersamaan: metode HiFi standar dan R8, protokol yang dimodifikasi AI dengan kinerja terbaik dari putaran optimisasi pertama.
Kami membandingkan pekerjaan robot dengan eksperimen yang dilakukan oleh manusia pada setiap langkah. Robot tersebut berhasil menangani proses transformasi, yang memerlukan berbagai operasi fisik: transfer dan mencampur cairan, memindahkan tabung sampel, menerapkan panas terkontrol pada sel, dan menyebarkan sel ke piring petri. Jika dibandingkan langsung dengan transformasi yang dilakukan manusia, robot tersebut menghasilkan data dengan kualitas serupa dan peningkatan yang setara dibandingkan garis dasar, menunjukkan potensi awal untuk mengotomatisasi dan mempercepat optimisasi eksperimen biologis.
Meskipun perubahan lipatan antara eksperimen robot dan manusia serupa, jumlah koloni absolut dari robot sekitar sepuluh kali lebih rendah daripada eksekusi manual, menunjukkan area untuk perbaikan seperti presisi penanganan cairan, kalibrasi kontrol suhu, dan mereplikasi nuansa teknik penanganan sel secara manual.
Baik metode HiFi standar (garis dasar) maupun metode R8 yang ditingkatkan dilaksanakan oleh peneliti manusia dan robot otonom, dengan efisiensi transformasi dinormalisasi terhadap kontrol HiFi garis dasar masing-masing (ditetapkan pada 1,0). R8 yang dijalankan oleh manusia menunjukkan peningkatan 2,39 kali lipat; R8 yang dijalankan oleh robot mencapai peningkatan 2,13 kali lipat (89% dari kinerja manusia), menunjukkan peringkat protokol yang sebanding meskipun hasil absolutnya lebih rendah.
Kami percaya bahwa eksperimen ini memberikan gambaran sekilas tentang seperti apa sains yang dipercepat AI di masa depan: model yang terus belajar dan berinteraksi dengan dunia nyata. Meskipun eksperimen kami meniadakan intervensi manusia untuk secara penuh mengukur kemampuan model, kami sangat menantikan AI membantu ilmuwan manusia merancang eksperimen dan berkontribusi pada terobosan dalam penelitian.
Sambil berupaya mempercepat kemajuan ilmiah secara aman dan bertanggung jawab, kami juga berusaha mengevaluasi dan mengurangi risiko, terutama yang terkait dengan biosekuriti. Hasil evaluasi ini menunjukkan bahwa model dapat melakukan penalaran di laboratorium basah untuk meningkatkan protokol, dan mungkin memiliki implikasi untuk biosekuriti seperti yang dijelaskan dalam Kerangka Kerja Kesiapan(terbuka di jendela baru) kami. Kami berkomitmen untuk membangun perlindungan yang diperlukan dan bernuansa pada tingkat model dan sistem untuk mengurangi risiko ini, serta mengembangkan evaluasi untuk melacak tingkat saat ini.


