Το GPT‑5 μειώνει το κόστος της πρωτεϊνοσύνθεσης χωρίς κύτταρα
Σε συνεργασία με την Ginkgo Bioworks, δημιουργήσαμε ένα αυτόνομο εργαστήριο με τεχνητή νοημοσύνη και επιτύχαμε μείωση 40% στο κόστος παραγωγής πρωτεϊνών.
Έχουμε δει ραγδαία πρόοδο από την ΤΝ σε τομείς όπως τα μαθηματικά και η φυσική, όπου οι ιδέες μπορούν συχνά να αξιολογηθούν χωρίς να αγγίξουν τον υλικό κόσμο. Η βιολογία είναι διαφορετική. Η πρόοδος περνά μέσα από το εργαστήριο, όπου οι επιστήμονες διεξάγουν πειράματα που απαιτούν χρόνο και χρήματα.
Αυτό αρχίζει να αλλάζει. Τα κορυφαία μοντέλα μπορούν πλέον να συνδέονται απευθείας με την αυτοματοποίηση εργαστηρίου, να προτείνουν πειράματα, να τα εκτελούν σε μεγάλη κλίμακα, να μαθαίνουν από τα αποτελέσματα και να αποφασίζουν τι να κάνουν στη συνέχεια. Σε μεγάλο μέρος των βιοεπιστημών, το σημείο συμφόρησης είναι η διορθωτική επανάληψη και τα αυτόνομα εργαστήρια έχουν κατασκευαστεί για να εξαλείψουν αυτόν τον περιορισμό.
Σε προηγούμενη εργασία, δείξαμε ότι το GPT‑5 μπορούσε να βελτιώσει τα πρωτόκολλα υγρού εργαστηρίου μέσω πειραματισμού κλειστού βρόχου. Εδώ, δείχνουμε ότι η ίδια προσέγγιση μπορεί να μειώσει το κόστος παραγωγής πρωτεΐνης.
Συνεργαστήκαμε με την Ginkgo Bioworks(ανοίγει σε νέο παράθυρο) για να συνδέσουμε το GPT‑5 με ένα εργαστήριο στο cloud —ένα αυτοματοποιημένο υγρό εργαστήριο που λειτουργεί εξ αποστάσεως μέσω λογισμικού, όπου ρομπότ εκτελούν πειράματα και επιστρέφουν δεδομένα— και χρησιμοποιήσαμε αυτήν τη διάταξη εργαστηρίου στον βρόχο για να βελτιστοποιήσουμε μια ευρέως χρησιμοποιούμενη βιολογική διαδικασία: τη σύνθεση πρωτεϊνών χωρίς κύτταρα (CFPS). Σε περισσότερους από έξι γύρους πειραματισμού κλειστού βρόχου, το σύστημα δοκίμασε περισσότερες από 36.000 μοναδικές συνθέσεις αντιδράσεων CFPS σε 580 αυτοματοποιημένες πλάκες. Αφού του παρασχέθηκε πρόσβαση σε υπολογιστή, πρόγραμμα περιήγησης στο web και τις σχετικές έρευνες, το GPT‑5 χρειάστηκε τρεις γύρους πειραματισμού για να καθιερώσει ένα νέο πρότυπο οικονομικού CFPS, επιτυγχάνοντας μείωση 40% στο κόστος παραγωγής πρωτεΐνης (και βελτίωση 57% στο κόστος των αντιδραστηρίων), συμπεριλαμβανομένων νέων συνθέσεων αντιδράσεων που είναι πιο ανθεκτικές στις συνθήκες αντίδρασης που είναι συνηθισμένες σε αυτόνομα εργαστήρια.
Η σύνθεση πρωτεϊνών χωρίς κύτταρα (CFPS) είναι μια μέθοδος παραγωγής πρωτεϊνών χωρίς την καλλιέργεια ζωντανών κυττάρων. Αντί να εισάγεται DNA στα κύτταρα και να ακολουθεί αναμονή προκειμένου να παράξουν μια πρωτεΐνη, το CFPS εκτελεί τον μηχανισμό παραγωγής πρωτεϊνών σε ένα ελεγχόμενο μείγμα. Αυτό το καθιστά ένα πρακτικό εργαλείο για ταχεία δημιουργία πρωτοτύπων και δοκιμές, καθώς οι επιστήμονες μπορούν να εκτελούν πολλά πειράματα γρήγορα και να μετρούν τα αποτελέσματα την ίδια ημέρα.
Οι πρωτεΐνες είναι ένα σημαντικό κομμάτι αυτού που προσφέρει η σύγχρονη βιολογία. Πολλά σημαντικά φάρμακα βασίζονται σε πρωτεΐνες. Πολλές διαγνωστικές και ερευνητικές δοκιμασίες εξαρτώνται από πρωτεΐνες. Σε βιομηχανικά περιβάλλοντα, οι πρωτεΐνες λειτουργούν ως ένζυμα που κάνουν τις χημικές διεργασίες πιο καθαρές και πιο αποδοτικές. Οι πρωτεΐνες βρίσκονται ακόμη και στο απορρυπαντικό πλυντηρίου σας. Όταν η παραγωγή πρωτεϊνών γίνεται ταχύτερη και φθηνότερη, οι επιστήμονες μπορούν συνήθως να δοκιμάσουν περισσότερες ιδέες νωρίτερα και να μειώσουν το κόστος μετατροπής της πρώιμης έρευνας σε κάτι από το οποίο οι άνθρωποι μπορούν να επωφεληθούν καθημερινά.
Το CFPS είναι ήδη χρήσιμο για αυτού του είδους τη διορθωτική επανάληψη. Το σημείο συμφόρησης είναι ότι είναι δύσκολο να βελτιστοποιηθεί και γίνεται ακριβό σε μεγάλη κλίμακα.
Η σύνθεση πρωτεϊνών χωρίς κύτταρα απαιτεί πολύπλοκα, αλληλεπιδρώντα συστατικά: το πρότυπο DNA που κωδικοποιεί την πρωτεΐνη που θα παραχθεί, το κυτταρικό λύμα (το «μίγμα» της κυτταρικής μηχανής από το εσωτερικό των κυττάρων) και έναν μεγάλο αριθμό βιοχημικών συστατικών που κυμαίνονται από πηγές ενέργειας έως άλατα. Ο συλλογισμός για το σύστημα συνολικά είναι τρομερά δύσκολος και πολλές(ανοίγει σε νέο παράθυρο) προηγούμενες(ανοίγει σε νέο παράθυρο) μελέτες(ανοίγει σε νέο παράθυρο) έχουν εφαρμόσει διαφορετικούς τύπους μηχανικής μάθησης για να μειώσουν το κόστος παραγωγής πρωτεϊνών.
Οι τυπικές συνθέσεις για σύνθεση πρωτεϊνών χωρίς κύτταρα (CFPS) και τα εμπορικά κιτ συχνά τιμολογούνται για εργασία με ρυθμό ανθρώπου. Τα αυτόνομα εργαστήρια μπορούν να εκτελέσουν χιλιάδες αντιδράσεις σε χρόνο κατά τον οποίο μια ανθρώπινη ομάδα μπορεί να εκτελέσει δεκάδες. Σε αυτή την κλίμακα, ο περιοριστικός παράγοντας είναι το κόστος των αντιδραστηρίων.
Το CFPS είναι επίσης δύσκολο να βελτιστοποιηθεί μόνο με τη διαίσθηση. Είναι ένα μείγμα πολλών αλληλεπιδρώντων στοιχείων. Οι μικρές αλλαγές μπορεί να έχουν σημασία, αλλά η κατεύθυνση της επίδρασης δεν είναι πάντα προφανής, και οι καλύτεροι συνδυασμοί μπορεί να είναι δύσκολο να βρεθούν χωρίς να διεξαχθούν πολλά πειράματα. Οι προηγούμενες προσεγγίσεις έχουν μειώσει το κόστος, αλλά η πρόοδος τείνει να είναι σταδιακή, επειδή η διεξοδική εξερεύνηση του χώρου απαιτεί πολλή εργασία.
Συνδυάσαμε το GPT‑5 με το εργαστήριο cloud της Ginkgo Bioworks για να δημιουργήσουμε ένα αυτόνομο σύστημα κλειστού βρόχου για τη βελτιστοποίηση της σύνθεσης πρωτεϊνών χωρίς κύτταρα (CFPS).
Το GPT‑5 σχεδίασε ομάδες πειραμάτων. Το εργαστήριο τα εκτέλεσε. Τα αποτελέσματα τροφοδοτήθηκαν στο μοντέλο. Το μοντέλο χρησιμοποίησε αυτά τα δεδομένα για να προτείνει τον επόμενο γύρο. Επαναλάβαμε αυτόν τον κύκλο έξι φορές.

Το GPT‑5 σχεδίασε παρτίδες πειραμάτων σε τυπική μορφή πλάκας 384 θέσεων και τις εκτέλεσε στο εργαστήριο cloud της Ginkgo Bioworks. Μόλις ολοκληρώθηκαν τα πειράματα, το εργαστήριο cloud έστειλε τα δεδομένα πίσω στο GPT‑5, όπου το μοντέλο ανέλυσε τα αποτελέσματα, δημιούργησε νέες υποθέσεις και σχεδίασε τον επόμενο γύρο πειραμάτων.
Για να παραμείνει ο κύκλος εστιασμένος σε όσα μπορεί να επιτύχει ένα αυτόνομο εργαστήριο, προσθέσαμε αυστηρή προγραμματική επικύρωση πριν από την εκτέλεση οποιουδήποτε πειράματος. Αυτή η επικύρωση διασφάλιζε ότι τα πειράματα που σχεδιάστηκαν με τεχνητή νοημοσύνη ήταν φυσικά εκτελέσιμα στην πλατφόρμα αυτοματισμού. Απέτρεψε «πειράματα επί χάρτου» που φαίνονται εύλογα στο κείμενο αλλά δεν μπορούν να πραγματοποιηθούν σε μια ρομποτική ροή εργασίας.
Κατά τη διάρκεια ολόκληρης της διαδικασίας, το σύστημα εκτέλεσε πάνω από 36.000 αντιδράσεις CFPS σε 580 αυτοματοποιημένες πλάκες. Αυτή η κλίμακα έχει σημασία, επειδή επιτρέπει την ανάδυση μοτίβων. Στη βιολογία, τα μεμονωμένα πειράματα είναι θορυβώδη. Η ρυθμαπόδοση και η διόρθωση είναι ο τρόπος με τον οποίο εσείς διαχωρίζετε το σήμα από τον τυχαίο θόρυβο. Μόλις το GPT‑5 απέκτησε πρόσβαση στη σχετική εργασία και στα εργαλεία, χρειάστηκαν τρεις γύροι πειραματισμού και δύο μήνες για να καθιερωθεί ένα νέο πρότυπο: 40% χαμηλότερο κόστος παραγωγής πρωτεΐνης σε σύγκριση με το καλύτερο προηγούμενο σημείο αναφοράς(ανοίγει σε νέο παράθυρο).
Τα επαναδιαμορφώσιμα καρότσια αυτοματοποίησης της Ginkgo Bioworks. Πηγή: Ginkgo Bioworks
Διαπιστώσαμε ότι οι βελτιώσεις προήλθαν από τον εντοπισμό συνδυασμών που λειτουργούν καλά μαζί και που αντέχουν στις πραγματικές συνθήκες αυτοματοποίησης υψηλής ρυθμαπόδοσης.
Διαπιστώσαμε ότι το GPT‑5 εντόπισε χαμηλού κόστους συνθέσεις αντιδράσεων που οι άνθρωποι δεν είχαν δοκιμάσει προηγουμένως σε αυτή τη διαμόρφωση. Η σύνθεση πρωτεϊνών χωρίς κύτταρα (CFPS) έχει μελετηθεί για χρόνια, αλλά το περιθώριο πιθανών μειγμάτων παραμένει μεγάλο. Όταν μπορείτε να προτείνετε και να εκτελείτε χιλιάδες συνδυασμούς γρήγορα, μπορείτε να βρείτε λειτουργικές περιοχές που είναι εύκολο να παραβλεφθούν με μια μη αυτόματη ροή εργασίας.
Διαπιστώσαμε επίσης ότι τα πειράματα υψηλής ρυθμαπόδοσης που βασίζονται σε πλάκες συχνά διαφέρουν από τα χειροκίνητα πειράματα σε πάγκο εργαστηρίου. Η οξυγόνωση μπορεί να είναι χαμηλότερη σε μορφές αντίδρασης υψηλής ρυθμαπόδοσης. Η ανάμειξη και η γεωμετρία μπορεί να είναι διαφορετική. Οι περισσότερες αντιδράσεις CFPS παράγουν πολύ περισσότερη πρωτεΐνη σε δοκιμαστικούς σωλήνες απ’ ό,τι σε πλάκες μικροτιτλοδότησης, επειδή οι μεγαλύτερες κλίμακες γενικά συνοδεύονται από μεγαλύτερη διαθεσιμότητα οξυγόνου και καλύτερη ανάμιξη. Στην πραγματικότητα, για αντιδράσεις σε πλάκες χαμηλού όγκου, το GPT‑5 πρότεινε πολλές αντιδράσεις που ξεπέρασαν την προηγούμενη καλύτερη αμέσως μετά την απόκτηση πρόσβασης σε υπολογιστή για ανάλυση δεδομένων και σε πρόγραμμα περιήγησης ιστού για αναζήτηση σχετικών εργασιών. Συνολικά, το GPT‑5 πρότεινε πολλούς συνδυασμούς αντιδραστηρίων που απέδωσαν καλά υπό περιορισμούς υψηλής ρυθμαπόδοσης, συμπεριλαμβανομένων πολλών που είναι πιο ανθεκτικοί σε συνθήκες χαμηλού οξυγόνου, οι οποίες είναι συνηθισμένες σε αυτοματοποιημένα εργαστηριακά περιβάλλοντα.
Επιπλέον, διαπιστώσαμε ότι μικρές αλλαγές στη ρυθμιστική ικανότητα, στα εξαρτήματα ανάκτησης ενέργειας και στις πολυαμίνες είχαν δυσανάλογη επίδραση σε σχέση με το κόστος τους. Αυτές δεν είναι πάντα οι πρώτες παράμετροι στις οποίες καταφεύγουν οι άνθρωποι, αλλά σε υψηλή ρυθμαπόδοση, μετατρέπονται σε ελέγξιμες υποθέσεις αντί για παρασκηνιακές παραδοχές.
Τέλος, η ίδια η δομή κόστους καθόρισε τι είχε σημασία. Στο CFPS, το κόστος πλέον κυριαρχείται από το λύμα και το DNA. Αυτό σημαίνει ότι η απόδοση είναι η στρατηγική με την καλύτερη προοπτική εκμετάλλευσης. Αν μπορείτε να αυξήσετε την παραγωγή πρωτεΐνης ανά μονάδα ακριβού εισαγόμενου, κάνετε ουσιαστική πρόοδο στο κόστος ακόμη και πριν επιδιώξετε οριακές εξοικονομήσεις αλλού.
Κατά τη διάρκεια έξι γύρων αυτόνομων πειραμάτων, το σύστημα βελτίωσε σταθερά τη σύνθεση πρωτεϊνών χωρίς κύτταρα, μειώνοντας το κόστος και αυξάνοντας την απόδοση πρωτεϊνών. Τα αποτελέσματα εμφανίζονται ως κόστος αντίδρασης έναντι τίτλου πρωτεΐνης για κάθε γύρο, με τους καλύτερους συμβιβασμούς να σχηματίζουν ένα κορυφαίο όριο. Τα μεγαλύτερα σημεία επισημαίνουν το χαμηλότερο κόστος ανά γραμμάριο που επιτεύχθηκε σε κάθε γύρο, και η αναφορά με αστέρι/διακεκομμένη γραμμή υποδεικνύει τον προηγούμενο δείκτη αναφοράς κορυφαίου επιπέδου σε πλάκες 384 θέσεων (Olsen et al., 2025). Μια πιο προσεκτική ματιά στους μεταγενέστερους γύρους αναδεικνύει τα τελικά κέρδη, ενώ μια σύνοψη ανά γύρο δείχνει ότι το καλύτερο κόστος ανά γραμμάριο μειώνεται με την πάροδο του χρόνου.
Αυτά τα αποτελέσματα επιδείχθηκαν σε μία πρωτεΐνη, την sfGFP, και σε ένα σύστημα σύνθεσης πρωτεϊνών χωρίς κύτταρα (CFPS). Η γενίκευση σε άλλες πρωτεΐνες και άλλα συστήματα CFPS δεν έχει αποδειχθεί ακόμη.
Η οξυγόνωση και η γεωμετρία της αντίδρασης μπορούν να επηρεάσουν έντονα τις αποδόσεις, και αυτοί οι παράγοντες μπορεί να διαφέρουν μεταξύ κλιμάκων. Ορισμένες βελτιώσεις μπορεί να εξαρτώνται σε μεγάλο βαθμό από αυτές τις συνθήκες, και η κατανόηση αυτών των εξαρτήσεων είναι μέρος του τι ακολουθεί.
Απαιτήθηκε ανθρώπινη επίβλεψη για βελτιώσεις του πρωτοκόλλου και τη διαχείριση αντιδραστηρίων. Το σύστημα μπορεί να σχεδιάζει και να ερμηνεύει πειράματα, αλλά η εργαστηριακή εργασία εξακολουθεί να περιλαμβάνει πρακτικές λεπτομέρειες που απαιτούν έμπειρους εκπροσώπους.
Σχεδιάζουμε να εφαρμόσουμε βελτιστοποίηση με τη μέθοδο lab-in-the-loop σε άλλες ροές βιολογικής εργασίας, όπου η ταχύτερη υλοποίηση με διορθωτικές κινήσεις μπορεί να επιταχύνει την πρόοδο. Βλέπουμε τα αυτόνομα εργαστήρια ως συμπληρωματικά προς τα μοντέλα. Τα μοντέλα μπορούν να δημιουργούν σχέδια, αλλά τελικά η βιολογία εξακολουθεί να απαιτεί δοκιμές και επαναλήψεις. Το να κλείνετε τον κύκλο μεταξύ δημιουργίας και πειραματισμού είναι ο τρόπος με τον οποίο μετατρέπετε υποσχόμενες ιδέες σε λειτουργικά αποτελέσματα.
Καθώς εργαζόμαστε για την ασφαλή και υπεύθυνη επιτάχυνση της επιστημονικής προόδου, επιδιώκουμε επίσης να αξιολογούμε και να μειώνουμε τους κινδύνους, ιδιαίτερα εκείνους που σχετίζονται με τη βιοασφάλεια. Αυτά τα αποτελέσματα δείχνουν ότι τα μοντέλα μπορούν να συλλογίζονται στο υγρό εργαστήριο για να βελτιώνουν πρωτόκολλα και ενδέχεται να έχουν επιπτώσεις στη βιοασφάλεια, τις οποίες αξιολογούμε και μετριάζουμε μέσω του Πλαισίου Ετοιμότητας. Δεσμευόμαστε να αναπτύξουμε τις απαραίτητες και λεπτομερώς στοχευμένες δικλίδες ασφαλείας σε επίπεδο μοντέλου και συστήματος για τη μείωση αυτών των κινδύνων, καθώς και να αναπτύξουμε αξιολογήσεις που θα παρακολουθούν τα τρέχοντα επίπεδα.
Είμαστε ευγνώμονες προς τους συνεργάτες μας στη Ginkgo Bioworks και τις ομάδες που συνέβαλαν στον σχεδιασμό, τη λειτουργία και την υποστήριξη του αυτοματοποιημένου εργαστηρίου cloud που υποστηρίζει αυτή την εργασία.


