Βελτίωση της νοημοσύνης υγείας στο ChatGPT
Το GPT‑5.5 Instant φέρνει προηγμένη νοημοσύνη υγείας σε περισσότερους ανθρώπους, μέσα από βελτιώσεις στα μοντέλα μας και αξιολόγηση με επικεφαλής γιατρούς.
Η υγεία είναι ένας από τους πιο ουσιαστικούς τρόπους με τους οποίους οι άνθρωποι χρησιμοποιούν το ChatGPT. Κάθε εβδομάδα, περισσότεροι από 230 εκατομμύρια άνθρωποι στρέφονται στο ChatGPT για βοήθεια σε ερωτήματα υγείας και ευεξίας: για να κατανοήσουν πληροφορίες υγείας, να ερμηνεύσουν εργαστηριακά αποτελέσματα, να προετοιμαστούν για ραντεβού, να διαχειριστούν θέματα ασφάλισης, να χτίσουν πιο υγιεινές συνήθειες και να αποφασίσουν τι πρέπει να ρωτήσουν στη συνέχεια.
Με το GPT‑5.5 Instant, βλέπουμε ένα σημαντικό βήμα προόδου στον τρόπο με τον οποίο το μοντέλο χειρίζεται ερωτήματα υγείας, με βελτιώσεις στην αναγνώριση περιπτώσεων όπου μπορεί να χρειάζεται επείγουσα φροντίδα, στην αναζήτηση σχετικού πλαισίου, στην εξήγηση της αβεβαιότητας και στην απλούστευση σύνθετων πληροφοριών. Στις πιο απαιτητικές αξιολογήσεις μας για την υγεία, το GPT‑5.5 Instant αποδίδει πλέον σε επίπεδο συγκρίσιμο με τα πρωτοποριακά μοντέλα Thinking μας. Επειδή είναι διαθέσιμο στους δωρεάν χρήστες του ChatGPT, περισσότεροι άνθρωποι μπορούν να επωφεληθούν από αυτές τις βελτιώσεις. Αυτό μπορεί να σημαίνει πληροφορίες υγείας που γίνονται πιο κατανοητές, καλύτερες ερωτήσεις και σαφή επόμενα βήματα.
Αυτή η πρόοδος αντανακλά τόσο τις εξελίξεις στις δυνατότητες των μοντέλων όσο και το έργο υπό την καθοδήγηση γιατρών που βρίσκεται πίσω από τις αξιολογήσεις μας για την υγεία. Σε όλες μας τις προσπάθειες, ένα παγκόσμιο δίκτυο γιατρών συμβάλλει στον ορισμό του πώς μοιάζει το «καλό» σε πραγματικές καταστάσεις υγείας, εξετάζοντας ενδεικτικές αποκρίσεις μοντέλων, περιγράφοντας την ιδανική συμπεριφορά και εντοπίζοντας τρόπους αποτυχίας. Η συνεργασία με γιατρούς μάς δίνει έναν τρόπο να μετράμε την πρόοδο στην υγεία και να βελτιώνουμε με την πάροδο του χρόνου τον τρόπο με τον οποίο απαντά το ChatGPT.
Στην υγεία, πρόοδος σημαίνει παροχή απαντήσεων που είναι ακριβείς, κατανοητές και βασίζονται σε ορθή κρίση: αναγνώριση του πότε χρειάζεται περισσότερο πλαίσιο, εξήγηση της αβεβαιότητας χωρίς υπερβολική αυτοπεποίθηση και βοήθεια στους ανθρώπους να κατανοήσουν πότε πρέπει να αναζητήσουν φροντίδα.
Για να μετρήσουμε αυτή την πρόοδο, χρησιμοποιούμε αξιολογήσεις ειδικά για την υγεία, όπως το HealthBench και το HealthBench Professional. Αυτές οι αξιολογήσεις χρησιμοποιούν ρεαλιστικές συζητήσεις για την υγεία και κριτήρια γραμμένα από γιατρούς για να αξιολογήσουν στοιχεία όπως η ακρίβεια, η ασφάλεια, η επικοινωνία, η επίγνωση του πλαισίου, η πληρότητα και η κατάλληλη κλιμάκωση.
Το GPT‑5.5 Instant φτάνει σε επίδοση στην υγεία παρόμοια με τα πιο πρόσφατα πρωτοποριακά μοντέλα μας σε συγκεντρωτικό σύνολο αξιολογήσεων υγείας, συμπεριλαμβανομένου του HealthBench Professional, βελτιωμένο σημαντικά σε σχέση με το GPT‑5.3 Instant. Το 5.5 Instant (κυκλοφόρησε τον Μάιο του 2026) και το 5.3 Instant (κυκλοφόρησε τον Μάρτιο του 2026) είναι διαθέσιμα σε όλους τους δωρεάν χρήστες του ChatGPT (υπόκεινται σε όρια), ενώ χρησιμοποιούμε την τιμολόγηση API για να υπολογίσουμε το κόστος των 5.4 Thinking και 5.5 Thinking.
Ως άλλη σύγκριση, ζητήσαμε επίσης από γιατρούς να γράψουν απαντήσεις για αντιπροσωπευτικές συζητήσεις υγείας, με απεριόριστο χρόνο και πρόσβαση στο διαδίκτυο (αλλά όχι σε TN). Στη συνέχεια, μια ξεχωριστή ομάδα γιατρών συνέκρινε αυτές τις απαντήσεις των γιατρών με μοντέλα Instant σε βάθος χρόνου, εξετάζοντας χαρακτηριστικά που έχουν σημασία σε πραγματικές αλληλεπιδράσεις, όπως η ακρίβεια, η επικοινωνία, η πληρότητα, η τήρηση οδηγιών και η χρησιμότητα για αποφάσεις υγείας, σε 3500 αξιολογημένες απαντήσεις.
Οι απαντήσεις του GPT‑5.5 Instant βαθμολογήθηκαν υψηλότερα από τις απαντήσεις που γράφτηκαν από γιατρούς και από παλαιότερα μοντέλα σε όλες τις διαστάσεις αυτής της αξιολόγησης.
Οι γιατροί αξιολόγησαν τις απαντήσεις του GPT‑5.5 Instant ως έχουσες λιγότερους τρόπους αποτυχίας σε σχέση με εκείνες παλαιότερων μοντέλων και γιατρών. Για παράδειγμα, το GPT 5.5 Instant είχε λιγότερες περιπτώσεις στις οποίες δεν προσαρμόστηκε στο τοπικό πλαίσιο υγειονομικής περίθαλψης, δεν εντόπισε προειδοποιητικά σημάδια ή ανάγκη παραπομπής σε φροντίδα, ή δεν ζήτησε πρόσθετο πλαίσιο από τον χρήστη όταν χρειαζόταν, τόσο σε σύγκριση με παλαιότερα μοντέλα όσο και με γιατρούς.
Δεδομένης της κλίμακας χρήσης των μοντέλων μας στην υγεία, ένας άλλος τρόπος να κατανοήσουμε τις πρόσφατες βελτιώσεις των μοντέλων είναι να μετρήσουμε την κίνηση παραγωγής. Χρησιμοποιούμε συστήματα παρακολούθησης που προστατεύουν το απόρρητο στην κίνηση παραγωγής, για να εντοπίζουμε πιθανά ζητήματα πραγματολογικής ακρίβειας στις απαντήσεις για την υγεία. Με βάση σύγκριση πρόσφατης κίνησης παραγωγής στην υγεία—δισεκατομμυρίων μηνυμάτων την εβδομάδα—το ποσοστό απαντήσεων με τουλάχιστον ένα επισημασμένο ζήτημα πραγματολογικής ακρίβειας έχει μειωθεί κατά 71% τους τελευταίους δύο μήνες.
Η σύγκριση απαντήσεων από μοντέλα σε διαφορετικές χρονικές στιγμές, σε πραγματικά ερωτήματα υγείας, δείχνει πώς το ChatGPT έχει βελτιωθεί σε τρόπους που έχουν σημασία για την υγεία: αναγνωρίζει πότε μια κατάσταση μπορεί να χρειάζεται επείγουσα προσοχή, χειρίζεται την αβεβαιότητα με καλύτερη κρίση και δίνει στους ανθρώπους σαφέστερη και πιο χρήσιμη καθοδήγηση για το τι να κάνουν στη συνέχεια.
GPT-5.2 Instant
Κάντε κλικ στο όνομα του μοντέλου για να δείτε επιπλέον αποκρίσεις του μοντέλου.
Αυτή η πρόοδος διαμορφώνεται από γιατρούς που μας βοηθούν να ορίζουμε, να μετράμε και να βελτιώνουμε τις απαντήσεις υγείας στο ChatGPT.
Η OpenAI συνεργάζεται με ένα παγκόσμιο δίκτυο άνω των 260 γιατρών σε 60 χώρες, 49 γλώσσες και 26 ιατρικές ειδικότητες. Η ανατροφοδότησή τους διαμορφώνει τον τρόπο με τον οποίο το ChatGPT απαντά σε ερωτήματα υγείας σε ένα ευρύ φάσμα σεναρίων, από καθημερινές ερωτήσεις ευεξίας έως πιο σύνθετες κλινικές καταστάσεις.
Οι γιατροί εξετάζουν ενδεικτικές αποκρίσεις μοντέλων και αξιολογούν αν είναι ακριβείς, σαφείς, πλήρεις, κατάλληλα προσεκτικές και χρήσιμες. Βοηθούν να εντοπιστεί πού μια απάντηση μπορεί να παραλείπει σημαντικό πλαίσιο, πού μπορεί να ακούγεται υπερβολικά βέβαιη, πού θα έπρεπε να είναι πιο σαφής για τα επόμενα βήματα ή να ενθαρρύνει πιο άμεσα κάποιον να αναζητήσει ιατρική φροντίδα.
Μέχρι σήμερα, οι γιατροί έχουν εξετάσει περισσότερες από 700.000 ενδεικτικές αποκρίσεις μοντέλων που αντανακλούν τον τρόπο με τον οποίο κλινικοί και ασθενείς μπορεί να χρησιμοποιούν το ChatGPT στον πραγματικό κόσμο. Κάθε λίγα λεπτά, ένας γιατρός εξετάζει μια νέα απάντηση. Η ανατροφοδότησή τους μετατρέπεται σε κριτήρια και πρότυπα αξιολόγησης που βοηθούν τους ερευνητές να μετρούν αν οι απαντήσεις είναι ακριβείς, ασφαλείς, σαφείς, πλήρεις, κατάλληλα προσεκτικές και χρήσιμες σε πραγματικές καταστάσεις υγείας. Αυτό μας δίνει έναν πιο ξεκάθαρο τρόπο να βλέπουμε πού τα μοντέλα βελτιώνονται και πού χρειάζονται ακόμη δουλειά.
Αυτό το έργο υποστηρίζει επίσης το ευρύτερο έργο της OpenAI στην υγεία, που καλύπτει εργαλεία τα οποία βοηθούν τους ανθρώπους να κατανοούν και να πλοηγούνται καλύτερα στις πληροφορίες υγείας, καθώς και εργαλεία που έχουν δημιουργηθεί για κλινικούς, όπως το ChatGPT για κλινικούς και το OpenAI for Healthcare, τα οποία υποστηρίζουν επαγγελματίες υγείας σε εργασίες όπως η τεκμηρίωση, η έρευνα και η συμβουλευτική φροντίδας.
Η βελτίωση της ανθρώπινης υγείας θα είναι ένας από τους πιο προσωπικούς και απτούς αντίκτυπους της AGI. Καθώς τα μοντέλα μας συνεχίζουν να βελτιώνονται, στόχος μας είναι να κάνουμε το ChatGPT πιο ακριβές, πιο προσεκτικό και πιο χρήσιμο σε αυτές τις στιγμές — και να συνεχίσουμε να φέρνουμε αυτή την πρόοδο σε περισσότερους ανθρώπους.


