Παρουσίαση της έρευνας σε βάθος
Ένας πράκτορας που χρησιμοποιεί συλλογιστική για να συνθέτει μεγάλο όγκο διαδικτυακών πληροφοριών και να ολοκληρώνει ερευνητικές εργασίες πολλαπλών βημάτων για λογαριασμό σας. Διατίθεται σήμερα στους χρήστες Pro και ακολουθούν οι χρήστες Plus και Team.
Ενημέρωση 10 Φεβρουαρίου 2026: Μπορείτε πλέον να συνδέσετε την έρευνα σε βάθος με οποιοδήποτε MCP ή εφαρμογή και να περιορίσετε τις αναζητήσεις στο web σε αξιόπιστους ιστότοπους, ώστε να εστιάζετε σε επαληθευμένες πηγές σύμφωνες με τα πρότυπα του εκάστοτε κλάδου. Μπορείτε επίσης πλέον να παρακολουθείτε την πρόοδο σε πραγματικό χρόνο και να διακόπτετε για να βελτιώνετε με διευκρινιστικές προτροπές ή νέες πηγές. Έχουμε ενημερώσει την οπτική εμπειρία ώστε να είναι πιο εύκολο να ξεκινήσετε, να παρακολουθείτε και να ελέγχετε την έρευνά σας από την αρχή μέχρι το τέλος.
Ενημέρωση 17 Ιουλίου 2025: Η έρευνα σε βάθος μπορεί πλέον να επεκταθεί ακόμη περισσότερο και να διευρυνθεί με πρόσβαση σε ένα οπτικό πρόγραμμα περιήγησης ως μέρος του πράκτορα ChatGPT. Για να αποκτήσετε πρόσβαση σε αυτές τις ενημερωμένες δυνατότητες, απλώς επιλέξτε «λειτουργία πράκτορα» από το αναπτυσσόμενο μενού στο εργαλείο σύνθεσης και εισαγάγετε απευθείας το ερώτημά σας. Η αρχική λειτουργικότητα της έρευνας σε βάθος παραμένει διαθέσιμη μέσω της επιλογής «έρευνα σε βάθος» στο μενού εργαλείων.
Ενημέρωση 24 Απριλίου 2025: Αυξάνουμε σημαντικά τη συχνότητα χρήσης της έρευνας σε βάθος—Επίσης, οι χρήστες Plus, Team, Enterprise και Edu λαμβάνουν πλέον 25 ερωτήματα ανά μήνα, οι χρήστες Pro λαμβάνουν 250 και οι χρήστες Free λαμβάνουν 5. Αυτό καθίσταται δυνατό μέσω μιας νέας ελαφριάς έκδοσης της έρευνας σε βάθος που υποστηρίζεται από μια έκδοση του o4-mini, σχεδιασμένη να είναι πιο οικονομική, διατηρώντας παράλληλα υψηλή ποιότητα. Μόλις φτάσετε το όριο για την πλήρη έκδοση, τα ερωτήματά σας θα μεταβαίνουν αυτόματα στην ελαφριά έκδοση.
Ενημέρωση 25 Φεβρουαρίου 2025: Όλοι οι χρήστες Plus μπορούν τώρα να χρησιμοποιούν έρευνα σε βάθος.
Ενημέρωση 5 Φεβρουαρίου 2025: Η έρευνα σε βάθος είναι πλέον διαθέσιμη σε χρήστες Pro στο Ηνωμένο Βασίλειο, την Ελβετία και τον Ευρωπαϊκό Οικονομικό Χώρο.
Σήμερα κυκλοφορούμε την έρευνα στο βάθος στο ChatGPT, μία νέα πρακτορική ικανότητα, η οποία πραγματοποιεί διαδικτυακή έρευνα πολλαπλών βημάτων για πολύπλοκες εργασίες. Καταφέρνει σε λίγα λεπτά αυτό για το οποίο ένας άνθρωπος θα χρειαζόταν πολλές ώρες.
Η έρευνα σε βάθος αποτελεί τον νέο πράκτορα του OpenAI που μπορεί να δουλέψει ανεξάρτητα για λογαριασμό σας. Απλώς του δίνετε μια προτροπή και το ChatGPT θα βρει, θα αναλύσει και θα συνθέσει εκατοντάδες διαδικτυακές πηγές για να συντάξει μία συνολική αναφορά σε επίπεδο ερευνητικού αναλυτή. Υποστηριζόμενο από μια έκδοση του επερχόμενου μοντέλου OpenAI o3 που είναι βελτιστοποιημένη για περιήγηση στο διαδίκτυο και ανάλυση δεδομένων, αξιοποιεί τη συλλογιστική για την αναζήτηση, την ερμηνεία και την ανάλυση τεράστιων ποσοτήτων κειμένου, εικόνων και PDF στο διαδίκτυο, προσαρμόζοντας το σύστημα σε συγκεκριμένες ανάγκες, ανάλογα με τις πληροφορίες που συναντά.
Η ικανότητα σύνθεσης γνώσης αποτελεί προϋπόθεση για τη δημιουργία νέας γνώσης. Για αυτόν τον λόγο, η έρευνα σε βάθος σηματοδοτεί ένα μεγάλο βήμα προς τον ευρύτερο στόχο μας για την ανάπτυξη της Γενικής Τεχνητής Νοημοσύνης (AGI), την οποία έχουμε οραματιστεί εδώ και καιρό ως ικανή να παράγει νέα επιστημονική έρευνα.
Deep research is built for people who do intensive knowledge work in areas like finance, science, policy, and engineering and need thorough, precise, and reliable research. It can be equally useful for discerning shoppers looking for hyper-personalized recommendations on purchases that typically require careful research, like cars, appliances, and furniture. Every output is fully documented, with clear citations and a summary of its thinking, making it easy to reference and verify the information. It is particularly effective at finding niche, non-intuitive information that would require browsing numerous websites. Deep research frees up valuable time by allowing you to offload and expedite complex, time-intensive web research with just one query.
Deep research independently discovers, reasons about, and consolidates insights from across the web. To accomplish this, it was trained on real-world tasks requiring browser and Python tool use, using the same reinforcement learning methods behind OpenAI o1, our first reasoning model. While o1 demonstrates impressive capabilities in coding, math, and other technical domains, many real-world challenges demand extensive context and information gathering from diverse online sources. Deep research builds on these reasoning capabilities to bridge that gap, allowing it to take on the types of problems people face in work and everyday life.
In ChatGPT, select ‘deep research’ in the message composer and enter your query. Tell ChatGPT what you need—whether it’s a competitive analysis on streaming platforms or a personalized report on the best commuter bike. You can attach files or spreadsheets to add context to your question. Once it starts running, a sidebar appears with a summary of the steps taken and sources used.
Deep research may take anywhere from 5 to 30 minutes to complete its work, taking the time needed to dive deep into the web. In the meantime, you can step away or work on other tasks—you’ll get a notification once the research is complete. The final output arrives as a report within the chat – in the next few weeks, we will also be adding embedded images, data visualizations, and other analytic outputs in these reports for additional clarity and context.
Compared to deep research, GPT‑4o is ideal for real-time, multimodal conversations. For multi-faceted, domain-specific inquiries where depth and detail are critical, deep research’s ability to conduct extensive exploration and cite each claim is the difference between a quick summary and a well-documented, verified answer that can be usable as a work product.
GPT-4o
Deep research
Deep research responds to the prompt in a highly detailed manner, providing side-by-side country-specific data for both top 10 developed and top 10 developing countries for easy reference and comparison. It uses that information to offer detailed market-entry recommendations that are informed and usable.
Η έρευνα σε βάθος εκπαιδεύτηκε χρησιμοποιώντας ενισχυτική μάθηση από άκρο σε άκρο σε δύσκολες εργασίες περιήγησης και συλλογισμού σε μια σειρά τομέων. Μέσω αυτής της εκπαίδευσης, έμαθε να δημιουργεί και να εκτελεί ένα πρόγραμμα πολλαπλών βημάτων για να βρει τα δεδομένα που χρειάζεται, να παρακολουθεί και να αντιδρά σε πληροφορίες σε πραγματικό χρόνο όπου είναι απαραίτητο. Το μοντέλο είναι επίσης σε θέση να περιηγηθεί σε αρχεία που έχουν ανεβάσει οι χρήστες, να σχεδιάσει και να επαναλάβει γραφήματα χρησιμοποιώντας το εργαλείο python, να ενσωματώσει γραφήματα και εικόνες που δημιουργούνται από ιστότοπους στις απαντήσεις του και να αναφέρει συγκεκριμένες προτάσεις ή αποσπάσματα από τις πηγές του. Ως αποτέλεσμα αυτής της εκπαίδευσης, φτάνει σε νέα υψηλά επίπεδα σε μια σειρά δημόσιων αξιολογήσεων που επικεντρώνονται σε προβλήματα του πραγματικού κόσμου.
Στην πρόσφατη αξιολόγηση Humanity's Last Exam(ανοίγει σε νέο παράθυρο) που δοκιμάζει την Τεχνητή Νοημοσύνη σε ένα ευρύ φάσμα θεμάτων με ερωτήσεις σε επίπεδο ειδικού, το μοντέλο που υποστηρίζει την έρευνα σε βάθος σημείωσε νέα κορυφαία επίδοση καθώς είχε ακρίβεια 26,6%. Αυτή η δοκιμή περιλαμβάνει περισσότερες από 3.000 ερωτήσεις πολλαπλής επιλογής και σύντομης απάντησης, σε περισσότερα από 100 θέματα από τη γλωσσολογία έως την επιστήμη των πυραύλων και από την κλασική φιλολογία έως την οικολογία. Σε σύγκριση με το OpenAI o1, οι μεγαλύτερες βελτιώσεις εμφανίστηκαν στη χημεία, τις ανθρωπιστικές και κοινωνικές επιστήμες, καθώς και τα μαθηματικά. Το μοντέλο που υποστηρίζει την έρευνα σε βάθος παρουσίασε μια ανθρώπινη προσέγγιση αναζητώντας αποτελεσματικά εξειδικευμένες πληροφορίες όταν ήταν απαραίτητο.
| Μοντέλο | Ακρίβεια (%) |
|---|---|
| GPT-4 | 3,3 |
| Grok-2 | 3,8 |
| Claude 3.5 Sonnet | 4,3 |
| Σκέψη των Διδύμων | 6,2 |
| OpenAI o1 | 9,1 |
| DeepSeek-R1* | 9,4 |
| OpenAI o3-mini (μεσαίο)* | 10,5 |
| OpenAI o3-mini (υψηλό)* | 13,0 |
| Έρευνα σε βάθος της OpenAI** | 26,6 |
Στο GAIA(ανοίγει σε νέο παράθυρο)1, ένα δημόσιο σημείο αναφοράς που αξιολογεί την ΤΝ σε ερωτήματα πραγματικού κόσμου, το μοντέλο που υποστηρίζει την έρευνα σε βάθος φτάνει σε νέα επίπεδα για τον χαρακτηρισμό state of the art (SOTA), κατακτώντας την κορυφή του εξωτερικού πίνακα κατάταξης(ανοίγει σε νέο παράθυρο). Περιλαμβάνοντας ερωτήσεις σε τρία επίπεδα δυσκολίας, η επιτυχής ολοκλήρωση αυτών των εργασιών απαιτεί ικανότητες όπως η συλλογιστική, η πολυτροπική ευχέρεια, η περιήγηση στο διαδίκτυο και η επάρκεια στη χρήση εργαλείων.
| GAIA | ||||
|---|---|---|---|---|
| Επίπεδο 1 | Επίπεδο 2 | Επίπεδο 3 | Μέσος όρος | |
| Προηγούμενη κορυφαία τεχνολογία(ανοίγει σε νέο παράθυρο) | 67,92 | 67,44 | 42,31 | 63,64 |
| Έρευνα σε βάθος (pass@1) | 74,29 | 69,06 | 47,6 | 67,36 |
| Έρευνα σε βάθος (cons@64) | 78,66 | 73,21 | 58,03 | 72,57 |
Παραδείγματα εργασιών GAIA
Σε μια εσωτερική αξιολόγηση εργασιών σε επίπεδο ειδικών σε διάφορους τομείς, η αξιολόγηση από ειδικούς του τομέα για την έρευνα σε βάθος έκρινε ότι έχει αυτοματοποιήσει πολλές ώρες δύσκολης, μη αυτόματης διερεύνησης.
Ποσοστό επιτυχίας έναντι μέγιστων κλήσεων εργαλείων
Παραδείγματα εργασιών επιπέδου ειδικού
Ποσοστό επιτυχίας σε εργασίες επιπέδου ειδικού βάσει εκτιμώμενης οικονομικής αξίας
Ποσοστό επιτυχίας σε εργασίες επιπέδου ειδικού ανά εκτιμώμενες ώρες
Deep research unlocks significant new capabilities, but it’s still early and has limitations. It can sometimes hallucinate facts in responses or make incorrect inferences, though at a notably lower rate than existing ChatGPT models, according to internal evaluations. It may struggle with distinguishing authoritative information from rumors, and currently shows weakness in confidence calibration, often failing to convey uncertainty accurately. At launch, there may be minor formatting errors in reports and citations, and tasks may take longer to kick off. We expect all these issues to quickly improve with more usage and time.
Deep research in ChatGPT is currently very compute intensive. The longer it takes to research a query, the more inference compute is required. We are starting with a version optimized for Pro users today, with up to 100 queries per month. Plus and Team users will get access next, followed by Enterprise. We are still working on bringing access to users in the United Kingdom, Switzerland, and the European Economic Area.
All paid users will soon get significantly higher rate limits when we release a faster, more cost-effective version of deep research powered by a smaller model that still provides high quality results.
In the coming weeks and months, we’ll be working on the technical infrastructure, closely monitoring the current release, and conducting even more rigorous testing. This aligns with our principle of iterative deployment. If all safety checks continue to meet our release standards, we anticipate releasing deep research to Plus users in about a month.
Η έρευνα σε βάθος είναι διαθέσιμη σήμερα στο ChatGPT στο web και θα κυκλοφορήσει σε εφαρμογές για κινητές συσκευές και υπολογιστές εντός του μήνα. Προς το παρόν, η έρευνα σε βάθος μπορεί να έχει πρόσβαση στο ανοιχτό web και σε οποιαδήποτε αρχεία έχετε ανεβάσει. Στο μέλλον, θα μπορείτε να συνδεθείτε με πιο εξειδικευμένες πηγές δεδομένων, επεκτείνοντας την πρόσβασή τους σε πόρους που βασίζονται σε συνδρομές ή σε εσωτερικούς πόρους, ώστε να γίνεται το αποτέλεσμα ακόμη πιο ισχυρό και εξατομικευμένο.
Κοιτάζοντας πιο μπροστά, οραματιζόμαστε εμπειρίες όπου το ChatGPT θα λειτουργεί αυτόνομα, πραγματοποιώντας ασύγχρονη έρευνα και εκτέλεση στον πραγματικό κόσμο. Ο συνδυασμός της έρευνας σε βάθος, που μπορεί να εκτελεί ασύγχρονη διαδικτυακή συλλογή στοιχείων, και του Operator, που μπορεί να ενεργεί στον πραγματικό κόσμο, θα επιτρέψει στο ChatGPT να εκτελεί όλο και πιο εξελιγμένες εργασίες για λογαριασμό σας.
Παράρτημα 3 Φεβρουαρίου 2025: Πραγματοποιήσαμε αυστηρούς ελέγχους ασφάλειας, αξιολογήσεις ετοιμότητας και αναθεωρήσεις διακυβέρνησης στην πρώιμη έκδοση του o3 που τροφοδοτεί την έρευνα σε βάθος, προσδιορίζοντάς την ως Μεσαίου(ανοίγει σε νέο παράθυρο) κινδύνου. Πραγματοποιήσαμε επίσης πρόσθετες δοκιμές ασφάλειας για την καλύτερη κατανόηση των επιπρόσθετων κινδύνων που σχετίζονται με την ικανότητα της έρευνας σε βάθος να περιηγείται στο Web, και προσθέσαμε νέες μεθόδους μετριασμού. Θα συνεχίσουμε να δοκιμάζουμε διεξοδικά και να παρακολουθούμε στενά την τρέχουσα περιορισμένη έκδοση. Θα μοιραστούμε τις πληροφορίες ασφαλείας και τα μέτρα ασφαλείας μας για την έρευνα σε βάθος σε μια κάρτα συστήματος όταν διευρύνουμε την πρόσβαση στους χρήστες Plus.
Footnotes
- 1
We found that the ground-truth answers for this dataset were widely leaked online and have blocked several websites or URLs accordingly to ensure a fair evaluation of the model.
Authors
Research Leads
Isa Fulford, Zhiqing Sun
Foundational Contributors
Alex Tachard Passos, Alexandra Barr, Allison Tam, Charlotte Cole, Hyung Won Chung, Jason Wei, Jon Blackman, Scott Mayer McKinney, Valerie Qi
Core Contributors
Research
Elaine Ya Le, Eric Mitchell, Eric Wallace, Hyung Won Chung, Ignasi Clavera, Leo Liu, Lorenz Kuhn, Louis Feuvrier, Max Schwarzer, Saachi Jain, Scottie Yan, Shunyu Yao, Vitchyr Pong
Deployment
Carpus Chang, Harry Zhao, Joseph Trasatti, Joshua Dickens, Matt Kaufer, Mike Trpcic, Minnia Feng, Neel Ajjarapu, Peter Vidani, Sean Fitzgerald
Contributors
Research
Ahmed El-Kishky, AJ Ostrow, Alexander Wei, Andrei Gheorghe, Andrew Kondrich, Andrey Mishchenko, Anuj Nair, Behrooz Ghorbani, Brydon Eastman, Chak Li, Foivos Tsimpourlas, Francis Song, Giambattista Parascandolo,Gildas Chabot, Hessam Bagherinezhad, Haitang Hu, Hongyu Ren, Henry Aspegren, Hunter Lightman, Ilya Kostrikov, Ilge Akkaya, James Lennon, Jean Harb, Jonathan Ward, Kai Chen, Katy Shi, Kevin Liu, Kevin Yu, Manuka Stratta, Marvin Zhang, Mengyuan Yan, Mostafa Rohaninejad, Noam Brown, Phoebe Thacker, Raz Goan, Reah Miyara, Spencer Papay, Taylor Gordon, Wenda Zhou, Wenlei Xie, Yash Patil, Yann Dubois, Youlong Cheng, Yushi Wang, Wyatt Thompson
+ all the contributors to o3.
Safety Systems
Adam Kalai, Alex Beutel, Andrea Vallone, Andy Applebaum, David Robinson, Elizabeth Proehl, Evan Mays, Grace Zhao, Irina Kofman, Jason Phang, Joaquin Quinonero Candela, Joel Parish, Kevin Liu, Kristen Ying, Lama Ahmad, Leon Maksin, Leyton Ho, Meghan Shah, Michele Wang, Miles Wang, Phillip Guo, Olivia Watkins, Owen Campbell-Moore, Patrick Chao, Sam Toizer, Samuel Miserendino, Sandhini Agarwal, Tejal Patwardhan, Tina Sriskandarajah, Troy Peterson, Yaodong Yu, Yunyun Wang
Deployment
Adam Koppel, Adam Wells, Adele Li, Andy Applebaum, Andrey Malevich, Andrew Duberstein, Andrew Howell, Anton Tananaev, Ashley Tyra, Brandon Walkin, Bryan Ashley, Cary Bassin, Cary Hudson, Cory Decareaux, Cristina Scheau, Derek Chen, Dibya Bhattacharjee, Drea Lopez, Eric Antonow, Eric Burke, Filippo Raso, Fotis Chantzis, Freddie Sulit, Harris Cohen, Heather Whitney, Jay Dixit, Jeffrey Han, Jen Robinson, Jessica Shieh, Joel Parish, Kan Wu, Kevin Gladstone, Kshitij Wadhwa, Leo Vandriel, Leyton Ho, Liang Chen, Madeline Christian, Mamie Rheingold, Matt Jones, Michelle Fradin, Mike McClay, Mingxuan Wang, Nacho Soto, Niko Felix, Patrick Delaney, Paul McMillan, Philip Pronin, Rodrigo Riaza Perez, Samuel Miserendino, Scott Ethersmith, Steven Baldwin, Thomas Dimson, Tomo Hiratsuka, Yaming Lin, Yara Khakbaz, Yining Chen
Leadership
Akshay Nathan, Greg Brockman, Hannah Wong, Jakub Pachocki, Jerry Tworek, Johannes Heidecke, Josh Tobin, Liam Fedus, Mark Chen, Mia Glaese, Nick Turley, Sam Altman, Wojciech Zaremba