Przedstawiamy głębokie badanie
Narzędzie wykorzystujące rozumowanie w celu syntetyzowania dużych ilości informacji dostępnych online i realizacji wieloetapowych procesów badawczych. Dostępne dla użytkowników Pro już dzisiaj, w przyszłości również w subskrypcjach Plus i Team.
Aktualizacja z 10 lutego 2026 r.: Teraz możesz połączyć głębokie badania z dowolną MCP lub aplikacją oraz ograniczyć wyszukiwanie w Internecie do zaufanych witryn. Dzięki temu możesz skupić się na sprawdzonych źródłach zgodnych ze standardami branżowymi, śledząc przy tym postępy w czasie rzeczywistym i przerywając proces w celu dopracowania wyników przy użyciu dodatkowych poleceń lub nowych źródeł. Zaktualizowaliśmy wygląd interfejsu, aby ułatwić rozpoczęcie, śledzenie i przeglądanie badań od początku do końca.
Aktualizacja z 17 lipca 2025 r.: Dzięki dostępowi do przeglądarki wizualnej w ramach agenta ChatGPT głębokie badania mogą być teraz jeszcze bardziej szczegółowe i rozbudowane. Aby uzyskać dostęp do tych zaktualizowanych funkcji, wystarczy wybrać „tryb agenta” z menu rozwijanego w edytorze i bezpośrednio wprowadzić zapytanie. Oryginalna funkcja głębokich badań jest nadal dostępna poprzez opcję „głębokie badania” w menu narzędzi.
Aktualizacja z 24 kwietnia 2025 r.: Znacząco zwiększamy częstotliwość, z jaką użytkownicy mogą korzystać z funkcji głębokiego badania – użytkownicy korzystający z planów Plus, Team, Enterprise i Edu otrzymują teraz 25 zapytań miesięcznie, użytkownicy planu Pro – 250, a użytkownicy planu Free – 5. Jest to możliwe dzięki nowej, lekkiej wersji zaawansowanej wyszukiwarki opartej na wersji o4-mini, zaprojektowanej z myślą o większej oszczędności przy zachowaniu wysokiej jakości. Po osiągnięciu limitu dla pełnej wersji zapytania automatycznie będą przełączane do wersji wykorzystującej mniej zasobów.
Aktualizacja z 25 lutego 2025 r.: Wszyscy użytkownicy korzystający z planu Plus mogą teraz korzystać z funkcji głębokiego badania.
Aktualizacja z 5 lutego 2025 r.: Funkcja głębokiego badania jest teraz dostępna dla użytkowników korzystających z planu Pro w Wielkiej Brytanii, Szwajcarii i Europejskim Obszarze Gospodarczym.
ChatGPT wzbogacił się dzisiaj o funkcję głębokiego badania, nową zdolność do sprawczego realizowania wieloetapowych badań zasobów internetowych w kontekście złożonych zadań. Funkcjonalność ta pozwala na osiągnięcie w kilkadziesiąt minut rezultatów, które wymagałyby wielu godzin pracy człowieka.
Model głębokiego badania to kolejny agent OpenAI zdolny do niezależnego wykonywania zadań w Twoim imieniu. Ty wydajesz polecenie, a ChatGPT wyszukuje, analizuje i syntetyzuje informacje z setek źródeł internetowych, aby wygenerować spójny raport na poziomie analogicznym do pracy analityka badawczego. Dzięki wykorzystaniu jednej z wersji nadchodzącego modelu OpenAI o3 zoptymalizowanego pod kątem przeglądania sieci i analizy danych, narzędzie wykorzystuje rozumowanie w procesach wyszukiwania, interpretacji i analizy ogromnych ilości tekstu, obrazów i plików PDF dostępnych w internecie, adaptując swoje strategie adekwatnie do napotykanych informacji.
Zdolność do syntetyzowania wiedzy jest kluczowa dla generowania nowej wiedzy. Z tego względu głębokie badanie stanowi istotny krok na drodze do osiągnięcia naszego nadrzędnego długofalowego celu, jakim jest stworzenie AGI zdolnego do prowadzenia nowatorskich badań naukowych.
Model głębokiego badania powstał z myślą o ludziach przetwarzających duże zasoby wiedzy w obszarach takich jak finanse, nauka, polityka czy inżynieria, w których dogłębne, precyzyjne i wiarygodne badania mają kluczowe znaczenie. Jednocześnie rozwiązanie to będzie również przydatne dla konsumentów poszukujących wysoce spersonalizowanych rekomendacji na temat produktów, które zazwyczaj wymagają intensywnego przeszukiwania licznych ofert sprzedaży samochodów, urządzeń, mebli itp. Każdy generowany wynik jest w pełni udokumentowany, zawiera wyraźnie oznaczone cytaty oraz streszczenie przyjętego rozumowania, co ułatwia identyfikację odniesień i weryfikację informacji. Narzędzie sprawdza się szczególnie dobrze przy wyszukiwaniu niszowych, nieintuicyjnych informacji, których znalezienie wymaga przejrzenia licznych stron internetowych. Głębokie badanie pozwala zaoszczędzić bezcenny czas dzięki możliwości przeprowadzenia i przyspieszenia złożonych, czasochłonnych wyszukiwań internetowych poprzez zadanie tylko jednego zapytania.
Model głębokiego badania samodzielnie wynajduje, rozpatruje i konsoliduje dane znalezione w sieci. Jest to możliwe dzięki treningowi w wykonywaniu rzeczywistych zadań wymagających wykorzystania przeglądarki i narzędzi Python, przeprowadzonemu z zastosowaniem tych samych metod uczenia przez wzmacnianie, które leżą u podstaw OpenAI o1, naszego pierwszego modelu rozumowania. Chociaż o1 wykazuje imponujące zdolności w obszarach kodowania, matematyki i innych czysto technicznych zadań, wiele codziennych zastosowań wymaga ujęcia szerokiego kontekstu i zgromadzenia informacji z różnorodnych źródeł dostępnych online. Głębokie badanie stanowi rozwinięcie umiejętności rozumowania w kierunku zapewnienia właśnie takich zdolności pozwalających na skuteczne podejmowanie problemów napotykanych przez użytkowników w życiu codziennym.
Z poziomu ChatGPT wybierz „głębokie badanie” w module komponowania wiadomości i wprowadź swoje zapytanie. Powiedz ChatGPT czego potrzebujesz – czy chcesz np. przeprowadzić analizę porównawczą platform streamingowych, czy uzyskać spersonalizowany raport na temat najlepszych ofert sprzedaży rowerów miejskich. Możesz dołączyć pliki lub arkusze kalkulacyjne, które sprecyzują kontekst pytania. Po uruchomieniu zostanie wyświetlony pasek boczny z podsumowaniem podejmowanych działań i wykorzystywanych źródeł.
Ukończenie zadanego głębokiego badania może trwać od 5 do 30 minut, potrzebnych do przeprowadzenia przez narzędzie pogłębionej analizy sieciowej. W tym czasie możesz zrobić sobie przerwę lub zająć się innymi zadaniami. Po ukończeniu badania otrzymasz stosowne powiadomienie. Dane wyjściowe generowane są formie raportu prezentowanego na czacie. W najbliższych tygodniach planujemy również dodać możliwość wzbogacania raportów o obrazy, wizualizacje danych i inne analityczne dane wyjściowe, co dodatkowo poprawi ich przejrzystość i zapewni lepszy kontekst.
W porównaniu do głębokiego badania GPT‑4o sprawdza się najlepiej w multimodalnych konwersacjach prowadzonych w czasie rzeczywistym. Natomiast w przypadku wieloaspektowych i specjalistycznych zapytań, w których kluczowe znaczenie ma szczegółowość i dogłębność analizy, zdolność modelu głębokiego badania do przeprowadzania rozbudowanych kwerend i prezentowania cytowań, na których bazują poszczególne twierdzenia, wyznacza różnicę pomiędzy krótkim podsumowaniem a dobrze udokumentowaną, zweryfikowaną odpowiedzią, którą można wykorzystać w dalszej pracy.
GPT-4o
Głębokie badanie
Głębokie badanie generuje szczegółową odpowiedź na wydane polecenie, prezentując krok po kroku dane krajowe dla najważniejszych 10 rozwiniętych i 10 rozwijających się krajów, zapewniając łatwość odniesienia i szerokie możliwości porównawcze. Model wykorzystuje te informacje, aby przedstawić szczegółowe rekomendacje rynkowe, oparte na rzeczywistych danych i gotowe do wykorzystania.
Model głębokiego badania był trenowany z wykorzystaniem kompleksowego systemu uczenia przez wzmacnianie w toku rozwiązywania trudnych problemów wymagających umiejętności wyszukiwania informacji i rozumowania w kontekście szerokiego wachlarza dziedzin. W procesie tego treningu narzędzie nauczyło się planować i realizować wieloetapowe trajektorie działań pozwalające na wyszukanie wymaganych danych oraz, tam gdzie jest to konieczne, cofanie się i reagowanie na informacje pozyskiwane w czasie rzeczywistym. Model ten jest również w stanie przeglądać pliki przesłane przez użytkownika, tworzyć i różnicować wykresy z użyciem narzędzia Python, uwzględniać zarówno wygenerowane wykresy jak i obrazy ze stron internetowych w swoich odpowiedziach, jak również cytować konkretne zdania lub paragrafy zaczerpnięte ze źródeł. W rezultacie tego treningu model osiągnął rekordowe wyniki w kilku publicznie prowadzonych ocenach koncentrujących się na rozwiązywaniu problemów występujących w życiu codziennym.
W Ostatnim egzaminie ludzkości(otwiera nowe okno), opublikowanym niedawno teście oceniającym AI w kontekście szerokiego wachlarza tematów na poziomie eksperckim, model wykorzystujący głębokie badanie osiąga rekordowy wynik z dokładnością na poziomie 26,6%. Test obejmuje ponad 3000 pytań wielokrotnego wyboru bądź wymagających udzielenia krótkiej odpowiedzi w ponad 100 obszarach tematycznych – od lingwistyki po budowę rakiet i od filozofii klasycznej po ekologię. W porównaniu z OpenAI o1 największe postępy udało się osiągnąć w zakresie chemii, nauk humanistycznych i społecznych, jak również matematyki. Model oparty na głębokim badaniu charakteryzował się podobnym do ludzkiego podejściem, skutecznie wyszukując specjalistyczne informacje tam, gdzie było to konieczne.
| Model | Dokładność (%) |
|---|---|
| GPT-4o | 3,3 |
| Grok-2 | 3,8 |
| Claude 3.5 Sonnet | 4,3 |
| Gemini Thinking | 6,2 |
| OpenAI o1 | 9,1 |
| DeepSeek-R1* | 9,4 |
| OpenAI o3-mini (średni) | 10,5 |
| OpenAI o3-mini (wysoki)* | 13,0 |
| Głębokie badanie OpenAI** | 26,6 |
W ramach GAIA(otwiera nowe okno)1, publicznego benchmarku oceniającego AI na podstawie pytań zaczerpniętych z rzeczywistych sytuacji, model wykorzystujący głębokie badanie osiąga nowy najwyższy poziom (SOTA), zdobywając szczyt w zewnętrznym zestawieniu wyników(otwiera nowe okno). Pytania obejmują trzy poziomy trudności, a skuteczne rozwiązanie zadawanych problemów wymaga różnorodnych umiejętności, w tym rozumowania, sprawności multimodalnej, przeszukiwania sieci i efektywnego wykorzystania narzędzi.
| GAIA | ||||
|---|---|---|---|---|
| Poziom 1 | Poziom 2 | Poziom 3 | Śr. | |
| Poprzedni SOTA(otwiera nowe okno) | 67,92 | 67,44 | 42,31 | 63,64 |
| Głębokie badanie (pass@1) | 74,29 | 69,06 | 47,6 | 67,36 |
| Głębokie badanie (cons@64) | 78,66 | 73,21 | 58,03 | 72,57 |
Przykłady zadań GAIA
W toku wewnętrznej oceny zadań na poziomie eksperckim w kontekście szerokiego zakresu obszarów tematycznych model głębokiego badania został oceniony przez ekspertów w poszczególnych dziedzinach jako metoda umożliwiająca automatyzację wielogodzinnych, żmudnych kwerend.
Współczynnik powodzenia vs. Maksymalna liczba wywołań narzędzia
Przykłady zadań na poziomie eksperckim
Współczynnik powodzenia dla zadań na poziomie eksperckim w odniesieniu do szacunkowej wartości ekonomicznej
Współczynnik powodzenia dla zadań na poziomie eksperckim w odniesieniu do szacunkowej liczby godzin
Głębokie badanie otwiera istotne nowe możliwości, ale będąc wciąż w początkowej fazie rozwoju, ma również swoje ograniczenia. Model doświadcza niekiedy halucynacji co do faktów w udzielanych odpowiedziach lub wyciąga błędne wnioski, choć, jak wskazują nasze wewnętrzne oceny, dzieje się tak zdecydowanie rzadziej niż w przypadku istniejących modeli ChatGPT. Może on też mieć problemy z odróżnianiem wiarygodnych informacji od pogłosek, obecnie wykazuje również niedobory pod kątem kalibracji pewności, często nie radząc sobie z poprawnym komunikowaniem niepewności. Po uruchomieniu modelu mogą występować drobne błędy w formatowaniu raportów i cytowań, a zadania mogą uruchamiać się z opóźnieniem. Oczekujemy, że uda się wyeliminować te problemy w krótkim czasie, wraz z coraz szerszym użytkowaniem modelu.
Funkcja głębokiego badania w ramach ChatGPT wymaga obecnie znacznej mocy obliczeniowej. Wraz ze wzrostem czasu koniecznego do zbadania zapytania rośnie również zapotrzebowanie na obliczenia związane z rozumowaniem. Na chwilę obecną udostępniamy wersję zoptymalizowaną pod kątem użytkowników Pro, z ograniczeniem do 100 zapytań miesięcznie. Użytkownicy Plus i Team uzyskają dostęp w następnej kolejności, a po nich również użytkownicy z subskrypcją Enterprise. Wciąż pracujemy nad udostępnieniem tej funkcjonalności użytkownikom z Wielkiej Brytanii, Szwajcarii i Europejskiego Obszaru Gospodarczego.
W najbliższym czasie znacząco rozszerzymy limity wykorzystań dla wszystkich użytkowników posiadających płatne subskrypcje wraz z wdrożeniem szybszej, bardziej opłacalnej wersji głębokiego badania w ramach modelu mniejszego, lecz wciąż zdolnego do generowania wysokiej jakości wyników.
W nadchodzących tygodniach i miesiącach będziemy pracować nad rozwojem naszej infrastruktury technicznej, jednocześnie uważnie monitorując bieżącą wersję i przeprowadzając kolejne, jeszcze bardziej wymagające testy. Podejście to jest zgodne z naszą zasadą wdrażania iteracyjnego. Zakładając, że wyniki naszych kontroli bezpieczeństwa będą w dalszym ciągu spełniać nasze standardy wdrożeniowe, oczekujemy, że głębokie badanie zostanie udostępnione użytkownikom Plus w ciągu około miesiąca.
Model głębokiego badania już funkcjonuje na stronie ChatGPT, a w ciągu miesiąca zostanie udostępniony w aplikacji na urządzenia mobilne i stacjonarne. Na chwilę obecną głębokie badanie jest w stanie przetwarzać otwarte zasoby internetowe i wszelkie przesyłane pliki. W przyszłości wprowadzimy możliwość połączeń z bardziej wyspecjalizowanymi źródłami danych – rozszerzając dostęp o zasoby subskrypcyjne lub wewnętrzne – co umożliwi dalszą rozbudowę i personalizację tej funkcjonalności.
W dalszej przyszłości planujemy zintegrować funkcjonalności sprawcze w ramach ChatGPT w kierunku asynchronicznej, rzeczywistej zdolności do podejmowania i przeprowadzania badań. Połącznie zalet głębokiego badania, zdolnego do skutecznego, asynchronicznego przeszukiwania zasobów online, i Operatora, zdolnego do podejmowania działań w świecie rzeczywistym, pozwoli ChatGPT na wykonywanie w Twoim imieniu coraz bardziej złożonych zadań.
Uzupełnienie, 3 lutego 2025 r.: Przeprowadziliśmy rygorystyczne testy bezpieczeństwa, oceny gotowości i przeglądy zarządzania dla wczesnej wersji o3 wykorzystującej głębokie badanie. W wyniku oceny poziom ryzyka został określony jakośredni(otwiera nowe okno). Wykonaliśmy również dodatkowe testy bezpieczeństwa, aby lepiej zrozumieć zagrożenia związane ze zdolnością modelu głębokiego badania do przeglądania zasobów sieciowych. Na podstawie uzyskanych wyników wdrożyliśmy nowe środki zaradcze. Będziemy w dalszym ciągu dogłębnie testować i monitorować bieżącą ograniczoną iterację. Nasze spostrzeżenia w zakresie bezpieczeństwa i informacje na temat zabezpieczeń zostaną udostępnione na karcie systemowej z chwilą rozszerzenia dostępu dla użytkowników Plus.
Przypisy
- 1
Ustaliliśmy, że zweryfikowane odpowiedzi wzorcowe dla tego zestawu danych wyciekły i zostały szeroko rozpowszechnione w Internecie. Aby w związku z tym zapewnić rzetelną ocenę modelu, zablokowaliśmy kilka stron internetowych i adresów URL.
Autorzy
Kierownicy badań
Isa Fulford i Zhiqing Sun
Podstawowi współpracownicy
Alex Tachard Passos, Alexandra Barr, Allison Tam, Charlotte Cole, Hyung Won Chung, Jason Wei, Jon Blackman, Scott Mayer McKinney i Valerie Qi
Główni współpracownicy
Badania
Elaine Ya Le, Eric Mitchell, Eric Wallace, Hyung Won Chung, Ignasi Clavera, Leo Liu, Lorenz Kuhn, Louis Feuvrier, Max Schwarzer, Saachi Jain, Scottie Yan, Shunyu Yao, Vitchyr Pong
Wdrażanie
Carpus Chang, Harry Zhao, Joseph Trasatti, Joshua Dickens, Matt Kaufer, Mike Trpcic, Minnia Feng, Neel Ajjarapu, Peter Vidani, Sean Fitzgerald
Współpracownicy
Badania
Ahmed El-Kishky, AJ Ostrow, Alexander Wei, Andrei Gheorghe, Andrew Kondrich, Andrey Mishchenko, Anuj Nair, Behrooz Ghorbani, Brydon Eastman, Chak Li, Foivos Tsimpourlas, Francis Song, Giambattista Parascandolo,Gildas Chabot, Hessam Bagherinezhad, Haitang Hu, Hongyu Ren, Henry Aspegren, Hunter Lightman, Ilya Kostrikov, Ilge Akkaya, James Lennon, Jean Harb, Jonathan Ward, Kai Chen, Katy Shi, Kevin Liu, Kevin Yu, Manuka Stratta, Marvin Zhang, Mengyuan Yan, Mostafa Rohaninejad, Noam Brown, Phoebe Thacker, Raz Goan, Reah Miyara, Spencer Papay, Taylor Gordon, Wenda Zhou, Wenlei Xie, Yash Patil, Yann Dubois, Youlong Cheng, Yushi Wang, Wyatt Thompson
+ wszyscy współpracownicy pracujący nad o3.
Systemy bezpieczeństwa
Adam Kalai, Alex Beutel, Andrea Vallone, Andy Applebaum, David Robinson, Elizabeth Proehl, Evan Mays, Grace Zhao, Irina Kofman, Jason Phang, Joaquin Quinonero Candela, Joel Parish, Kevin Liu, Kristen Ying, Lama Ahmad, Leon Maksin, Leyton Ho, Meghan Shah, Michele Wang, Miles Wang, Phillip Guo, Olivia Watkins, Owen Campbell-Moore, Patrick Chao, Sam Toizer, Samuel Miserendino, Sandhini Agarwal, Tejal Patwardhan, Tina Sriskandarajah, Troy Peterson, Yaodong Yu, Yunyun Wang
Wdrażanie
Adam Koppel, Adam Wells, Adele Li, Andy Applebaum, Andrey Malevich, Andrew Duberstein, Andrew Howell, Anton Tananaev, Ashley Tyra, Brandon Walkin, Bryan Ashley, Cary Bassin, Cary Hudson, Cory Decareaux, Cristina Scheau, Derek Chen, Dibya Bhattacharjee, Drea Lopez, Eric Antonow, Eric Burke, Filippo Raso, Fotis Chantzis, Freddie Sulit, Harris Cohen, Heather Whitney, Jay Dixit, Jeffrey Han, Jen Robinson, Jessica Shieh, Joel Parish, Kan Wu, Kevin Gladstone, Kshitij Wadhwa, Leo Vandriel, Leyton Ho, Liang Chen, Madeline Christian, Mamie Rheingold, Matt Jones, Michelle Fradin, Mike McClay, Mingxuan Wang, Nacho Soto, Niko Felix, Patrick Delaney, Paul McMillan, Philip Pronin, Rodrigo Riaza Perez, Samuel Miserendino, Scott Ethersmith, Steven Baldwin, Thomas Dimson, Tomo Hiratsuka, Yaming Lin, Yara Khakbaz, Yining Chen
Kierownictwo
Akshay Nathan, Greg Brockman, Hannah Wong, Jakub Pachocki, Jerry Tworek, Johannes Heidecke, Josh Tobin, Liam Fedus, Mark Chen, Mia Glaese, Nick Turley, Sam Altman i Wojciech Zaremba