Karşınızda derin araştırma
Büyük miktarda çevrimiçi bilgiyi sentezlemek için akıl yürütme kullanan ve senin yerine çok adımlı araştırma görevlerini tamamlayan bir aracı. Pro kullanıcıları bugün kullanmaya başlayabilir, ardından sıra Plus ve Team kullanıcılarına gelecek.
10 Şubat 2026 güncellemesi: Artık derin araştırmayı herhangi bir MCP'ye veya uygulamaya bağlayabilir ve web aramalarını güvenilir sitelerle sınırlandırabilirsiniz, böylece doğrulanmış, sektör standardı kaynaklara odaklanabilirsiniz. Ayrıca, ilerlemeyi gerçek zamanlı olarak takip edebilir ve takip komutları veya yeni kaynaklarla iyileştirmek için müdahale edebilirsiniz. Görsel deneyimi, araştırmanızı baştan sona daha kolay başlatabilmeniz, takip edebilmeniz ve gözden geçirebilmeniz için güncelledik.
17 Temmuz 2025 güncellemesi: ChatGPT ajanı kapsamında görsel tarayıcıya erişim sayesinde derin araştırmalar artık daha da derin ve geniş kapsamlı hale gelebilir. Bu güncellenmiş özelliklere erişmek için oluşturucu menüsündeki açılır menüden "ajan modu"nu seçin ve sorgunuzu doğrudan girin. Orijinal derin araştırma işlevi, araçlar menüsündeki "derin araştırma" seçeneği aracılığıyla kullanılmaya devam etmektedir.
24 Nisan 2025 güncellemesi: Derin araştırmayı ne sıklıkla kullanabileceğinizi önemli ölçüde artırıyoruz—Artık Plus, Team, Enterprise ve Edu kullanıcıları ayda 25 sorgu, Pro kullanıcıları ayda 250 sorgu ve Free kullanıcıları ayda 5 sorgu yapabilir. Bu, yüksek kaliteyi korurken daha düşük maliyetle çalışacak şekilde tasarlanmış, o4-mini sürümünden güç alan derin araştırmanın yeni ve hafif bir sürümü sayesinde mümkün oldu. Tam sürüm için limitinize ulaştığınızda, sorgularınız otomatik olarak hafif sürüme geçer.
25 Şubat 2025 güncellemesi: Artık tüm Plus kullanıcıları derin araştırmayı kullanabilir.
5 Şubat 2025 güncellemesi: Birleşik Krallık, İsviçre ve Avrupa Ekonomik Alanı'ndaki Pro kullanıcıları artık Derin araştırmayı kullanabilir.
Karmaşık görevler için internette çok adımlı araştırma yapan yeni bir aracılı yapay zeka yetkinliği olan derin araştırma artık ChatGPT’de. Bir insanın saatlerini alabilecek araştırmayı dakikalar içinde tamamlayabilir.
OpenAI’ın yeni aracısı derin araştırma senden bağımsız bir şekilde senin için çalışır. Bir istem girdiğinde, ChatGPT bir araştırma analistinin yetkinlik düzeyinde kapsamlı bir rapor hazırlamak için yüzlerce çevrimiçi kaynağı bulur, analiz eder ve sentezler. Yakında çıkaracağımız OpenAI o3 modelinin web taraması ve veri analizi için optimize edilmiş bir sürümünden güç alır. İnternette büyük miktarda metin, görsel ve PDF aramak, yorumlamak, analiz etmek ve karşılaştığı bilgilere göre yön belirlemek için akıl yürütme kullanır.
Bilgiyi sentezleme becerisi yeni bilgi üretmenin ön koşuludur. Bu nedenle, derin araştırma uzun zamandır yeni bilimsel araştırmalar üretebileceğini öngördüğümüz AGI, yani yapay genel zeka geliştirme hedefimiz doğrultusunda önemli bir adım.
Derin araştırma finans, bilim, politika ve mühendislik gibi yoğun bilgi gerektiren alanlarda çalışan ve kapsamlı, doğru, güvenilir araştırmalara ihtiyaç duyan kişiler için geliştirildi. Otomobil, beyaz eşya ve mobilya gibi genellikle dikkatli bir araştırma gerektiren satın alımlarda son derece kişiselleştirilmiş öneriler arayan seçici alışveriş yapanlar için de aynı ölçüde yararlı olabilir. Her çıktı, açıkça belirtilmiş alıntılar ve düşünce özeti ile eksiksiz bir şekilde belgelenir ve bu da bilgiye referans vermeyi ve doğrulamayı kolaylaştırır. Çok sayıda web sitesine göz atılmasını gerektiren, hemen akla gelmeyen ve sezgisel olmayan bilgilerin bulunmasında özellikle etkilidir. Derin araştırma karmaşık ve zaman alıcı web araştırmalarını tek bir sorguyla çabucak yaptırmana olanak tanır ve böylece değerli zamanın sana kalır.
Derin araştırma bağımsız bir şekilde web’de tarama yaparak kullanışlı bilgileri bulur, üzerlerinde akıl yürütür ve bunları birleştirir. Bunu başarmak için, ilk akıl yürütme modelimiz olan OpenAI o1'in de temelinde yatan aynı takviyeli öğrenme yöntemlerini kullanarak derin araştırmayı tarayıcı ve Python araç kullanımı gerektiren gerçek dünya görevlerinde eğittik. o1 modeli kodlama, matematik ve diğer teknik alanlarda etkileyici yetkinlikler sergiliyor, ancak gerçek dünya problemlerinin çoğu için çok farklı çevrimiçi kaynaklardan kapsamlı bağlam ve bilgi toplanması gerekir. Derin araştırma bu akıl yürütme yetkinliklerinin üzerine çıkarak aradaki boşluğu kapatır ve böylece insanların işte ve günlük yaşamda karşılaştıkları türden sorunları ele alabilir.
ChatGPT’de mesaj kutusunun altında ‘derin araştırmayı’ seç ve sorgunu gir. İster yayın platformları hakkında rekabetçi bir analize, ister en iyi şehir bisikleti hakkında kişiselleştirilmiş bir rapora ihtiyacın olsun, bunu ChatGPT’ye söylemen yeterli. Sorduğun soruya bağlam eklemek için dosyalar veya elektronik tablolar ekleyebilirsin. Çalışmaya başladığında, atılan adımların ve kullanılan kaynakların özetini içeren bir kenar çubuğu görünür.
Derin araştırma web’i derinlemesine taramak için gereken zamanı kullanarak çalışmasını 5 ila 30 dakika içinde tamamlayabilir. Bu arada sen de başka görevler üzerinde çalışabilirsin ve araştırma tamamlandığında bir bildirim alırsın. Çıktının son hali sohbet içinde bir rapor olarak görüntülenir. Önümüzdeki birkaç hafta içinde bu raporlara daha açık olmaları ve bağlamı göstermeleri için gömülü görseller, veri görselleştirmeleri ve diğer analitik çıktılar da ekleyeceğiz.
Derin araştırmayla karşılaştırıldığında, GPT‑4o hem görsel hem de metin içeren gerçek zamanlı konuşmalar için idealdir. Derinlik ve detayların kritik önem taşıdığı çok boyutlu ve uzmanlık gerektiren sorularda, derin araştırma sadece kısa bir özet sunmakla kalmaz, ayrıca her detayı araştırıp kaynak göstererek verdiği yanıtı gerçekten işe yarar, güvenilir bilgiye dönüştürür.
GPT-4o
Derin araştırma
Derin araştırma girilen isteme son derece ayrıntılı bir şekilde yanıt veriyor ve kolay referans verme ve karşılaştırma için en gelişmiş 10 ülke ile gelişmekte olan ülkeler sıralamasının ilk 10’una ait ülke bazlı verileri yan yana sunuyor. Bu verilerden yola çıkarak pazara giriş konusunda işe yarar ve iyi düşünülmüş tavsiyeler veriyor.
Derin araştırma uçtan uca takviyeli öğrenme yoluyla, çok farklı alanlarda zorlu araştırma ve akıl yürütme görevleri kullanılarak eğitildi. Bu eğitim yoluyla, aradığı verilere ulaşmak için gerektiğinde geri dönüp strateji değiştirecek ve gerçek zamanlı bilgilere göre hareket edecek şekilde çok adımlı bir plan hazırlamayı ve uygulamayı öğrendi. Model ayrıca kullanıcının yüklediği dosyaları inceleyebiliyor, python aracıyla grafikler çizip yineleyebiliyor, oluşturduğu grafikleri ve web sitelerinden aldığı görselleri yanıtlarına ekleyebiliyor ve kaynaklarından aldığı belirli cümlelere veya bölümlere doğrudan referans verebiliyor. Bu eğitimin sonucunda, gerçek dünyadan problemlere odaklanan birçok genel testte yeni rekorlara ulaştı.
Yapay zekayı çok çeşitli konularda uzman seviyesinde sorularla test eden Humanity’s Last Exam(yeni bir pencerede açılır), yani İnsanlığın Son Sınavı adlı yeni bir değerlendirmede, derin araştırmanın temelinde yatan model %26,6 doğrulukla yeni bir rekor kırdı. Bu test dilbilimden roket bilimine, klasik eserlerden ekolojiye kadar 100’den fazla alanda 3000’in üzerinde çoktan seçmeli ve kısa yanıtlı sorudan oluşuyor. OpenAI o1 ile karşılaştırıldığında, en büyük ilerlemeler kimya, insani ve sosyal bilimler ve matematik alanlarında görüldü. Derin araştırmanın temelinde yatan model, gerektiğinde uzmanlaşmış bilgiyi etkili bir biçimde bularak insan benzeri bir yaklaşım ortaya koydu.
| Model | Doğruluk (%) |
|---|---|
| GPT-4o | 3,3 |
| Grok-2 | 3,8 |
| Claude 3.5 Sonnet | 4,3 |
| Gemini Thinking | 6,2 |
| OpenAI o1 | 9,1 |
| DeepSeek-R1* | 9,4 |
| OpenAI o3-mini (medium)* | 10,5 |
| OpenAI o3-mini (high)* | 13,0 |
| OpenAI derin araştırma** | 26,6 |
Gerçek dünya hakkında sorularla yapay zekayı test eden GAIA(yeni bir pencerede açılır)1 adlı genel kıyaslamada, derin araştırmanın temelinde yatan model en yüksek performansı (SOTA) göstererek dış sıralamanın(yeni bir pencerede açılır) zirvesine oturdu. Üç farklı zorluk düzeyinde kapsamlı sorular içeren bu görevleri başarıyla tamamlamak için akıl yürütme, farklı medyalarda akıcılık, web’de gezinme ve araç kullanma becerisi gibi yetkinlikler gerekiyor.
| GAIA | ||||
|---|---|---|---|---|
| 1. Seviye | 2. Seviye | 3. Seviye | Ort. | |
| Önceki SOTA(yeni bir pencerede açılır) | 67,92 | 67,44 | 42,31 | 63,64 |
| Deep Research (pass@1) | 74,29 | 69,06 | 47,6 | 67,36 |
| Deep Research (cons@64) | 78,66 | 73,21 | 58,03 | 72,57 |
GAIA görev örnekleri
Alanlarında uzman isimler, farklı konularda uzmanlık gerektiren görevlerle ilgili yapılan bir iç değerlendirmede derin araştırmanın normalde saatler sürecek el emeği gerektiren zorlu soruşturmaları otomatikleştirdiğini belirtti.
Başarı Oranı ile Maks Araç Çağrısı İlişkisi
Uzmanlık gerektiren görev örnekleri
Tahmini Ekonomik Değerine Göre Uzmanlık Gerektiren Görevlerde Başarı Oranı
Tahmini Saate Göre Uzmanlık Gerektiren Görevlerde Başarı Oranı
Derin araştırma pek çok yeni yetkinliğin kapısını aralıyor, ancak hâlâ gelişiminin erken aşamalarında ve bazı sınırlamalara tabi. Yapılan iç testlere göre, önceki ChatGPT modellerine kıyasla çok daha az oranda olsa bile bazen hatalı çıkarımlar yapabiliyor veya hayali olgular üretebiliyor. Bazen güvenilir bilgiyle söylentileri ayırt etmekte zorlanabiliyor. Şu an için güvenilirlik kalibrasyonu konusunda zaaf gösteriyor ve belirsizlik durumunu genellikle doğru bir şekilde aktaramıyor. Lansman aşamasında, raporlarda ve verdiği referanslarda ufak biçimlendirme hataları olabilir ve görevlere başlaması beklenenden uzun sürebilir. Tüm bu sorunların zaman geçtikçe daha fazla kullanımla hızla düzelmesini bekliyoruz.
ChatGPT’nin derin araştırma özelliği şu anda çok yüksek bilgi işlem gücüne ihtiyaç duyuyor. Bir sorguyu araştırmak ne kadar uzun sürerse, o kadar fazla çıkarım bilgi işlem gücü gerekir. Bugün, ayda 100 adede kadar sorguyla Pro kullanıcıları için optimize edilmiş bir sürümle başlıyoruz. Sırada Plus ve Team kullanıcıları var ve onların ardından Enterprise gelecek. Birleşik Krallık, İsviçre ve Avrupa Ekonomik Alanı’ndaki kullanıcılara erişim sağlamak için çalışmalarımıza devam ediyoruz.
Tüm ücretli kullanıcılar çok yakında daha hızlı ve maliyet açısından daha verimli bir sürümün sunulmasıyla birlikte belirgin ölçüde artırılmış sorgu limitlerine erişebilecek. Bu yeni derin araştırma sürümü daha küçük bir modelden güç almasına rağmen yüksek kaliteli sonuçlar üretmeye devam edecek.
Önümüzdeki haftalarda ve aylarda hem teknik altyapıyı güçlendireceğiz, hem de bu sürümü yakından takip edecek ve daha titiz testler yürüteceğiz. Bu yaklaşım da yinelemeli dağıtım ilkemizle örtüşüyor. Tüm güvenlik kontrolleri lansman standartlarımızı karşılamaya devam ederse, derin araştırmayı yaklaşık bir ay içinde Plus kullanıcılarına sunmayı öngörüyoruz.
Derin araştırma bugün ChatGPT web üzerinde kullanıma sunuldu ve bu ay içinde mobil ve masaüstü uygulamalarına da gelecek. Derin araştırma şu anda açık web’e ve yüklenen dosyalara erişebiliyor. Gelecekte daha özelleştirilmiş veri kaynaklarına bağlanarak abonelik tabanlı veya kurum içi kaynaklara da erişebilecek ve bu sayede alınan çıktılar çok daha kapsamlı ve kişiselleştirilmiş olacak.
İlerleyen dönemde, gerçek dünya araştırmaları ve uygulamaları için eş zamansız çalışan aracılı deneyimleri ChatGPT’ye taşımayı hedefliyoruz. Eş zamansız çevrimiçi soruşturma yapabilen derin araştırma ile gerçek dünyada eyleme geçebilen Operator bir araya geldiğinde ChatGPT çok daha karmaşık görevleri yürütebilecek.
3 Şubat 2025 eki: Derin araştırmanın temelinde yatan o3 modelinin önceki sürümü üzerinde kapsamlı güvenlik testleri, hazırlıklı olma kontrolleri ve yönetişim değerlendirmeleri yaptık ve bu sürümün Orta(yeni bir pencerede açılır) riskli olduğu sonucuna ulaştık. Derin araştırmanın web’de gezinme becerisiyle birlikte artan riskleri daha iyi anlamak için ekstra güvenlik testleri yürüttük ve bu riskleri azaltacak yeni önlemler aldık. Mevcut sınırlı sürümü kapsamlı bir şekilde test etmeye ve yakından izlemeye devam edeceğiz. Erişimi Plus kullanıcılarına genişlettiğimizde, derin araştırmayla ilgili güvenlik bulgularımızı ve aldığımız önlemleri bir sistem kartında açıklayacağız.
Dipnotlar
- 1
Bu veri setine ilişkin kesin referans yanıtların çevrimiçi ortamda yaygın bir şekilde sızdırıldığını tespit ettik ve bu doğrultuda, modelin adil bir şekilde değerlendirilmesini sağlamak için çeşitli web sitelerini veya URL'leri engelledik.
Yazarlar
Araştırma Lideri
Isa Fulford, Zhiqing Sun
Kurulma Aşamasında Katkıda Bulunanlar
Alex Tachard Passos, Alexandra Barr, Allison Tam, Charlotte Cole, Hyung Won Chung, Jason Wei, Jon Blackman, Scott Mayer McKinney, Valerie Qi
Temel Araştırmalara Katkıda Bulunanlar
Araştırma
Elaine Ya Le, Eric Mitchell, Eric Wallace, Hyung Won Chung, Ignasi Clavera, Leo Liu, Lorenz Kuhn, Louis Feuvrier, Max Schwarzer, Saachi Jain, Scottie Yan, Shunyu Yao, Vitchyr Pong
Kullanıma Sokma
Carpus Chang, Harry Zhao, Joseph Trasatti, Joshua Dickens, Matt Kaufer, Mike Trpcic, Minnia Feng, Neel Ajjarapu, Peter Vidani, Sean Fitzgerald
Katkıda bulunanlar
Araştırma
Ahmed El-Kishky, AJ Ostrow, Alexander Wei, Andrei Gheorghe, Andrew Kondrich, Andrey Mishchenko, Anuj Nair, Behrooz Ghorbani, Brydon Eastman, Chak Li, Foivos Tsimpourlas, Francis Song, Giambattista Parascandolo,Gildas Chabot, Hessam Bagherinezhad, Haitang Hu, Hongyu Ren, Henry Aspegren, Hunter Lightman, Ilya Kostrikov, Ilge Akkaya, James Lennon, Jean Harb, Jonathan Ward, Kai Chen, Katy Shi, Kevin Liu, Kevin Yu, Manuka Stratta, Marvin Zhang, Mengyuan Yan, Mostafa Rohaninejad, Noam Brown, Phoebe Thacker, Raz Goan, Reah Miyara, Spencer Papay, Taylor Gordon, Wenda Zhou, Wenlei Xie, Yash Patil, Yann Dubois, Youlong Cheng, Yushi Wang, Wyatt Thompson
ve o3'e katkıda bulunan herkes.
Güvenlik Sistemleri
Adam Kalai, Alex Beutel, Andrea Vallone, Andy Applebaum, David Robinson, Elizabeth Proehl, Evan Mays, Grace Zhao, Irina Kofman, Jason Phang, Joaquin Quinonero Candela, Joel Parish, Kevin Liu, Kristen Ying, Lama Ahmad, Leon Maksin, Leyton Ho, Meghan Shah, Michele Wang, Miles Wang, Phillip Guo, Olivia Watkins, Owen Campbell-Moore, Patrick Chao, Sam Toizer, Samuel Miserendino, Sandhini Agarwal, Tejal Patwardhan, Tina Sriskandarajah, Troy Peterson, Yaodong Yu, Yunyun Wang
Kullanıma Sokma
Adam Koppel, Adam Wells, Adele Li, Andy Applebaum, Andrey Malevich, Andrew Duberstein, Andrew Howell, Anton Tananaev, Ashley Tyra, Brandon Walkin, Bryan Ashley, Cary Bassin, Cary Hudson, Cory Decareaux, Cristina Scheau, Derek Chen, Dibya Bhattacharjee, Drea Lopez, Eric Antonow, Eric Burke, Filippo Raso, Fotis Chantzis, Freddie Sulit, Harris Cohen, Heather Whitney, Jay Dixit, Jeffrey Han, Jen Robinson, Jessica Shieh, Joel Parish, Kan Wu, Kevin Gladstone, Kshitij Wadhwa, Leo Vandriel, Leyton Ho, Liang Chen, Madeline Christian, Mamie Rheingold, Matt Jones, Michelle Fradin, Mike McClay, Mingxuan Wang, Nacho Soto, Niko Felix, Patrick Delaney, Paul McMillan, Philip Pronin, Rodrigo Riaza Perez, Samuel Miserendino, Scott Ethersmith, Steven Baldwin, Thomas Dimson, Tomo Hiratsuka, Yaming Lin, Yara Khakbaz, Yining Chen
Liderlik Ekibi
Akshay Nathan, Greg Brockman, Hannah Wong, Jakub Pachocki, Jerry Tworek, Johannes Heidecke, Josh Tobin, Liam Fedus, Mark Chen, Mia Glaese, Nick Turley, Sam Altman, Wojciech Zaremba