심층 리서치를 만나보세요
추론을 사용하여 대량의 온라인 정보를 종합하고 여러 단계에 걸친 리서치 작업을 완료하는 에이전트입니다. 현재 Pro 사용자가 이용할 수 있으며, 추후 Plus 및 Team으로 확대될 예정입니다.
2026년 2월 10일 업데이트: 이제 심층 리서치를 모든 MCP 또는 앱에 연결하고 웹 검색을 신뢰할 수 있는 사이트로 제한하여 인증된 업계 표준 소스에 집중할 수 있습니다. 또한 이제 진행 상황을 실시간으로 추적하고, 후속 프롬프트나 새로운 소스를 사용해 중단 후 보완할 수 있습니다. 시작부터 종료까지 연구를 더 쉽게 시작하고, 추적하고, 검토할 수 있도록 시각적 경험을 업데이트했습니다.
2025년 7월 17일 업데이트: 이제 심층 리서치는 ChatGPT 에이전트의 일부로 제공되는 시각적 브라우저에 액세스하여 더 깊고 더 폭넓은 연구를 수행할 수 있습니다. 이러한 업데이트된 기능에 액세스하려면 컴포저의 드롭다운에서 “에이전트 모드”를 선택한 후 쿼리를 직접 입력하세요. 기존 심층 리서치 기능은 툴 메뉴의 “심층 리서치” 옵션을 통해 계속 이용할 수 있습니다.
2025년 4월 24일 업데이트: 심층 리서치를 사용할 수 있는 횟수를 대폭 늘렸습니다. Plus, Team, Enterprise, Edu 사용자는 이제 월 25회, Pro 사용자는 250회, Free 사용자는 5회를 사용할 수 있습니다. 이는 높은 품질을 유지하면서 비용 효율성을 높이도록 설계된 o4-mini 버전을 기반으로 하는 새로운 경량 버전의 심층 리서치를 통해 가능해졌습니다. 전체 버전의 한도에 도달하면 쿼리는 자동으로 경량 버전으로 전환됩니다.
2025년 2월 25일 업데이트: 이제 모든 Plus 사용자가 심층 리서치를 사용할 수 있습니다.
2025년 2월 5일 업데이트: 이제 영국, 스위스 및 유럽 경제 지역의 Pro 사용자는 심층 리서치를 이용할 수 있습니다.
복잡한 작업을 위해 인터넷에서 다단계 리서치를 수행하는 새로운 에이전트 기능인 심층 리서치를 ChatGPT에 공개합니다. 이 기능은 인간이 여러 시간을 써서 처리하는 일을 수십 분 내에 해냅니다.
심층 리서치는 OpenAI의 차세대 에이전트로, 사용자를 대신하여 독립적으로 업무를 수행할 수 있습니다. 프롬프트가 주어지면 ChatGPT가 수백 개의 온라인 소스를 찾고 분석하고 종합하여 리서치 분석가 수준의 포괄적인 보고서를 만듭니다. 웹 브라우징과 데이터 분석에 최적화된 OpenAI o3 모델의 곧 공개될 버전으로 구동되는 이 에이전트는 추론을 활용하여 인터넷상에 있는 방대한 양의 텍스트, 이미지, PDF를 검색하여 해석 및 분석하고 접하는 정보에 따라 필요하면 방향을 전환합니다.
지식을 종합하는 능력은 새로운 지식을 생성하기 위한 전제 조건입니다. 이러한 이유로, 심층 리서치는 AGI 개발이라는 더 광범위한 목표로 나아가는 중요한 진전입니다. OpenAI는 AGI가 새로운 과학 리서치를 수행할 수 있을 것으로 오랫동안 구상해 왔습니다.
심층 리서치는 금융, 과학, 정책, 엔지니어링 등의 분야에서 수준 높은 지식을 요하는 일을 하며 철저하고 정확하며 신뢰할 수 있는 리서치를 요구하는 사람을 위해 설계되었습니다. 그뿐만 아니라, 일반적으로 면밀하게 조사해서 구매하는 자동차, 가전제품, 가구 등과 관련하여 고도로 개인화된 상품 추천을 원하는 안목 있는 구매자에게도 똑같이 유용할 수 있습니다. 모든 출력은 에이전트의 생각을 명확하게 인용 및 요약하여 완전히 문서화되므로 내용을 참조하고 정보를 확인하기가 쉽습니다. 특히 여러 웹사이트를 둘러봐야 하는 특정 분야의 비직관적인 정보를 찾는 데 효과적입니다. 심층 리서치는 단 하나의 쿼리로 복잡하고 시간 집약적인 웹 리서치를 신속히 처리하고 과정을 단축하여 작업자의 소중한 시간을 아껴줍니다.
심층 리서치는 관련 정보를 독립적으로 탐색하고 추론하며 웹 전체에서 얻은 인사이트를 통합하여 정리합니다. 이를 달성하기 위해 OpenAI의 첫 번째 추론 모델인 OpenAI o1의 기반이 된 방식과 동일한 강화 학습 방법을 사용하여, 브라우저 및 Python 도구 사용이 필요한 실제 작업으로 훈련되었습니다. o1은 코딩, 수학, 기타 기술 영역에서 인상적으로 역량을 발휘했지만, 현실에서 접하는 많은 과제는 다양한 온라인 소스에서의 광범위한 컨텍스트 및 정보 수집을 요구합니다. 심층 리서치는 이러한 추론 기능을 기반으로 그 격차를 좁힘으로써 사람들이 업무와 일상에서 마주하는 다양한 유형의 문제를 처리합니다.
ChatGPT의 메시지 컴포저에서 ‘심층 리서치’를 선택하고 쿼리를 입력합니다. ChatGPT에게 필요한 내용을 말합니다. 예를 들어, 스트리밍 플랫폼상의 경쟁력 분석이나 나에게 가장 좋은 통근용 자전거를 맞춤형 보고서로 요청합니다. 질문에 컨텍스트를 추가하기 위해 파일이나 스프레드시트를 첨부할 수 있습니다. 구동하기 시작하면 수행한 단계 및 사용한 소스를 요약한 사이드바가 나타납니다.
심층 리서치는 웹을 심도 있게 탐색하는 데 시간을 소요하므로 작업을 완료하는 데 5~30분 정도 걸릴 수 있습니다. 그동안 사용자는 잠시 쉬거나 다른 작업을 진행할 수 있습니다. 리서치가 완료되면 알림을 받게 됩니다. 최종 출력은 채팅 내에서 보고서로 표시됩니다. 몇 주 내로, 명확성을 높이고 컨텍스트를 더하기 위해 보고서에 이미지 삽입, 데이터 시각화, 기타 분석 결과도 추가할 예정입니다.
심층 리서치에 비해 GPT‑4o는 실시간 멀티 모달 대화에 이상적입니다. 깊이와 밀도가 중요한 분야별 다면적 연구를 위해 광범위한 탐색을 수행하고 각 주장을 인용할 수 있는 심층 리서치의 역량은 작업 결과물로 사용할 수 있도록 제대로 문서화되고 검증된 답변을 제공하므로 요약과 차이가 있습니다.
GPT-4o
심층 리서치
심층 리서치는 고도로 세분된 방식으로 프롬프트에 대응하며, 상위 10개 선진국과 상위 10개 개발도상국에 대한 국가별 데이터를 나란히 제공하여 쉽게 참고하고 비교하도록 해줍니다. 해당 정보를 이용하여 정보 기반의 활용도 높은 상세한 시장 진입 추천 사항을 제공합니다.
심층 리서치는 다양한 영역을 아우르는 어려운 검색 및 추론 작업에 대해 포괄적인 강화 학습을 사용하여 훈련되었습니다. 그 훈련을 통해, 필요한 데이터를 찾기 위해 여러 단계를 거치는 방법을 계획하고 실행하며 실시간으로 접하는 정보에 따라 필요하면 방향을 전환해 대응하는 것을 학습했습니다. 이 모델은 사용자가 업로드한 파일을 탐색하고, Python 도구를 사용하여 그래프를 구성 및 반복하고, 응답에서 생성된 그래프와 이미지를 삽입하며, 소스에서 찾은 특정 문장이나 구절을 인용할 수도 있습니다. 이러한 훈련의 결과로, 현실에서의 문제에 중점을 둔 다수의 공개 평가에서 최고 점수를 새롭게 기록했습니다.
광범위한 분야의 주제에 대해 전문가 수준의 질문으로 AI를 테스트한 Humanity’s Last Exam(새 창에서 열기)에서 최근 공개된 결과에 따르면 심층 리서치를 구동하는 모델이 26.6%의 정확도로 새롭게 최고 점수를 기록했습니다. 이 테스트는 언어학에서 로켓 과학, 고전에서 생태학에 이르기까지 100개 이상의 주제에 걸쳐 3,000개 이상의 객관식 및 단답형 질문으로 구성되어 있습니다. OpenAI o1과 비교할 때 가장 큰 향상은 화학, 인문학 및 사회 과학, 그리고 수학 분야에서 나타났습니다. 심층 리서치를 구동하는 모델은 필요할 때 전문 정보를 효과적으로 찾아내는 인간과 유사한 접근 방식을 보여주었습니다.
| 모델 | 정확도(%) |
|---|---|
| GPT-4o | 3.3 |
| Grok-2 | 3.8 |
| Claude 3.5 Sonnet | 4.3 |
| Gemini Thinking | 6.2 |
| OpenAI o1 | 9.1 |
| DeepSeek-R1* | 9.4 |
| OpenAI o3-mini (medium)* | 10.5 |
| OpenAI o3-mini (high)* | 13.0 |
| OpenAI 심층 리서치** | 26.6 |
실제 질문에 대해 AI를 평가하는 공개 벤치마크인 GAIA(새 창에서 열기)1에 따르면 심층 리서치를 구동하는 모델이 외부 리더보드(새 창에서 열기)에서 최고점을 기록하며 새로운 최고 수준(SOTA)을 달성했습니다. 세 가지 난이도 수준의 질문을 포함하는 이러한 과제를 성공적으로 완료하려면 추론, 멀티 모달 숙련도, 웹 브라우징, 능숙한 도구 사용 등의 능력이 필요합니다.
| GAIA | ||||
|---|---|---|---|---|
| 레벨 1 | 레벨 2 | 레벨 3 | 평균 | |
| 이전 SOTA(새 창에서 열기) | 67.92 | 67.44 | 42.31 | 63.64 |
| 심층 리서치(pass@1) | 74.29 | 69.06 | 47.6 | 67.36 |
| 심층 리서치(cons@64) | 78.66 | 73.21 | 58.03 | 72.57 |
GAIA 작업 예시
여러 영역에 걸쳐 전문가 수준 작업을 내부적으로 평가한 결과, 각 분야 전문가는 심층 리서치가 몇 시간이 걸려 직접 처리해야 하는 까다로운 조사 작업을 자동화한다고 평가했습니다.
통과 비율 vs 최대 도구 호출
전문가 수준 작업 예시
예상 경제적 가치별 전문가 수준의 통과 비율
예상 시간별 전문가 수준의 통과 비율
심층 리서치는 새로운 가능성을 상당히 열어주지만, 아직 초기 단계이며 한계가 있습니다. 내부 평가에 따르면 기존 ChatGPT 모델보다 현저히 낮은 비율이긴 하지만 응답에서 사실처럼 말하는 환각 현상과 잘못된 추론이 때떄로 발생할 수 있습니다. 권위 있는 정보와 소문을 구별하는 데 어려움을 겪을 수 있으며, 현재 신뢰도 보정에서 약점을 보여 불확실성을 정확하게 전달하지 못하는 경우가 많습니다. 실행 시 보고서 및 인용에 사소한 형식 오류가 있을 수 있으며, 작업 시작에 더 오랜 시간이 걸릴 수 있습니다. 이러한 모든 문제들은 사용량이 늘고 시간이 지나면 빠르게 개선될 것으로 예상합니다.
ChatGPT의 심층 리서치는 현재 매우 많은 컴퓨팅 자원을 필요로 합니다. 쿼리 리서치에 걸리는 시간이 길수록 더 많은 추론 컴퓨팅이 필요합니다. 오늘부터 Pro 사용자에게 최적화된 버전으로 시작하며, 월 최대 100개의 쿼리를 제공합니다. Plus 및 Team 사용자에게 다음으로 액세스 권한이 부여되고, 그 다음은 Enterprise 사용자입니다. 현재 영국, 스위스, 유럽 경제 지역의 사용자에게 액세스를 제공하기 위해 노력 중입니다.
더 빠르고 비용 효율적인 심층 리서치 버전을 출시할 예정이며, 이 버전은 더 작은 모델을 기반으로 하지만 여전히 고품질 결과를 제공하므로 유료 사용자에게는 훨씬 더 높은 사용량을 제공할 예정입니다.
앞으로 몇 주, 몇 달 동안 기술 인프라를 개선하고, 현재 출시 상황을 면밀히 모니터링하며, 더욱 엄격한 테스트를 진행할 예정입니다. 이는 ChatGPT의 점진적 배포 원칙과 일치합니다. 모든 안전 점검이 출시 기준을 계속 충족한다면, 약 한 달 안에 Plus 사용자에게 심층 리서치 기능을 출시할 것으로 예상합니다.
심층 리서치는 현재 ChatGPT 웹에서 사용할 수 있으며 이달 내에 모바일 및 데스크톱 앱으로 확대될 예정입니다. 현재 심층 리서치는 공개 웹과 업로드된 파일에 액세스할 수 있습니다. 향후에는 구독 기반 또는 내부 리소스로 액세스를 확장하고, 더욱 전문화된 데이터 소스에 연결하여 더욱 향상된 품질의 보다 개인화된 출력을 얻을 수 있습니다.
더 나아가, 우리는 실제 세계의 비동기적 리서치 및 실행을 위해 ChatGPT 내에서 에이전트 경험의 통합을 구상하고 있습니다. 비동기 온라인 조사를 수행할 수 있는 심층 리서치와 실제 작업을 실행할 수 있는 Operator의 결합을 통해 ChatGPT는 사용자를 위해 점점 더 정교한 작업을 수행할 수 있을 것입니다.
2025년 2월 3일, 부록: 심층 리서치를 구동하는 o3 초기 버전에 대해 엄격한 안전 테스트, 준비성 평가 및 거버넌스 검토를 수행했으며, 그 결과 중간(새 창에서 열기) 위험으로 파악되었습니다. 심층 리서치의 웹 브라우징 기능과 관련된 점증적 위험을 더 잘 이해하기 위해 추가적인 안전 테스트도 실시했으며, 새로운 완화 조치를 추가했습니다. 현재의 제한적 출시를 계속해서 철저히 테스트하고 면밀히 모니터링할 것입니다. 액세스를 Plus 사용자에게 확대할 때 시스템 카드에 심층 리서치에 대한 안전 인사이트와 보호 조치를 공유할 예정입니다.
각주
- 1
OpenAI는 온라인상에 이 데이터세트에 대한 실제 정답이 널리 퍼진 것을 파악했고 모델의 공정한 평가를 위해 여러 웹사이트 및 URL을 차단했습니다.
작성
리서치 리드
Isa Fulford 및 Zhiqing Sun
기초 기여자
Alex Tachard Passos, Alexandra Barr, Allison Tam, Charlotte Cole, Hyung Won Chung, Jason Wei, Jon Blackman, Scott Mayer McKinney 및 Valerie Qi
핵심 기여자
리서치
Elaine Ya Le, Eric Mitchell, Eric Wallace, Hyung Won Chung, Ignasi Clavera, Leo Liu, Lorenz Kuhn, Louis Feuvrier, Max Schwarzer, Saachi Jain, Scottie Yan, Shunyu Yao, Vitchyr Pong
배포
Carpus Chang, Harry Zhao, Joseph Trasatti, Joshua Dickens, Matt Kaufer, Mike Trpcic, Minnia Feng, Neel Ajjarapu, Peter Vidani, Sean Fitzgerald
기여자
리서치
Ahmed El-Kishky, AJ Ostrow, Alexander Wei, Andrei Gheorghe, Andrew Kondrich, Andrey Mishchenko, Anuj Nair, Behrooz Ghorbani, Brydon Eastman, Chak Li, Foivos Tsimpourlas, Francis Song, Giambattista Parascandolo,Gildas Chabot, Hessam Bagherinezhad, Haitang Hu, Hongyu Ren, Henry Aspegren, Hunter Lightman, Ilya Kostrikov, Ilge Akkaya, James Lennon, Jean Harb, Jonathan Ward, Kai Chen, Katy Shi, Kevin Liu, Kevin Yu, Manuka Stratta, Marvin Zhang, Mengyuan Yan, Mostafa Rohaninejad, Noam Brown, Phoebe Thacker, Raz Goan, Reah Miyara, Spencer Papay, Taylor Gordon, Wenda Zhou, Wenlei Xie, Yash Patil, Yann Dubois, Youlong Cheng, Yushi Wang, Wyatt Thompson
+ 그 외 o3와 관련된 모든 기여자
안전 시스템
Adam Kalai, Alex Beutel, Andrea Vallone, Andy Applebaum, David Robinson, Elizabeth Proehl, Evan Mays, Grace Zhao, Irina Kofman, Jason Phang, Joaquin Quinonero Candela, Joel Parish, Kevin Liu, Kristen Ying, Lama Ahmad, Leon Maksin, Leyton Ho, Meghan Shah, Michele Wang, Miles Wang, Phillip Guo, Olivia Watkins, Owen Campbell-Moore, Patrick Chao, Sam Toizer, Samuel Miserendino, Sandhini Agarwal, Tejal Patwardhan, Tina Sriskandarajah, Troy Peterson, Yaodong Yu, Yunyun Wang
배포
Adam Koppel, Adam Wells, Adele Li, Andy Applebaum, Andrey Malevich, Andrew Duberstein, Andrew Howell, Anton Tananaev, Ashley Tyra, Brandon Walkin, Bryan Ashley, Cary Bassin, Cary Hudson, Cory Decareaux, Cristina Scheau, Derek Chen, Dibya Bhattacharjee, Drea Lopez, Eric Antonow, Eric Burke, Filippo Raso, Fotis Chantzis, Freddie Sulit, Harris Cohen, Heather Whitney, Jay Dixit, Jeffrey Han, Jen Robinson, Jessica Shieh, Joel Parish, Kan Wu, Kevin Gladstone, Kshitij Wadhwa, Leo Vandriel, Leyton Ho, Liang Chen, Madeline Christian, Mamie Rheingold, Matt Jones, Michelle Fradin, Mike McClay, Mingxuan Wang, Nacho Soto, Niko Felix, Patrick Delaney, Paul McMillan, Philip Pronin, Rodrigo Riaza Perez, Samuel Miserendino, Scott Ethersmith, Steven Baldwin, Thomas Dimson, Tomo Hiratsuka, Yaming Lin, Yara Khakbaz, Yining Chen
리더십
Akshay Nathan, Greg Brockman, Hannah Wong, Jakub Pachocki, Jerry Tworek, Johannes Heidecke, Josh Tobin, Liam Fedus, Mark Chen, Mia Glaese, Nick Turley, Sam Altman 및 Wojciech Zaremba