2025년 5월 21일

응답 API의 새로운 도구 및 기능

응답 API에서 개발자와 기업을 위해 제공하는 원격 MCP 서버 지원, 이미지 생성, 코드 인터프리터를 소개합니다.

로딩 중...

에이전트형 애플리케이션 구축을 위한 핵심 API 요소인 응답 API에 추가된 새로운 내장 도구를 오늘 공개합니다. 여기에는 모든 원격 모델 컨텍스트 프로토콜(Model Context Protocol, MCP) 서버⁠(새 창에서 열기)뿐 아니라 이미지 생성⁠(새 창에서 열기), 코드 인터프리터⁠(새 창에서 열기), 그리고 향상된 파일 검색⁠(새 창에서 열기)에 대한 지원이 포함됩니다. 이들 도구는 GTP-4o 시리즈, GPT‑4.1 시리즈 및 OpenAI o-시리즈 추론 모델에서 사용할 수 있습니다. 현재 o3 및 o4-mini는 응답 API 사고의 사슬 내에서 곧바로 도구 및 기능을 호출하여 더욱 컨텍스트가 풍부하고 관련성이 높은 답변을 생성할 수 있습니다. o3 및 o4-mini를 응답 API와 함께 사용하면 요청과 도구 호출에 대한 추론 토큰을 보존하여 모델 인텔리전스를 개선하고 개발자 입장의 비용 및 레이턴시를 줄입니다.

기업과 개발자를 위해 신뢰성, 가시성, 개인정보 보호를 향상하는 새로운 기능도 응답 API에서 공개합니다. 여기에는 장시간 실행 작업을 비동기적으로, 그리고 더 안정적으로 처리하는 백그라운드 모드⁠(새 창에서 열기)가 포함되며, 추론 요약⁠(새 창에서 열기) 및 암호화된 추론 항목⁠(새 창에서 열기)을 지원합니다.

2025년 3월 웹 검색, 파일 검색, 컴퓨터 사용 등의 도구를 포함한 응답 API를 공개한 후, 수십만에 달하는 개발자들이 API를 사용하여 OpenAI의 모델 전반에서 엄청난 양의 토큰을 처리해 왔습니다. 고객들은 API를 사용하여 다양한 에이전트형 애플리케이션을 구축했습니다. Zencoder⁠(새 창에서 열기)의 코딩 에이전트, 사모 펀드 및 투자 은행 분야를 지원하는 Revi⁠(새 창에서 열기)의 시장 인텔리전스 에이전트, MagicSchool AI⁠(새 창에서 열기)의 교육 어시스턴트를 예로 들 수 있으며, 이들 애플리케이션은 모두 웹 검색을 사용하여 관련성 높은 최신 정보를 앱에 가져옵니다. 이제 개발자들은 오늘 공개된 새로운 도구와 기능을 활용하여 훨씬 더 유용하고 신뢰할 수 있는 에이전트를 구축할 수 있습니다.

새로운 원격 MCP 서버 지원

에이전트 SDK 내 MPC 지원⁠(새 창에서 열기) 릴리즈를 기반으로 응답 API에 원격 MCP 서버⁠(새 창에서 열기)에 대한 지원을 추가할 예정입니다. MCP는 애플리케이션이 LLM에 컨텍스트를 제공하는 방식을 표준화하는 오픈 프로토콜입니다. 응답 API에서 MCP 서버를 지원함으로써 개발자는 코드 몇 줄만 작성하면 MCP에서 호스팅되는 도구에 OpenAI 모델을 연결할 수 있습니다. 현재 개발자들이 원격 MCP 서버와 응답 API를 함께 사용하는 예시는 다음과 같습니다.

Python

1response = client.responses.create(
2  model="gpt-4.1",
3  tools=[{
4    "type": "mcp",
5    "server_label": "shopify",
6    "server_url": "https://pitchskin.com/api/mcp",
7  }],
8  input="Add the Blemish Toner Pads to my cart"
9)

The Blemish Toner Pads have been added to your cart! You can proceed to checkout here:

Pitch. Skin checkout page showing express options (Shop Pay, PayPal, G Pay), contact and delivery form fields, and an order summary for one ‘Blemish Toner Pads 200 mL (120 pads)’ priced at AUD $49.

널리 쓰이는 원격 MCP 서버에는 Cloudflare⁠(새 창에서 열기), HubSpot⁠(새 창에서 열기), Intercom⁠(새 창에서 열기), PayPal⁠(새 창에서 열기), Plaid⁠(새 창에서 열기), Shopify⁠(새 창에서 열기), Stripe⁠(새 창에서 열기), Square⁠(새 창에서 열기), Twilio⁠(새 창에서 열기), Zapier⁠(새 창에서 열기) 등이 있습니다. 원격 MCP 서버의 에코시스템이 가까운 시일 내에 빠르게 성장하여 사용자들이 이미 많이 사용하고 있는 도구 및 데이터 소스에 연결할 수 있는 강력한 에이전트를 개발자들이 더욱 쉽게 구축할 수 있기를 기대합니다. 에코시스템의 지원과 표준 개발에 대한 지원을 최대화하기 위해 OpenAI는 MCP 운영 위원회에 합류했습니다.

자체 원격 MCP 서버를 구동하는 방법을 알아보려면 Cloudflare⁠(새 창에서 열기)의 가이드를 확인하세요. 응답 API에서 MCP 도구를 사용하는 방법을 알아보려면 OpenAI의 API Cookbook의 가이드⁠(새 창에서 열기)를 확인하세요.

이미지 생성, 코드 인터프리터 및 파일 검색 업데이트

응답 API의 내장 도구를 이용해 개발자들은 단 한 번의 API 호출로 더 기능이 뛰어난 에이전트를 쉽게 만들 수 있습니다. 추론하는 동안 다양한 도구를 호출함으로써 모델은 Humanity’s Last Exam과 같은 산업 표준 벤치마크에서 훨씬 더 높은 도구 호출 성능을 달성할 수 있습니다(소스). 오늘 다음과 같은 새로운 도구를 공개합니다.

이미지 생성: 이미지 API⁠(새 창에서 열기) 사용에 더해 개발자들은 이제 OpenAI의 최신 이미지 생성 모델인 gpt-image-1을 응답 API 내 도구로 활용할 수 있습니다. 이 도구는 실시간 스트리밍을 지원하므로, 개발자는 생성된 그대로의 이미지를 미리 볼 수 있으며 멀티 턴 편집을 통해 이들 이미지를 단계별로 세세하게 개선하도록 모델에 지시할 수 있습니다. 자세히 알아보기⁠(새 창에서 열기)
코드 인터프리터: 개발자는 이제 응답 API 내에서 코드 인터프리터⁠(새 창에서 열기) 도구를 사용할 수 있습니다. 이 도구는 데이터 분석에 유용하며, 복잡한 수학과 코딩 문제를 해결하고, 모델이 이미지를 심층적으로 이해하고 조작하도록 돕습니다(예: 이미지를 이용한 생각). o3 및 o4-mini 같은 모델이 사고의 사슬 내에서 코드 인터프리터를 사용할 수 있게 되면서, Humanity’s Last Exam 등의 다양한 벤치마크에서 성능 향상을 달성할 수 있었습니다(소스). 자세히 알아보기⁠(새 창에서 열기)
파일 검색: 개발자들은 이제 OpenAI의 추론 모델이서 파일 검색⁠(새 창에서 열기) 도구에 액세스할 수 있습니다. 파일 검색을 통해 개발자는 사용자의 쿼리에 따라 문서의 관련 부분을 모델의 컨텍스트로 가져올 수 있습니다. OpenAI는 파일 검색 도구 업데이트도 공개할 예정이며, 업데이트 기능을 통해 개발자는 여러 벡터 저장소에서 검색을 수행하고 배열을 사용한 속성 필터링을 지원할 수 있습니다. 자세히 알아보기⁠(새 창에서 열기)

응답 API의 새로운 기능

새로운 도구와 더불어 응답 API의 새로운 기능을 다음과 같이 추가합니다.

백그라운드 모드: Codex, 심층 리서치, Operator 등의 에이전트형 제품에서 확인된 바와 같이 추론 모델은 복잡한 문제를 몇 분 만에 해결할 수 있습니다. 이제 개발자는 백그라운드 모드를 사용하여 유사한 환경을 o3 같은 모델에 구축할 수 있습니다. 백그라운드 모드는 작업을 비동기식으로 처리하므로 타임아웃이나 연결 문제를 걱정할 필요가 없습니다. 개발자는 완료 여부를 확인하기 위해 이 객체들을 폴링하거나, 애플리케이션이 최신 상태를 따라잡아야 할 때마다 이벤트를 스트리밍하기 시작할 수 있습니다. 자세히 알아보기⁠(새 창에서 열기)

Python

1response = client.responses.create(
2  model="o3",
3  input="Write me an extremely long story.",
4  reasoning={ "effort": "high" },
5  background=True
6)

추론 요약: 이제 응답 API는 사용자가 ChatGPT에서 보는 것과 비슷하게 모델 내부 사고의 사슬을 자연어로 간략히 정리한 요약을 생성할 수 있습니다. 이를 통해 개발자는 더욱 쉽게 디버깅과 감사를 진행하고 더 나은 최종 사용자 경험을 구축할 수 있습니다. 추론 요약은 추가 비용 없이 사용할 수 있습니다. 자세히 알아보기⁠(새 창에서 열기)

Python

1response = client.responses.create(
2    model="o4-mini",
3    tools=[
4        {
5            "type": "code_interpreter",
6            "container": {"type": "auto"}
7        }
8    ],
9    instructions=(
10        "You are a personal math tutor. "
11        "When asked a math question, run code to answer the question."
12    ),
13    input="I need to solve the equation `3x + 11 = 14`. Can you help me?",
14    reasoning={"summary": "auto"}
15)

암호화 추론 항목: 데이터 미보존(ZDR)⁠(새 창에서 열기) 사용에 적격한 고객은 이제 추론 항목을 OpenAI의 서버에 저장하지 않고 API 요청에서 추론 항목을 재사용할 수 있습니다. o3 및 o4-mini 같은 모델의 경우, 함수 호출 간 추론 항목 재사용을 통해 인텔리전스를 향상하고 토큰 사용을 줄이고 캐시 적중률을 증가시켜 비용과 레이턴시를 낮춥니다. 자세히 알아보기⁠(새 창에서 열기)

Python

1response = client.responses.create(
2  model="o3",
3  input="Implement a simple web server in Rust from scratch.",
4  store=False,
5  include=["reasoning.encrypted_content"]
6)

가격 및 가용성

여기서 소개된 모든 도구와 기능은 현재 응답 API에서 사용할 수 있으며 GPT‑4o 시리즈, GPT‑4.1 시리즈 및 OpenAI o-시리즈 추론 모델(o1, o3, o3‑mini, o4-mini)에서 지원됩니다. 이미지 생성은 OpenAI 추론 모델 시리즈 중 o3에서만 지원됩니다.

기존 도구의 가격은 변함 없이 그대로 유지됩니다. 이미지 생성은 1백만 텍스트 입력 토큰당 $5.00, 1백만 이미지 입력 토큰당 $10.00, 1백만 이미지 출력 토큰당 $40.00의 가격으로 제공되며 캐시된 입력 토큰은 75% 할인이 적용됩니다. 코드 인터프리터는 컨테이너당 $0.03의 가격으로 제공됩니다. 파일 검색은 벡터 저장소 1GB당 하루 $0.10, 도구 호출 1,000건당 $2.50의 가격으로 제공됩니다. 원격 MCP 서버 도구 호출에는 별도의 비용이 청구되지 않으므로 API의 출력 토큰에 대한 비용만 결제하면 됩니다. OpenAI 문서에서 가격⁠(새 창에서 열기)에 대해 자세히 알아보세요.

OpenAI는 여러분이 선보일 프로젝트를 기대하고 있습니다.

저자

OpenAI