한 단계 더 진화한 에이전트 SDK
업데이트된 Agents SDK는 개발자가 파일을 확인하고, 명령을 실행하며, 코드를 수정하고, 제어된 샌드박스 환경에서 장기적인 작업을 수행할 수 있는 에이전트를 구축할 수 있도록 지원합니다.
OpenAI 모델에 최적화된 표준 인프라를 보다 쉽게 활용할 수 있도록 Agents SDK에 새로운 기능을 추가했습니다. 여기에는 에이전트가 컴퓨터 내 파일과 툴 전반에서 작업할 수 있도록 하는 모델에 최적화된 실행 환경과, 해당 작업을 안전하게 수행할 수 있도록 하는 네이티브 샌드박스 실행 기능이 포함됩니다.
예를 들어 개발자는 에이전트에 제어된 워크스페이스, 명확한 지침, 그리고 필요한 툴을 제공하여 데이터를 검토하고 분석하도록 할 수 있습니다.
개발자가 유용한 에이전트를 구축하려면 최고의 모델만으로는 부족하며, 에이전트가 파일을 확인하고, 명령을 실행하고, 코드를 작성하며, 여러 단계를 거쳐 계속 작업할 수 있도록 지원하는 시스템이 필요합니다.
현재 시스템은 팀이 프로토타입에서 프로덕션으로 전환하는 과정에서 여러 가지 한계를 동반합니다. 모델에 종속되지 않는 프레임워크는 유연하지만 최첨단 모델의 성능을 충분히 활용하지 못하며, 모델 제공자의 SDK는 모델에 더 밀접하게 연결될 수 있지만 실행 환경에 대한 가시성이 부족한 경우가 많고, 관리형 에이전트 API는 배포를 단순화하는 대신 에이전트의 실행 위치나 민감한 데이터 접근 방식에 제약을 둡니다.
다음은 새로운 SDK를 함께 테스트한 고객들의 의견입니다.
“GPT-5.4는 문서 중심의 법률 업무에서 새로운 성능 기준을 제시하며 당사의 BigLaw Bench 평가에서 91%의 점수를 기록했습니다. 다른 모델과 비교했을 때 GPT-5.4는 복잡한 거래 분석을 더 체계적으로 구성하고 긴 계약서에서도 정확성을 안정적으로 유지하며 법률 실무자가 요구하는 높은 수준의 세부 정보까지 충실하게 제공합니다.”
이번 릴리스를 통해 Agents SDK의 실행 환경은 문서, 파일, 시스템을 다루는 에이전트에 더욱 적합하게 강화되었습니다. 이제 구성 가능한 메모리, 샌드박스 인식 오케스트레이션, Codex와 유사한 파일 시스템 툴, 그리고 최첨단 에이전트 시스템에서 점점 표준이 되어가고 있는 기본 구성 요소와의 통합 기능이 추가되었습니다.
이러한 기본 구성 요소에는 MCP(새 창에서 열기)를 통한 툴 사용, skills(새 창에서 열기)를 통한 점진적 정보 제공, AGENTS.md(새 창에서 열기)를 통한 사용자 정의 지침이 포함됩니다. 또한 shell(새 창에서 열기) 툴을 사용한 코드 실행, apply patch(새 창에서 열기) 툴을 사용한 파일 수정 등 다양한 기능이 포함됩니다. 이 실행 환경은 앞으로도 새로운 에이전틱 패턴과 구성 요소를 지속적으로 반영해 나갈 예정이며, 이를 통해 개발자는 핵심 인프라를 업데이트하는 데 드는 시간을 줄이고, 에이전트를 실제로 유용하게 만드는 도메인 로직에 더 집중할 수 있습니다.
또한 이 실행 환경은 실행 방식을 모델의 최적 작동 방식에 맞춤으로써, 최첨단 모델의 성능을 더 효과적으로 끌어낼 수 있도록 지원합니다. 이를 통해 에이전트가 모델의 자연스러운 동작 방식에 더 가깝게 작동하게 되며, 특히 장시간 실행되거나 다양한 툴과 시스템 간 협업이 필요한 복잡한 작업에서 신뢰성과 성능이 향상됩니다.
또한 각 제품은 고유한 특성을 가지며, 정형화된 틀에 딱 맞는 경우는 드물다는 점을 잘 알고 있습니다. 우리는 이러한 다양성을 지원하기 위해 Agents SDK를 설계했습니다. 개발자는 바로 사용할 수 있으면서도 유연한 실행 환경을 제공받아, 툴 사용, 메모리, 샌드박스 환경 등을 포함해 자신의 기술 스택에 맞게 쉽게 적용할 수 있습니다.
업데이트된 Agents SDK는 샌드박스 실행을 기본으로 지원하므로, 에이전트는 작업에 필요한 파일, 툴, 의존성을 갖춘 제어된 컴퓨터 환경에서 실행될 수 있습니다.
많은 유용한 에이전트는 파일을 읽고 쓰고, 의존성을 설치하며, 코드를 실행하고, 툴을 안전하게 사용할 수 있는 작업 공간을 필요로 합니다. 샌드박스 실행을 기본으로 제공함으로써, 개발자는 이러한 실행 환경을 처음부터 직접 구성해야 하는 부담 없이 바로 활용할 수 있습니다.
개발자는 자체 샌드박스를 사용할 수도 있고, Blaxel, Cloudflare, Daytona, E2B, Modal, Runloop, Vercel에 대한 기본 제공 지원을 활용할 수도 있습니다.
이러한 환경을 다양한 제공자 간에 이동 가능하도록 하기 위해, SDK는 에이전트의 워크스페이스를 정의하기 위한 매니페스트 추상화도 도입했습니다. 개발자는 로컬 파일을 마운트하고, 출력 디렉터리를 정의하며, AWS S3, Google Cloud Storage, Azure Blob Storage, Cloudflare R2와 같은 스토리지 제공자로부터 데이터를 불러올 수 있습니다.
이를 통해 개발자는 로컬 프로토타입부터 프로덕션 배포까지 일관된 방식으로 에이전트 환경을 구성할 수 있습니다. 또한 모델 입장에서도 입력을 어디서 찾고, 출력을 어디에 기록하며, 장시간 실행되는 작업을 어떻게 정리할지에 대해 예측 가능한 작업 환경이 제공됩니다.

에이전트 시스템은 프롬프트 인젝션 및 데이터 유출 시도를 전제로 설계되어야 합니다. 실행 환경과 컴퓨팅을 분리하면 모델이 생성한 코드가 실행되는 환경에서 자격 증명이 노출되는 것을 방지할 수 있습니다.
또한 안정적인 실행을 가능하게 합니다. 에이전트의 상태가 외부에 저장되면, 샌드박스 컨테이너가 사라지더라도 실행 자체가 손실되는 것은 아닙니다. 내장된 스냅샷 및 복원 기능을 통해, Agents SDK는 원래 환경이 실패하거나 만료되더라도 새로운 컨테이너에서 에이전트 상태를 복원하고 마지막 체크포인트부터 작업을 이어갈 수 있습니다.
마지막으로, 에이전트의 확장성을 높입니다. 에이전트 실행은 하나 또는 여러 개의 샌드박스를 사용할 수 있으며, 필요할 때만 샌드박스를 호출하고, 서브 에이전트를 격리된 환경으로 분리하며, 여러 컨테이너에서 작업을 병렬 처리해 실행 속도를 높일 수 있습니다.
이러한 새로운 Agents SDK 기능은 API를 통해 모든 고객에게 제공되며, 토큰 사용량과 툴 사용을 기준으로 하는 표준 API 요금이 적용됩니다.
Agents SDK 개발을 계속 진행하면서, 개발자가 구축할 수 있는 기능을 지속적으로 확장해 나갈 예정이며, 맞춤형 인프라를 최소화하면서도 더 강력한 에이전트를 프로덕션 환경에 쉽게 도입할 수 있도록 지원하는 동시에, 각자의 환경에 맞게 적용할 수 있는 유연성과 제어 기능을 유지할 것입니다.
새로운 실행 환경 및 샌드박스 기능은 우선 Python에서 제공되며, TypeScript 지원은 향후 릴리스에서 추가될 예정입니다. 또한 코드 모드와 서브 에이전트를 포함한 추가 에이전트 기능을 Python과 TypeScript 모두에서 지원하기 위해 개발을 진행하고 있습니다.
또한 더 많은 샌드박스 제공자 지원, 다양한 통합 기능, 그리고 개발자가 기존에 사용하는 툴과 시스템에 SDK를 연결할 수 있는 다양한 방법을 통해, 장기적으로 더 넓은 에이전트 에코시스템을 구축하는 데 기여하고자 합니다.


