Agents SDK'nın sonraki gelişim adımı
Güncellenen Agents SDK, geliştiricilerin dosyaları inceleyebilen, komut çalıştırabilen, kod düzenleyebilen ve kontrollü sandbox ortamlarında uzun soluklu görevler üzerinde çalışabilen ajanlar geliştirmesine yardımcı oluyor.
Agents SDK'ya, geliştiricilere kullanıma başlaması kolay ve OpenAI modelleri için doğru şekilde tasarlanmış standart bir altyapı sunmak üzere; ajanların bilgisayardaki dosyalar ve araçlar arasında çalışmasını sağlayan modele özel bir çalıştırma altyapısı ve güvenli yürütmeyi destekleyen yerleşik sandbox desteği gibi yeni yetkinlikler ekliyoruz.
Örneğin, geliştiriciler bir ajana kanıtları incelemesi için kontrollü bir çalışma alanı, açık talimatlar ve ihtiyaç duyduğu araçları sağlayabiliyor.
Kullanışlı ajanlar geliştirmek için geliştiricilerin yalnızca en iyi modellere değil, aynı zamanda ajanların dosyaları incelemesini, komut çalıştırmasını, kod yazmasını ve çok adımlı görevleri sürdürebilmesini mümkün kılan sistemlere de ihtiyacı var.
Bugün kullanılan sistemler, ekipler prototipten üretime geçerken bazı sınırlamaları ve zorunlu tercihleri de beraberinde getiriyor. Modelden bağımsız çerçeveler esneklik sunuyor, ancak en gelişmiş modellerin yetkinliklerinden tam olarak yararlanamıyor. Model sağlayıcılarının SDK'ları modellere daha yakın çalışabiliyor, ancak çoğu zaman çalıştırma altyapısı üzerinde yeterli görünürlük sunmuyor. Yönetilen ajan API'leri ise devreye almayı kolaylaştırsa da, ajanların nerede çalışacağını ve hassas verilere nasıl erişeceğini sınırlayabiliyor.
Yeni SDK'yı bizimle birlikte test eden bazı müşterilerin değerlendirmeleri şöyle:
"GPT-5.4, kapsamlı belge analizine dayanan hukuki çalışmalar için yeni bir performans standardı belirliyor. BigLaw Bench değerlendirmemizde %91 puan elde etti. Diğer modellere kıyasla GPT-5.4; karmaşık işlemsel analizleri yapılandırma, uzun sözleşmeler boyunca doğruluğu koruma ve hukuk profesyonellerinin ihtiyaç duyduğu yüksek ayrıntı düzeyini sağlama konusunda şu anda daha başarılı."
Bugünkü sürümle birlikte Agents SDK'nın çalıştırma altyapısı, belgeler, dosyalar ve sistemlerle çalışan ajanlar için daha güçlü hale geliyor. Artık yapılandırılabilir bellek, sandbox ortamını dikkate alan orkestrasyon, Codex benzeri dosya sistemi araçları ve en üst seviye ajan sistemlerinde giderek yaygınlaşan temel yapı taşlarıyla standartlaştırılmış entegrasyonlar ekliyor.
Bu temel yapı taşları; MCP(yeni bir pencerede açılır) üzerinden araç kullanımını, skills(yeni bir pencerede açılır) aracılığıyla adım adım açıklamayı, AGENTS.md(yeni bir pencerede açılır) üzerinden özel talimatları, shell(yeni bir pencerede açılır) aracıyla kod yürütmeyi, apply_patch(yeni bir pencerede açılır) aracıyla dosya düzenlemeyi ve daha fazlasını kapsıyor. Çalıştırma altyapısı, zaman içinde yeni ajan odaklı desenleri ve temel yapı taşlarını bünyesine katmayı sürdürecek. Böylece geliştiriciler, çekirdek altyapıyı güncellemeye daha az; ajanlarını gerçekten faydalı kılan alan odaklı mantığa ise daha fazla zaman ayırabilecek.
Çalıştırma altyapısı ayrıca, çalıştırma katmanını bu modellerin en iyi performans gösterdiği çalışma biçimiyle uyumlu hale getirerek geliştiricilerin en üst seviye modellerin yetkinliklerinden daha fazla yararlanmasına yardımcı oluyor. Bu da ajanları modelin doğal çalışma düzenine daha yakın tutuyor ve özellikle görevler uzun soluklu olduğunda ya da farklı araç ve sistemler arasında koordinasyon gerektiğinde, karmaşık işlerde güvenilirliği ve performansı artırıyor.
Bununla birlikte, her ürünün kendine özgü ihtiyaçları olduğunu ve çoğu zaman tek bir kalıba tam olarak uymadığını biliyoruz. Agents SDK'yı da bu çeşitliliği destekleyecek şekilde tasarladık. Geliştiriciler, kullanıma hazır ancak aynı zamanda esnek bir altyapıya sahip oluyor. Bu da onların araç kullanımı, bellek ve sandbox ortamı dahil olmak üzere sistemi kendi teknoloji altyapısına kolayca uyarlamasını sağlıyor.
Güncellenen Agents SDK, sandbox çalıştırmayı yerel olarak destekliyor. Böylece ajanlar, belirli bir görev için ihtiyaç duydukları dosyalar, araçlar ve bağımlılıklarla kontrollü bilgisayar ortamlarında çalışabiliyor.
Birçok kullanışlı ajan; dosya okuyup yazabilecekleri, bağımlılık kurabilecekleri, kod çalıştırabilecekleri ve araçları güvenli biçimde kullanabilecekleri bir çalışma alanına ihtiyaç duyar. Yerleşik sandbox desteği, geliştiricilere bu çalıştırma katmanını hazır şekilde sunuyor; böylece bunu sıfırdan kendilerinin kurması gerekmiyor.
Geliştiriciler kendi sandbox yapılarını kullanabilir ya da Blaxel, Cloudflare, Daytona, E2B, Modal, Runloop ve Vercel için sunulan yerleşik destekten yararlanabilir.
Bu ortamların farklı sağlayıcılar arasında taşınabilmesini sağlamak için SDK, ajanın çalışma alanını tanımlayan bir Tanım Dosyası soyutlaması da sunuyor. Geliştiriciler yerel dosyaları bağlayabilir, çıktı dizinlerini tanımlayabilir ve AWS S3, Google Cloud Storage, Azure Blob Storage ve Cloudflare R2 gibi depolama sağlayıcılarından veri getirebilir.
Bu sayede geliştiriciler, ajanın çalışma ortamını yerel prototipten canlı kullanım ortamına geçişe kadar tutarlı biçimde kurgulayabiliyor. Ayrıca modele de öngörülebilir bir çalışma alanı sağlıyor: girdileri nerede bulacağını, çıktıları nereye yazacağını ve uzun soluklu bir görev boyunca işi nasıl düzenli tutacağını tanımlıyor.

Ajan sistemleri, prompt enjeksiyonu ve veri dışarı sızdırma girişimleri olacakmış gibi tasarlanmalıdır. Çalıştırma altyapısı ile bilgi işlemin ayrılması, kimlik bilgilerinin model tarafından üretilen kodun çalıştığı ortamlardan uzak tutulmasına yardımcı olur.
Ayrıca dayanıklı çalıştırmayı da mümkün kılar. Ajanın durumu dışsallaştırıldığında, bir sandbox kapsayıcısının kaybedilmesi çalışmanın kaybedilmesi anlamına gelmez. Yerleşik anlık görüntü alma ve yeniden yükleme özellikleri sayesinde Agents SDK, orijinal ortam başarısız olur ya da süresi dolarsa ajanın durumunu yeni bir kapsayıcı içinde geri yükleyebilir ve son kontrol noktasından devam edebilir.
Son olarak, ajanları daha kolay büyütülebilir hale getirir. Ajan çalıştırmaları bir ya da birden fazla sandbox kullanabilir, sandbox'ları yalnızca gerektiğinde çağırabilir, alt ajanları izole ortamlara yönlendirebilir ve daha hızlı çalıştırma için kapsayıcılar arasında işi paralelleştirebilir.
Bu yeni Agents SDK yetkinlikleri, API üzerinden tüm müşterilerin genel kullanımına sunulmuştur ve token ile araç kullanımına dayalı standart API fiyatlandırmasını kullanır.
Agents SDK'yı geliştirmeyi sürdürürken, geliştiricilerin onunla neler oluşturabileceğinin kapsamını da genişletmeye devam edeceğiz. Amacımız, daha yetkin ajanların daha az özel altyapıyla canlı kullanım ortamına taşınmasını kolaylaştırırken, geliştiricilerin bu ajanları kendi ortamlarına uyarlamak için ihtiyaç duyduğu esneklik ve kontrolü korumak.
Yeni çalıştırma altyapısı ve sandbox yetkinlikleri ilk olarak Python'da kullanıma sunuluyor; TypeScript desteği ise sonraki sürümlerden birinde gelecek. Ayrıca kod modu ve alt ajanlar gibi ek ajan yetkinliklerini hem Python'a hem de TypeScript'e kazandırmak için çalışıyoruz.
Ayrıca zaman içinde daha fazla sandbox sağlayıcısını, daha fazla entegrasyonu ve geliştiricilerin SDK'yı mevcut araç ve sistemlerine bağlamasını kolaylaştıracak yeni yöntem desteğini devreye alarak daha geniş ajan ekosistemini bir araya getirmeyi amaçlıyoruz.


