Ajanlar oluşturmak için yeni araçlar
Platformumuzu, geliştiricilerin ve işletmelerin kullanışlı ve güvenilir ajanlar oluşturmasına yardımcı olacak şekilde geliştiriyoruz.

Bugün, geliştiricilerin ve işletmelerin kullanışlı ve güvenilir aracılar oluşturmasına yardımcı olacak yapı taşlarının ilk setini yayınlıyoruz. Ajanlar, görevleri kullanıcılar adına bağımsız olarak yerine getiren sistemlerdir Geçtiğimiz yıl içerisinde gelişmiş akıl yürütme, çok modlu etkileşimler ve yeni güvenlik teknikleri gibi yeni model yeteneklerini kullanıma sunduk. Modellerimiz, ajanlar oluşturmak için gereken karmaşık, çok adımlı görevleri bu yetenekler temelinde yerine getirebiliyor. Ancak müşterilerimizden aldığımız geri bildirimler, genellikle yeterli görünürlük veya yerleşik destek olmadan kapsamlı istem yineleme ve özel orkestrasyon mantığı gerektiren bu yeteneklerin üretime hazır ajanlara dönüştürülmesinin zorlu olabileceğini gösteriyor.
Bu zorlukların üstesinden gelmek amacıyla, ajan tabanlı uygulamaların geliştirilmesini basitleştirmek için özel olarak tasarlanmış yeni bir API setini ve araçları kullanıma sunuyoruz:
- Ajanlar oluşturmak için Chat Completions API’nin basitliğini, Assistants API'nin araç kullanım yetenekleriyle birleştiren yeni Responses API(yeni bir pencerede açılır)
- Web araması(yeni bir pencerede açılır), dosya arama(yeni bir pencerede açılır) ve bilgisayar kullanımı(yeni bir pencerede açılır) gibi yerleşik araçlar
- Tek ajanlı ve çok ajanlı iş akışlarının orkestrasyonu için yeni Agents SDK(yeni bir pencerede açılır)
- Ajanların iş akışını nasıl yönettiğini izlemek ve denetlemek için entegre gözlemlenebilirlik araçları(yeni bir pencerede açılır)
Bu yeni araçlar temel ajan mantığını, orkestrasyonu ve etkileşimleri düzenleyerek, geliştiricilerin ajan oluşturmaya başlamasını önemli ölçüde kolaylaştırıyor. Önümüzdeki haftalarda ve aylarda platformumuzda ajan tabanlı uygulamalarının oluşturulmasını daha da basitleştirmek ve hızlandırmak için ek araçlar ve özellikler yayınlamayı planlıyoruz.
Responses API, ajanlar oluşturmak için OpenAI’ın yerleşik araçlarından yararlanmayı kolaylaştıran yeni API temelimiz. Chat Completions’ın basitliğini, Assistants API’nin araç kullanım yetenekleriyle bir araya getiriyor. Modelin yetenekleri gelişmeye devam ettikçe, Responses API’nin ajan tabanlı uygulamalar oluşturan geliştiriciler için daha esnek bir temel sağlayacağına inanıyoruz. Geliştiriciler, birden fazla araç ve model yanıtı kullanan ve giderek karmaşıklaşan görevleri tek bir Responses API çağrısıyla çözebilecekler.
Responses API başlangıçta web araması, dosya araması ve bilgisayar kullanımı gibi yeni yerleşik araçları destekleyecek. Birlikte çalışarak modellerle gerçek dünya arasında bağlantı kurmak için tasarlanan bu araçlar, böylece görevleri tamamlama açısından daha kullanışlı hâle geliyor. Aynı zamanda; tek tip öğe tabanlı bir tasarım, basitleştirilmiş polimorfizm (çok biçimlilik), sezgisel yanıt akışı olayları ve modelin metin çıktısına kolayca erişmek için response.output_text gibi SDK yardımcıları da dâhil olmak üzere, çeşitli kullanılabilirlik iyileştirmelerini de beraberinde getiriyor.
Responses API, OpenAI modellerini ve yerleşik araçları kendi uygulamalarıyla kolayca birleştirmek isteyen ama birden fazla API veya haricî tedarikçi entegrasyonu gibi karmaşık adımlardan kaçınmak isteyen geliştiriciler için tasarlandı. API ayrıca, geliştiricilerin izleme ve değerlendirme gibi özellikleri kullanarak ajan performansını değerlendirebilmesi için OpenAI üzerinde veri depolamayı da kolaylaştırıyor. Veriler OpenAI’da depolansa bile, işletme verilerinin varsayılan olarak modellerimizin eğitiminde kullanılmadığını hatırlatmak isteriz. API, bugünden itibaren tüm geliştiricilerin kullanımına açıktır ve ayrıca ücretlendirilmez; tokenler ve araçlar, fiyatlandırma sayfamızda(yeni bir pencerede açılır) belirtilen standart ücretlerle faturalandırılır. Daha fazla bilgi almak için Responses API hızlı başlangıç kılavuzuna(yeni bir pencerede açılır) göz atın.
- Chat Completions API(yeni bir pencerede açılır): En yaygın olarak benimsenen API’miz olmaya devam eden Chat Completions API’yi yeni modeller ve yeteneklerle desteklemeye kararlıyız. Yerleşik araçlara ihtiyaç duymayan geliştiriciler, Chat Completions’ı güvenle kullanmaya devam edebilirler. Yerleşik araçlara veya birden fazla model çağrısına ihtiyaç duymadan yeteneklerini kullanabilen yeni Chat Completions modellerini yayınlamaya devam edeceğiz. Ancak Responses API, aynı şekilde harika performans sunan Chat Completions'ın üst kümesidir(yeni bir pencerede açılır), bu nedenle yeni entegrasyonlar için Responses API ile başlamanızı öneririz.
- Assistants API(yeni bir pencerede açılır): Geliştiricilerin Assistants API beta sürümü hakkındaki geri bildirimleri doğrultusunda, Responses API’de önemli iyileştirmeler yaptık ve onu daha esnek, daha hızlı ve daha kolay kullanılabilir hâle getirdik. Assistant benzeri ve Thread benzeri nesneler ile Kod Yorumlayıcı aracı desteği dâhil olmak üzere, Assistants API ile Responses API’lerinin özellikleri arasında tam bir denklik sağlamaya çalışıyoruz. Bu süreç tamamlandıktan sonra, Assistants API’nin artık desteklenmeyeceğini ve 2026 ortasından itibaren kullanımdan kaldırılacağını resmen duyurmayı planlıyoruz. API kullanımdan kaldırıldıktan sonra, Assistants API’den Responses API’ye geçişte geliştiricilerin tüm verilerini korumalarını ve uygulamalarını taşımalarını sağlayacak net bir kılavuz sunacağız. Assistants API’yi resmî olarak kullanımdan kaldırdığımızı duyurana kadar yeni modellerini sunmaya devam edeceğiz. Responses API, OpenAI üzerinde ajan oluşturmanın gelecekte gideceği yönü temsil ediyor.
Geliştiriciler artık web'den net ve alakalı alıntılar içeren hızlı, güncel yanıtlar alabilirler. Responses API’de web araması, gpt-4o ve gpt-4o-mini kullanılırken bir araç işlevi görür ve diğer araçlarla veya fonksiyon çağrılarıyla eşleştirilebilir.
İlk testler sırasında geliştiricilerin; alışveriş asistanları, araştırma ajanları ve seyahat rezervasyon ajanları gibi çeşitli kullanım durumlarında, yani web'den zamanında bilgi alınmasını gerektiren her türlü uygulamada web aramasını kullanarak ajanlar geliştirdiğini gördük.
Örneğin Hebbia(yeni bir pencerede açılır), kullandığı web araması aracı sayesinde varlık yöneticilerinin, özel sermaye şirketlerinin, kredi şirketlerinin ve hukuk bürolarının geniş kapsamlı kamu ve özel veri setlerinden hızla eyleme dönüştürülebilir bilgiler çıkarmasına yardımcı oluyor. Bu aracın gerçek zamanlı arama yeteneklerini kendi araştırma iş akışlarına entegre eden Hebbia, müşterilerine piyasa hakkında daha zengin, bağlama özgü bilgiler sunuyor. Ayrıca analizlerinin hassasiyetini ve alaka düzeyini sürekli olarak iyileştirerek, mevcut kıyaslamalarda üstün bir performans gösteriyor.
API’deki web araması aracı, ChatGPT arama için kullanılan aynı modelle destekleniyor. LLM’lerin olgulara dayalı kısa sorulara verdiği yanıtların doğruluğunu değerlendiren bir kıyaslama olan SimpleQA'de GPT‑4o arama ön izlemesi %90, GPT‑4o mini arama ön izlemesi ise %88 puan aldı.
SimpleQA Doğruluğu (yüksek değerler daha iyidir)
API’de web aramasıyla oluşturulan yanıtlarda haber makaleleri ve blog yazıları gibi kaynaklara bağlantılar verilmesi, kullanıcıların daha fazla bilgi edinebilmelerini sağlar. Açıkça belirtilmiş satır içi alıntılar, kullanıcıların bilgiyle yeni bir şekilde etkileşime girmesini sağlar ve içerik sahiplerine daha geniş kitlelere ulaşmaları için yeni fırsatlar sunar.
Her web sitesi ve yayıncı, API’deki web aramasında görünmeyi seçebilir(yeni bir pencerede açılır).
Web’de arama aracı, Responses API’sinde ön izleme aşamasında tüm geliştiricilerin kullanımına sunulmuştur. Ayrıca gpt-4o-search-preview ve gpt-4o-mini-search-preview aracılığıyla, geliştiriciler için Chat Completions API’sindeki ince ayarlı arama modellerimize doğrudan erişim sağlıyoruz. Fiyatlandırma(yeni bir pencerede açılır), bin sorgu başına GPT‑4o arama için 30 dolardan ve 4o-mini arama için 25 dolardan başlıyor. Playground(yeni bir pencerede açılır)’da web aramasına göz atın ve daha fazla bilgi almak için belgelerimize(yeni bir pencerede açılır) bakın.
Geliştiriciler artık geliştirilmiş dosya arama aracını kullanarak çok sayıda belgeden ilgili bilgilere kolayca ulaşabilirler. Bu araç, birden fazla dosya türü desteği, sorgu optimizasyonu, üstveri filtreleme ve özel yeniden sıralama ile hızlı ve doğru arama sonuçları sunabilir. Yine bu araçta da, Responses API ile entegrasyon için sadece birkaç satır kod yeterlidir.
Dosya arama aracı, müşteri destek temsilcilerinin SSS'lere kolayca erişmesini sağlamak, bir hukuk asistanının kalifiye bir uzman için geçmiş davalara hızlı bir şekilde başvurmasına yardımcı olmak ve bir kodlama ajanının teknik belgeleri sorgulamasına yardımcı olmak gibi çeşitli gerçek kullanım örneklerinde kullanılabilir. Örneğin Navan(yeni bir pencerede açılır), yapay zeka destekli seyahat ajanında dosya arama özelliğini kullanarak kullanıcılarına bilgi tabanındaki makalelerden (örn. şirketlerinin seyahat politikaları) hızlı bir şekilde kesin yanıtlar sağlıyor. Yerleşik sorgu optimizasyonu ve yeniden sıralama sayesinde, ekstra ayarlama veya yapılandırmaya gerek kalmadan güçlü bir RAG (bilgiyle desteklenen metin üretimi) akışı kurabiliyorlar. Her kullanıcı grubu için özel vektör depoları bulunan Navan, bireysel hesap ayarlarına ve kullanıcı rollerine göre yanıtlar üretebiliyor, böylece müşteriler ve çalışanları için zamandan tasarruf sağlarken doğru ve kişiselleştirilmiş destek sağlanmasına yardımcı oluyor.
Bu araç, Responses API’de tüm geliştiricilerin kullanımına sunulmuştur. Kullanım ücreti(yeni bir pencerede açılır) bin sorgu başına 2,50 dolar, dosya depolama ücreti ise ilk GB ücretsiz olmak üzere günlük 0,10 dolar/GB olarak belirlendi. Araç, Assistants API’de sunulmaya devam ediyor. Son olarak, verilerinizi diğer uygulamalarda ve API’lerde kullanmak üzere doğrudan sorgulayabilmeniz için Vector Store API nesnelerine yeni bir arama uç noktası da ekledik. Daha fazla bilgi almak için belgelerimize(yeni bir pencerede açılır) göz atın ve Playground(yeni bir pencerede açılır)’da test etmeye başlayın.
Geliştiriciler, bilgisayarda görevleri tamamlayabilen ajanlar oluşturmak için artık Responses API’de bulunan bilgisayar kullanımı aracını kullanabilirler. Bu araç, Operator’ı etkinleştiren aynı Bilgisayar Kullanan Ajan (CUA) modeli tarafından destekleniyor. Bu araştırma ön izlemesi modeli, tam bilgisayar kullanımı görevlerinde OSWorld(yeni bir pencerede açılır)’de %38,1, WebArena(yeni bir pencerede açılır)’da %58,1 ve web tabanlı etkileşimlerde WebVoyager(yeni bir pencerede açılır)’da %87 başarı elde ederek yeni bir rekor kırdı.
Yerleşik bilgisayar kullanım aracı, model tarafından oluşturulan fare ve klavye hareketlerini algılar ve geliştiricilerin bu hareketleri kendi ortamları içerisinde doğrudan yürütülebilir komutlara dönüştürerek, bilgisayar kullanım görevlerini otomatikleştirmesini mümkün kılar.
Geliştiriciler, web uygulamalarında kalite güvencesi eylemleri gerçekleştirmek veya eski sistemlerde veri girişi görevlerini yürütmek gibi tarayıcı tabanlı iş akışlarını otomatikleştirmek için bilgisayar kullanım aracını kullanabilirler. Örneğin Unify(yeni bir pencerede açılır); niyeti belirlemek, hesapları araştırmak ve alıcılarla etkileşim kurmak için ajanları kullanan, geliri artırmaya yönelik bir eylem sistemidir. OpenAI'ın bilgisayar kullanım aracını kullanan Unify temsilcileri, daha önce API’ler aracılığıyla erişilemeyen bilgilere erişebilir; örneğin, bir gayrimenkul yönetim şirketinin çevrimiçi haritalar aracılığıyla bir işletmenin gayrimenkul ayak izini genişletip genişletmediğinin doğrulamasını sağlayabilir. Bu araştırma, kişiselleştirilmiş iletişimi tetiklemek için özel bir sinyal görevi görerek, pazar stratejisi ekiplerinin alıcılarla hassas ve kapsamlı bir şekilde etkileşim kurmasını sağlar.
Bir başka örnek olarak Luminai(yeni bir pencerede açılır), API kullanılabilirliği ve standartlaştırılmış verilerden yoksun olan eski sistemlere sahip büyük işletmeler için karmaşık operasyonel iş akışlarını otomatikleştirmek amacıyla bilgisayar kullanım aracını entegre etti. Luminai, yakın zamanda büyük bir kamu hizmeti kuruluşuyla gerçekleştirdiği bir pilot uygulamayla, başvuru işleme ve kullanıcı kayıt sürecini sadece birkaç gün içinde otomatikleştirdi. Bu, geleneksel robotik süreç otomasyonunun (RPA) aylarca süren çabalarına rağmen başaramadığı bir şeydi.
Geçtiğimiz yıl Operator’da bilgisayar kullanım ajanını (CUA) kullanıma sunmadan önce kapsamlı güvenlik testleri ve kırmızı takım testleri yürüttük ve kötüye kullanım, model hataları ve sınır riskleri olmak üzere üç temel risk alanını ele aldık. API’deki CUA aracılığıyla Operator’ın yeteneklerinin yerel işletim sistemlerini kapsayacak şekilde genişletilmesiyle ilişkili riskleri ele almak için ek güvenlik değerlendirmeleri ve kırmızı takım testleri gerçekleştirdik. Geliştiriciler için zararlı istem girişimlerine karşı güvenlik kontrolleri, hassas görevler için onay istemleri, geliştiricilerin ortamlarını izole etmelerine yardımcı olacak araçlar ve potansiyel politika ihlallerinin gelişmiş tespiti gibi risk azaltıcı önlemler de ekledik. Bu önlemler riski azaltmaya yardımcı olsa da model, özellikle tarayıcı dışı ortamlarda, hâlâ yanlışlıkla hata yapabilir. Örneğin, yapay zeka ajanlarının gerçek hayattaki görevlerdeki performansını ölçmek için tasarlanmış bir kıyaslama olan OSWorld’de CUA’nın mevcut performansı %38,1'dir. Bu da modelin işletim sistemlerindeki görevleri otomatikleştirmek için henüz yüksek düzeyde güvenilirliğe sahip olmadığını gösterir. Bu senaryolarda insan denetimi tavsiye edilir. API’lere özgü güvenlik çalışmalarımız hakkında daha ayrıntılı bilgileri, güncellenen sistem kartımızda bulabilirsiniz.
| Kıyaslama türü | Kıyaslama | Bilgisayar kullanımı (evrensel arayüz) | Web’de gezinme aracıları | İnsan | |
|---|---|---|---|---|---|
| OpenAI CUA | Önceki SOTA | Önceki SOTA | |||
| Bilgisayar kullanımı | OSWorld | %38,1 | %22,0 | - | %72,4 |
| Tarayıcı kullanımı | WebArena | %58,1 | %36,2 | %57,1 | %78,2 |
| WebVoyager | %87,0 | %56,0 | %87,0 | - | |
Bilgisayar kullanım aracı, bugünden itibaren 3 ila 5 arasındaki kullanım kademelerinde(yeni bir pencerede açılır) bulunan belirli geliştiriciler için Responses API’de araştırma ön izlemesi olarak kullanıma sunuluyor. Kullanım ücreti(yeni bir pencerede açılır) 1 milyon girdi tokeni başına 3 dolar, 1 milyon çıktı tokeni başına 12 dolar olarak belirlendi. Daha fazla bilgi almak için belgelerimize(yeni bir pencerede açılır) göz atın ve bu araçla nasıl geliştirme yapabileceğinizi gösteren örnek uygulamayı(yeni bir pencerede açılır) inceleyin.
Ajanların temel mantığını oluşturmanın ve faydalı olabilmeleri için gerekli araçlara erişmelerini sağlamanın yanı sıra, geliştiriciler ajan tabanlı iş akışlarının orkestrasyonunu da gerçekleştirmelidir. Yeni açık kaynaklı Agents SDK’mız, çok ajanlı iş akışlarının orkestrasyonunu basitleştiriyor ve geçen yıl yayınladığımız, geliştirici topluluğu tarafından yaygın şekilde benimsenen ve birçok müşterimiz tarafından başarıyla kullanıma alınan deneysel bir SDK olan Swarm(yeni bir pencerede açılır)’a kıyasla önemli iyileştirmeler sunuyor.
Bu iyileştirmeler aşağıdakileri içeriyor:
- Ajanlar: Net talimatlar ve yerleşik araçlarla kolayca yapılandırılabilen LLM’ler.
- Kontrol Aktarımları: Ajanlar arasında akıllı kontrol aktarımı.
- Koruyucu Önlemler: Girdi ve çıktı doğrulaması için yapılandırılabilir güvenlik kontrolleri.
- İzleme ve Gözlemlenebilirlik: Ajanların yürütme izlerini görselleştirerek hataları ayıklama ve performansı optimize etme.
Agents SDK; müşteri desteği otomasyonu, çok adımlı araştırma, içerik oluşturma, kod inceleme ve potansiyel satış araştırması gibi çeşitli gerçek hayat uygulamaları için uygundur. Örneğin Coinbase(yeni bir pencerede açılır), yapay zeka ajanlarının kripto cüzdanlarla ve blokzincir üzerindeki çeşitli aktivitelerle sorunsuz bir şekilde etkileşime girmesini sağlayan bir araç takımı olan AgentKit’in hızlı bir şekilde prototipini çıkarmak ve kullanıma sunmak için Agents SDK’yı kullandı. Coinbase, sadece birkaç saat içinde Developer Platform SDK’sından gelen özel eylemleri tam işlevli bir ajana entegre etti. AgentKit'in gelişmiş mimarisi, yeni ajan eylemleri ekleme sürecini basitleştirerek geliştiricilerin karmaşık ajan kurulumlarını çözmeye uğraşmak yerine, anlamlı entegrasyonlara daha fazla odaklanmasını sağladı.
Box(yeni bir pencerede açılır), birkaç gün içinde web aramasını ve Agents SDK’sını kullanarak kuruluşların Box'ta ve genel internet kaynaklarında depolanan yapılandırılmamış verilerden arama, sorgulama ve içgörü çıkarma işlemlerini gerçekleştirmesini sağlayan ajanları hızla oluşturmayı başardı. Bu yaklaşım, müşterilerin yalnızca en son bilgilere erişmelerini sağlamakla kalmayıp, aynı zamanda dâhili izinlerine ve güvenlik politikalarına uyan güvenli ve emniyetli bir şekilde şirket içi tescilli verilerinde arama yapmalarını da sağlar. Örneğin, bir finansal hizmetler firması, Box'ta depolanan dâhili piyasa analizlerini web'den gelen gerçek zamanlı haberler ve ekonomik verilerle entegre etmek için Box yapay zeka ajanını çağıran özel bir ajan oluşturabilir ve böylece analistlerinin yatırım kararları için kapsamlı bir görüşe sahip olmalarını sağlayabilir.
Agents SDK, Responses API ve Chat Completions API ile birlikte çalışır. SDK, Chat Completions tarzı bir API uç noktası sağladıkları sürece diğer sağlayıcıların modelleriyle de çalışır. Geliştiriciler bunu hemen Python kod tabanlarına entegre edebilirler. Node.js desteği de yakında sunulmaya başlanacak. Daha fazla bilgi almak için belgelerimize(yeni bir pencerede açılır) bakın.
Ekibimiz, Agents SDK’yı tasarlarken topluluğumuzdaki diğer oyuncuların Pydantic(yeni bir pencerede açılır), Griffe(yeni bir pencerede açılır) ve MkDocs(yeni bir pencerede açılır) gibi mükemmel çalışmalarından ilham aldı. Topluluktaki diğer kişilerin de yaklaşımımızı genişletebilmesi için Agents SDK’yı açık kaynaklı bir çerçeve olarak geliştirmeye devam etme konusunda kararlıyız.
Ajanların çok yakında iş gücünün ayrılmaz bir parçası hâline geleceğine ve tüm sektörlerde üretkenliği önemli ölçüde artıracağına inanıyoruz. Şirketler karmaşık görevler için yapay zekadan giderek daha fazla yararlanmanın yolları ararken, geliştiricilerin ve işletmelerin gerçek bir etki yaratan otonom sistemleri etkili bir şekilde oluşturmalarını mümkün kılan yapı taşlarını sağlamaya kararlıyız.
Bugün kullanıma sunulan özelliklerle, geliştiricilerin ve işletmelerin güvenilir, yüksek performanslı yapay zeka ajanlarını daha kolay bir şekilde oluşturmasını, kullanıma sunmasını ve ölçeklendirmesini sağlayacak ilk yapı taşlarını sunuyoruz. Model yetenekleri giderek daha da ajan tabanlı hâle gelirken, tüm API’lerimizde daha derin entegrasyonlara ve üretimdeki ajanları kullanıma sunma, değerlendirme ve optimize etmeye yardımcı olacak yeni araçlara yatırım yapmaya devam edeceğiz. Bunu yaparken, geliştiricilere her sektörde çeşitli görevlerde yardımcı olabilecek ajanlar oluşturmaları için kusursuz bir platform deneyimi sunmayı amaçlıyoruz. Geliştiricilerin bundan sonraki dönemde neler oluşturacağını görmeyi heyecanla bekliyoruz. Başlamak için belgelerimizi(yeni bir pencerede açılır) inceleyin ve yakında yayınlanacak diğer güncellemeler için takipte kalın.