Introducing more enterprise-grade features for API customers

ჩვენ ვთანამშრომლობთ მრავალ კომპანიასთან, როგორიცაა Klarna, Morgan Stanley, Oscar, Salesforce და Wix, რათა დავეხმაროთ მათ AI გადაწყვეტილებების ნულიდან შექმნაში და AI-ის უსაფრთხოდ დანერგვაში მათ ორგანიზაციებსა და პროდუქტებში. ჩვენ ვაღრმავებთ ჩვენს მხარდაჭერას კომპანიებისთვის ახალი ფუნქციებით, რომლებიც სასარგებლოა როგორც დიდი ბიზნესებისთვის, ისე ნებისმიერი დეველოპერისთვის, ვინც ჩვენს პლატფორმაზე სწრაფად იზრდება.
ჩვენ წარმოვადგინეთ Private Link — ახალი გზა, რომელიც კლიენტებს საშუალებას აძლევს, Azure-სა და OpenAI-ს შორის პირდაპირი კომუნიკაცია უზრუნველყონ და ამავდროულად ღია ინტერნეტზე დამოკიდებულება მინიმუმამდე დაიყვანონ. ჩვენ ასევე გამოვუშვით ნატიური მრავალფაქტორიანი ავთენტიფიკაცია(იხსნება ახალ ფანჯარაში) (MFA), რათა წვდომის კონტროლის მზარდ მოთხოვნებთან შესაბამისობის უზრუნველყოფაში დავეხმაროთ. ეს არის ახალი დამატებები ჩვენი არსებული კორპორაციული უსაფრთხოების ფუნქციების(იხსნება ახალ ფანჯარაში) ნაკრებისთვის, რომელიც მოიცავს SOC 2 Type II სერტიფიკაციას, ერთიანი ავთენტიფიკაციით შესვლას (SSO), მოსვენებულ მდგომარეობაში მონაცემთა დაშიფვრას AES-256-ით და გადაცემისას TLS 1.2-ით, ასევე როლებზე დაფუძნებულ წვდომის კონტროლს. ჩვენ ასევე ვთავაზობთ ბიზნეს პარტნიორის შეთანხმებებს(იხსნება ახალ ფანჯარაში) ჯანდაცვის კომპანიებისთვის, რომლებსაც HIPAA-ს შესაბამისობა სჭირდებათ, და მონაცემთა ნულოვანი შენარჩუნების პოლიტიკას API-ის იმ კლიენტებისთვის, რომლებსაც შესაბამისი გამოყენების შემთხვევა აქვთ.
ჩვენი ახალი Projects(იხსნება ახალ ფანჯარაში) ფუნქციით ორგანიზაციებს OpenAI-ში ცალკეულ პროექტებზე უფრო დეტალური კონტროლი და ზედამხედველობა ექნებათ. ეს მოიცავს შესაძლებლობას, როლები და API გასაღებები კონკრეტულ პროექტებს დაუკავშირონ, შეზღუდონ/დაუშვან რომელი მოდელები იქნება ხელმისაწვდომი და დააყენონ გამოყენებასა და rate-ზე დაფუძნებული ლიმიტები, რათა მისცენ წვდომა და თავიდან აიცილონ მოულოდნელი გადაჭარბებული ხარჯები. პროექტის მფლობელებს ასევე ექნებათ შესაძლებლობა შექმნან service account API გასაღებები, რომლებიც პროექტებზე წვდომას უზრუნველყოფს ინდივიდუალურ მომხმარებელზე მიბმის გარეშე.

ჩვენ შევიტანეთ რამდენიმე განახლება Assistants API-ში, რათა უზრუნველყოფილი იყოს უფრო ზუსტი მოძიება, მეტი მოქნილობა მოდელის ქცევისა და ამოცანების შესასრულებლად გამოყენებული ხელსაწყოების გარშემო, ასევე ხარჯებზე უკეთესი კონტროლი. ეს ფუნქციები მოიცავს:
- გაუმჯობესებულ მოძიებას ‘file_search’-ით, რომელსაც თითო assistant-ზე 10,000-მდე ფაილის მიღება შეუძლია — ეს 500-ჯერ მეტია წინა 20-ფაილიანი ლიმიტთან შედარებით. ხელსაწყო უფრო სწრაფია, მხარს უჭერს პარალელურ მოთხოვნებს მრავალნაკადიანი ძიების საშუალებით და აქვს გაუმჯობესებული reranking და query rewriting.
- სტრიმინგის მხარდაჭერას რეალურ დროში, საუბრის სტილის პასუხებისთვის — დეველოპერებისა და კომპანიების ერთ-ერთი მთავარი მოთხოვნა.
API-ში ახალი ‘vector_store’ ობიექტები, რათა ფაილები დაემატოს vector store-ს და ავტომატურად დამუშავდეს, დაიყოს ნაწილებად და დაემატოს embeddings file search-ისთვის მოსამზადებლად. Vector store-ების გამოყენება შესაძლებელია assistant-ებსა და thread-ებს შორის, რაც ამარტივებს ფაილების მართვასა და ბილინგს. - კონტროლს თითო გაშვებაზე გამოყენებული token-ების მაქსიმალურ რაოდენობაზე, ასევე თითო გაშვებაში გამოყენებულ წინა და უახლეს შეტყობინებებზე ლიმიტებს, რათა შეძლოთ token-ების გამოყენების ხარჯების მართვა.
ახალ ‘tool_choice’ პარამეტრს, რათა კონკრეტულ გაშვებაში აირჩიოთ კონკრეტული ხელსაწყო (მაგალითად, ‘file_search’, ‘code_interpreter’ ან ‘function’). - API-ში fine-tuned GPT‑3.5 Turbo მოდელების მხარდაჭერას (დასაწყისისთვის, ჩვენ მხარს დავუჭერთ ‘gpt-3.5-turbo-0125’-ის fine-tune-ებს).

იმისთვის, რომ ორგანიზაციებს AI-ის გამოყენების მასშტაბირება ბიუჯეტის გადაჭარბების გარეშე შევაძლებინოთ, ჩვენ დავამატეთ ორი ახალი გზა, რომლითაც შეიძლება შემცირდეს ხარჯები სტაბილურ და ასინქრონულ დატვირთვებზე:
- ფასდაკლებული გამოყენება დაჯავშნილ მწარმოებლურობაზე: კლიენტებს, რომლებსაც GPT‑4‑ზე ან GPT‑4 Turbo-ზე წუთში token-ების (TPM) გამოყენების სტაბილური დონე აქვთ, შეუძლიათ მოითხოვონ წვდომა provisioned throughput-ზე, რათა მიიღონ 10–50%-იანი ფასდაკლება ვალდებულების მოცულობის მიხედვით.
- შემცირებული ხარჯები ასინქრონულ დატვირთვებზე: კლიენტებს შეუძლიათ გამოიყენონ ჩვენი ახალი Batch API(იხსნება ახალ ფანჯარაში)არასასწრაფო დატვირთვების ასინქრონულად გასაშვებად. Batch API-ის მოთხოვნები საერთო ტარიფებთან შედარებით 50%-იანი ფასდაკლებით ფასდება, მნიშვნელოვნად უფრო მაღალ rate limit-ებს გვთავაზობს და შედეგებს 24 საათის განმავლობაში აბრუნებს. ეს იდეალურია ისეთი გამოყენების შემთხვევებისთვის, როგორიცაა მოდელის შეფასება, ოფლაინ კლასიფიკაცია, შეჯამება და სინთეზური მონაცემების გენერირება.
ჩვენ ვგეგმავთ ახალი ფუნქციების დამატების გაგრძელებას, რომლებიც ფოკუსირებულია კორპორაციული დონის უსაფრთხოებაზე, ადმინისტრაციულ კონტროლებსა და ხარჯების მართვაზე. ამ განახლებების შესახებ დამატებითი ინფორმაციისთვის ეწვიეთ ჩვენს API დოკუმენტაციას(იხსნება ახალ ფანჯარაში) ან დაუკავშირდით ჩვენს გუნდს, რათა თქვენი კომპანიისთვის მორგებული გადაწყვეტილებები განვიხილოთ.



