GPT‑3.5 Turbo-სა და Whisper-ის API-ების გაცნობა
დეველოპერებს ახლა შეუძლიათ GPT‑3.5 Turbo-სა და Whisper-ის მოდელების ინტეგრირება საკუთარ აპებსა და პროდუქტებში ჩვენი API-ის მეშვეობით.

განახლება 2024 წლის 24 აპრილს: ChatGPT API-ის სახელწოდება შეწყვეტილია. ამ ბლოგში ChatGPT API-ის ხსენებები GPT‑3.5 Turbo API-ს გულისხმობს.
ChatGPT და Whisper მოდელები ახლა უკვე ხელმისაწვდომია ჩვენს API-ზე, რაც დეველოპერებს უახლესი ენობრივი (არა მხოლოდ ჩატი!) და მეტყველებიდან ტექსტში გარდაქმნის შესაძლებლობებზე აძლევს წვდომას. სისტემური მასშტაბის ოპტიმიზაციების სერიის მეშვეობით დეკემბრის შემდეგ ChatGPT‑ის ხარჯები 90%-ით შევამცირეთ; ახლა ამ დანაზოგს API მომხმარებლებსაც გადავცემთ. დეველოპერებს ახლა შეუძლიათ გამოიყენონ ჩვენი ღია კოდის Whisper large-v2 მოდელი API-ში ბევრად უფრო სწრაფი და ხარჯეფექტური შედეგებით. GPT‑3.5 API-ის მომხმარებლებს შეუძლიათ ელოდონ მოდელის უწყვეტ გაუმჯობესებებს და გამოყოფილი სიმძლავრის არჩევის შესაძლებლობას მოდელებზე უფრო ღრმა კონტროლისთვის. ასევე ყურადღებით მოვუსმინეთ ჩვენი დეველოპერების უკუკავშირს და დავხვეწეთ ჩვენი API-ის მომსახურების პირობები, რათა უკეთ შეესაბამებოდეს მათ საჭიროებებს.
Snap Inc(იხსნება ახალ ფანჯარაში)., Snapchat-ის შემქმნელმა, ამ კვირაში Snapchat+-ისთვის My AI წარადგინა. ეს ექსპერიმენტული ფუნქცია GPT‑3.5 API-ზე მუშაობს. My AI Snapchat-ის მომხმარებლებს ხელმისაწვდომ ადგილზე სთავაზობს მეგობრულ, მორგებად ჩატბოტს, რომელიც რეკომენდაციებს იძლევა და მეგობრებისთვის წამებში ჰაიკუს დაწერაც კი შეუძლია. Snapchat-ს, სადაც კომუნიკაცია და მიმოწერა ყოველდღიური ქცევაა, თვეში 750 მილიონი მომხმარებელი ჰყავს:
My AI for Snapchat+
Quizlet(იხსნება ახალ ფანჯარაში) არის გლობალური სასწავლო პლატფორმა, რომელსაც 60 მილიონზე მეტი სტუდენტი იყენებს სასწავლად, სავარჯიშოდ და იმის დასაუფლებლად, რასაც სწავლობენ. Quizlet ბოლო სამი წლის განმავლობაში OpenAI-სთან თანამშრომლობს და GPT‑3‑ს მრავალ გამოყენების შემთხვევაში იყენებს, მათ შორის ლექსიკის შესასწავლად და პრაქტიკული ტესტებისთვის. GPT‑3.5 API-ის გაშვებით Quizlet წარადგენს Q-Chat-ს, სრულად ადაპტირებად AI დამრიგებელს, რომელიც სტუდენტებს შესაბამის სასწავლო მასალებზე დაფუძნებული ადაპტური კითხვებით ერთვება სასიამოვნო ჩატის გამოცდილების საშუალებით:
Quizlet Q-Chat
Instacart(იხსნება ახალ ფანჯარაში) აფართოებს Instacart აპის შესაძლებლობებს, რათა მომხმარებლებს შეეძლოთ საკვებზე კითხვების დასმა და შთამაგონებელი, შესაძენი პასუხების მიღება. ეს იყენებს ChatGPT‑ს Instacart-ის საკუთარ AI-სთან და მათი 75,000-ზე მეტი პარტნიორი საცალო მაღაზიის ლოკაციიდან მიღებულ პროდუქტის მონაცემებთან ერთად, რათა მომხმარებლებს დაეხმაროს იდეების აღმოჩენაში ღია სავაჭრო მიზნებისთვის, როგორიცაა „როგორ მოვამზადო შესანიშნავი თევზის ტაკო?“ ან „რა არის ჯანსაღი სადილი ჩემი ბავშვებისთვის?“ Instacart გეგმავს „Ask Instacart“-ის გაშვებას წლის მოგვიანებით პერიოდში:
Instacart’s Ask Instacart
Shop(იხსნება ახალ ფანჯარაში), Shopify-ის სამომხმარებლო აპს, 100 მილიონი მყიდველი იყენებს მათთვის საყვარელი პროდუქტებისა და ბრენდების საპოვნელად და მათთან დასაკავშირებლად. GPT‑3.5 API გამოიყენება Shop-ის ახალი სავაჭრო ასისტენტის გასაძლიერებლად. როდესაც მყიდველები პროდუქტებს ეძებენ, სავაჭრო ასისტენტი მათ მოთხოვნებზე დაფუძნებით პერსონალიზებულ რეკომენდაციებს აძლევს. Shop-ის ახალი AI-ზე დაფუძნებული სავაჭრო ასისტენტი აპში ყიდვას გაამარტივებს მილიონობით პროდუქტის სკანირებით, რათა სწრაფად იპოვოს ის, რასაც მყიდველები ეძებენ — ან დაეხმაროს მათ რაიმე ახლის აღმოჩენაში:
Shopify’s Shop app
Speak(იხსნება ახალ ფანჯარაში) არის AI-ზე დაფუძნებული ენის სწავლის აპი, რომელიც ორიენტირებულია სალაპარაკო თავისუფლებისკენ საუკეთესო გზის შექმნაზე. ის სამხრეთ კორეაში ყველაზე სწრაფად მზარდი ინგლისურის აპია და უკვე იყენებს Whisper API-ს ახალი AI სასაუბრო კომპანიონი პროდუქტის გასაძლიერებლად და მის სწრაფად გასატანად დანარჩენ მსოფლიოშიც. Whisper-ის ადამიანურ დონესთან მიახლოებული სიზუსტე ყველა დონის ენის შემსწავლელისთვის ხსნის მართლაც ღია სასაუბრო პრაქტიკასა და ძალიან ზუსტ უკუკავშირს:
The Speak app
მოდელი: ChatGPT‑ის მოდელთა ოჯახი, რომელსაც დღეს ვუშვებთ, gpt-3.5-turbo, იგივე მოდელია, რომელიც ChatGPT პროდუქტში გამოიყენება. მისი ფასი შეადგენს $0.002-ს 1k token-ზე, რაც ჩვენს არსებულ GPT‑3.5 მოდელებზე 10-ჯერ იაფია. ეს ასევე ჩვენი საუკეთესო მოდელია არაერთი არაჩატის გამოყენების შემთხვევისთვის — ვნახეთ, რომ ადრეული ტესტერები text-davinci-003-დან gpt-3.5-turbo-ზე გადავიდნენ და მათ მოთხოვნებში მხოლოდ მცირე ცვლილებები დასჭირდათ.
API: ტრადიციულად, GPT მოდელები იღებენ არასტრუქტურირებულ ტექსტს, რომელიც მოდელისთვის „token“-ების მიმდევრობით არის წარმოდგენილი. ChatGPT მოდელები ამის ნაცვლად იღებენ შეტყობინებების მიმდევრობას მეტამონაცემებთან ერთად. (დაინტერესებულთათვის: შიგნით შეყვანა ისევ მოდელისთვის „token“-ების მიმდევრობით რენდერდება; მოდელის მიერ გამოყენებული ნედლი ფორმატი ახალი ფორმატია, სახელად Chat Markup Language(იხსნება ახალ ფანჯარაში) („ChatML“).)
ჩვენ შევქმენით ახალი საბოლოო წერტილი ჩვენს ChatGPT მოდელებთან ურთიერთობისთვის:
GPT‑3.5 API-ის შესახებ მეტის გასაგებად, ეწვიეთ ჩვენს Chat გზამკვლევს(იხსნება ახალ ფანჯარაში).
ჩვენ მუდმივად ვაუმჯობესებთ ჩვენს ChatGPT მოდელებს და გვსურს, ეს გაუმჯობესებები დეველოპერებისთვისაც ხელმისაწვდომი იყოს. დეველოპერები, რომლებიც gpt-3.5-turbo მოდელს იყენებენ, ყოველთვის მიიღებენ ჩვენს მიერ რეკომენდებულ სტაბილურ მოდელს, ხოლო ამავე დროს შეინარჩუნებენ მოქნილობას, აირჩიონ კონკრეტული მოდელის ვერსია. მაგალითად, დღეს ვუშვებთ gpt-3.5-turbo-0301-ს, რომელსაც მხარდაჭერა მინიმუმ 1 ივნისამდე ექნება, ხოლო აპრილში gpt-3.5-turbo-ს ახალ სტაბილურ რელიზზე განვაახლებთ. მოდელების გვერდი(იხსნება ახალ ფანჯარაში) გადასვლის განახლებებს მოგაწვდით.
ახლა ასევე ვთავაზობთ გამოყოფილ ინსტანსებს იმ მომხმარებლებისთვის, რომლებსაც კონკრეტული მოდელის ვერსიასა და სისტემის წარმადობაზე უფრო ღრმა კონტროლი სურთ. სტანდარტულად, მოთხოვნები ეშვება გამოთვლით ინფრასტრუქტურაზე, რომელსაც სხვა მომხმარებლებთან იზიარებენ და თითო მოთხოვნაზე იხდიან. ჩვენი API Azure-ზე მუშაობს, ხოლო გამოყოფილი ინსტანსებით დეველოპერები გადაიხდიან დროის პერიოდის მიხედვით იმ გამოთვლითი ინფრასტრუქტურისთვის, რომელიც მათი მოთხოვნების მომსახურებისთვისაა რეზერვირებული.
დეველოპერები სრულ კონტროლს იღებენ ინსტანსის დატვირთვაზე (უფრო მაღალი დატვირთვა აუმჯობესებს მწარმოებლურობას, თუმცა თითოეულ მოთხოვნას უფრო ნელს ხდის), აქვთ უფრო გრძელი კონტექსტის ლიმიტების მსგავსი ფუნქციების ჩართვის შესაძლებლობა და შეუძლიათ მოდელის snapshot-ის დაფიქსირება.
გამოყოფილი ინსტანსები შეიძლება ეკონომიკურად გამართლებული იყოს იმ დეველოპერებისთვის, რომლებიც დღეში ~450M token-ს აჭარბებენ. გარდა ამისა, ეს შესაძლებელს ხდის დეველოპერის სამუშაო დატვირთვის პირდაპირ ოპტიმიზაციას აპარატურის წარმადობასთან მიმართებით, რაც საერთო ინფრასტრუქტურასთან შედარებით ხარჯებს მნიშვნელოვნად ამცირებს. გამოყოფილ ინსტანსებთან დაკავშირებით კითხვებისთვის დაგვიკავშირდით.
Whisper, მეტყველებიდან ტექსტში გარდამქმნელი მოდელი, რომელიც 2022 წლის სექტემბერში ღია კოდით გამოვაქვეყნეთ, დეველოპერთა საზოგადოებისგან უდიდესი მოწონება დაიმსახურა, თუმცა მისი გაშვება შესაძლოა რთულიც იყოს. ახლა large-v2 მოდელი ჩვენი API-ის საშუალებით გავხადეთ ხელმისაწვდომი, რაც მოთხოვნისამებრ მოსახერხებელ წვდომას იძლევა $0.006 / წუთი ფასად. გარდა ამისა, ჩვენი ძლიერ ოპტიმიზებული სერვირების სტეკი სხვა სერვისებთან შედარებით უფრო სწრაფ წარმადობას უზრუნველყოფს.
Whisper API ხელმისაწვდომია ჩვენი transcriptions (ტრანსკრიფცია საწყის ენაზე) ან translations (ტრანსკრიფცია ინგლისურად) საბოლოო წერტილების მეშვეობით და იღებს მრავალ ფორმატს (m4a, mp3, mp4, mpeg, mpga, wav, webm):
Whisper API-ის შესახებ მეტის გასაგებად, ეწვიეთ ჩვენს Speech to Text გზამკვლევს(იხსნება ახალ ფანჯარაში).
ბოლო ექვსი თვის განმავლობაში ჩვენ ვაგროვებდით უკუკავშირს ჩვენი API მომხმარებლებისგან, რათა გაგვეგო, როგორ შეგვეძლო მათთვის უკეთესი მომსახურების გაწევა. შევიტანეთ კონკრეტული ცვლილებები, როგორიცაა:
- API-ის მეშვეობით გაგზავნილი მონაცემები აღარ გამოიყენება სერვისის გაუმჯობესებისთვის (მათ შორის მოდელის ტრენინგისთვის), თუ ორგანიზაცია თავად არ აირჩევს ამას
- API მომხმარებლებისთვის ნაგულისხმევად 30-დღიანი მონაცემთა შენარჩუნების პოლიტიკის დანერგვა, მომხმარებლის საჭიროებიდან გამომდინარე უფრო მკაცრი შენარჩუნების ვარიანტებით.
- წინასაგაშვებო მიმოხილვის გაუქმება (რაც შესაძლებელი გახდა ჩვენი ავტომატური მონიტორინგის გაუმჯობესებით)
- დეველოპერული დოკუმენტაციის გაუმჯობესება
- ჩვენი მომსახურების პირობებისა და გამოყენების პოლიტიკების(იხსნება ახალ ფანჯარაში) გამარტივება, მათ შორის მონაცემთა საკუთრებასთან დაკავშირებული პირობების: მომხმარებლები ფლობენ მოდელების შეყვანასა და გამოყვანას.
ბოლო ორი თვის განმავლობაში ჩვენი უწყვეტი მუშაობის მაჩვენებელი ვერ აკმაყოფილებდა ვერც ჩვენს და ვერც ჩვენი მომხმარებლების მოლოდინებს. ჩვენი საინჟინრო გუნდის უმაღლესი პრიორიტეტი ახლა საწარმოო გამოყენების შემთხვევების სტაბილურობაა — ვიცით, რომ იმისთვის, რათა AI-მ სარგებელი მოუტანოს მთელ კაცობრიობას, სანდო სერვისის მიმწოდებელი უნდა ვიყოთ. დაგვაკისრეთ პასუხისმგებლობა მომდევნო თვეებში უწყვეტი მუშაობის გაუმჯობესებისთვის!
გვჯერა, რომ AI-ს შეუძლია ყველასთვის შექმნას წარმოუდგენელი შესაძლებლობები და ეკონომიკური გაძლიერება, და ამის მიღწევის საუკეთესო გზა არის ყველას მივცეთ მასზე აშენების შესაძლებლობა. ვიმედოვნებთ, რომ დღეს გამოცხადებული ცვლილებები ბევრ აპლიკაციას გამოიწვევს, რომლითაც ყველა ისარგებლებს. დაიწყეთ შემდეგი თაობის აპების შექმნა, რომლებსაც ChatGPT & Whisper ამოძრავებს.
ავტორები
კონტრიბუტორები
Jeff Belgum, Jake Berdine, Trevor Cai, Alexander Carney, Brooke Chan, Che Chang, Derek Chen, Ruby Chen, Aidan Clark, Thomas Degry, Steve Dowling, Sheila Dunning, Liam Fedus, Vik Goel, Scott Gray, Aurelia Guy, Jeff Harris, Peter Hoeschele, Angela Jiang, Denny Jin, Jong Wook Kim, Yongjik Kim, Michael Lampe, Daniel Levy, Brad Lightcap, Patricia Lue, Bianca Martin, Christine McLeavey, Luke Metz, Andrey Mishchenko, Vinnie Monaco, Evan Morikawa, Mira Murati, Rohan Nuttall, Alex Paino, Ashley Pantuliano, Mikhail Pavlov, Andrew Peng, Henrique Ponde de Oliveira Pinto, Alec Radford, Kendra Rimbach, Aliisa Rosenthal, Nick Ryder, Ted Sanders, Heather Schmidt, John Schulman, Zarina Stanik, Felipe Such, Nick Turley, Carroll Wainwright, Peter Welinder, Clemens Winter, Sherwin Wu, Tao Xu, Qiming Yuan, Barret Zoph


