GPT‑4 API general availability and deprecation of older models in the Completions API

განახლება 2024 წლის 24 აპრილს: ChatGPT API-ის სახელწოდება გაუქმდა. ამ ბლოგში ChatGPT API-ის ხსენებები GPT‑3.5 Turbo API-ს მიემართება.
დღეიდან ყველა გადამხდელ API მომხმარებელს აქვს წვდომა GPT‑4‑ზე. მარტში ჩვენ წარვადგინეთ OpenAI API, ხოლო ამ თვის დასაწყისში გამოვუშვით ჩვენი პირველი განახლებები ჩატზე დაფუძნებული მოდელებისთვის. ჩვენ წარმოგვიდგენია მომავალი, სადაც ჩატზე დაფუძნებულ მოდელებს ნებისმიერი გამოყენების შემთხვევის მხარდაჭერა შეეძლებათ. დღეს ვაცხადებთ Completions API-ის ძველი მოდელებისთვის გაუქმების გეგმას და მომხმარებლებს ვურჩევთ, გამოიყენონ ჩატის დასრულების API.
GPT‑4 ჩვენი ყველაზე შესაძლებლობიანი მოდელია. მარტის შემდეგ მილიონობით დეველოპერმა მოითხოვა GPT‑4 API-ზე წვდომა, და GPT‑4‑ის გამოყენებით შექმნილი ინოვაციური პროდუქტების სპექტრი ყოველდღიურად ფართოვდება. დღეს ყველა არსებულ API დეველოპერს, რომელსაც წარმატებული გადახდების ისტორია აქვს, შეუძლია GPT‑4 API-ზე წვდომა 8K კონტექსტით. ვგეგმავთ, რომ ამ თვის ბოლომდე წვდომა ახალ დეველოპერებსაც გავუხსნათ, შემდეგ კი ეტაპობრივად დავიწყოთ rate limit-ების გაზრდა გამოთვლითი რესურსების ხელმისაწვდომობის მიხედვით.
წარმოების მასშტაბის გამოყენებისთვის ამ მოდელების სტაბილურობასა და მზადყოფნაზე დაყრდნობით, ასევე GPT‑3.5 Turbo, DALL·E და Whisper API-ებსაც ვხადით ზოგადად ხელმისაწვდომს. ჩვენ ვმუშაობთ GPT‑4‑ისა და GPT‑3.5 Turbo-ის fine-tuning-ის უსაფრთხოდ ჩართვაზე და ველით, რომ ეს შესაძლებლობა ამ წლის ბოლოს გახდება ხელმისაწვდომი.
ჩვენ მარტში წარვადგინეთ Chat Completions API(იხსნება ახალ ფანჯარაში) და ახლა ის ჩვენი API GPT გამოყენების 97%-ს შეადგენს.
საწყისი Completions API 2020 წლის ივნისში წარვადგინეთ, რათა ჩვენს ენობრივ მოდელებთან ურთიერთობისთვის თავისუფალი ფორმის ტექსტური მოთხოვნა მიგვეწოდებინა. მას შემდეგ გავიგეთ, რომ ხშირად უკეთესი შედეგების მიღება უფრო სტრუქტურირებული მოთხოვნის ინტერფეისით შეგვიძლია. ჩატზე დაფუძნებული პარადიგმა ძლიერი აღმოჩნდა — ის ამუშავებს წინა გამოყენების შემთხვევების აბსოლუტურ უმრავლესობასა და ახალ სასაუბრო საჭიროებებს, თან უფრო მაღალ მოქნილობასა და სპეციფიკურობას უზრუნველყოფს. კერძოდ, Chat Completions API-ის სტრუქტურირებული ინტერფეისი (მაგ., სისტემური შეტყობინებები, ფუნქციის გამოძახება) და მრავალსვლიანი საუბრის შესაძლებლობები დეველოპერებს აძლევს საშუალებას შექმნან სასაუბრო გამოცდილებები და completion ამოცანების ფართო სპექტრი. ის ასევე ამცირებს პრომპტ ინიექცია შეტევების რისკს, რადგან მომხმარებლის მიერ მოწოდებული კონტენტი შეიძლება სტრუქტურულად გაიმიჯნოს ინსტრუქციებისგან.
ვგეგმავთ, რომ ჩვენი პლატფორმის ძალისხმევის უმეტესობის ინვესტირება ამ მიმართულებით გავაგრძელოთ, რადგან გვჯერა, რომ ეს დეველოპერებს სულ უფრო მეტად შესაძლებლობებით მდიდარ და მარტივად გამოსაყენებელ გამოცდილებას შესთავაზებს. ჩვენ სწრაფად ვმუშაობთ Chat Completions API-ის ბოლო რამდენიმე დარჩენილი ხარვეზის დახურვაზე, როგორიცაა დასრულების token-ების log probability-ები და მართვადობის გაზრდა, რათა პასუხების „ჭარბი საუბრობადობა“ შემცირდეს.
Chat Completions API-ში ჩვენი გაზრდილი ინვესტიციისა და გამოთვლითი რესურსების ოპტიმიზაციის ძალისხმევის ფარგლებში, 6 თვეში Completions API-ის გამოყენებით ჩვენს ზოგიერთ ძველ მოდელს გავაუქმებთ. მიუხედავად იმისა, რომ ეს API ხელმისაწვდომი დარჩება, დღეიდან ჩვენს დეველოპერულ დოკუმენტაციაში მას „legacy“-დ მოვნიშნავთ. ვგეგმავთ, რომ მომავალი მოდელებისა და პროდუქტების გაუმჯობესებები Chat Completions API-ზე იყოს კონცენტრირებული და არ გვაქვს გეგმაში Completions API-ის გამოყენებით ახალი მოდელების საჯაროდ გამოშვება.
2024 წლის 4 იანვრიდან ძველი completion მოდელები(იხსნება ახალ ფანჯარაში) აღარ იქნება ხელმისაწვდომი და შეიცვლება შემდეგი მოდელებით:
ძველი მოდელი | ახალი მოდელი |
|---|---|
ada | babbage-002 |
babbage | babbage-002 |
curie | davinci-002 |
davinci | davinci-002 |
davinci-instruct-beta | gpt-3.5-turbo-instruct |
curie-instruct-beta | gpt-3.5-turbo-instruct |
text-ada-001 | gpt-3.5-turbo-instruct |
text-babbage-001 | gpt-3.5-turbo-instruct |
text-curie-001 | gpt-3.5-turbo-instruct |
text-davinci-001 | gpt-3.5-turbo-instruct |
text-davinci-002 | gpt-3.5-turbo-instruct |
text-davinci-003 | gpt-3.5-turbo-instruct |
აპლიკაციები, რომლებიც საბაზისო GPT‑3 მოდელებისთვის სტაბილურ მოდელის სახელებს იყენებენ (ada, babbage, curie, davinci), 2024 წლის 4 იანვარს ავტომატურად განახლდებიან ზემოთ ჩამოთვლილ ახალ მოდელებზე. ახალი მოდელები ასევე ხელმისაწვდომი გახდება მომდევნო კვირებში ადრეული ტესტირებისთვის, თუ API გამოძახებებში მიუთითებთ შემდეგ მოდელის სახელებს: babbage-002, davinci-002.
დეველოპერებს, რომლებიც სხვა ძველ completion მოდელებს იყენებენ (მაგალითად text-davinci-003), 2024 წლის 4 იანვრამდე დასჭირდებათ თავიანთი ინტეგრაციის ხელით განახლება, რისთვისაც API მოთხოვნების “model” პარამეტრში უნდა მიუთითონ gpt-3.5-turbo-instruct. gpt-3.5-turbo-instruct არის InstructGPT‑ის სტილის მოდელი, რომელიც text-davinci-003-ის მსგავსადაა გაწვრთნილი. ეს ახალი მოდელი Completions API-ში პირდაპირი ჩანაცვლებაა და მომდევნო კვირებში ხელმისაწვდომი იქნება ადრეული ტესტირებისთვის.
დეველოპერებს, რომლებსაც 2024 წლის 4 იანვრის შემდეგაც სურთ თავიანთი fine-tuned მოდელების გამოყენების გაგრძელება, დასჭირდებათ შემცვლელების fine-tune ახალ საბაზისო GPT‑3 მოდელებზე (babbage-002, davinci-002) ან უფრო ახალ მოდელებზე (gpt-3.5-turbo, gpt-4). როგორც კი ეს შესაძლებლობა ხელმისაწვდომი გახდება ამ წლის ბოლოს, GPT‑3.5 Turbo-ისა და GPT‑4‑ის fine-tuning-ზე პრიორიტეტულ წვდომას მივანიჭებთ იმ მომხმარებლებს, რომლებმაც ადრე ძველი მოდელები fine-tune გააკეთეს. ვაცნობიერებთ, რომ იმ მოდელებიდან მიგრაცია, რომლებიც თქვენს საკუთარ მონაცემებზეა fine-tune გაკეთებული, რთულია. ჩვენ მხარდაჭერას გავუწევთ იმ მომხმარებლებს, რომლებმაც ადრე მოდელები fine-tune გააკეთეს, რათა ეს გადასვლა მაქსიმალურად გლუვი იყოს.
მომდევნო კვირებში დავუკავშირდებით დეველოპერებს, რომლებმაც ახლახან გამოიყენეს ეს ძველი მოდელები, და მეტ ინფორმაციას გავაზიარებთ, როგორც კი ახალი completion მოდელები ადრეული ტესტირებისთვის მზად იქნება.
ემბედინგის ძველი მოდელების მომხმარებლებს (მაგ., text-search-davinci-doc-001) 2024 წლის 4 იანვრამდე დასჭირდებათ text-embedding-ada-002-ზე მიგრაცია. ჩვენ text-embedding-ada-002 2022 წლის დეკემბერში გამოვუშვით და დავადგინეთ, რომ ის წინა მოდელებზე უფრო შესაძლებლობიანი და ხარჯეფექტურია. დღეს text-embedding-ada-002 ემბედინგის API-ის მთლიანი გამოყენების 99.9%-ს შეადგენს.
გვესმის, რომ ეს მნიშვნელოვანი ცვლილებაა იმ დეველოპერებისთვის, რომლებიც ამ ძველ მოდელებს იყენებენ. ამ მოდელების ეტაპობრივი შეწყვეტა გადაწყვეტილება არ არის, რომელსაც მსუბუქად ვიღებთ. ჩვენ დავფარავთ მომხმარებლების ფინანსურ ხარჯს, რომელიც ამ ახალი მოდელებით კონტენტის ხელახალ ემბედინგს უკავშირდება. მომდევნო დღეებში დაზარალებულ მომხმარებლებს დავუკავშირდებით.
ძველი მოდელი | ახალი მოდელი |
|---|---|
code-search-ada-code-001 | text-embedding-ada-002 |
code-search-ada-text-001 | text-embedding-ada-002 |
code-search-babbage-code-001 | text-embedding-ada-002 |
code-search-babbage-text-001 | text-embedding-ada-002 |
text-search-ada-doc-001 | text-embedding-ada-002 |
text-search-ada-query-001 | text-embedding-ada-002 |
text-search-babbage-doc-001 | text-embedding-ada-002 |
text-search-babbage-query-001 | text-embedding-ada-002 |
text-search-curie-doc-001 | text-embedding-ada-002 |
text-search-curie-query-001 | text-embedding-ada-002 |
text-search-davinci-doc-001 | text-embedding-ada-002 |
text-search-davinci-query-001 | text-embedding-ada-002 |
text-similarity-ada-001 | text-embedding-ada-002 |
text-similarity-babbage-001 | text-embedding-ada-002 |
text-similarity-curie-001 | text-embedding-ada-002 |
text-similarity-davinci-001 | text-embedding-ada-002 |
Edits API-ისა და მასთან დაკავშირებული მოდელების მომხმარებლებს (მაგ., text-davinci-edit-001 ან code-davinci-edit-001) 2024 წლის 4 იანვრამდე დასჭირდებათ GPT‑3.5 Turbo-ზე მიგრაცია. Edits API beta ადრეული საძიებო API იყო, რომელიც იმისთვის შეიქმნა, რომ დეველოპერებს ინსტრუქციებზე დაფუძნებით მოთხოვნის რედაქტირებული ვერსიის დაბრუნება შესძლებოდათ. Edits API-დან მიღებული უკუკავშირი გავითვალისწინეთ gpt-3.5-turbo-ისა და Chat Completions API-ის შემუშავებისას, რომელთა გამოყენებაც ახლა იმავე მიზნისთვის შეიძლება:


