გადადით მთავარ შინაარსზე
OpenAI

ვუშვებთ ახალ მოდელებს, ვამცირებთ GPT‑3.5 Turbo-ის ფასებს და დეველოპერებისთვის ვნერგავთ API გასაღებების მართვისა და API გამოყენების გაგების ახალ გზებს. ახალი მოდელები მოიცავს:

  • ემბედინგის ორ ახალ მოდელს
  • განახლებულ GPT‑4 Turbo preview მოდელს
  • განახლებულ GPT‑3.5 Turbo მოდელს
  • განახლებულ ტექსტის მოდერაციის მოდელს

ნაგულისხმევად, OpenAI API-ში გაგზავნილი მონაცემები OpenAI მოდელების გასაწვრთნელად ან გასაუმჯობესებლად არ იქნება გამოყენებული.

ემბედინგის ახალი მოდელები უფრო დაბალი ფასებით

წარმოგიდგენთ ემბედინგის ორ ახალ მოდელს: უფრო მცირე და მაღალეფექტიან text-embedding-3-small მოდელს და უფრო დიდ და ძლიერ text-embedding-3-large მოდელს.

ემბედინგი არის რიცხვების თანმიმდევრობა, რომელიც წარმოაჩენს შიგთავსში არსებულ ცნებებს, როგორიცაა ბუნებრივი ენა ან კოდი. ემბედინგები ამარტივებს მანქანური სწავლების მოდელებისა და სხვა ალგორითმებისთვის შიგთავსებს შორის კავშირების გაგებას და ისეთი ამოცანების შესრულებას, როგორიცაა კლასტერიზაცია ან მოძიება. ისინი ამუშავებს ისეთ აპლიკაციებს, როგორიცაა ცოდნის მოძიება როგორც ChatGPT‑ში, ისე Assistants API-ში, და retrieval augmented generation (RAG) დეველოპერული ხელსაწყოების მრავალ სახეობას.

იტვირთება...

ახალი მცირე ტექსტური ემბედინგის მოდელი

text-embedding-3-small ჩვენი ახალი მაღალეფექტიანი ემბედინგის მოდელია და მნიშვნელოვან გაუმჯობესებას წარმოადგენს მის წინამორბედთან, text-embedding-ada-002 მოდელთან შედარებით, რომელიც 2022 წლის დეკემბერში გამოვიდა.

უფრო ძლიერი წარმადობა. text-embedding-ada-002-ისა და text-embedding-3-small-ის შედარებისას, მრავალენოვანი მოძიებისთვის ფართოდ გამოყენებულ ბენჩმარკზე (MIRACL(იხსნება ახალ ფანჯარაში)) საშუალო ქულა 31.4%-დან 44.0%-მდე გაიზარდა, ხოლო ინგლისურენოვანი ამოცანებისთვის ფართოდ გამოყენებულ ბენჩმარკზე (MTEB(იხსნება ახალ ფანჯარაში)) საშუალო ქულა 61.0%-დან 62.3%-მდე გაიზარდა.

შემცირებული ფასი. text-embedding-3-small ასევე მნიშვნელოვნად უფრო ეფექტიანია, ვიდრე ჩვენი წინა თაობის text-embedding-ada-002 მოდელი. ამიტომ text-embedding-3-small-ის ფასი text-embedding-ada-002-თან შედარებით 5-ჯერ შემცირდა — 1k token-ზე $0.0001-დან $0.00002-მდე.

ჩვენ არ ვწყვეტთ text-embedding-ada-002-ის მხარდაჭერას, ამიტომ, მიუხედავად იმისა, რომ ახალ მოდელს ვურჩევთ, მომხმარებლებს შეუძლიათ გააგრძელონ წინა თაობის მოდელის გამოყენება.

ახალი დიდი ტექსტური ემბედინგის მოდელი: text-embedding-3-large

text-embedding-3-large ჩვენი ახალი, შემდეგი თაობის უფრო დიდი ემბედინგის მოდელია და ქმნის ემბედინგებს 3072-მდე განზომილებით.

უფრო ძლიერი წარმადობა. text-embedding-3-large ჩვენი ახალი საუკეთესო წარმადობის მოდელია. text-embedding-ada-002-ისა და text-embedding-3-large-ის შედარებისას: MIRACL-ზე საშუალო ქულა 31.4%-დან 54.9%-მდე გაიზარდა, ხოლო MTEB-ზე საშუალო ქულა 61.0%-დან 64.6%-მდე გაიზარდა.

შეფასების ბენჩმარკი

ada v2

text-embedding-3-small

text-embedding-3-large

MIRACL საშუალო

31.4

44.0

54.9

MTEB საშუალო

61.0

62.3

64.6

text-embedding-3-large-ის ფასი იქნება $0.00013 / 1k token.

ემბედინგის ახალი მოდელების გამოყენების შესახებ მეტის გასაგებად იხილეთ ჩვენი ემბედინგების გზამკვლევი(იხსნება ახალ ფანჯარაში).

ემბედინგების შემოკლების ნატიური მხარდაჭერა

უფრო დიდი ემბედინგების გამოყენება, მაგალითად მათი retrieval-ისთვის ვექტორულ საცავში შენახვა, როგორც წესი, უფრო ძვირი ჯდება და უფრო მეტ გამოთვლით რესურსს, მეხსიერებასა და საცავს მოიხმარს, ვიდრე მცირე ემბედინგების გამოყენება.

ჩვენი ორივე ახალი ემბედინგის მოდელი გაწვრთნილია ტექნიკითA, რომელიც დეველოპერებს საშუალებას აძლევს დააბალანსონ ემბედინგების გამოყენების წარმადობა და ღირებულება. კერძოდ, დეველოპერებს შეუძლიათ ემბედინგები შეამოკლონ (ანუ, წაშალონ ზოგიერთი რიცხვი მიმდევრობის ბოლოდან) ისე, რომ ემბედინგმა არ დაკარგოს ცნებების წარმოჩენის თვისებები, dimensions API პარამეტრის გადაცემით. მაგალითად, MTEB ბენჩმარკზე text-embedding-3-large ემბედინგი შეიძლება 256 ზომამდე შემცირდეს და მაინც აჭარბებდეს შეუმოკლებელ text-embedding-ada-002 ემბედინგს, რომლის ზომაც 1536-ია.

იტვირთება...

ეს ძალიან მოქნილი გამოყენების შესაძლებლობას იძლევა. მაგალითად, როცა იყენებთ ვექტორულ მონაცემთა საცავს, რომელიც მხოლოდ 1024 განზომილებამდე ემბედინგებს უჭერს მხარს, დეველოპერებს ახლა მაინც შეუძლიათ გამოიყენონ ჩვენი საუკეთესო ემბედინგის მოდელი text-embedding-3-large და dimensions API პარამეტრისთვის მიუთითონ 1024-ის მნიშვნელობა, რაც ემბედინგს 3072 განზომილებიდან შეამცირებს და მცირე ვექტორის ზომის სანაცვლოდ გარკვეულ სიზუსტეს დათმობს.

სხვა ახალი მოდელები და დაბალი ფასები

განახლებული GPT-3.5 Turbo მოდელი და დაბალი ფასები

მომავალ კვირას წარმოგიდგენთ GPT‑3.5 Turbo-ის ახალ მოდელს, gpt-3.5-turbo-0125-ს, და ბოლო ერთი წლის განმავლობაში უკვე მესამედ შევამცირებთ GPT‑3.5 Turbo-ის ფასებს, რათა ჩვენს მომხმარებლებს მასშტაბირება გავუადვილოთ. ახალი მოდელისთვის შემომავალი ფასები 50%-ით მცირდება და შეადგენს $0.0005 /1K token-ს, ხოლო გამომავალი ფასები 25%-ით მცირდება და შეადგენს $0.0015 /1K token-ს. ამ მოდელს ასევე ექნება სხვადასხვა გაუმჯობესება, მათ შორის მოთხოვნილ ფორმატებში პასუხის უფრო მაღალი სიზუსტე და შეცდომის(იხსნება ახალ ფანჯარაში) გამოსწორება, რომელმაც არაინგლისურ ენაზე ფუნქციის გამოძახებებისთვის ტექსტის კოდირების პრობლემა გამოიწვია.

მომხმარებლები, რომლებიც იყენებენ არამიბმულ gpt-3.5-turbo მოდელის ალიასს, ამ მოდელის გაშვებიდან ორი კვირის შემდეგ ავტომატურად განახლდებიან gpt-3.5-turbo-0613-დან gpt-3.5-turbo-0125-ზე.

განახლებული GPT-4 Turbo preview

GPT‑4 API-ის მომხმარებლების მოთხოვნების 70%-ზე მეტი მის გამოშვების შემდეგ უკვე გადავიდა GPT‑4 Turbo-ზე, რადგან დეველოპერები იყენებენ მის განახლებულ ცოდნის cut-off-ს, უფრო დიდ 128k კონტექსტურ ფანჯრებს და დაბალ ფასებს.

დღეს ვუშვებთ განახლებულ GPT‑4 Turbo preview მოდელს, gpt-4-0125-preview. ეს მოდელი ამოცანებს, როგორიცაა კოდის გენერირება, უფრო სრულად ასრულებს, ვიდრე წინა preview მოდელი, და გამიზნულია იმ “სიზარმაცის” შემთხვევების შესამცირებლად, როცა მოდელი ამოცანას არ ასრულებს ბოლომდე. ახალი მოდელი ასევე მოიცავს იმ შეცდომის გამოსწორებას, რომელიც გავლენას ახდენდა არაინგლისურ UTF-8 გენერაციებზე.

მათთვის, ვისაც სურს ავტომატურად განახლდეს GPT‑4 Turbo preview-ის ახალ ვერსიებზე, ასევე ვნერგავთ ახალ gpt-4-turbo-preview მოდელის სახელის ალიასს, რომელიც ყოველთვის ჩვენს უახლეს GPT‑4 Turbo preview მოდელზე მიუთითებს.

ვგეგმავთ, რომ მომდევნო თვეებში GPT‑4 Turbo with vision ზოგადი ხელმისაწვდომობით გავუშვათ.

განახლებული მოდერაციის მოდელი

უფასო Moderation API დეველოპერებს საშუალებას აძლევს გამოავლინონ პოტენციურად საზიანო ტექსტი. ჩვენი უსაფრთხოების უწყვეტი მუშაობის ფარგლებში ვუშვებთ text-moderation-007-ს, ჩვენს დღემდე ყველაზე გამძლე მოდერაციის მოდელს. text-moderation-latest და text-moderation-stable ალიასები განახლდა ისე, რომ მასზე მიუთითებდეს. უსაფრთხო AI სისტემების შექმნის შესახებ მეტის გასაგებად იხილეთ ჩვენი უსაფრთხოების საუკეთესო პრაქტიკების გზამკვლევი(იხსნება ახალ ფანჯარაში).

API გამოყენების გაგებისა და API გასაღებების მართვის ახალი გზები

ვუშვებთ პლატფორმის ორ გაუმჯობესებას, რათა დეველოპერებს მივცეთ როგორც მათი გამოყენების უკეთესი ხილვადობა, ისე API გასაღებებზე მეტი კონტროლი.

პირველ რიგში, დეველოპერებს ახლა შეუძლიათ API გასაღებებს ნებართვები მიანიჭონ API გასაღებების გვერდიდან(იხსნება ახალ ფანჯარაში). მაგალითად, გასაღებს შეიძლება მიენიჭოს მხოლოდ-წაკითხვის წვდომა შიდა ტრეკინგის დაფის გასაძლიერებლად, ან შეიზღუდოს ისე, რომ მხოლოდ გარკვეულ საბოლოო წერტილებზე ჰქონდეს წვდომა.

მეორე, გამოყენების დაფა და გამოყენების ექსპორტის ფუნქცია ახლა მეტრიკებს API გასაღების დონეზე აჩვენებს ტრეკინგის ჩართვის(იხსნება ახალ ფანჯარაში) შემდეგ. ეს ამარტივებს გამოყენების ნახვას ფუნქციის, გუნდის, პროდუქტის ან პროექტის დონეზე, უბრალოდ თითოეულისთვის ცალკე API გასაღებების ქონით.

Image2

მომდევნო თვეებში ვგეგმავთ კიდევ უფრო გავაუმჯობესოთ დეველოპერებისთვის API გამოყენების ნახვისა და API გასაღებების მართვის შესაძლებლობა, განსაკუთრებით უფრო დიდ ორგანიზაციებში.

OpenAI-ის API-ების უახლესი განახლებებისთვის გამოგვყევით X-ზე მისამართზე @OpenAIDevs(იხსნება ახალ ფანჯარაში).

ავტორი

OpenAI

მადლობები

Juntang Zhuang, Paul Baltescu, Joy Jiao, Arvind Neelakantan, Andrew Braunstein, Jeff Harris, Logan Kilpatrick, Leher Pathak, Enoch Cheung, Ted Sanders, Yutian Liu, Anushree Agrawal, Andrew Peng, Ian Kivlichan, Mehmet Yatbaz, Madelaine Boyd, Anna-Luisa Brakman, Florencia Leoni Aleman, Henry Head, Molly Lin, Meghan Shah, Chelsea Carlson, Sam Toizer, Ryan Greene, Alison Harmon, Denny Jin, Karolis Kosas, Marie Inuzuka, Peter Bakkum, Barret Zoph, Luke Metz, Jiayi Weng, Randall Lin, Yash Patil, Mianna Chen, Andrew Kondrich, Brydon Eastman, Liam Fedus, John Schulman, Vlad Fomenko, Andrej Karpathy, Aidan Clark, Owen Campbell-Moore