
Il-mudell il-ġdid, text-embedding-ada-002, jissostitwixxi ħames mudelli separati għat-tfittxija fit-test, is-similarità fit-test, u t-tfittxija fil-kodiċi, u jaqbeż lill-aktar mudell preċedenti kapaċi tagħna, Davinci, fil-biċċa l-kbira tal-kompiti, filwaqt li l-prezz tiegħu hu 99.8% inqas.
L-embeddings huma rappreżentazzjonijiet numeriċi ta’ kunċetti kkonvertiti f’sekwenzi ta’ numri, li jagħmluha faċli għall-kompjuters biex jifhmu r-relazzjonijiet bejn dawk il-kunċetti. Sa mit-tnedija inizjali tal-punt ta' tmiem inizjali ta’ OpenAI /embeddings(jinfetaħ f’tieqa ġdida), ħafna applikazzjonijiet inkorporaw embeddings biex jippersonalizzaw, jirrakkomandaw, u jfittxu kontenut.
Tista’ tagħmel query lill-punt ta' tmiem /embeddings(jinfetaħ f’tieqa ġdida) għall-mudell il-ġdid b’żewġ linji ta’ kodiċi billi tuża l-OpenAI Python Library(jinfetaħ f’tieqa ġdida) tagħna, eżatt kif stajt tagħmel bil-mudelli preċedenti:
import openai
response = openai.Embedding.create(
input="porcine pals say",
model="text-embedding-ada-002"
)Prestazzjoni aktar b’saħħitha. text-embedding-ada-002 jaqbeż il-mudelli kollha qodma tal-embedding fil-kompiti ta’ tfittxija fit-test, tfittxija fil-kodiċi, u similarità tas-sentenzi u jikseb prestazzjoni komparabbli fil-klassifikazzjoni tat-test. Għal kull kategorija ta’ kompiti, nevalwaw il-mudelli fuq id-datasets użati f’embeddings qodma(jinfetaħ f’tieqa ġdida).
| Mudell | Prestazzjoni |
| text-embedding-ada-002 | 53.3 |
| text-search-davinci-*-001 | 52.8 |
| text-search-curie-*-001 | 50.9 |
| text-search-babbage-*-001 | 50.4 |
| text-search-ada-*-001 | 49.0 |
Unifikazzjoni tal-kapaċitajiet. Issimplifikajna b’mod sinifikanti l-interface tal-punt ta' tmiem /embeddings(jinfetaħ f’tieqa ġdida) billi għaqqadna l-ħames mudelli separati murija hawn fuq (text-similarity, text-search-query, text-search-doc, code-search-text u code-search-code) f’mudell ġdid wieħed. Din ir-rappreżentazzjoni waħda tagħti riżultati aħjar mill-mudelli preċedenti tagħna tal-embedding fuq sett divers ta’ benchmarks ta’ tfittxija fit-test, similarità tas-sentenzi, u tfittxija fil-kodiċi.
Kuntest itwal. It-tul tal-kuntest tal-mudell il-ġdid żdied b’erba’ darbiet, minn 2048 għal 8192, u b’hekk sar aktar konvenjenti biex taħdem ma’ dokumenti twal.
Daqs iżgħar tal-embedding. L-embeddings il-ġodda għandhom biss 1536 dimensjoni, wieħed minn tmienja mid-daqs tal-embeddings ta’ davinci-001, u dan jagħmilhom aktar ekonomiċi meta taħdem ma’ databases ta’ vetturi.
Prezz imnaqqas. Naqqasna l-prezz tal-mudelli l-ġodda tal-embedding b’90% meta mqabbel ma’ mudelli qodma tal-istess daqs. Il-mudell il-ġdid jikseb prestazzjoni aħjar jew simili bħall-mudelli qodma Davinci bi prezz 99.8% inqas.
B’mod ġenerali, il-mudell il-ġdid tal-embedding huwa għodda ferm aktar b’saħħitha għall-ipproċessar tal-lingwa naturali u għal kompiti tal-kodiċi. Ninsabu eċċitati naraw kif il-klijenti tagħna se jużawh biex joħolqu applikazzjonijiet saħansitra aktar kapaċi fl-oqsma rispettivi tagħhom.
Il-mudell il-ġdid text-embedding-ada-002 ma jaqbiżx lil text-similarity-davinci-001 fuq il-benchmark ta’ klassifikazzjoni SentEval linear probing. Għal kompiti li jeħtieġu t-taħriġ ta’ saff lineari ħafif fuq il-vetturi tal-embedding għat-tbassir tal-klassifikazzjoni, nissuġġerixxu li tqabblu l-mudell il-ġdid ma’ text-similarity-davinci-001 u tagħżlu liema mudell jagħti l-aħjar prestazzjoni.
Iċċekkja t-taqsima Limitazzjonijiet u Riskji(jinfetaħ f’tieqa ġdida) fid-dokumentazzjoni tal-embeddings għal-limitazzjonijiet ġenerali tal-mudelli tagħna tal-embedding.
Kalendar AI(jinfetaħ f’tieqa ġdida) huwa prodott ta’ sales outreach li juża embeddings biex iqabbel l-aħjar sales pitch mal-klijenti t-tajbin minn dataset li fih 340M profili. Din l-awtomazzjoni tiddependi fuq is-similarità bejn l-embeddings tal-profili tal-klijenti u s-sale pitches biex tordna l-aktar tqbil xieraq, u telimina 40–56% ta’ immirar mhux mixtieq meta mqabbel mal-approċċ il-qadim tagħhom.
Notion(jinfetaħ f’tieqa ġdida), il-kumpanija online tal-workspace, se tuża l-embeddings il-ġodda ta’ OpenAI biex ittejjeb it-tfittxija ta’ Notion lil hinn mis-sistemi tal-lum ta’ tqabbil bil-kliem ewlieni.


