D.U.K. apie įterpinius

2024 m. sausio 25 d. išleidome du naujus įterpinių modelius: text-embedding-3-small ir text-embedding-3-large. Tai naujausi ir našiausi mūsų įterpinių modeliai, pasižymintys mažesnėmis sąnaudomis, geresniu daugiakalbiu našumu ir nauju įterpinių trumpinimo parametru. Skaitykite daugiau.

Kuo skiriasi naujausi įterpinių modeliai?

Mūsų naujausi v3 modeliai užtikrina geresnį našumą įprastuose etaloniniuose testuose už mažesnę kainą. Daugiau apie našumo patobulinimus galite perskaityti pranešimo tinklaraščio įraše ir kūrėjų dokumentacijoje.

Kaip sužinoti, kiek žetonų turės eilutė, prieš bandant ją paversti įterpiniu?

Galite naudoti OpenAI „Tiktoken“ paketą, kad patikrintumėte, kiek žetonų turės eilutė. Sužinokite daugiau mūsų įterpinių kūrėjų vadove.

Kaip greitai gauti K artimiausius įterpinių vektorius?

Norint greitai ieškoti daugelyje vektorių, rekomenduojame naudoti vektorių duomenų bazę.

Kurią atstumo funkciją turėčiau naudoti?

OpenAI API įterpinių išvestys pagal numatytuosius nustatymus yra L2 normalizuotos iki 1 ilgio, įskaitant ir sutrumpinus naudojant parametrą dimensions, o tai reiškia, kad:

OpenAI įterpiniai normalizuojami iki 1 ilgio, o tai reiškia, kad:

Kosinusinį panašumą galima apskaičiuoti šiek tiek greičiau naudojant tik skaliarinę sandaugą
Kosinusinis panašumas ir Euklido atstumas duos identiškus reitingus

Kuo skiriasi naujausi įterpinių modeliai?

Kaip sužinoti, kiek žetonų turės eilutė, prieš bandant ją paversti įterpiniu?

Kaip greitai gauti K artimiausius įterpinių vektorius?

Kurią atstumo funkciją turėčiau naudoti?

Ar šis straipsnis buvo naudingas?