25 Ocak 2024’te iki yeni embeddings modeli yayınladık: text-embedding-3-small ve text-embedding-3-large. Bunlar daha düşük maliyetler, daha yüksek çok dilli performans ve embeddings'i kısaltmaya yönelik yeni bir parametre ile en yeni ve en yüksek performanslı embedding modellerimizdir. Daha fazlasını okuyun.
En yeni embeddings modellerinde ne farklı?
En yeni v3 modellerimiz, daha düşük fiyatla yaygın kıyaslamalarda daha güçlü performans sunar. Performans iyileştirmeleri hakkında daha fazlasını duyuru blog yazısında ve geliştirici belgelerinde okuyabilirsiniz.
Bir dizgeyi embed etmeyi denemeden önce kaç token içereceğini nasıl anlayabilirim?
Bir dizgenin kaç token içereceğini kontrol etmek için OpenAI’ın Tiktoken paketini kullanabilirsiniz. Daha fazlasını embeddings geliştirici kılavuzumuzda öğrenin.
K en yakın embedding vektörlerini hızlıca nasıl alabilirim?
Çok sayıda vektör üzerinde hızlı arama için vektör veritabanı kullanmanızı öneririz.
Hangi uzaklık fonksiyonunu kullanmalıyım?
Kosinüs benzerliğini öneririz. Uzaklık fonksiyonu seçimi genelde çok önemli değildir.
OpenAI embeddings'leri 1 uzunluğuna normalize edilir; bu da şu anlama gelir:
Kosinüs benzerliği yalnızca bir noktasal çarpım kullanılarak biraz daha hızlı hesaplanabilir
Kosinüs benzerliği ile Öklid uzaklığı aynı sıralamaları verir
