FAQ zu Embeddings

Am 25. Januar 2024 haben wir zwei neue Embedding-Modelle veröffentlicht: text-embedding-3-small und text-embedding-3-large. Dies sind unsere neuesten und leistungsstärksten Embedding-Modelle mit niedrigeren Kosten, höherer mehrsprachiger Leistung und einem neuen Parameter zum Kürzen von Embeddings. Mehr erfahren.

Was ist anders an den neuesten Embedding-Modellen?

Unsere neuesten v3-Modelle bieten eine stärkere Leistung bei gängigen Benchmarks zu einem niedrigeren Preis. Mehr über die Leistungsverbesserungen erfährst du im Ankündigungs-Blogbeitrag und in der Dokumentation für Entwickler:innen.

Wie kann ich vor dem Einbetten feststellen, wie viele Token ein String haben wird?

Du kannst das Tiktoken-Paket von OpenAI verwenden, um zu prüfen, wie viele Token ein String haben wird. Weitere Informationen findest du in unserem Leitfaden für Embeddings.

Wie kann ich die K nächstgelegenen Embedding-Vektoren schnell abrufen?

Für die schnelle Suche über viele Vektoren empfehlen wir die Verwendung einer Vektordatenbank.

Welche Distanzfunktion sollte ich verwenden?

Embedding-Ausgaben der OpenAI API sind standardmäßig L2-normalisiert auf Länge 1, auch nach dem Kürzen mit dem Parameter dimensions. Das bedeutet:

OpenAI-Embeddings sind auf Länge 1 normalisiert. Das bedeutet:

Die Kosinus-Ähnlichkeit kann mit nur einem Skalarprodukt etwas schneller berechnet werden
Kosinus-Ähnlichkeit und euklidische Distanz führen zu identischen Rankings

Was ist anders an den neuesten Embedding-Modellen?

Wie kann ich vor dem Einbetten feststellen, wie viele Token ein String haben wird?

Wie kann ich die K nächstgelegenen Embedding-Vektoren schnell abrufen?

Welche Distanzfunktion sollte ich verwenden?

War dieser Artikel hilfreich?