此頁面由機器翻譯。查看原始英文文章。

嵌入常見問題

全新改良嵌入模型的常見問題

更新日期：19 hours ago

2024 年 1 月 25 日，我們發布了兩個新的嵌入模型：text-embedding-3-small 和 text-embedding-3-large。這些是我們最新且效能最強的嵌入模型，成本更低、多語言效能更高，並具備可縮短嵌入的新參數。閱讀更多。

最新嵌入模型有何不同？

我們最新的 v3 模型以更低價格，在常見基準測試上提供更強效能。你可以在公告部落格文章和開發人員文件中進一步了解效能改進。

在嘗試嵌入字串之前，如何判斷它會有多少個 Token？

你可以使用 OpenAI 的 Tiktoken 套件來檢查字串會有多少個 Token。請參閱我們的嵌入開發人員指南以了解更多。

如何快速擷取 K 個最近的嵌入向量？

若要快速搜尋大量向量，我們建議使用向量資料庫。

我應該使用哪個距離函數？

OpenAI API 嵌入輸出預設會經 L2 正規化為長度 1，包括使用 dimensions 參數縮短之後，這表示：

OpenAI 嵌入會正規化為長度 1，這表示：

僅使用點積即可稍微更快地計算餘弦相似度
餘弦相似度和歐幾里得距離會產生相同的排名

這篇文章有幫助嗎？