截至 2025 年 3 月 11 日,我們已推出全新 Agents 平台的基礎構件。詳情請參閱我們的 API 文件,包括 Responses API、工具如 Web Search、File Search 及 Computer Use,以及我們的 Agents SDK 與Tracing。根據你對 Assistants API beta 的意見回饋,我們已將多項重要改進納入 Responses API。在達成功能全面對齊後,我們將於今年稍後公布Assistants API 的淘汰計劃,目標於 2026 年上半年停止服務。
甚麼是 Assistants API?
Assistants API 讓開發者可輕鬆在其應用程式中建立功能強大的 AI 助理。此 API 免除管理對話記錄的需要,並可使用由 OpenAI 託管的工具,例如程式碼解譯器和 File Search。API 亦支援經改進的第三方工具函數調用。
我仍可使用 Assistants API v1 beta 嗎?
不可以。自 2024 年 12 月 18 日起,用戶已不能再存取 Assistant API beta 的 v1 版本。我們目前只支援 v2。請參閱這份遷移指南,將你的 API 呼叫由 v1 轉換至 v2
我如何存取?
任何擁有 OpenAI API 帳戶的人都可使用 Assistants API。你亦可透過 Assistants Playground 開始使用。
甚麼是 Assistant?
Assistant 代表一個為特定用途而設的 AI,使用 OpenAI 的模型,並可存取檔案、維持持久執行緒,以及調用工具。
甚麼是 Thread?
Thread 是 Assistant 與用戶之間的一個對話工作階段。Threads 透過儲存訊息記錄,並在對話長度超出模型上下文長度時加以截斷,從而簡化應用程式開發。
甚麼是 File Search 工具?
file_search 工具內建多項檢索最佳實務,協助你從檔案中提取正確資料,以增強模型回應。更多資訊請參閱我們的開發者文件。
預設情況下,file_search 工具使用以下設定:
區塊大小:800 tokens
區塊重疊:400 tokens
嵌入模型:維度為 256 的
text-embedding-3-large加入上下文的最大區塊數:20
上載檔案有甚麼限制?
上載檔案的限制如下:
每個檔案 512 MB
每個檔案 5M tokens
每個向量儲存最多 10k 個檔案
每個 assistant 1 個向量儲存
每個 thread 1 個向量儲存
機構中每個專案的整體儲存上限為 100 GB。
File Search 工具有甚麼限制?
目前有幾項已知限制,我們正努力在未來數月內加入支援:
目前無法修改區塊切分、嵌入或檢索設定。
我們不支援剖析文件中的圖片。
我們不支援對結構化檔案格式(例如 .csv 或 .jsonl 檔案)進行檢索。請參閱支援的檔案類型。
Assistants API 的速率限制是多少?
Assistants API 的速率限制並不與使用層級和模型掛鈎。相反,系統會按請求類型設有預設限制,另有少數例外:
GET:1000 RPM
POST:300 RPM
POST 至
/v1/threads/<thread_id>/runs:200 RPMPOST 至
/v1/threads/runs:200 RPM
DELETE:每分鐘 300 個請求
API 中的 Code Interpreter 如何收費?
程式碼解譯器的收費為每個工作階段 $0.03。若你的 assistant 在兩個不同的threads中同時調用程式碼解譯器,便會建立兩個程式碼解譯器工作階段(2 * $0.03)。每個工作階段預設會維持一小時,這表示若你的用戶在同一 thread 中持續向程式碼解譯器發出指示長達一小時,你只需支付一次此費用。
API 中的 File Search 如何收費?
File Search 的收費為每天每 GB 向量儲存空間 $0.10(首 1 GB 儲存空間免費)。向量儲存空間的大小以你的檔案被剖析、切分區塊及嵌入後所得的向量儲存實際大小為準。
任何於 2024 年 4 月 17 日之前建立的向量儲存,至 2024 年底前均免費,其後將會:
如曾在 2024 年 4 月 17 日之後建立的某次 Run 中至少使用過一次,則按現行費率收費(目前為 $0.10/GB/日)。
如在 2024 年 4 月 17 日至 2024 年 12 月 31 日期間未曾在任何一次 Run 中使用,則會被刪除——以避免你為那些在此收費變更公布前建立但從未使用的向量儲存被收費。
我可建立的 assistants 數量有限制嗎?
每個機構可建立的 assistants 數量沒有限制。
API 支援串流嗎?
是,Assistants API 支援串流。
Assistants API 支援 JSON mode 嗎?
是,Assistants API 可透過 Assistants 或 Run 物件上的 response_format 參數使用 JSON mode。
Assistants API 亦會管理第三方函數調用的請求嗎?
不會。雖然函數調用可讓模型選擇工具並為其格式化請求,但對第三方工具的實際調用執行並非由 OpenAI 管理。
我傳送給 OpenAI 的資料會如何處理?
與我們平台其他部分一樣,傳送至 OpenAI API 的資料和檔案絕不會用作訓練我們的模型,而你可在需要時隨時刪除你的資料。上載至 Assistants API 的資料會無限期儲存,直至用戶手動刪除為止。
DALL-E 可透過 Assistants API 使用嗎?
目前暫未提供 DALL-E。
Assistants API 有 UI 介面嗎?
你可到 Assistants API 的 Playground 看看。請確保你位於左側欄的 Assistants 檢視,並使用與你想啟用工具相容的模型。

Assistants API 中 assistant 指示的字元上限是多少?
assistant 使用的系統指示最大長度為 256,000 個字元。
我收到類似「The server had an error while processing your request. Sorry about that! You can retry your request, or contact us through our help center at help.openai.com if the error persists. 」的錯誤訊息。我該怎麼辦?
若你收到這個錯誤,可能表示你的提示詞設定不正確。若你反覆重試請求仍然失敗,可嘗試以下做法:
請重新組織你的提示詞,將任何類似函數的指令視為函數
將提示詞中的任何指令加入至
tools作為函數
為何我的 File Search 工具效果不佳?
使用 File Search 工具時,我們建議將 max_prompt_tokens 設為不少於 20,000。對於較長對話或多次與 File Search 互動,請考慮將此限制提高至 50,000,或最好完全移除 max_prompt_tokens 限制,以獲得最高品質結果。按此處了解更多。
我可以如何提供意見回饋?
我們非常樂意聽取你在開發者論壇、透過 help.openai.com 的說明中心,或在 Twitter @OpenAIDevs 上提供的意見。
