截至 2025 年 3 月 11 日,我們已發布全新 Agents 平台的基礎構件。詳細資訊請參閱我們的 API 文件:Responses API、包含 Web Search、File Search 與 Computer Use 等 Tools,以及具備 Tracing 的 Agents SDK。我們根據你對 Assistants API beta 的回饋,已將關鍵改進納入 Responses API。待我們達成完整功能對等後,將在今年稍晚公布 Assistants API 的淘汰計畫,並以 2026 年上半年為目標停用日期。
什麼是 Assistants API?
Assistants API 讓開發者能在自己的 App 內輕鬆打造強大的 AI 助理。此 API 免除管理對話歷史紀錄的需求,並提供存取 OpenAI 託管的工具(例如 Code Interpreter 與 File Search)。此外,該 API 也支援針對第三方工具的改良版函式呼叫。
我還能使用 Assistants API v1 beta 嗎?
不行。自 2024 年 12 月 18 日起,使用者已無法存取 Assistants API beta 的 v1 版本。我們目前僅支援 v2。請參考這份移轉指南,將你的 API 呼叫從 v1 轉換為 v2
我要如何存取?
只要有 OpenAI API 帳號即可使用 Assistants API。你也可以透過 Assistants Playground 開始使用。
什麼是 Assistant?
Assistant 代表一個為特定用途打造的 AI,會使用 OpenAI 的模型,並且能存取檔案、維持持久的 threads,以及呼叫工具。
什麼是 Thread?
Thread 是助理與使用者之間的一段對話工作階段。Threads 透過儲存訊息歷史並在對話長度超出模型上下文長度時加以截斷,來簡化應用程式開發。
什麼是 File Search 工具?
file_search 工具內建多項檢索最佳實務,協助你從檔案中擷取正確資料,以增強模型的回覆。更多資訊請閱讀我們的開發者文件。
預設情況下,file_search 工具使用以下設定:
Chunk 大小:800 tokens
Chunk 重疊:400 tokens
Embedding 模型:
text-embedding-3-large(256 維)加入上下文的 chunk 最大數量:20
檔案上傳有哪些限制?
上傳檔案的限制如下:
每個檔案 512 MB
每個檔案 5M tokens
每個 vector store 10k 檔案
每個 assistant 1 個 vector store
每個 thread 1 個 vector store
組織中每個專案的總儲存上限為 100 GB。
File Search 工具有哪些限制?
我們目前有一些已知限制,並計畫在接下來幾個月內逐步支援:
目前無法修改 chunking、embedding 或檢索設定。
不支援解析文件內的圖片。
不支援針對結構化檔案格式(例如 .csv 或 .jsonl 檔)進行檢索。請參閱支援的檔案類型。
Assistants API 的速率限制是多少?
Assistants API 的速率限制不會綁定到使用層級與模型。相反地,我們會依請求類型提供預設限制,另有少數例外:
GET:1000 RPM
POST:300 RPM
POST 至
/v1/threads/<thread_id>/runs:200 RPMPOST 至
/v1/threads/runs:200 RPM
DELETE:每分鐘 300 次請求
API 中的 Code Interpreter 如何計費?
Code Interpreter 以每個工作階段 $0.03 計費。若你的 assistant 在兩個不同的threads中同時呼叫 Code Interpreter,將會建立兩個 Code Interpreter 工作階段(2 * $0.03)。每個工作階段預設啟用一小時,這表示若使用者在同一個 thread 中持續對 Code Interpreter 下指令(最多一小時),你只需支付一次費用。
API 中的 File Search 如何計費?
File Search 以每天每 GB 的 vector store 儲存空間 $0.10 計費(前 1 GB 儲存免費)。vector store 的大小以檔案經解析、分塊(chunked)與向量嵌入(embedded)後的最終大小為準。
在 2024 年 4 月 17 日之前建立的任何 vector stores,將免費至 2024 年底;之後將會:
若在 2024 年 4 月 17 日之後建立的某次 Run 中至少被使用過一次,則以目前費率計費(目前為 $0.10/GB/天)。
若在 2024 年 4 月 17 日到 2024 年 12 月 31 日之間的任何 Run 都未使用過,將被刪除——這是為了避免你因為在宣布此定價變更前建立但從未使用的 vector stores 而被收費。
我能建立的 assistants 數量有上限嗎?
組織可建立的 assistants 數量沒有上限。
API 支援串流(streaming)嗎?
是的,Assistants API 支援串流。
Assistants API 支援 JSON 模式嗎?
是的,Assistants API 透過 Assistants 或 Run 物件上的 response_format 參數提供 JSON 模式。
Assistants API 也會代為管理第三方函式呼叫的請求嗎?
不會。雖然函式呼叫可讓模型選擇工具並為其格式化請求,但對第三方工具的呼叫執行並非由 OpenAI 管理。
我傳送給 OpenAI 的資料會如何處理?
與我們平台的其他部分相同,傳入 OpenAI API 的資料與檔案絕不會用於訓練我們的模型,且你可在需要時隨時刪除你的資料。上傳至 Assistants API 的資料會被無限期保存,直到使用者手動刪除為止。
DALL-E 能透過 Assistants API 使用嗎?
目前 DALL-E 尚不可用。
Assistants API 有提供 UI 嗎?
你可以使用 Assistants API 的 Playground。請確保你在左側邊欄中選擇Assistants視圖,並使用與你想要啟用之 Tools 相容的模型。

Assistants API 中 assistant 指令的字元上限是多少?
assistant 使用的系統指令最長為 256,000 個字元。
我遇到像是「伺服器在處理你的請求時發生錯誤。很抱歉!你可以重試請求,或若錯誤持續發生,請透過我們的說明中心 help.openai.com 聯絡我們。」這樣的錯誤訊息。我該怎麼辦?
若你收到此錯誤,可能代表你的提示(prompt)設定不正確。若你持續重試仍失敗,請嘗試以下做法:
確保重新調整你的提示,將任何類似函式的命令當作函式處理
將提示中的任何命令作為函式加入
tools
為什麼我的 File Search 工具效果不佳?
使用 File Search 工具時,我們建議將 max_prompt_tokens 設定為不低於 20,000。對於較長的對話或與 File Search 的多次互動,建議將此上限提高到 50,000,或理想情況下乾脆移除 max_prompt_tokens 限制,以取得最高品質的結果。更多內容請見這裡。
我可以如何提供回饋?
我們很期待在Developer Forum、透過 help.openai.com 的說明中心,或在 Twitter 上的 @OpenAIDevs 聽到你的回饋。
