OpenAI
页面内容为机器翻译。查看英文原文

Assistants API (v2) 常见问题解答

更新于:8 days ago

截至 2025 年 3 月 11 日,我们已发布新 Agents 平台的构建模块。有关详细信息,请参阅我们的 Responses API API 文档、包括 Web SearchFile SearchComputer Use 在内的工具,以及包含 TracingAgents SDK。根据你对 Assistants API beta 的反馈,我们已将关键改进纳入 Responses API。在实现完整功能对等后,我们将在今年晚些时候公布 Assistants API 弃用计划,目标停止使用日期为 2026 年上半年。

什么是 Assistants API?

Assistants API 使开发者能够轻松地在自己的应用中构建强大的 AI 助手。此 API 免去了管理对话历史的需要,并增加了对 OpenAI 托管工具(如代码解释器和 File Search)的访问。该 API 还支持面向第三方工具的改进函数调用。

我还能使用 Assistants API v1 beta 吗?

不能。自 2024 年 12 月 18 日起,用户不再能够访问 Assistant API beta 的 v1 版本。我们目前仅支持 v2。请查看此迁移指南,将你的 API 调用从 v1 转换为 v2

我如何访问它?

任何拥有 OpenAI API 账户的人都可以使用 Assistants API,但它已弃用,并将于 2026 年 8 月移除。对于新项目,请改用 Responses API。如果你已在使用 Assistants API,请规划迁移到 Responses API。在该 API 仍可用期间,你仍可在 Assistants Playground 中访问现有 assistants。

什么是 Assistant?

Assistant 表示一种专用 AI,它使用 OpenAI 的模型,并且可以访问文件、维护持久线程以及调用工具。

什么是 Thread?

线程是 assistant 与用户之间的对话会话。线程通过存储消息历史,并在对话超出模型上下文长度时截断历史,简化了应用开发。

什么是 File Search 工具?

`file_search` 工具开箱即用地实现了多项检索最佳实践,帮助你从文件中提取正确数据,以增强模型的回答。如需更多信息,请阅读我们的开发者文档

默认情况下,file_search 工具使用以下设置:

  • 分块大小:800 Token

  • 分块重叠:400 Token

  • 嵌入模型:`text-embedding-3-large`,256 维

  • 添加到上下文的最大分块数:20

文件上传有哪些限制?

上传文件的限制如下:

  • 每个文件 512 MB

  • 每个文件 5M Token

  • 每个向量存储 10k 个文件

  • 每个 assistant 1 个向量存储

  • 每个线程 1 个向量存储

组织中每个项目的总体存储限制为 100 GB。

File Search 工具有哪些限制?

我们有一些已知限制,并正在努力在未来几个月内增加支持:

  1. 目前无法修改分块、嵌入或检索设置。

  2. 我们不支持解析文档中的图片。

  3. 我们不支持对结构化文件格式(如 .csv 或 .jsonl 文件)进行检索。查看支持的文件类型。

Assistants API 的速率限制是什么?

Assistants API 的速率限制不与使用层级和模型绑定。相反,它按请求类型设有默认限制,但有几个例外:

  • GET:1000 RPM

  • POST:300 RPM

  • DELETE:每分钟 300 个请求

API 中的代码解释器如何计费?

代码解释器按每个会话 $0.03 计费。如果你的助手在两个不同的线程中同时调用代码解释器,则会创建两个代码解释器会话(2 * $0.03)。每个会话默认活跃一小时,这意味着如果你的用户在同一线程中持续向代码解释器发出指令,最长一小时内你只需支付一次该费用。

API 中的 File Search 如何计费?

File Search 按向量存储的存储量计费,每天 $0.10/GB(首个 GB 存储免费)。向量存储的大小基于你的文件经过解析、分块和嵌入后得到的向量存储大小。

2024 年 4 月 17 日之前创建的任何向量存储将在 2024 年底前免费,之后它们将:

  • 如果在 2024 年 4 月 17 日之后创建的 Run 中至少使用过一次,则按当前费率(目前为 $0.10/GB/天)计费。

  • 如果在 2024 年 4 月 17 日至 2024 年 12 月 31 日期间未在任何 Run 中使用过,则会被删除——这是为了避免你因在此次定价变更公布前创建但从未使用过的向量存储而被收费。

我可以创建的 assistants 数量有限制吗?

组织可创建的 assistants 数量没有限制。

API 支持流式传输吗?

支持,Assistants API 可使用流式传输。

Assistants API 支持 JSON 模式吗?

支持,Assistants API 可通过 Assistants 或 Run 对象上的 response_format 参数使用 JSON 模式。

Assistants API 也会管理第三方函数调用的请求吗?

不会。虽然函数调用使模型能够选择工具并为其格式化请求,但对第三方工具执行调用并不由 OpenAI 管理。

我发送给 OpenAI 的数据会如何处理?

与我们平台的其他部分一样,传递给 OpenAI API 的数据和文件绝不会用于训练我们的模型,并且你可以在需要时随时删除你的数据。上传到 Assistants API 的数据会无限期存储,直到用户手动删除。

DALL-E 可通过 Assistants API 使用吗?

目前,DALL-E 尚不可用。

Assistants API 有 UI 吗?

你可以查看 Assistants API 的 Playground。请确保你位于左侧边栏的 Assistants 视图中,并使用与你希望开启的工具兼容的模型。

Playground Assistants view editing MyQuickstartAssistant with gpt-3.5-turbo and Code interpreter enabled

Assistants API 中 assistant 指令的字符限制是多少?

assistant instructions 字段的最大长度为 256,000 个字符。

我收到类似“服务器在处理您的请求时出错。对此我们深表歉意!你可以重试请求;如果错误仍然存在,请通过我们的帮助中心 help.openai.com 联系我们。”的错误。我该怎么办?

如果你遇到此错误,可能意味着你的提示设置不正确。如果你不断重试请求但仍然失败,可以尝试以下方法:

  1. 确保重新组织你的提示,将任何类似函数的命令视为函数

  2. 将提示中的任何命令作为函数添加到 tools

为什么我的 File Search 工具效果不好?

使用 File Search 工具时,我们建议将 max_prompt_tokens 设置为不低于 20,000。对于较长的对话或与 File Search 的多次交互,请考虑将此限制提高到 50,000,或者最好完全移除 max_prompt_tokens 限制,以获得最高质量的结果。在此处阅读更多内容。

我如何提供反馈?

我们很乐意通过我们的开发者论坛、帮助中心 help.openai.com,或 Twitter @OpenAIDevs 听取你的反馈。

这篇文章对你有帮助吗?