注意:本文提供高层概览。有关技术设置的信息可在 gpt-oss 网站、GitHub、Hugging Face 和 OpenAI Cookbooks 上找到。
概览
介绍两个开放权重推理模型:gpt‑oss‑120b 和 gpt‑oss‑20b。它们可在您控制的基础设施上运行,也可通过托管提供商运行。
注意:这些模型不通过 OpenAI API 提供,也不在 ChatGPT 中提供。
为什么采用开放权重
选择和控制:在本地或私有云中运行模型,保持数据驻留,并按需定制性能。
自定义:使用您偏好的开放工具微调或调整模型。
可用性和许可
许可证:Apache 2.0 允许广泛使用、修改和再分发,包括商业用途(须遵守我们的 gpt-oss 使用政策)。
服务:不通过 OpenAI API 提供,因此 API 定价和速率限制不适用。
兼容性:可使用 vLLM、Ollama、llama.cpp 等常见开放推理栈运行,也可在云端或自管理 GPU 环境中运行。
开始使用
要获取模型权重和配套资源,您可以:
访问 gpt-oss 网站,查看概览和直接链接。
从 Hugging Face collection 下载权重——这是一个社区中心,您可以在其中找到这两个模型、查看使用示例,并可选择直接通过 Hugging Face 的服务运行推理。
访问我们的 GitHub 仓库,获取参考推理代码。
使用 OpenAI Cookbook 中的指南,配置 Ollama、vLLM 和 Transformers 等受支持的运行时。Cookbook 还包含在本地运行、使用常见运行时,以及在支持的情况下微调 gpt‑oss 模型的分步说明。
gpt‑oss‑safeguard(研究预览版)
gpt‑oss‑safeguard 是一组基于 gpt‑oss 构建的开放权重安全推理模型。它们专为您在自有基础设施上运行的基于政策的安全分类及相关信任与安全任务而设计。与其他 gpt‑oss 模型一样,这些权重不通过 OpenAI API 或 ChatGPT 提供服务。
带有参考结构化输出模式(例如政策判定、理由)的纯文本模型。
自带政策:模型会解读您编写的政策,以便以最少的工程工作跨产品泛化。
有推理依据的决策:可选的推理轨迹有助于调试和审计(面向开发者和安全从业者,不适合向最终用户展示)。
可配置的推理投入:选择低 / 中 / 高,以在延迟与深度之间取舍。
许可证:Apache 2.0(见下方可用性和许可)。
gpt‑oss‑safeguard 非常适合用于 LLM 的输入/输出过滤、在线内容标注,以及离线批量标注或审核工作流。对于通用应用(聊天、智能体等),我们推荐核心 gpt‑oss 模型。
您可以按需调整模式。请参阅 OpenAI Cookbook,获取有关提示和示例的指南。
模型变体和规模
| 模型 | 预期用途 | 备注 |
|---|---|---|
| gpt‑oss‑safeguard‑120b | 生产环境、高容量安全推理 | 117B 参数(≈5.1B 活跃)。设计为可在 单块 80 GB GPU 上运行(例如 NVIDIA H100;也可在 AMD MI300X 等更大显存的 GPU 上运行)。 |
| gpt‑oss‑safeguard‑20b | 较低延迟 / 受限环境 | 21B 参数(≈3.6B 活跃)。 |
两个模型均由 gpt‑oss 微调而来,架构没有变化。它们使用与 gpt‑oss 相同的聊天模板;您可以保留现有设置。推荐的提示模式是将您的政策放在开发者消息中,将要评估的内容放在用户消息中。
支持和社区
开放权重部署由您自行管理和自助服务。您可以在以下渠道获取支持:
问题、讨论、技巧:使用 Hugging Face 模型页面与社区互动。
OpenAI 参考推理代码中的可复现 bug:在 gpt-oss GitHub 仓库中提交 issue。
第三方运行时(例如 vLLM、Ollama、llama.cpp)的问题:使用相应项目的 issue 跟踪器、论坛或支持流程。
对于任何自托管或第三方托管的开放权重设置、配置、环境或应用,OpenAI 不提供协助、上手实施或调试支持。
我们将继续与社区迭代,改进开放安全工具,包括通过 ROOST Model Community (RMC) 开展相关工作。RMC 汇聚安全从业者和研究人员,分享将开源 AI 模型实施到安全工作流中的最佳实践,包括评估结果和模型反馈。访问 RMC GitHub 仓库,详细了解这项合作以及如何参与。
支持和社区
开放权重部署由您自行管理和自助服务。您可以在以下渠道获取支持:
问题、讨论、技巧:使用 Hugging Face 模型页面与社区互动。
OpenAI 参考推理代码中的可复现 bug:在 gpt-oss GitHub 仓库中提交 issue。
第三方运行时(例如 vLLM、Ollama、llama.cpp)的问题:使用相应项目的 issue 跟踪器、论坛或支持流程。
对于任何自托管或第三方托管的开放权重设置、配置、环境或应用,OpenAI 不提供协助、上手实施或调试支持。
隐私和安全
隐私和数据
这些模型旨在您控制的基础设施上运行(本地部署,或在您的云环境或托管合作伙伴中)。除非您明确与 OpenAI 共享数据,或使用我们的某个托管合作伙伴,否则 OpenAI 不会接收或处理您发送给这些自托管模型的数据。
举报内容违规
如果您认为使用 gpt‑oss 模型生成的内容违反了我们的政策,可以通过我们的举报内容表单进行举报。请提供尽可能多的详细信息,帮助我们的团队审核您的提交。
常见问题
这些模型是免费的吗?
gpt-oss 模型权重可在 Apache 2.0 许可证和 gpt-oss 使用政策下免费下载和使用。但是,您需要自行承担运行它们所产生的任何费用,例如计算、存储或第三方托管费用。这些费用将取决于您选择的基础设施或提供商。
这些模型是“开源”的吗?
我们使用开放模型或开放权重来表示训练后的权重可在宽松的 Apache 2.0 许可证和 gpt-oss 使用政策下公开获取。这意味着您可以下载这些模型,在自己的基础设施上或使用受支持的托管框架运行它们,并对其进行自定义或微调。
开放模型为开发者和组织提供更大的控制力和灵活性。您可以选择托管位置,针对特定用例调整模型,并受益于允许广泛使用、修改和再分发的许可。虽然训练后的权重是开放的,但某些周边基础设施或工具可能仍归其提供商专有。
我可以通过 OpenAI API 或 ChatGPT 访问这些模型吗?
不可以。这些模型不在 OpenAI API 中提供,也不会出现在 ChatGPT 中。
我可以微调这些模型吗?
可以。您可以使用开源工具和您偏好的基础设施进行微调。我们不通过 OpenAI API 为这些模型提供微调。
开放权重模型是否比使用 API 更便宜?
成本会因基础设施、工作负载和运营方式而异。在某些情况下,自托管可能更便宜;而在考虑托管、维护和升级时,我们的 API Platform 可能更高效。
这些模型支持哪些功能?
这些模型目前是纯文本推理模型。常见运行时支持流式传输、函数调用和结构化输出。请查看您所用运行时的文档,了解具体能力。
这与 ModAPI 有何不同?
这是一个能力很强的推理模型,允许您自带政策。它可以与 ModAPI 协同工作,但可能无法替代低延迟用例。
