OpenAI
页面内容为机器翻译。查看英文原文

OpenAI 开放权重模型(gpt-oss)

了解 OpenAI 的开放权重模型(gpt-oss)以及如何获取支持

更新于:2 hours ago

注意:本文提供的是高层概览。技术配置相关信息可在 gpt-oss 网站GitHubHugging Face 以及 OpenAI Cookbook 中找到。

概览

我们推出两款开放权重推理模型:gpt‑oss‑120b 和 gpt‑oss‑20b。它们可在你掌控的基础设施上运行,或通过托管服务提供商运行。

注意:这些模型不通过 OpenAI API 提供,也无法在 ChatGPT 中使用。

为什么选择开放权重

  • 选择与掌控:可在本地部署或你的私有云中运行模型,保留数据驻留,并按需定制性能。

  • 可定制性:使用你偏好的开源工具对模型进行微调或适配。

可用性与许可

  • 许可:Apache 2.0 允许广泛使用、修改与再分发,包括商业用途(需遵守我们的 gpt-oss 使用政策)。

  • 托管/推理服务:不通过 OpenAI API 提供,因此不适用 API 定价和速率限制。

  • 兼容性:可与常见的开源推理栈一起运行,例如 vLLM、Ollama、llama.cpp,以及云端或自管 GPU 环境。

快速开始

要获取模型权重和相关支持资源,你可以:

  • 访问 gpt-oss 网站,查看概览与直达链接。

  • Hugging Face 合集下载权重——这是一个社区中心,你可以在其中找到两款模型、查看使用示例,并可选地通过 Hugging Face 的服务直接运行推理。

  • 访问我们的 GitHub 仓库获取参考推理代码。

  • 使用 OpenAI Cookbook 中的指南,完成与 Ollama、vLLM、Transformers 等受支持运行时的配置。Cookbook 还包含本地运行、使用常见运行时,以及在支持的情况下对 gpt‑oss 模型进行微调的分步说明。

gpt‑oss‑safeguard(研究预览)

gpt‑oss‑safeguard 是一对构建在 gpt‑oss 之上的开放权重安全推理模型。它们面向基于政策的安全分类以及你在自有基础设施上运行的相关信任与安全任务而设计。与其他 gpt‑oss 模型一样,这些权重不通过 OpenAI API 或 ChatGPT 提供。

  • 纯文本模型,提供参考的结构化输出 schema(如:政策判定、理由)。

  • 自带政策:模型会解读你书写的政策,从而以最少工程工作量在不同产品间泛化。

  • 有理有据的决策:可选的推理轨迹,用于辅助调试与审计(面向开发者与安全从业者,不用于终端用户展示)。

  • 可配置的推理强度:可选择低 / 中 / 高,在延迟与深度之间权衡。

  • 许可:Apache 2.0(参见下方可用性与许可)。

gpt‑oss‑safeguard 很适合用于 LLM 的输入/输出过滤、在线内容标注,以及离线批量标注或审核工作流。对于通用应用(聊天、智能体等),我们推荐核心的 gpt‑oss 模型。

你可以按需调整 schema。关于提示词编写指南与示例,请参阅 OpenAI Cookbook

模型变体与规模

模型预期用途备注
gpt‑oss‑safeguard‑120b生产环境,高容量安全推理117B 参数(≈5.1B 激活)。设计为可适配单张 80 GB GPU(例如 NVIDIA H100;也可在更大显存的 GPU 上运行,如 AMD MI300X)。
gpt‑oss‑safeguard‑20b更低延迟 / 受限环境21B 参数(≈3.6B 激活)。

两款模型均由 gpt‑oss 微调而来,架构不变。它们使用与 gpt‑oss 相同的聊天模板;你可以保留现有配置。推荐的提示模式是:将你的政策放在 developer 消息中,将要评估的内容放在 user 消息中。

支持与社区

开放权重部署需要自主管理与自助支持。获取支持的渠道如下:

  • 问题、讨论、技巧:使用 Hugging Face 模型页面与社区交流。

  • OpenAI 参考推理代码中的可复现 bug:在 gpt-oss GitHub 仓库提交 issue。

  • 第三方运行时的问题(如 vLLM、Ollama、llama.cpp):使用相应项目的 issue tracker、论坛或支持流程。

OpenAI 为任何自托管或第三方托管的开放权重方案、配置、环境或应用提供协助、上手式实施或调试支持。

我们将继续与社区迭代改进开放安全工具,包括通过 ROOST Model Community(RMC)。RMC 汇聚安全从业者与研究人员,分享将开源 AI 模型纳入安全工作流的最佳实践,包括评估结果与模型反馈。访问 RMC GitHub 仓库,了解该合作伙伴关系及参与方式。

支持与社区

开放权重部署需要自主管理与自助支持。获取支持的渠道如下:

  • 问题、讨论、技巧:使用 Hugging Face 模型页面与社区交流。

  • OpenAI 参考推理代码中的可复现 bug:在 gpt-oss GitHub 仓库提交 issue。

  • 第三方运行时的问题(如 vLLM、Ollama、llama.cpp):使用相应项目的 issue tracker、论坛或支持流程。

OpenAI 为任何自托管或第三方托管的开放权重方案、配置、环境或应用提供协助、上手式实施或调试支持。

隐私与安全

隐私与数据

这些模型旨在运行于你掌控的基础设施上(本地部署或你的云环境或托管合作伙伴)。除非你明确与 OpenAI 分享数据,或使用我们的某个托管合作伙伴,否则 OpenAI 不会接收或处理你发送到这些自托管模型的数据。

安全

这些模型经过了广泛的安全训练与测试。更多详情请参见我们的 模型卡技术报告

举报内容违规

如果你认为使用 gpt‑oss 模型生成的内容违反了我们的政策,你可以通过 举报内容表单进行报告。请尽可能提供更多细节,以便我们的团队审核你的提交。

常见问题

这些模型免费吗?

gpt-oss 模型权重可在 Apache 2.0 许可和 gpt-oss 使用政策下免费下载安装与使用。但运行它们产生的任何成本——例如计算、存储或第三方托管费用——均由你自行承担。这些费用的定价将取决于你选择的基础设施或提供商。

这些模型是“开源”的吗?

我们使用开放模型开放权重来表示训练权重在宽松的 Apache 2.0 许可与 gpt-oss 使用政策下公开可用。这意味着你可以下载模型,在自有基础设施或受支持的托管框架上运行,并对其进行定制或微调。

开放模型为开发者与组织带来更强的控制力与灵活性。你可以选择托管位置,针对特定用例适配模型,并受益于允许广泛使用、修改与再分发的许可。尽管训练权重是开放的,但周边的一些基础设施或工具可能仍由其提供商保持专有。

我能通过 OpenAI API 或 ChatGPT 访问这些模型吗?

不能。这些模型不通过 OpenAI API 提供,也不会出现在 ChatGPT 中。

我可以对模型进行微调吗?

可以。你可以使用开源工具和你偏好的基础设施进行微调。我们不通过 OpenAI API 为这些模型提供微调服务。

开放权重模型比使用 API 更便宜吗?

成本会因基础设施、工作负载和运维方式而异。自托管在某些情况下可能更便宜;而在综合考虑托管、维护与升级之后,我们的 API 平台在效率上也可能更有优势。

这些模型支持哪些功能?

这些模型目前为纯文本推理模型。常见运行时支持流式输出、函数调用和结构化输出。具体能力请查看你所用运行时的文档。

这和 ModAPI 有什么不同?

这是一个能力很强的推理模型,允许你自带政策。它可以与 ModAPI 搭配使用,但对于低延迟用例而言,很可能无法替代 ModAPI。

这篇文章对你有帮助吗?