OpenAI
此頁面由機器翻譯。查看原始英文文章

OpenAI 開放權重模型(gpt-oss)

了解 OpenAI 的開放權重模型(gpt-oss)以及在哪裡取得支援

更新日期:this minute

注意:本文提供高層級概覽。技術設定資訊可在 gpt-oss 網站GitHubHugging Face,以及 OpenAI Cookbook 中找到。

概覽

推出兩款開放權重推理模型:gpt‑oss‑120b 與 gpt‑oss‑20b。它們可在你掌控的基礎架構上執行,或透過託管服務供應商使用。

注意:這些模型不透過 OpenAI API 提供,也不會在 ChatGPT 中提供。

為什麼選擇開放權重

  • 選擇與掌控:可在本地端(on‑premises)或私有雲上執行模型,維持資料駐留,並依需求調校效能。

  • 客製化:可使用你偏好的開源工具對模型進行微調或調適。

可用性與授權

  • 授權:Apache 2.0 允許廣泛使用、修改與再散布(包含商業用途;受我們的 gpt-oss 使用政策約束)。

  • 提供方式:不透過 OpenAI API 提供,因此不適用 API 定價與速率限制。

  • 相容性:可搭配常見的開源推理堆疊(如 vLLM、Ollama、llama.cpp)執行,也可在雲端或自管 GPU 環境中運行。

開始使用

要取得模型權重與相關資源,你可以:

  • 造訪 gpt-oss 網站,查看概覽與直接連結。

  • Hugging Face 合集下載權重——這是社群樞紐,你可以在此找到兩個模型、查看使用範例,並可選擇透過 Hugging Face 的服務直接執行推理。

  • 前往我們的 GitHub repo 取得參考推理程式碼。

  • 使用 OpenAI Cookbook 中的指南,在 Ollama、vLLM 與 Transformers 等支援的執行環境完成設定。Cookbook 也包含逐步教學:如何在本機執行、使用常見 runtime,以及在支援的情況下,如何微調 gpt‑oss 模型。

gpt‑oss‑safeguard(研究預覽)

gpt‑oss‑safeguard 是一對建立在 gpt‑oss 之上的 開放權重安全推理模型。它們專為基於政策的安全分類與相關的信任與安全(trust & safety)工作而設計,供你在自有基礎架構上執行。與其他 gpt‑oss 模型相同,這些權重不透過 OpenAI API 或 ChatGPT 提供。

  • 純文字模型,並提供參考用的結構化輸出 schema(例如:政策判定、理由)。

  • 自帶政策:模型會解讀你撰寫的政策,讓它能以最少的工程投入,跨產品進行泛化。

  • 有理有據的決策:可選擇輸出推理軌跡以協助除錯與稽核(供開發者與安全從業者使用,不用於終端使用者呈現)。

  • 可調整的推理強度:可選 low / medium / high,在延遲與深度之間取捨。

  • 授權:Apache 2.0(請見下方可用性與授權)。

gpt‑oss‑safeguard 很適合用於 LLM 的輸入/輸出過濾、線上內容標註,以及離線批次標註或審查流程。若是一般應用(聊天、代理等),我們建議使用核心的 gpt‑oss 模型。

你可以依需求調整 schema。關於提示詞與範例,請參考 OpenAI Cookbook 的指南。

模型版本與規模

模型預期用途備註
gpt‑oss‑safeguard‑120b正式環境、高容量安全推理117B 參數(≈5.1B 活躍)。設計可在一張

單張 80 GB GPU
上運行(例如 NVIDIA H100;也可在記憶體更大的 GPU 上執行,如 AMD MI300X)。
gpt‑oss‑safeguard‑20b較低延遲/受限環境21B 參數(≈3.6B 活躍)。

兩個模型皆由 gpt‑oss 微調而來,架構不變。它們使用與 gpt‑oss 相同的聊天模板,你可以保留既有設定。建議的提示詞模式是:將你的政策放在 developer 訊息中,將待評估的內容放在 user 訊息中。

支援與社群

開放權重部署需自行管理與自行維運。你可以在以下管道取得支援:

  • 提問、討論、技巧:透過 Hugging Face 模型頁面與社群互動。

  • OpenAI 參考推理程式碼中可重現的 bug:在 gpt-oss GitHub repo 開 issue。

  • 第三方 runtime 的問題(例如 vLLM、Ollama、llama.cpp):使用各專案的 issue tracker、論壇或支援流程。

OpenAI 不會為任何自架或第三方託管的開放權重設定、組態、環境或應用提供協助、實作支援或除錯支援。

我們將持續與社群迭代,改善開放式安全工具(包括透過 ROOST Model Community,RMC)。RMC 匯聚安全從業者與研究人員,分享將開源 AI 模型導入安全流程的最佳實務,包括評估結果與模型回饋。請造訪 RMC GitHub repo,了解這項合作與如何參與。

支援與社群

開放權重部署需自行管理與自行維運。你可以在以下管道取得支援:

  • 提問、討論、技巧:透過 Hugging Face 模型頁面與社群互動。

  • OpenAI 參考推理程式碼中可重現的 bug:在 gpt-oss GitHub repo 開 issue。

  • 第三方 runtime 的問題(例如 vLLM、Ollama、llama.cpp):使用各專案的 issue tracker、論壇或支援流程。

OpenAI 不會為任何自架或第三方託管的開放權重設定、組態、環境或應用提供協助、實作支援或除錯支援。

隱私與安全

隱私與資料

這些模型設計為在你掌控的基礎架構上執行(本地端,或在你的雲端/託管合作夥伴上)。除非你明確與 OpenAI 分享資料,或使用我們的受管託管合作夥伴之一,否則 OpenAI 不會接收或處理你送至這些自架模型的資料。

安全

這些模型經過大量的安全訓練與測試。更多細節請參考我們的 model cardtechnical report

回報內容違規

若你認為使用 gpt‑oss 模型產生的內容違反我們的政策,可透過 Report Content 表單回報。請盡可能提供詳細資訊,以協助我們的團隊審查你的提交內容。

FAQ

這些模型是免費的嗎?

gpt-oss 模型權重可在 Apache 2.0 授權與 gpt-oss 使用政策下免費下載與使用。不過,你需自行承擔執行它們所產生的任何成本——例如算力、儲存或第三方託管費用。其定價取決於你選擇的基礎架構或供應商。

這些模型算是「開源」嗎?

我們使用開放模型開放權重(open-weight)一詞,表示訓練後的權重會在寬鬆的 Apache 2.0 授權與 gpt-oss 使用政策下公開提供。這代表你可以下載模型、在自有基礎架構或支援的託管框架上運行,並加以客製化或微調。

開放模型讓開發者與組織擁有更高的掌控力與彈性。你可以選擇託管位置、針對特定情境調整模型,並受益於允許廣泛使用、修改與再散布的授權條款。雖然訓練後的權重是開放的,但周邊的某些基礎架構或工具仍可能是其供應商的專有技術。

我可以透過 OpenAI API 或 ChatGPT 存取這些模型嗎?

不行。這些模型不在 OpenAI API 中提供,也不會出現在 ChatGPT。

我可以微調模型嗎?

可以。你可以使用開源工具與你偏好的基礎架構進行微調。我們不透過 OpenAI API 為這些模型提供微調服務。

開放權重模型會比使用 API 更便宜嗎?

成本會因基礎架構、工作負載與營運方式而異。某些情況下自架可能更便宜;但把託管、維護與升級成本納入考量時,我們的 API Platform 可能更有效率。

這些模型支援哪些功能?

這些模型目前是純文字推理模型。常見 runtime 支援串流、函式呼叫與結構化輸出。實際能力請以你所使用的 runtime 文件為準。

這和 ModAPI 有什麼不同?

這是一個能力很強的推理模型,讓你能自帶政策。它可以與 ModAPI 搭配使用,但對於低延遲的使用情境,可能不適合作為替代方案。

這篇文章有幫助嗎?