OpenAI
此頁面由機器翻譯。查看原文英文文章

OpenAI 開放權重模型(gpt-oss)

了解 OpenAI 的開放權重模型(gpt-oss)及可在哪裡獲取支援

更新日期:2 days ago

注意:本文提供高層概覽。技術設定資訊可於 gpt-oss 網站GitHubHugging FaceOpenAI Cookbook 查閱。

概覽

隆重介紹兩款開放權重推理模型:gpt‑oss‑120b 和 gpt‑oss‑20b。它們可在你自行控制的基礎設施上運行,或透過託管供應商運行。

注意:這些模型不透過 OpenAI API 提供,亦不會在 ChatGPT 中提供。

為何選擇開放權重

  • 選擇與控制:可於本地部署或私人雲端運行模型,保留資料駐留,並按你的需要調整效能。

  • 自訂:可使用你偏好的開放工具鏈對模型進行微調或調適。

供應情況與授權

  • 授權:Apache 2.0 允許廣泛使用、修改及再分發,包括商業用途(須遵守我們的 gpt-oss 使用政策)。

  • 提供方式:不透過 OpenAI API 提供,因此不適用 API 定價及速率限制。

  • 相容性:可配合常見的開放推論堆疊運行,例如 vLLM、Ollama、llama.cpp,以及雲端或自行管理的 GPU 環境。

開始使用

如要取得模型權重及相關支援資源,你可以:

  • 前往 gpt-oss 網站 查看概覽及直接連結。

  • Hugging Face collection 下載權重——這是一個社群樞紐,你可在此找到兩款模型、查看使用範例,並可選擇直接透過 Hugging Face 的服務執行推論。

  • 存取我們的 GitHub repo 以取得參考推論程式碼。

  • 使用 OpenAI Cookbook 中的指南,配合 Ollama、vLLM 及 Transformers 等受支援運行環境完成設定。Cookbook 亦提供在本機運行、使用常見運行環境,以及在支援情況下微調 gpt‑oss 模型的逐步指引。

gpt‑oss‑safeguard(研究預覽)

gpt‑oss‑safeguard 是一對建基於 gpt‑oss 的 開放權重安全推理模型。它們專為基於政策的安全分類及相關信任與安全任務而設,並在你自行控制的基礎設施上運行。與其他 gpt‑oss 模型一樣,這些權重不會透過 OpenAI API 或 ChatGPT 提供。

  • 純文字模型,附有參考用的結構化輸出內容結構定義(例如政策裁決、理據)。

  • 自攜政策:模型會解讀你撰寫的政策,因此只需最少工程工作,便可跨產品泛化應用。

  • 具推理依據的決策:可選擇輸出推理軌跡,以協助除錯及審核(供開發者及安全從業員使用,並非用於向終端用戶顯示)。

  • 可配置的推理強度:可選擇 low / medium / high,以權衡延遲與深度。

  • 授權:Apache 2.0(見下方供應情況與授權)。

gpt‑oss‑safeguard 很適合用於 LLM 的輸入/輸出過濾、網上內容標註,以及離線批次標註或審核工作流程。對於一般應用(聊天、智能代理等),我們建議使用核心 gpt‑oss 模型。

你可按需要調整結構定義。請參閱 OpenAI Cookbook 了解提示詞指南及範例。

模型變體與規模

模型預期用途備註
gpt‑oss‑safeguard‑120b生產環境、高容量安全推理117B 參數(≈5.1B 啟用)。設計為可配合單張 80 GB GPU使用(例如 NVIDIA H100;亦可於記憶體更大的 GPU 上運行,如 AMD MI300X)。
gpt‑oss‑safeguard‑20b較低延遲/受限環境21B 參數(≈3.6B 啟用)。

兩款模型均由 gpt‑oss 微調而成,架構並無改動。它們使用與 gpt‑oss 相同的聊天範本;你可保留現有設定。建議的提示詞模式,是在 developer message 中放入你的政策,並在 user message 中放入要評估的內容。

支援與社群

開放權重部署屬自行管理及自行支援。以下是獲取支援的途徑:

  • 問題、討論、貼士:使用 Hugging Face 模型頁面 與社群交流。

  • OpenAI 參考推論程式碼中可重現的錯誤:請在 gpt-oss GitHub repo 開立 issue。

  • 第三方運行環境的問題(例如 vLLM、Ollama、llama.cpp):請使用相關專案的 issue tracker、論壇或支援流程。

OpenAI 不會 為任何自行託管或第三方託管的開放權重設定、配置、環境或應用提供協助、實作支援或除錯支援。

我們會繼續與社群迭代改進開放安全工具,包括透過 ROOST Model Community (RMC) 進行。RMC 匯聚安全從業員及研究人員,分享將開源 AI 模型實施到安全工作流程中的最佳實踐,包括評估結果及模型回饋。歡迎前往 RMC GitHub repo 了解更多這項合作及參與方式。

支援與社群

開放權重部署屬自行管理及自行支援。以下是獲取支援的途徑:

  • 問題、討論、貼士:使用 Hugging Face 模型頁面 與社群交流。

  • OpenAI 參考推論程式碼中可重現的錯誤:請在 gpt-oss GitHub repo 開立 issue。

  • 第三方運行環境的問題(例如 vLLM、Ollama、llama.cpp):請使用相關專案的 issue tracker、論壇或支援流程。

OpenAI 不會 為任何自行託管或第三方託管的開放權重設定、配置、環境或應用提供協助、實作支援或除錯支援。

私隱與安全

私隱與資料

這些模型設計為在你自行控制的基礎設施上運行(本地部署、你的雲端或託管夥伴)。除非你明確與 OpenAI 分享資料,或使用我們的其中一個託管夥伴,否則 OpenAI 不會接收或處理你傳送至這些自行託管模型的資料。

安全

這些模型經過廣泛的安全訓練及測試。詳情請參閱我們的 模型說明卡技術報告

舉報內容違規

如果你認為使用 gpt‑oss 模型產生的內容違反我們的政策,可透過我們的 舉報內容表格 提交舉報。請盡可能提供詳細資料,以協助我們的團隊審核你的提交。

常見問題

這些模型是免費的嗎?

gpt-oss 模型權重可根據 Apache 2.0 授權及 gpt-oss 使用政策 免費下載及使用。然而,你需自行承擔運行它們的相關成本——例如運算、儲存或第三方託管費用。相關價格將取決於你所選用的基礎設施或供應商。

這些模型屬於「開源」嗎?

我們使用 開放模型開放權重 一詞,表示訓練後的權重可根據寬鬆的 Apache 2.0 授權及 gpt-oss 使用政策 公開取得。這表示你可下載模型、在自己的基礎設施上或透過受支援的託管框架運行,並對其作出自訂或微調。

開放模型為開發者及機構帶來更大控制權與靈活性。你可選擇託管位置、按特定用例調適模型,並受惠於容許廣泛使用、修改及再分發的授權。雖然訓練後的權重是開放的,但部分周邊基礎設施或工具仍可能屬其供應商的專有資產。

我可以透過 OpenAI API 或 ChatGPT 存取這些模型嗎?

不可以。這些模型不會在 OpenAI API 中提供,亦不會出現在 ChatGPT 中。

我可以微調這些模型嗎?

可以。你可使用開源工具及你偏好的基礎設施進行微調。我們不會透過 OpenAI API 為這些模型提供微調服務。

與使用 API 相比,開放權重模型是否更便宜?

成本會因基礎設施、工作負載及營運方式而異。自行託管在某些情況下可能較便宜,而在計入託管、維護及升級後,我們的 API Platform 可能更具效率。

這些模型支援哪些功能?

這些模型目前是純文字推理模型。常見運行環境支援串流、函數調用及結構化輸出內容。請查閱你的運行環境文件以了解確實能力。

這與 ModAPI 有何不同?

這是一款能力很強的推理模型,讓你可自攜政策。它可與 ModAPI 配合使用,但對低延遲用例而言,未必能作為替代方案。

這篇文章對你有幫助嗎?