OpenAI
このページは機械翻訳されています。元の英語の記事を表示

OpenAI オープンウェイトモデル(gpt-oss)

OpenAI のオープンウェイトモデル(gpt-oss)とサポートの入手先について学ぶ

更新日: 4 days ago

注:この記事は概要を提供するものです。技術的なセットアップ情報は、gpt-oss ウェブサイトGitHubHugging Face、および OpenAI Cookbooks で確認できます。

概要

2 つのオープンウェイト・リーズニングモデル、gpt‑oss‑120b と gpt‑oss‑20b を紹介します。これらは、お客様が管理するインフラストラクチャ上、またはホスティングプロバイダー経由で実行できます。

注:これらのモデルは OpenAI API 経由では提供されず、ChatGPT でも利用できません。

オープンウェイトである理由

  • 選択肢と制御:モデルをオンプレミスまたはプライベートクラウドで実行し、データレジデンシーを維持し、ニーズに合わせてパフォーマンスを調整できます。

  • カスタマイズ:お好みのオープンツールを使って、モデルをファインチューニングまたは適応できます。

提供状況とライセンス

  • ライセンス:Apache 2.0 は、商用利用を含む幅広い利用、変更、再配布を許可します(当社の gpt-oss 使用ポリシーに従う必要があります)。

  • 提供:OpenAI API 経由では利用できないため、API 料金とレート制限は適用されません。

  • 互換性:vLLM、Ollama、llama.cpp などの一般的なオープン推論スタック、およびクラウドまたは自己管理の GPU 環境で実行できます。

はじめに

モデルウェイトとサポートリソースを入手するには、次の方法があります。

  • 概要と直接リンクについては、gpt-oss ウェブサイトをご覧ください。

  • Hugging Face コレクションからウェイトをダウンロードしてください。ここは、両方のモデルを見つけ、使用例を確認し、必要に応じて Hugging Face のサービスから直接推論を実行できるコミュニティハブです。

  • リファレンス推論コードには、当社の GitHub リポジトリからアクセスできます。

  • Ollama、vLLM、Transformers などの対応ランタイムでのセットアップには、OpenAI Cookbook のガイドを使用してください。Cookbook には、ローカル実行、一般的なランタイムの使用、対応している場合の gpt‑oss モデルのファインチューニングについて、ステップごとの手順も含まれています。

gpt‑oss‑safeguard(研究プレビュー)

gpt‑oss‑safeguard は、gpt‑oss を基盤として構築された 2 つのオープンウェイト安全性リーズニングモデルです。これらは、お客様が管理するインフラストラクチャ上で実行するポリシーベースの安全性分類と、関連するトラスト & セーフティタスク向けに設計されています。他の gpt‑oss モデルと同様、これらのウェイトは OpenAI API や ChatGPT では提供されません。

  • リファレンスの構造化出力スキーマ(例:ポリシー判定、根拠)を備えたテキスト専用モデル

  • 独自ポリシーの持ち込み:モデルがお客様の記述したポリシーを解釈するため、最小限のエンジニアリングで製品横断的に汎化できます。

  • 推論に基づく判断:デバッグと監査を支援する任意の推論トレース(エンドユーザー表示ではなく、開発者と安全性実務者向け)。

  • 設定可能な推論エフォート:低 / 中 / 高を選択し、レイテンシと深さのバランスを調整できます。

  • ライセンス:Apache 2.0(下記の提供状況とライセンスを参照)。

gpt‑oss‑safeguard は、LLM の入力/出力フィルタリング、オンラインコンテンツのラベリング、オフラインのバッチラベリングやレビューのワークフローに適しています。一般的なアプリケーション(チャット、エージェントなど)には、コアの gpt‑oss モデルを推奨します。

スキーマはニーズに合わせて調整できます。プロンプトの作成ガイドと例については、OpenAI Cookbook を参照してください。

モデルのバリエーション & サイズ

| モデル | 想定用途 | 注記 | | gpt‑oss‑safeguard‑120b | 本番環境、高容量の安全性推論 | 117B パラメータ(アクティブは約 5.1B)。<br>単一の 80 GB GPU<br>(例:NVIDIA H100。AMD MI300X など、より大容量メモリの GPU でも実行可能)に収まるよう設計されています。| | gpt‑oss‑safeguard‑20b | 低レイテンシ / 制約のある環境 | 21B パラメータ(アクティブは約 3.6B)。|

どちらのモデルも、アーキテクチャを変更せずに gpt‑oss からファインチューニングされています。gpt‑oss と同じチャットテンプレートを使用するため、既存のセットアップをそのまま使えます。推奨されるプロンプトパターンは、ポリシーを開発者メッセージに、評価対象のコンテンツをユーザーメッセージに配置することです。

サポートとコミュニティ

オープンウェイトのデプロイは、自己管理・自己対応です。サポートを受ける場所は次のとおりです。

  • 質問、議論、ヒント:コミュニティとの交流には、Hugging Face のモデルページを使用してください。

  • OpenAI のリファレンス推論コードで再現可能なバグ:gpt-oss の GitHub リポジトリで issue を開いてください。

  • サードパーティランタイム(例:vLLM、Ollama、llama.cpp)の問題:各プロジェクトの issue トラッカー、フォーラム、またはサポート手順を使用してください。

OpenAI は、セルフホストまたはサードパーティホストのオープンウェイト設定、構成、環境、アプリケーションについて、支援、ハンズオン実装、デバッグサポートを提供しません

当社は、ROOST Model Community(RMC)を通じた取り組みを含め、オープンな安全性ツールの改善に向けてコミュニティと継続的に反復していきます。RMC は、安全性実務者と研究者を結び付け、評価結果やモデルフィードバックを含め、オープンソース AI モデルを安全性ワークフローに実装するためのベストプラクティスを共有します。このパートナーシップの詳細と参加方法については、RMC GitHub リポジトリをご覧ください。

サポートとコミュニティ

オープンウェイトのデプロイは、自己管理・自己対応です。サポートを受ける場所は次のとおりです。

  • 質問、議論、ヒント:コミュニティとの交流には、Hugging Face のモデルページを使用してください。

  • OpenAI のリファレンス推論コードで再現可能なバグ:gpt-oss の GitHub リポジトリで issue を開いてください。

  • サードパーティランタイム(例:vLLM、Ollama、llama.cpp)の問題:各プロジェクトの issue トラッカー、フォーラム、またはサポート手順を使用してください。

OpenAI は、セルフホストまたはサードパーティホストのオープンウェイト設定、構成、環境、アプリケーションについて、支援、ハンズオン実装、デバッグサポートを提供しません

プライバシーと安全性

プライバシーとデータ

これらのモデルは、お客様が管理するインフラストラクチャ(オンプレミス、またはお客様のクラウドやホスティングパートナー)で実行するように設計されています。OpenAI は、お客様が明示的に OpenAI と共有する場合、または当社のマネージドホスティングパートナーを利用する場合を除き、これらのセルフホストモデルに送信されたデータを受信または処理しません。

安全性

これらのモデルは、広範な安全性トレーニングとテストを受けています。詳細については、当社のモデルカード技術レポートをご覧ください。

コンテンツ違反の報告

gpt‑oss モデルで生成されたコンテンツが当社のポリシーに違反していると思われる場合は、当社のコンテンツ報告フォームから報告できます。当社チームがご提出内容を確認できるよう、できるだけ詳しい情報を提供してください。

FAQ

これらのモデルは無料ですか?

gpt-oss のモデルウェイトは、Apache 2.0 ライセンスおよび gpt-oss の使用ポリシーの下で、無料でダウンロードして使用できます。ただし、コンピュート、ストレージ、サードパーティのホスティング料金など、実行に関連する費用はお客様の負担となります。それらの料金は、選択したインフラストラクチャまたはプロバイダーによって異なります。

これらのモデルは「オープンソース」ですか?

当社では、学習済みウェイトが寛容な Apache 2.0 ライセンスと gpt-oss の使用ポリシーの下で公開されていることを示すために、オープンモデルまたはオープンウェイトという用語を使用しています。つまり、モデルをダウンロードし、自社インフラストラクチャ上または対応するホスティングフレームワークで実行し、カスタマイズやファインチューニングを行えます。

オープンモデルは、開発者と組織により大きな制御性と柔軟性をもたらします。ホスト先を選択し、特定のユースケース向けにモデルを適応させ、幅広い利用、変更、再配布を可能にするライセンスのメリットを得られます。学習済みウェイトはオープンですが、周辺のインフラストラクチャやツールの一部は、それぞれのプロバイダーの独自仕様のままである場合があります。

これらのモデルには OpenAI API または ChatGPT からアクセスできますか?

いいえ。これらのモデルは OpenAI API では提供されず、ChatGPT にも表示されません。

モデルをファインチューニングできますか?

はい。オープンソースツールとお好みのインフラストラクチャを使用してファインチューニングできます。これらのモデルについては、OpenAI API 経由のファインチューニングは提供していません。

オープンウェイトモデルは API を使うより安価ですか?

コストは、インフラストラクチャ、ワークロード、運用方法によって異なります。場合によってはセルフホスティングの方が安価なこともありますが、ホスティング、メンテナンス、アップグレードを考慮すると、当社の API Platform の方が効率的な場合もあります。

これらのモデルはどの機能をサポートしていますか?

これらのモデルは現在、テキスト専用のリーズニングモデルです。一般的なランタイムは、ストリーミング、Function Calling、構造化出力をサポートしています。正確な機能については、お使いのランタイムのドキュメントを確認してください。

これは ModAPI とどう違いますか?

これは、独自のポリシーを持ち込める高性能なリーズニングモデルです。ModAPI と連携して動作できますが、低レイテンシのユースケースの代替にはならない可能性があります。

この記事は役に立ちましたか?