概要
最新の Playground アップデートでは、構造化されロールバックしやすいワークフローが導入され、安心して反復し、変更を検証し、より少ない手順で実験から本番へ移行できます。以下では、提供開始される機能と開始方法を簡単に紹介します。
新機能
プロジェクトレベルのプロンプト
プロンプトはユーザーレベルではなく、プロジェクトレベルになりました。
ワンクリックでロールバックできるバージョン履歴
任意のドラフトを公開して新しいバージョンを作成し、以前のバージョンをすぐに復元できます。内部的には、単一の Prompt ID が常に最新の公開済みバージョンを指します。また、固定参照が必要な場合は特定のバージョンを指定することもできます。
プロンプト変数
{user_goal} などのプレースホルダーを追加すると、静的なプロンプトとインスタンス固有の情報(入力)を分離しやすくなります。
Prompt ID
公開すると、現在のドラフトが ID に固定され、下流のツールから安定して呼び出せるようになります。その間も、新しいドラフトで反復を続けられます。
横並び比較
リリース前に 2 つのバージョンの出力を視覚的に比較し、どちらのパフォーマンスが優れているかを判断できます。
API & SDK で認識される変数
Responses API と Agents SDK は、Playground で定義したものと同じ {variables} を受け付けるようになりました。そのため、テストしたプロンプトをそのままプログラムから呼び出せます。現時点では、レンダリング済みのテキストを渡してください。
組み込みの Evals 連携(手動実行)
Eval をリンクすると、変数を事前入力し、プロンプト詳細ページで合否結果を直接確認できます。リンクは Prompt ID とともに保存され、繰り返し可能なテストに使用できます。
Optimize
Optimize は Playground と Logs ページで利用できる新しいツールで、矛盾、不明確な指示、出力形式の欠落を検出して修正することで、プロンプトを自動的に改善します。
実行すると、加えられた変更の概要とともに、改善版のプロンプトまたは役立つ提案が返されます。修正内容をプレビューし、Playground でワンクリックで直接適用できます。
---
クイックスタートガイド
プロンプトの作成
Playground → Prompts → Create New に移動し、テキストのドラフトを作成して、必要に応じて {variables} を追加します。
generate 機能を使うと、タスクの説明に基づいて、ChatGPT にプロンプト、Function 定義、または出力スキーマの提案を生成させることができます。
optimize 機能を使って、レビューと改善提案を行います。
Function の追加(任意)
Function Calling を使うと、Playground を離れることなく、プロンプトを現実世界のアクションやデータに接続できます。
Function の使用に関する追加の手順については、こちらの記事を参照してください:Chat Playground における Function Calling
Eval の添付(任意)
Link Eval を選択して、テストデータの生成、採点の実行、合否結果の確認を行います。自動実行が提供されるまでは、公開のたびに Eval を再実行してリグレッションを検出します。
公開
Publish をクリックして Prompt ID を作成します。新しいドラフトで実験を続け、History から公開済みの任意のバージョンをワンクリックで復元できます。
反復
新しいプロンプトをテストし、結果を確認して、必要に応じて反復します。
優れたプロンプトを作成するためのヒント
全体的なトーンやロールのガイダンスは System メッセージに置き、タスク固有の詳細や例は User メッセージに入れます。
フューショットの例は、簡潔な YAML 風または箇条書きのブロックにまとめると、確認や更新がしやすくなります。
明確なフォルダー名でプロジェクト構造を反映し、チームメイトがプロンプトをすばやく見つけられるようにします。
公開するたびにリンク済みの Eval を再実行します。本番環境で修正するより、早期に問題を検出するほうがはるかに低コストです。
---
FAQ
既存のプリセットは壊れますか?
プロンプトは、バージョニングとテンプレート変数をサポートした、構成管理のためのより強力な方法です。既存のプリセットはすべて、Playground の Prompt ドロップダウンにある「プリセットをインポート」オプションを使って Prompts にインポートできます。

コードでバージョンを指定する必要はありますか?
古いバージョンに固定したい場合にのみ必要です。Prompt ID だけを呼び出すと、常に最新バージョンが使用されます。
Eval の実行を自動化できますか?
現在利用できるのは手動での再実行のみです。
