プロンプトトークンと補完トークンの違いは何ですか？

2025 年 3 月 11 日時点で、新しいエージェントプラットフォームの構成要素をリリースしました。詳細については、Responses API の API ドキュメント、ウェブ検索、ファイル検索、コンピューター操作などのツール、およびAgents SDKとトレーシングをご覧ください。

プロンプトトークンとは、モデルに入力するトークンです。これは、プロンプト内のトークン数です。

補完トークンとは、入力に応じてモデルが生成するすべてのトークンです。標準的なリクエストでは、これは補完内のトークン数です。

当社が提供するほとんどのモデルには、取り込めるトークン数（プロンプトトークン）と出力できるトークン数（補完トークンまたはサンプルトークン）の両方に制限があります。

これには、best_of または n に大きな値を使用したときに生成されるトークンも含まれます。たとえば、best_of = 3 を使用して 3 個の候補補完を生成する場合、サンプリングされるトークン数は最大で 3 * max_tokens になります。

トークン管理について詳しくは、テキスト生成ガイドをご覧ください。

プロンプトトークンと補完トークンの違いは何ですか？

この記事は役に立ちましたか？