2025年3月11日時点で、新しいAgentsプラットフォームの構成要素(ビルディングブロック)を公開しました。詳細は、Responses API のAPIドキュメント、Web Search、File Search、Computer Use などのTools、ならびに Agents SDK(Tracing を含む)をご覧ください。
プロンプトトークンとは、モデルに入力するトークンのことです。つまり、あなたのプロンプトに含まれるトークン数です。
補完トークンとは、入力に対してモデルが生成するトークンのことです。標準的なリクエストでは、補完(completion)に含まれるトークン数を指します。
当社が提供するほとんどのモデルには、取り込めるトークン数(プロンプトトークン)と、出力できるトークン数(補完トークン/サンプルトークン)の両方に上限があります。
これには、best_of や n を高い値に設定した際に生成されるトークンも含まれます。たとえば、best_of = 3 を使って候補となる補完を3つ生成する場合、サンプルされたトークン数は最大で 3 * max_tokens になります。
トークン管理の詳細は、テキスト生成ガイドをご覧ください。
