Au 11 mars 2025, nous avons publié les briques de base de notre nouvelle plateforme Agents. Pour plus de détails, consultez notre documentation API pour notre API Responses, les outils, dont Web Search, File Search et Computer Use, ainsi que notre SDK Agents avec Tracing.
Les jetons de prompt sont les jetons que vous saisissez dans le modèle. Il s’agit du nombre de jetons dans votre prompt.
Les jetons de complétion sont tous les jetons que le modèle génère en réponse à votre entrée. Pour une requête standard, il s’agit du nombre de jetons dans la complétion.
La plupart des modèles que nous proposons ont à la fois une limite sur le nombre de jetons qu’ils peuvent recevoir (jetons de prompt) et une limite sur le nombre de jetons qu’ils peuvent produire (jetons de complétion ou jetons échantillonnés).
Cela inclut également tous les jetons générés lorsque vous utilisez une valeur plus élevée de best_of ou de n. Par exemple, si vous générez 3 complétions candidates en utilisant best_of = 3, le nombre de jetons échantillonnés sera au maximum 3 * max_tokens.
Vous pouvez en savoir plus sur la gestion des jetons dans notre guide de génération de texte.
