OpenAI

Plateforme d'API – offre Scale pour les grandes entreprises existantes

Dernière mise à jour : 3 days ago

Avec l'offre Scale sur la plateforme API, vous pouvez acheter, en amont, un certain nombre de tokens d'entrée et de sortie API par minute (appelés « unités de token ») pour accéder à un modèle dédié. Chaque unité de token est facturée sur une base minimale de 30 jours.

Après avoir signé le bon de commande, vous pouvez ajouter et supprimer des unités de token depuis votre compte API Platform. Veuillez noter que seuls les propriétaires de l'organisation et les utilisateurs autorisés peuvent consulter les paramètres de l'offre Scale et acheter des unités de token d'entrée et de sortie.

En savoir plus sur la tarification de l'offre Scale.

Comment puis-je accéder aux paramètres de mon offre Scale ?

Les propriétaires d'une organisation API Platform peuvent accéder aux paramètres de leur offre Scale en sélectionnant l'icône d'engrenage Paramètres en haut à droite de la page, puis en sélectionnant Offre Scale dans la section « Organisation » du menu situé sur le côté gauche de l'écran.

Image

La page des paramètres de l'offre Scale vous permet d'ajouter de la capacité, de consulter votre utilisation des tokens d'entrée, de planifier la capacité, de consulter vos tokens provisionnés et de vérifier vos acheteurs autorisés.

Comment puis-je acheter de la capacité supplémentaire ?

Vous pouvez acheter de la capacité en sélectionnant le bouton Ajouter de la capacité en haut à droite de la page de votre offre Scale. Veuillez consulter notre page principale de l'offre Scale pour obtenir les informations les plus récentes sur les droits TPM par unité de token d'entrée et de sortie.

Après avoir sélectionné le type de token que vous souhaitez acheter, vous pouvez saisir directement une quantité ou déplacer le curseur pour sélectionner le nombre de tokens que vous souhaitez acheter. Le curseur vous permet de visualiser facilement les variations de TPM dans la section Résumé à mesure que vous modifiez les token. Nous vous fournirons également une recommandation sur le nombre d'unités à acheter pour couvrir vos 30 derniers jours de trafic.

Add token capacity dialog for gpt-4o with Input Tokens selected and input limit increasing from 40K to 60K

Une fois votre sélection finalisée, sélectionnez Paiement pour confirmer votre achat dans la fenêtre modale suivante.

Veuillez noter que les prix indiqués dans notre récapitulatif correspondent à nos tarifs standard et n'incluent pas les remises négociées dans le bon de commande de votre organisation. Les remises applicables seront appliquées et figureront sur la facture émise à votre organisation. Toutes les unités achetées seront actives jusqu'au début de la prochaine période de facturation, puis se renouvelleront chaque jour par la suite.

Comment activer les appels pour utiliser les tokens de l'offre Scale ?

Vous devrez activer l'option offre Scale activée dans les paramètres du projet.

Si vous utilisez l'API Completions, veuillez également consulter notre documentation expliquant la clé service_tier, afin de déterminer si vous devez la définir manuellement ou vous fier au comportement par défaut.

Les appels à l'API Responses utilisent par défaut service_tier=auto. Si l'offre Scale est activée pour un projet, les requêtes qui omettent service_tier (ou utilisent « auto ») utiliseront l'offre Scale par défaut lorsque le quota de l'offre Scale est disponible. Les demandes avec service_tier=default utiliseront la capacité de calcul partagée/PAYG.

Comment puis-je consulter mon historique d'achats et mes tokens expirés ?

Vous pouvez consulter l'historique de vos achats de l'offre Scale sur la page offre Scale en sélectionnant un modèle sous tokens provisionnés.

Provisioned tokens table with active allocations for gpt-4o and gpt-4o-mini

Une fois que vous aurez sélectionné un modèle, vous pourrez consulter les tokens expirés et les transactions précédentes en bas de la page.

Image

Comment puis-je modifier ma capacité de token ?

Vous pouvez modifier la capacité en tokens d'un modèle en sélectionnant un modèle sous Tokens provisionnés sur votre page offre Scale. Une fois que vous avez sélectionné un modèle, repérez votre achat sous l'en-tête Actif, puis sélectionnez Annuler à côté de votre achat pour le modifier.

Image

Dans la fenêtre modale, vous pouvez saisir directement le nombre d'unités à annuler ou utiliser le curseur pour ajuster le modèle TPM au fur et à mesure de votre sélection.

Edit Token Capacity dialog for gpt-4o canceling 1 package and reducing output limit TPM from 2.248M to 2.246M

Comment consulter mes limites RPM/TPM et mon utilisation pour l'offre Scale ?

Vous pouvez consulter un récapitulatif de l'utilisation de l'API pour votre organisation sur votre page offre Scale. Toutes les dates et heures sont exprimées en UTC, et les données peuvent être retardées de 5 minutes maximum.

Input token usage chart for the last 30 days with several spikes and a peak near 700K

Vous pouvez consulter votre utilisation dans le tableau de bord d'utilisation des activités en sélectionnant vos modèles de l'offre Scale dans le menu déroulant des modèles. Vous pouvez consulter ces données sur une période de 30 jours, d'un jour ou de 15 minutes. Vos données d'utilisation sont présentées sous forme empilée afin d'indiquer le volume d'utilisation du modèle couvert par votre offre Scale par rapport au volume d'utilisation couvert par le forfait de votre compte.

Veuillez noter que seuls les propriétaires de l'organisation peuvent consulter le tableau de bord d'utilisation.

Quand verrai-je le changement de ma capacité de tokens reflété dans le tableau de bord d'utilisation ?

Il peut falloir jusqu'à 24 heures pour que les modifications que vous apportez soient prises en compte. Les changements eux-mêmes entreront en vigueur quasi instantanément.

Cet article vous a-t-il été utile ?