L’offre Scale sur l’API Platform vous permet d’acheter d’avance un nombre défini de tokens d’entrée et de sortie d’API par minute (appelés « unités de tokens ») pour accéder à un instantané de modèle dédié. Chaque unité de tokens est achetée pour un minimum de 30 jours.
Une fois votre bon de commande signé, vous pouvez ajouter et retirer des unités de tokens à partir de votre compte API Platform. Veuillez noter que seuls les propriétaires d’organisation et les utilisateurs autorisés peuvent voir les paramètres de l’offre Scale et acheter des unités de tokens d’entrée et de sortie.
En savoir plus sur la tarification de l’offre Scale.
Comment accéder à mes paramètres de l’offre Scale?
Les propriétaires d’organisation d’API Platform peuvent accéder à leurs paramètres d’offre Scale en sélectionnant l’icône d’engrenage Paramètres en haut à droite de la page, puis en sélectionnant Offre Scale dans la section « Organization » du menu à gauche de l’écran.
La page des paramètres de l’offre Scale vous permet d’ajouter de la capacité, de voir votre utilisation des tokens d’entrée, de planifier la capacité, de voir vos tokens approvisionnés et de vérifier vos acheteurs autorisés.
Comment puis-je acheter plus de capacité?
Vous pouvez acheter de la capacité en sélectionnant le bouton Add capacity en haut à droite de votre page offre Scale. Veuillez consulter notre page principale de l’offre Scale pour connaître les plus récentes informations sur les droits TPM par unités de tokens d’entrée et de sortie.
Après avoir sélectionné le type de tokens à acheter, vous pouvez entrer directement une quantité ou déplacer le curseur pour choisir le nombre de tokens que vous souhaitez acheter. Le curseur vous permet de voir facilement les changements de TPM dans le sommaire à mesure que vous modifiez les tokens. Nous fournirons également une recommandation sur le nombre d’unités à acheter pour couvrir vos 30 derniers jours de trafic.
Une fois votre sélection finalisée, sélectionnez Checkout pour confirmer votre achat dans la prochaine fenêtre modale.
Veuillez noter que les prix indiqués dans notre sommaire sont nos tarifs standards et n’incluent pas les rabais négociés dans le bon de commande de votre organisation. Tout rabais applicable sera appliqué et indiqué sur la facture émise à votre organisation. Toutes les unités achetées seront actives jusqu’au début de la prochaine période de facturation, puis se renouvelleront chaque jour par la suite.
Comment activer les appels afin d’utiliser les tokens de l’offre Scale?
Vous devrez activer le bouton bascule Scale Tier Enabled dans les paramètres du projet.
Si vous utilisez l’API Completions, veuillez aussi consulter notre documentation expliquant la clé service_tier, afin de décider si vous devez la définir manuellement ou vous fier au comportement par défaut.
Les appels à l’API Responses utilisent par défaut service_tier=auto. Si un projet a Scale Tier Enabled, les requêtes qui omettent service_tier (ou utilisent auto) utiliseront l’offre Scale par défaut lorsque le quota de l’offre Scale est disponible. Les requêtes avec service_tier=default utiliseront la capacité de calcul partagée/PAYG.
Comment puis-je voir mon historique d’achats et mes tokens expirés?
Vous pouvez voir l’historique de vos achats de l’offre Scale dans votre page offre Scale en sélectionnant un modèle sous Tokens approvisionnés.
Une fois un modèle sélectionné, vous pourrez voir les tokens expirés et les transactions antérieures au bas de la page.
Comment puis-je modifier ma capacité de tokens?
Vous pouvez modifier la capacité de tokens d’un modèle en sélectionnant un modèle sous Tokens approvisionnés dans votre page offre Scale. Une fois un modèle sélectionné, trouvez votre achat sous l’en-tête Actif et sélectionnez Cancel à côté de votre achat pour le modifier
Dans la fenêtre modale, vous pouvez entrer directement le nombre d’unités à annuler ou utiliser le curseur pour modéliser le TPM à mesure que vous faites votre sélection.
Comment puis-je voir mes RPM/TPM de l’offre Scale et mon utilisation?
Vous pouvez voir un sommaire de l’utilisation de l’API pour votre organisation dans votre page offre Scale. Toutes les dates et heures sont basées sur l’UTC, et les données peuvent être retardées jusqu’à 5 minutes.
Vous pouvez examiner votre utilisation dans le tableau de bord d’utilisation de l’activité en sélectionnant vos modèles de l’offre Scale dans le menu déroulant des modèles. Vous pouvez voir ces données sur 30 jours, 1 jour et 15 minutes. Vos données d’utilisation sont empilées pour montrer la quantité d’utilisation du modèle couverte par votre offre Scale par rapport à la quantité d’utilisation couverte par votre forfait de compte.
Veuillez noter que seuls les propriétaires d’organisation peuvent voir le tableau de bord d’utilisation.
Quand verrai-je mon changement de capacité de tokens reflété dans le tableau de bord d’utilisation?
Les changements que vous apportez peuvent prendre jusqu’à 24 heures avant d’être reflétés. Les changements eux-mêmes entreront en vigueur presque instantanément.
