OpenAI
Αυτή η σελίδα μεταφράστηκε αυτόματα. Δείτε το πρωτότυπο άρθρο στα αγγλικά.

API Platform - Επίπεδο κλιμάκωσης για υφιστάμενους πελάτες Enterprise

Τελευταία ενημέρωση: 3 days ago

Το Επίπεδο κλιμάκωσης στο API Platform σάς επιτρέπει να αγοράζετε εκ των προτέρων έναν καθορισμένο αριθμό token εισόδου και εξόδου API ανά λεπτό (γνωστά ως «μονάδες token») για πρόσβαση σε ένα αποκλειστικό snapshot μοντέλου. Κάθε μονάδα token αγοράζεται για ελάχιστο διάστημα 30 ημερών.

Μόλις υπογράψετε μια φόρμα παραγγελίας, μπορείτε να προσθέτετε και να αφαιρείτε μονάδες token μέσω του λογαριασμού σας στο API Platform. Λάβετε υπόψη ότι μόνο οι κάτοχοι του Οργανισμού και οι εξουσιοδοτημένοι χρήστες μπορούν να δουν τις ρυθμίσεις του Επιπέδου κλιμάκωσης και να αγοράσουν μονάδες token εισόδου και εξόδου.

Μάθετε περισσότερα για την τιμολόγηση του Επιπέδου κλιμάκωσης.

Πώς μπορώ να αποκτήσω πρόσβαση στις ρυθμίσεις του Επιπέδου κλιμάκωσης;

Οι κάτοχοι Οργανισμού του API Platform μπορούν να αποκτήσουν πρόσβαση στις ρυθμίσεις του Επιπέδου κλιμάκωσης επιλέγοντας το γρανάζι Ρυθμίσεων επάνω δεξιά στη σελίδα και έπειτα το Scale Tier στην ενότητα «Organization» στο μενού στην αριστερή πλευρά της οθόνης.

Image

Η σελίδα ρυθμίσεων του Επιπέδου κλιμάκωσης σάς επιτρέπει να προσθέτετε περισσότερη χωρητικότητα, να βλέπετε τη χρήση token εισόδου, να προγραμματίζετε τη χωρητικότητα, να βλέπετε τα provisioned token σας και να ελέγχετε τους εξουσιοδοτημένους αγοραστές σας.

Πώς μπορώ να αγοράσω περισσότερη χωρητικότητα;

Μπορείτε να αγοράσετε χωρητικότητα επιλέγοντας το κουμπί Add capacity επάνω δεξιά στη σελίδα Scale tier. Δείτε την κύρια σελίδα του Scale tier για τις πιο πρόσφατες λεπτομέρειες σχετικά με τα δικαιώματα TPM ανά μονάδα token εισόδου και εξόδου.

Αφού επιλέξετε τον τύπο token που θα αγοράσετε, μπορείτε να εισαγάγετε απευθείας ένα ποσό ή να μετακινήσετε το ρυθμιστικό για να επιλέξετε τον αριθμό των token που θέλετε να αγοράσετε. Το ρυθμιστικό σάς επιτρέπει να βλέπετε εύκολα τις αλλαγές TPM στην ενότητα Summary καθώς αλλάζετε τα token. Θα σας παρέχουμε επίσης μια σύσταση για τον αριθμό μονάδων που πρέπει να αγοράσετε ώστε να καλύψετε την κίνηση των τελευταίων 30 ημερών.

Add token capacity dialog for gpt-4o with Input Tokens selected and input limit increasing from 40K to 60K

Μόλις ολοκληρώσετε την επιλογή σας, επιλέξτε Checkout για να επιβεβαιώσετε την αγορά σας στο επόμενο modal.

Λάβετε υπόψη ότι οι τιμές που εμφανίζονται στη σύνοψή μας είναι οι τυπικές χρεώσεις μας και δεν περιλαμβάνουν τυχόν εκπτώσεις που έχουν συμφωνηθεί στη φόρμα παραγγελίας του οργανισμού σας. Τυχόν ισχύουσες εκπτώσεις θα εφαρμοστούν και θα αποτυπωθούν στο τιμολόγιο που θα εκδοθεί στον οργανισμό σας. Οποιεσδήποτε μονάδες αγοραστούν θα είναι ενεργές έως την έναρξη της επόμενης περιόδου τιμολόγησης και μετά θα ανανεώνονται καθημερινά.

Πώς ενεργοποιώ τις κλήσεις ώστε να χρησιμοποιούν token του Επιπέδου κλιμάκωσης;

Θα χρειαστεί να ενεργοποιήσετε τον διακόπτη Scale Tier Enabled στις Ρυθμίσεις έργου.

Αν χρησιμοποιείτε το Completions API, δείτε επίσης την τεκμηρίωσή μας που εξηγεί το κλειδί service_tier, ώστε να αποφασίσετε αν πρέπει να το ορίσετε χειροκίνητα ή να βασιστείτε στην προεπιλεγμένη συμπεριφορά.

Οι κλήσεις στο Responses API χρησιμοποιούν από προεπιλογή service_tier=auto. Αν ένα έργο έχει ενεργοποιημένο το Scale Tier, τα αιτήματα που παραλείπουν το service_tier (ή χρησιμοποιούν auto) θα χρησιμοποιούν από προεπιλογή το Scale Tier όταν υπάρχει διαθέσιμη ποσόστωση του Scale Tier. Τα αιτήματα με service_tier=default θα χρησιμοποιούν κοινόχρηστους/PAYG υπολογιστικούς πόρους.

Πώς μπορώ να δω το ιστορικό αγορών μου και τα ληγμένα token;

Μπορείτε να δείτε το ιστορικό αγορών του Scale tier στη σελίδα Scale tier επιλέγοντας ένα μοντέλο στην ενότητα Provisioned tokens.

Provisioned tokens table with active allocations for gpt-4o and gpt-4o-mini

Μόλις επιλέξετε ένα μοντέλο, θα μπορείτε να δείτε τα Expired tokens και Prior transactions στο κάτω μέρος της σελίδας.

Image

Πώς μπορώ να επεξεργαστώ τη χωρητικότητα token μου;

Μπορείτε να επεξεργαστείτε τη χωρητικότητα token ενός μοντέλου επιλέγοντας ένα μοντέλο στην ενότητα Provisioned tokens στη σελίδα Scale tier. Μόλις επιλέξετε ένα μοντέλο, βρείτε την αγορά σας κάτω από την επικεφαλίδα Active και επιλέξτε Cancel δίπλα στην αγορά σας για επεξεργασία

Image

Στο modal, μπορείτε να εισαγάγετε απευθείας τον αριθμό των μονάδων προς ακύρωση ή να χρησιμοποιήσετε το ρυθμιστικό για να προσομοιώσετε το TPM καθώς κάνετε την επιλογή σας.

Edit Token Capacity dialog for gpt-4o canceling 1 package and reducing output limit TPM from 2.248M to 2.246M

Πώς μπορώ να δω τα RPM/TPM του Επιπέδου κλιμάκωσης και τη χρήση μου;

Μπορείτε να δείτε μια σύνοψη της χρήσης API για τον οργανισμό σας στη σελίδα Scale tier. Όλες οι ημερομηνίες και ώρες βασίζονται σε UTC και τα δεδομένα μπορεί να καθυστερούν έως και 5 λεπτά.

Input token usage chart for the last 30 days with several spikes and a peak near 700K

Μπορείτε να ελέγξετε τη χρήση σας στον Πίνακα ελέγχου χρήσης δραστηριότητας επιλέγοντας τα μοντέλα του Scale tier από το αναπτυσσόμενο μενού μοντέλων. Μπορείτε να δείτε αυτά τα δεδομένα σε παράθυρο 30 ημερών, 1 ημέρας και 15 λεπτών. Τα δεδομένα χρήσης σας εμφανίζονται σωρευτικά ώστε να δείχνουν το ποσό χρήσης για το μοντέλο που καλύπτεται από το Scale tier σε σχέση με το ποσό χρήσης που καλύπτεται από το πρόγραμμα του λογαριασμού σας.

Λάβετε υπόψη ότι μόνο οι κάτοχοι Οργανισμού μπορούν να δουν τον Πίνακα ελέγχου χρήσης.

Πότε θα δω την αλλαγή στη χωρητικότητα token να αποτυπώνεται στον πίνακα ελέγχου χρήσης;

Μπορεί να χρειαστούν έως και 24 ώρες για να αποτυπωθούν οι αλλαγές που κάνετε. Οι ίδιες οι αλλαγές θα τεθούν σε ισχύ σχεδόν ακαριαία.

Σας βοήθησε αυτό το άρθρο;