OpenAI
Trang này được dịch bằng máy học. Xem bài viết gốc bằng tiếng Anh.

Nền tảng API - Cấp năng lực xử lý cho khách hàng Enterprise hiện tại

Đã cập nhật: 4 days ago

Cấp năng lực xử lý trên Nền tảng API cho phép bạn mua trước một số lượng token đầu vào và đầu ra API cố định mỗi phút (gọi là “đơn vị token”) để truy cập vào một ảnh chụp mô hình chuyên dụng. Mỗi đơn vị token được mua với thời hạn tối thiểu là 30 ngày.

Sau khi bạn ký đơn đặt hàng, bạn có thể thêm và gỡ các đơn vị token thông qua tài khoản Nền tảng API của mình. Xin lưu ý rằng chỉ Chủ sở hữu tổ chức và người dùng được ủy quyền mới có thể xem cài đặt Cấp năng lực xử lý và mua đơn vị token đầu vào và đầu ra.

Tìm hiểu thêm về giá của Cấp năng lực xử lý.

Làm cách nào để truy cập cài đặt Cấp năng lực xử lý?

Chủ sở hữu Tổ chức trên Nền tảng API có thể truy cập cài đặt Cấp năng lực xử lý bằng cách chọn biểu tượng bánh răng Cài đặt ở góc trên bên phải trang và chọn Scale Tier trong mục "Organization" ở menu bên trái màn hình.

Image

Trang cài đặt Cấp năng lực xử lý cho phép bạn thêm dung lượng, xem mức sử dụng token đầu vào, lập kế hoạch dung lượng, xem token đã được cấp và xem lại những người mua được ủy quyền.

Làm cách nào để mua thêm dung lượng?

Bạn có thể mua dung lượng bằng cách chọn nút Add capacity ở góc trên bên phải của trang Scale tier. Vui lòng xem trang chính về Scale tier của chúng tôi để biết thông tin mới nhất về quyền lợi TPM cho mỗi đơn vị token đầu vào và đầu ra.

Sau khi chọn loại token bạn muốn mua, bạn có thể nhập trực tiếp số lượng hoặc di chuyển thanh trượt để chọn số token muốn mua. Thanh trượt cho phép bạn dễ dàng xem các thay đổi TPM trong phần Summary khi thay đổi số token. Chúng tôi cũng sẽ cung cấp đề xuất về số đơn vị nên mua để đáp ứng lưu lượng trong 30 ngày gần nhất của bạn.

Add token capacity dialog for gpt-4o with Input Tokens selected and input limit increasing from 40K to 60K

Sau khi hoàn tất lựa chọn, hãy chọn Checkout để xác nhận giao dịch mua của bạn trong cửa sổ tiếp theo.

Xin lưu ý rằng giá hiển thị trong phần tóm tắt là mức giá tiêu chuẩn của chúng tôi và không bao gồm bất kỳ khoản giảm giá nào đã được đàm phán trong đơn đặt hàng của tổ chức bạn. Mọi khoản giảm giá áp dụng sẽ được tính và thể hiện trong hóa đơn gửi cho tổ chức của bạn. Mọi đơn vị đã mua sẽ hoạt động cho đến khi bắt đầu kỳ hóa đơn tiếp theo, và sau đó được gia hạn hằng ngày.

Làm cách nào để bật cuộc gọi sử dụng token Cấp năng lực xử lý?

Bạn cần bật nút chuyển Scale Tier Enabled trong Project Settings.

Nếu bạn đang dùng Completions API, vui lòng xem thêm tài liệu của chúng tôi giải thích khóa service_tier, để quyết định xem bạn nên đặt thủ công hay dựa vào hành vi mặc định.

Các lệnh gọi đến Responses API mặc định là service_tier=auto. Nếu một dự án đã bật Scale Tier Enabled, các yêu cầu bỏ qua service_tier (hoặc dùng auto) sẽ mặc định sử dụng Scale Tier khi còn hạn mức Scale Tier. Các yêu cầu có service_tier=default sẽ dùng năng lực tính toán dùng chung/PAYG.

Làm cách nào để xem lịch sử mua hàng và token đã hết hạn?

Bạn có thể xem lịch sử mua Scale tier trong trang Scale tier của mình bằng cách chọn một mô hình trong Provisioned tokens.

Provisioned tokens table with active allocations for gpt-4o and gpt-4o-mini

Sau khi chọn một mô hình, bạn sẽ có thể xem Expired tokens và Prior transactions ở cuối trang.

Image

Làm cách nào để chỉnh sửa dung lượng token?

Bạn có thể chỉnh sửa dung lượng token của một mô hình bằng cách chọn mô hình đó trong Provisioned tokens trên trang Scale tier của mình. Sau khi chọn mô hình, hãy tìm giao dịch mua của bạn trong mục Active và chọn Cancel bên cạnh giao dịch mua đó để chỉnh sửa

Image

Trong cửa sổ này, bạn có thể nhập trực tiếp số đơn vị cần hủy hoặc dùng thanh trượt để mô phỏng TPM khi thực hiện lựa chọn.

Edit Token Capacity dialog for gpt-4o canceling 1 package and reducing output limit TPM from 2.248M to 2.246M

Làm cách nào để xem RPM/TPM và mức sử dụng Cấp năng lực xử lý?

Bạn có thể xem bản tóm tắt mức sử dụng API của tổ chức mình trên trang Scale tier. Tất cả ngày giờ đều dựa trên UTC và dữ liệu có thể chậm tối đa 5 phút.

Input token usage chart for the last 30 days with several spikes and a peak near 700K

Bạn có thể xem lại mức sử dụng của mình trong Bảng điều khiển Mức sử dụng Hoạt động bằng cách chọn các mô hình Scale tier trong danh sách thả xuống models. Bạn có thể xem dữ liệu này theo khung 30 ngày, 1 ngày và 15 phút. Dữ liệu sử dụng của bạn được xếp chồng để hiển thị lượng sử dụng cho mô hình được Cấp năng lực xử lý bao phủ so với lượng sử dụng được gói tài khoản của bạn bao phủ.

Xin lưu ý rằng chỉ Chủ sở hữu tổ chức mới có thể xem Bảng điều khiển Mức sử dụng.

Khi nào thay đổi dung lượng token của tôi sẽ được phản ánh trên bảng điều khiển mức sử dụng?

Có thể mất tới 24 giờ để các thay đổi bạn thực hiện được phản ánh. Bản thân các thay đổi sẽ có hiệu lực gần như ngay lập tức.

Bài viết này có hữu ích không?