Câu hỏi thường gặp về Assistants API (v2)

Kể từ ngày 11 tháng 3 năm 2025, chúng tôi đã phát hành các khối dựng nền tảng Agents mới của mình. Để biết chi tiết, hãy xem tài liệu API của chúng tôi cho Responses API, các Công cụ bao gồm Web Search, File Search và Computer Use, cũng như Agents SDK với Tracing của chúng tôi. Dựa trên phản hồi của bạn về Assistants API beta, chúng tôi đã tích hợp các cải tiến chính vào Responses API. Sau khi đạt được đầy đủ tính năng tương đương, chúng tôi sẽ công bố kế hoạch ngừng hỗ trợ Assistants API vào cuối năm nay, với ngày ngừng hoạt động mục tiêu trong nửa đầu năm 2026.

Assistants API là gì?

Assistants API cho phép nhà phát triển dễ dàng xây dựng các assistant AI mạnh mẽ trong ứng dụng của họ. API này loại bỏ nhu cầu quản lý lịch sử trò chuyện và bổ sung quyền truy cập vào các công cụ do OpenAI lưu trữ như Trình Thông dịch Mã và File Search. API cũng hỗ trợ gọi hàm được cải thiện cho các công cụ của bên thứ ba.

Tôi còn có thể sử dụng Assistants API v1 beta không?

Không. Kể từ ngày 18 tháng 12 năm 2024, người dùng không còn quyền truy cập vào phiên bản v1 của Assistant API beta. Chúng tôi hiện chỉ hỗ trợ v2. Vui lòng xem hướng dẫn di chuyển này để chuyển đổi các lệnh gọi API của bạn từ v1 sang v2

Làm cách nào để truy cập?

Assistants API có sẵn cho bất kỳ ai có tài khoản OpenAI API, nhưng API này đã bị ngừng hỗ trợ và sẽ bị gỡ bỏ vào tháng 8 năm 2026. Đối với dự án mới, hãy dùng Responses API thay thế. Nếu bạn đã sử dụng Assistants API, hãy lên kế hoạch di chuyển sang Responses API. Bạn vẫn có thể truy cập các assistant hiện có trong Assistants Playground trong khi API vẫn còn khả dụng.

Assistant là gì?

Một assistant đại diện cho một AI được xây dựng theo mục đích cụ thể, sử dụng mô hình của OpenAI, có thể truy cập tệp, duy trì các luồng liên tục và gọi công cụ.

Thread là gì?

Thread là một phiên trò chuyện giữa assistant và người dùng. Thread đơn giản hóa việc phát triển ứng dụng bằng cách lưu trữ lịch sử tin nhắn và cắt bớt lịch sử đó khi cuộc trò chuyện trở nên quá dài so với độ dài ngữ cảnh của mô hình.

Công cụ File Search là gì?

Công cụ `file_search` triển khai sẵn nhiều phương pháp hay nhất về truy xuất để giúp bạn trích xuất dữ liệu phù hợp từ tệp nhằm bổ sung cho phản hồi của mô hình. Để biết thêm thông tin, vui lòng đọc tài liệu dành cho nhà phát triển của chúng tôi.

Theo mặc định, công cụ file_search sử dụng các cài đặt sau:

Kích thước đoạn: 800 token
Phần chồng lấn giữa các đoạn: 400 token
Mô hình nhúng: `text-embedding-3-large` ở 256 chiều
Số đoạn tối đa được thêm vào ngữ cảnh: 20

Các hạn chế đối với việc tải tệp lên là gì?

Các hạn chế khi tải Tệp lên là:

512 MB mỗi tệp
5 triệu token mỗi tệp
10 nghìn tệp mỗi kho vector
1 kho vector cho mỗi assistant
1 kho vector cho mỗi luồng

Giới hạn lưu trữ tổng thể cho mỗi dự án trong một tổ chức là 100 GB.

Công cụ File Search có những hạn chế nào?

Chúng tôi có một số hạn chế đã biết và đang nỗ lực bổ sung hỗ trợ trong những tháng tới:

Hiện chưa có cách nào để sửa đổi cài đặt chia đoạn, nhúng hoặc truy xuất.
Chúng tôi không hỗ trợ phân tích cú pháp hình ảnh trong tài liệu.
Chúng tôi không hỗ trợ truy xuất trên các định dạng tệp có cấu trúc (như tệp .csv hoặc .jsonl). Xem các loại tệp được hỗ trợ.

Các giới hạn tốc độ của Assistants API là gì?

Các giới hạn tốc độ của Assistants API không gắn với cấp độ sử dụng và mô hình. Thay vào đó, có các giới hạn mặc định theo loại yêu cầu, với một vài ngoại lệ:

GET: 1000 RPM
POST: 300 RPM

DELETE: 300 yêu cầu mỗi phút

Trình Thông dịch Mã trong API được tính phí như thế nào?

Trình Thông dịch Mã có giá $0.03 / phiên. Nếu trợ lý của bạn gọi Trình Thông dịch Mã đồng thời trong hai luồng khác nhau, thao tác này sẽ tạo hai phiên Trình Thông dịch Mã (2 * $0.03). Theo mặc định, mỗi phiên hoạt động trong một giờ, nghĩa là bạn chỉ trả khoản phí này một lần nếu người dùng của bạn tiếp tục đưa ra hướng dẫn cho Trình Thông dịch Mã trong cùng một luồng trong tối đa một giờ.

File Search trong API được tính phí như thế nào?

File Search có giá $0.10/GB dung lượng lưu trữ kho vector mỗi ngày (GB lưu trữ đầu tiên được miễn phí). Kích thước của kho vector dựa trên kích thước kết quả của kho vector sau khi tệp của bạn được phân tích cú pháp, chia đoạn và nhúng.

Mọi kho vector được tạo trước ngày 17 tháng 4 năm 2024 sẽ được miễn phí đến hết năm 2024, sau đó chúng sẽ:

Được tính phí theo mức giá hiện tại (hiện là $0.10/GB/ngày) nếu chúng đã được sử dụng ít nhất một lần trong một Run được tạo sau ngày 17 tháng 4 năm 2024.
Bị xóa nếu chúng chưa được sử dụng trong bất kỳ Run nào từ ngày 17 tháng 4 năm 2024 đến ngày 31 tháng 12 năm 2024 — điều này nhằm tránh việc bạn bị tính phí cho các kho vector có thể đã tạo trước khi thay đổi giá này được công bố nhưng chưa từng sử dụng.

Có giới hạn về số lượng assistant mà tôi có thể tạo không?

Không có giới hạn về số lượng assistant mà một tổ chức có thể tạo.

API có hỗ trợ phát trực tuyến không?

Có, Assistants API có hỗ trợ phát trực tuyến.

Chế độ JSON có sẵn trong Assistants API không?

Có, chế độ JSON có sẵn trên Assistants API thông qua tham số response_format trên các đối tượng Assistants hoặc Run.

Assistants API cũng sẽ quản lý các yêu cầu cho lệnh gọi hàm của bên thứ ba chứ?

Không. Mặc dù gọi hàm cho phép mô hình chọn công cụ và định dạng yêu cầu cho các công cụ đó, việc thực thi lệnh gọi đến công cụ của bên thứ ba không do OpenAI quản lý.

Dữ liệu tôi gửi đến OpenAI được xử lý như thế nào?

Cũng như phần còn lại của nền tảng của chúng tôi, dữ liệu và tệp được chuyển đến OpenAI API không bao giờ được dùng để huấn luyện các mô hình của chúng tôi và bạn có thể xóa dữ liệu của mình bất cứ khi nào cần. Dữ liệu được tải lên Assistants API được lưu trữ vô thời hạn cho đến khi người dùng xóa thủ công.

DALL-E có sẵn qua Assistants API không?

Hiện tại, DALL-E chưa có sẵn.

Có giao diện người dùng cho Assistants API không?

Bạn có thể xem Khu thử nghiệm dành cho Assistants API. Hãy đảm bảo bạn đang ở chế độ xem Assistants trên thanh bên trái và đang sử dụng một mô hình tương thích với các Công cụ mà bạn muốn bật.

Playground Assistants view editing MyQuickstartAssistant with gpt-3.5-turbo and Code interpreter enabled

Giới hạn ký tự cho hướng dẫn của assistant trong Assistants API là bao nhiêu?

Trường hướng dẫn của assistant có độ dài tối đa là 256.000 ký tự.

Tôi đang gặp lỗi như “Máy chủ gặp lỗi khi xử lý yêu cầu của bạn. Xin lỗi về điều đó! Bạn có thể thử lại yêu cầu, hoặc liên hệ với chúng tôi qua Trung tâm Trợ giúp tại help.openai.com nếu lỗi vẫn tiếp diễn. ” Tôi nên làm gì?

Nếu bạn gặp lỗi này, điều đó có thể có nghĩa là câu lệnh của bạn chưa được thiết lập đúng cách. Nếu bạn tiếp tục thử lại yêu cầu mà vẫn thất bại, đây là một số cách có thể thử:

hãy đảm bảo tái cấu trúc câu lệnh của bạn để xử lý mọi lệnh giống hàm như các hàm
thêm mọi lệnh trong câu lệnh của bạn dưới dạng một hàm vào tools

Tại sao công cụ File Search của tôi hoạt động không tốt?

Khi sử dụng công cụ File Search, chúng tôi khuyến nghị đặt max_prompt_tokens không thấp hơn 20.000. Đối với các cuộc trò chuyện dài hơn hoặc nhiều lượt tương tác với File Search, hãy cân nhắc tăng giới hạn này lên 50.000, hoặc lý tưởng nhất là bỏ hoàn toàn các giới hạn max_prompt_tokens để có kết quả chất lượng cao nhất. Đọc thêm tại đây.

Tôi có thể cung cấp phản hồi bằng cách nào?

Chúng tôi rất muốn nhận phản hồi của bạn trên Diễn đàn Nhà phát triển, qua Trung tâm Trợ giúp tại help.openai.com, hoặc trên Twitter @OpenAIDevs.