Tính đến ngày 11 tháng 3 năm 2025, chúng tôi đã phát hành các khối xây dựng của nền tảng Agents mới. Để biết chi tiết, hãy xem tài liệu API của chúng tôi cho Responses API, các Công cụ gồm Tìm kiếm Web, Tìm kiếm Tệp, và Sử dụng Máy tính, cùng Agents SDK của chúng tôi với Theo dõi. Dựa trên phản hồi của bạn về bản beta Assistants API, chúng tôi đã tích hợp các cải tiến quan trọng vào Responses API. Sau khi đạt được sự tương đương đầy đủ về tính năng, chúng tôi sẽ công bố kế hoạch ngừng sử dụng Assistants API vào cuối năm nay, với ngày ngừng hoạt động dự kiến trong nửa đầu năm 2026.
Assistants API là gì?
Assistants API cho phép nhà phát triển dễ dàng xây dựng các trợ lý AI mạnh mẽ trong ứng dụng của họ. API này loại bỏ nhu cầu quản lý lịch sử hội thoại và bổ sung quyền truy cập vào các công cụ do OpenAI lưu trữ như Trình Thông dịch Mã và Tìm kiếm Tệp. API này cũng hỗ trợ gọi hàm được cải thiện cho các công cụ bên thứ ba.
Tôi vẫn có thể dùng Assistants API v1 beta không?
Không. Kể từ ngày 18 tháng 12 năm 2024, người dùng không còn quyền truy cập vào phiên bản v1 của bản beta Assistant API nữa. Hiện tại chúng tôi chỉ hỗ trợ v2. Vui lòng xem hướng dẫn di chuyển này để chuyển các lệnh gọi API của bạn từ v1 sang v2
Tôi truy cập nó như thế nào?
Assistants API khả dụng cho bất kỳ ai có tài khoản OpenAI API. Bạn cũng có thể bắt đầu qua Khu thử nghiệm Assistants.
Assistant là gì?
Một assistant đại diện cho một AI được xây dựng cho mục đích cụ thể, sử dụng các mô hình của OpenAI và có thể truy cập tệp, duy trì thread liên tục, và gọi công cụ.
Thread là gì?
Thread là một phiên hội thoại giữa assistant và người dùng. Thread đơn giản hóa việc phát triển ứng dụng bằng cách lưu trữ lịch sử tin nhắn và cắt bớt khi hội thoại trở nên quá dài so với độ dài ngữ cảnh của mô hình.
Công cụ Tìm kiếm Tệp là gì?
Công cụ file_search triển khai sẵn một số phương pháp thực hành tốt nhất về truy xuất để giúp bạn trích xuất đúng dữ liệu từ tệp của mình nhằm bổ sung cho phản hồi của mô hình. Để biết thêm thông tin, vui lòng đọc tài liệu dành cho nhà phát triển của chúng tôi.
Theo mặc định, công cụ file_search sử dụng các cài đặt sau:
Kích thước đoạn: 800 token
Chồng lấp đoạn: 400 token
Mô hình embedding:
text-embedding-3-largeở 256 chiềuSố lượng đoạn tối đa được thêm vào ngữ cảnh: 20
Các giới hạn đối với việc tải tệp lên là gì?
Các giới hạn khi tải một Tệp lên là:
512 MB cho mỗi tệp
5M token cho mỗi tệp
10k tệp cho mỗi vector store
1 vector store cho mỗi assistant
1 vector store cho mỗi thread
Giới hạn lưu trữ tổng thể cho mỗi dự án trong một tổ chức là 100 GB.
Những hạn chế của công cụ Tìm kiếm Tệp là gì?
Chúng tôi có một vài hạn chế đã biết mà chúng tôi đang nỗ lực bổ sung hỗ trợ trong những tháng tới:
Hiện chưa có cách nào để sửa đổi cài đặt chunking, embedding hoặc retrieval.
Chúng tôi không hỗ trợ phân tích hình ảnh trong tài liệu.
Chúng tôi không hỗ trợ truy xuất trên các định dạng tệp có cấu trúc (như tệp .csv hoặc .jsonl). Xem các loại tệp được hỗ trợ.
Giới hạn tốc độ cho Assistants API là gì?
Giới hạn tốc độ cho Assistants API không gắn với bậc sử dụng và mô hình. Thay vào đó, có các giới hạn mặc định theo loại yêu cầu, với một vài ngoại lệ:
GET: 1000 RPM
POST: 300 RPM
POST tới
/v1/threads/<thread_id>/runs: 200 RPMPOST tới
/v1/threads/runs: 200 RPM
DELETE: 300 yêu cầu mỗi phút
Trình Thông dịch Mã trong API được tính giá như thế nào?
Trình Thông dịch Mã có giá $0.03 / phiên. Nếu assistant của bạn gọi Trình Thông dịch Mã đồng thời trong hai thread khác nhau, điều này sẽ tạo ra hai phiên Trình Thông dịch Mã (2 * $0.03). Mỗi phiên mặc định hoạt động trong một giờ, nghĩa là bạn sẽ chỉ trả khoản phí này một lần nếu người dùng của bạn tiếp tục đưa hướng dẫn cho Trình Thông dịch Mã trong cùng một thread tối đa một giờ.
Tìm kiếm Tệp trong API được tính giá như thế nào?
Tìm kiếm Tệp có giá $0.10/GB dung lượng lưu trữ vector store mỗi ngày (GB lưu trữ đầu tiên là miễn phí). Kích thước của vector store dựa trên kích thước kết quả của vector store sau khi tệp của bạn được phân tích, chia đoạn và embedding.
Bất kỳ vector store nào được tạo trước ngày 17 tháng 4 năm 2024 sẽ được miễn phí đến hết năm 2024, sau đó chúng sẽ:
Được tính phí theo mức giá hiện hành (hiện là $0.10/GB/ngày) nếu chúng đã được sử dụng ít nhất một lần trong một Run được tạo sau ngày 17 tháng 4 năm 2024.
Bị xóa nếu chúng chưa được dùng trong bất kỳ Run nào từ ngày 17 tháng 4 năm 2024 đến ngày 31 tháng 12 năm 2024 — điều này nhằm tránh việc bạn bị tính phí cho các vector store mà bạn có thể đã tạo trước khi thay đổi giá này được công bố nhưng chưa từng sử dụng.
Có giới hạn số lượng assistant tôi có thể tạo không?
Không có giới hạn về số lượng assistant mà một tổ chức có thể tạo.
API có hỗ trợ streaming không?
Có, streaming khả dụng trên Assistants API.
Chế độ JSON có khả dụng trong Assistants API không?
Có, chế độ JSON khả dụng trên Assistants API thông qua tham số response_format trên các đối tượng Assistants hoặc Run.
Assistants API có quản lý các yêu cầu gọi hàm của bên thứ ba không?
Không. Mặc dù gọi hàm cho phép mô hình chọn công cụ và định dạng yêu cầu cho chúng, việc thực thi lệnh gọi đến công cụ bên thứ ba không do OpenAI quản lý.
Dữ liệu tôi gửi cho OpenAI được xử lý như thế nào?
Cũng như phần còn lại của nền tảng của chúng tôi, dữ liệu và tệp được փոխանց tới OpenAI API không bao giờ được dùng để huấn luyện mô hình của chúng tôi và bạn có thể xóa dữ liệu của mình bất cứ khi nào cần. Dữ liệu được tải lên Assistants API được lưu trữ vô thời hạn cho đến khi người dùng xóa thủ công.
DALL-E có khả dụng qua Assistants API không?
Hiện tại, DALL-E chưa khả dụng.
Có giao diện người dùng cho Assistants API không?
Bạn có thể xem Khu thử nghiệm cho Assistants API. Hãy đảm bảo bạn đang ở chế độ xem Assistants trên thanh bên trái và đang dùng một mô hình tương thích với các Công cụ mà bạn muốn bật.

Giới hạn ký tự cho hướng dẫn của assistant trong Assistants API là bao nhiêu?
Các hướng dẫn hệ thống mà assistant sử dụng có độ dài tối đa là 256.000 ký tự.
Tôi đang nhận lỗi như “Máy chủ gặp lỗi khi xử lý yêu cầu của bạn. Chúng tôi rất tiếc về điều đó! Bạn có thể thử lại yêu cầu của mình, hoặc liên hệ với chúng tôi qua trung tâm trợ giúp tại help.openai.com nếu lỗi vẫn tiếp diễn.” Tôi nên làm gì?
Nếu bạn gặp lỗi này, có thể nghĩa là câu lệnh của bạn chưa được thiết lập đúng cách. Nếu bạn tiếp tục thử lại yêu cầu mà vẫn thất bại, đây là một số điều nên thử:
hãy đảm bảo cấu trúc lại câu lệnh của bạn để coi mọi lệnh giống hàm là các hàm
thêm mọi lệnh trong câu lệnh của bạn dưới dạng một hàm vào
tools
Tại sao công cụ Tìm kiếm Tệp của tôi hoạt động không tốt?
Khi dùng công cụ Tìm kiếm Tệp, chúng tôi khuyên bạn đặt max_prompt_tokens không thấp hơn 20.000. Với các hội thoại dài hơn hoặc nhiều lần tương tác với Tìm kiếm Tệp, hãy cân nhắc tăng giới hạn này lên 50.000, hoặc lý tưởng nhất là xóa hẳn giới hạn max_prompt_tokens để có kết quả chất lượng cao nhất. Đọc thêm tại đây.
Tôi có thể gửi phản hồi bằng cách nào?
Chúng tôi rất mong nhận được phản hồi của bạn trên Diễn đàn Nhà phát triển, qua Trung tâm Trợ giúp tại help.openai.com, hoặc trên Twitter @OpenAIDevs.
