FAQ Assistants API (v2)

Mulai 11 Maret 2025, kami telah merilis blok penyusun platform Agents baru kami. Untuk detailnya, lihat dokumentasi API kami untuk Responses API, Tools termasuk Web Search, File Search, dan Computer Use, serta Agents SDK kami dengan Tracing. Berdasarkan masukan Anda untuk Assistants API beta, kami telah memasukkan peningkatan utama ke dalam Responses API. Setelah kami mencapai paritas fitur penuh, kami akan mengumumkan rencana penghentian Assistants API akhir tahun ini, dengan target tanggal penghentian pada paruh pertama 2026.

Apa itu Assistants API?

Assistants API memungkinkan developer dengan mudah membangun asisten AI yang andal di dalam aplikasi mereka. API ini menghilangkan kebutuhan untuk mengelola riwayat percakapan dan menambahkan akses ke alat yang dihosting OpenAI seperti Penerjemah Kode dan File Search. API ini juga mendukung pemanggilan fungsi yang lebih baik untuk alat pihak ke-3.

Apakah saya masih dapat menggunakan Assistants API v1 beta?

Tidak. Mulai 18 Desember 2024, pengguna tidak lagi memiliki akses ke versi v1 dari Assistant API beta. Saat ini kami hanya mendukung v2. Silakan lihat panduan migrasi ini untuk mengonversi panggilan API Anda dari v1 ke v2

Bagaimana cara mengaksesnya?

Assistants API tersedia bagi siapa pun yang memiliki akun OpenAI API, tetapi sudah dihentikan bertahap dan akan dihapus pada Agustus 2026. Untuk proyek baru, gunakan Responses API sebagai gantinya. Jika Anda sudah menggunakan Assistants API, rencanakan migrasi Anda ke Responses API. Anda masih dapat mengakses asisten yang ada di Assistants Playground selama API tetap tersedia.

Apa itu Assistant?

Assistant merepresentasikan AI yang dibuat untuk tujuan tertentu, menggunakan model OpenAI, serta dapat mengakses file, mempertahankan thread persisten, dan memanggil alat.

Apa itu Thread?

Thread adalah sesi percakapan antara asisten dan pengguna. Thread menyederhanakan pengembangan aplikasi dengan menyimpan riwayat pesan dan memotongnya ketika percakapan menjadi terlalu panjang untuk panjang konteks model.

Apa itu alat File Search?

Alat `file_search` menerapkan beberapa praktik terbaik retrieval secara langsung untuk membantu Anda mengekstrak data yang tepat dari file Anda guna melengkapi respons model. Untuk informasi selengkapnya, silakan baca dokumentasi developer kami.

Secara default, alat file_search menggunakan pengaturan berikut:

Ukuran chunk: 800 token
Tumpang tindih chunk: 400 token
Model embedding: `text-embedding-3-large` pada 256 dimensi
Jumlah maksimum chunk yang ditambahkan ke konteks: 20

Apa saja batasan untuk unggahan File?

Batasan untuk mengunggah File adalah:

512 MB per file
5 juta token per file
10 ribu file per vector store
1 vector store per asisten
1 vector store per thread

Batas penyimpanan keseluruhan untuk setiap proyek dalam organisasi adalah 100 GB.

Apa saja batasan alat File Search?

Kami memiliki beberapa batasan yang diketahui dan sedang kami upayakan dukungannya dalam beberapa bulan mendatang:

Saat ini belum ada cara untuk mengubah pengaturan chunking, embedding, atau retrieval.
Kami tidak mendukung penguraian gambar dalam dokumen.
Kami tidak mendukung retrieval pada format file terstruktur (seperti file .csv atau .jsonl). Lihat jenis file yang didukung.

Apa saja batas laju untuk Assistants API?

Batas laju untuk Assistants API tidak terkait dengan tingkat penggunaan dan model. Sebaliknya, ada batas default berdasarkan jenis permintaan, dengan beberapa pengecualian:

GET: 1000 RPM
POST: 300 RPM

DELETE: 300 permintaan per menit

Bagaimana harga Penerjemah Kode di API?

Penerjemah Kode dikenai harga $0,03 / sesi. Jika asisten Anda memanggil Penerjemah Kode secara bersamaan di dua thread berbeda, ini akan membuat dua sesi Penerjemah Kode (2 * $0,03). Setiap sesi aktif secara default selama satu jam, yang berarti Anda hanya akan membayar biaya ini sekali jika pengguna Anda terus memberikan instruksi kepada Penerjemah Kode di thread yang sama hingga satu jam.

Bagaimana harga File Search di API?

File Search dikenai harga $0,10/GB penyimpanan vector store per hari (GB pertama penyimpanan gratis). Ukuran vector store didasarkan pada ukuran akhir vector store setelah file Anda diuraikan, dipecah menjadi chunk, dan di-embed.

Vector store apa pun yang dibuat sebelum 17 April 2024 akan gratis hingga akhir 2024, setelah itu akan:

Ditagih dengan tarif saat ini (saat ini $0,10/GB/hari) jika telah digunakan setidaknya sekali dalam Run yang dibuat setelah 17 April 2024.
Dihapus jika belum pernah digunakan dalam satu Run antara 17 April 2024 dan 31 Desember 2024 — ini untuk menghindari Anda ditagih atas vector store yang mungkin Anda buat sebelum perubahan harga ini diumumkan tetapi tidak pernah digunakan.

Apakah ada batas jumlah asisten yang dapat saya buat?

Tidak ada batas jumlah asisten yang dapat dibuat oleh sebuah organisasi.

Apakah streaming tersedia di API?

Ya, streaming tersedia di Assistants API.

Apakah mode JSON tersedia di Assistants API?

Ya, mode JSON tersedia di Assistants API melalui parameter response_format pada objek Assistants atau Run.

Apakah Assistants API juga akan mengelola permintaan untuk pemanggilan fungsi pihak ke-3?

Tidak. Meskipun pemanggilan fungsi memungkinkan model memilih alat dan memformat permintaan untuk alat tersebut, eksekusi panggilan ke alat pihak ke-3 tidak dikelola oleh OpenAI.

Bagaimana data yang saya kirim ke OpenAI ditangani?

Seperti platform kami lainnya, data dan file yang dikirimkan ke OpenAI API tidak pernah digunakan untuk melatih model kami, dan Anda dapat menghapus data Anda kapan pun diperlukan. Data yang diunggah ke Assistants API disimpan tanpa batas waktu hingga pengguna menghapusnya secara manual.

Apakah DALL-E tersedia melalui Assistants API?

Saat ini, DALL-E tidak tersedia.

Apakah ada UI untuk Assistants API?

Anda dapat mencoba Playground untuk Assistants API. Pastikan Anda berada di tampilan Assistants pada bilah sisi kiri dan menggunakan model yang kompatibel dengan Tools yang ingin Anda aktifkan.

Playground Assistants view editing MyQuickstartAssistant with gpt-3.5-turbo and Code interpreter enabled

Berapa batas karakter untuk instruksi asisten di Assistants API?

Kolom instruksi asisten memiliki panjang maksimum 256.000 karakter.

Saya mendapatkan kesalahan seperti “Server mengalami kesalahan saat memproses permintaan Anda. Maaf tentang hal itu! Anda dapat mencoba ulang permintaan Anda, atau menghubungi kami melalui pusat bantuan kami di help.openai.com jika kesalahan berlanjut. ” Apa yang harus saya lakukan?

Jika Anda mendapatkan kesalahan ini, itu mungkin berarti prompt Anda tidak disiapkan dengan benar. Jika Anda terus mencoba ulang permintaan dan tetap gagal, berikut beberapa hal yang dapat dicoba:

pastikan untuk menyusun ulang prompt Anda agar memperlakukan perintah yang mirip fungsi sebagai fungsi
tambahkan perintah apa pun dalam prompt Anda sebagai fungsi ke tools

Mengapa alat File Search saya tidak berfungsi dengan baik?

Saat menggunakan alat File Search, kami menyarankan agar max_prompt_tokens diatur tidak kurang dari 20.000. Untuk percakapan yang lebih panjang atau beberapa interaksi dengan File Search, pertimbangkan untuk menaikkan batas ini menjadi 50.000, atau idealnya, menghapus batas max_prompt_tokens sepenuhnya untuk mendapatkan hasil berkualitas tertinggi. Baca selengkapnya di sini.

Bagaimana saya dapat memberikan masukan?

Kami ingin mendengar masukan Anda di Forum Developer kami, melalui Pusat Bantuan di help.openai.com, atau di Twitter @OpenAIDevs.