OpenAI
Halaman ini diterjemahkan oleh mesin. Lihat artikel asli dalam bahasa Inggris.

FAQ Assistants API (v2)

Diperbarui: 12 days ago

Mulai 11 Maret 2025, kami telah merilis building block dari platform Agents baru kami. Untuk detailnya, lihat dokumentasi API kami untuk Responses API, Tools termasuk Web Search, File Search, dan Computer Use, serta Agents SDK kami dengan Tracing. Berdasarkan masukan Anda untuk Assistants API beta, kami telah memasukkan peningkatan-peningkatan penting ke dalam Responses API. Setelah kami mencapai kesetaraan fitur sepenuhnya, kami akan mengumumkan rencana penghentian (deprecation) Assistants API pada akhir tahun ini, dengan target tanggal penghentian layanan pada paruh pertama 2026.

Apa itu Assistants API?

Assistants API memungkinkan developer untuk dengan mudah membangun asisten AI yang andal di dalam aplikasi mereka. API ini menghilangkan kebutuhan untuk mengelola riwayat percakapan dan menambahkan akses ke tool yang di-host oleh OpenAI seperti Code Interpreter dan File Search. API ini juga mendukung pemanggilan fungsi (function calling) yang ditingkatkan untuk tool pihak ketiga.

Apakah saya masih bisa menggunakan Assistants API v1 beta?

Tidak. Mulai 18 Desember 2024 pengguna tidak lagi memiliki akses ke versi v1 dari Assistant API beta. Saat ini kami hanya mendukung v2. Silakan lihat panduan migrasi ini untuk mengonversi pemanggilan API Anda dari v1 ke v2

Bagaimana cara mengaksesnya?

Assistants API tersedia untuk siapa pun yang memiliki akun OpenAI API. Anda juga bisa mulai menggunakan melalui Assistants Playground.

Apa itu Assistant?

Assistant merepresentasikan AI yang dibuat untuk tujuan tertentu yang menggunakan model OpenAI dan dapat mengakses file, mempertahankan thread yang persisten, serta memanggil tool.

Apa itu Thread?

Thread adalah sesi percakapan antara assistant dan pengguna. Thread mempermudah pengembangan aplikasi dengan menyimpan riwayat pesan dan memotongnya saat percakapan menjadi terlalu panjang untuk batas panjang konteks model.

Apa itu tool File Search?

Tool file_search menerapkan beberapa praktik terbaik retrieval siap pakai untuk membantu Anda mengekstrak data yang tepat dari file Anda guna melengkapi respons model. Untuk informasi lebih lanjut, silakan baca dokumentasi developer kami.

Secara default, tool file_search menggunakan pengaturan berikut:

  • Ukuran chunk: 800 token

  • Tumpang tindih chunk: 400 token

  • Model embedding: text-embedding-3-large pada 256 dimensi

  • Jumlah maksimum chunk yang ditambahkan ke konteks: 20

Apa saja pembatasan untuk upload File?

Pembatasan untuk mengunggah File adalah:

  • 512 MB per file

  • 5 juta token per file

  • 10 ribu file per vector store

  • 1 vector store per assistant

  • 1 vector store per thread

Batas penyimpanan total untuk setiap proyek dalam sebuah organisasi adalah 100 GB.

Apa saja keterbatasan tool File Search?

Kami memiliki beberapa keterbatasan yang sudah diketahui dan sedang kami upayakan dukungannya dalam beberapa bulan mendatang:

  1. Saat ini belum ada cara untuk mengubah pengaturan chunking, embedding, atau retrieval.

  2. Kami tidak mendukung parsing gambar di dalam dokumen.

  3. Kami tidak mendukung retrieval pada format file terstruktur (seperti file .csv atau .jsonl). Lihat jenis file yang didukung.

Apa batas rate untuk Assistants API?

Batas rate untuk Assistants API tidak terikat pada tier penggunaan dan model. Sebagai gantinya, ada batas default berdasarkan jenis request, dengan beberapa pengecualian:

  • GET: 1000 RPM

  • POST: 300 RPM

    • POST ke /v1/threads/<thread_id>/runs: 200 RPM

    • POST ke /v1/threads/runs: 200 RPM

  • DELETE: 300 request per menit

Bagaimana harga Code Interpreter di API?

Code Interpreter dikenai biaya $0,03 / sesi. Jika assistant Anda memanggil Code Interpreter secara bersamaan di dua thread yang berbeda, ini akan membuat dua sesi Code Interpreter (2 * $0,03). Setiap sesi aktif secara default selama satu jam, yang berarti Anda hanya membayar biaya ini sekali jika pengguna Anda terus memberi instruksi ke Code Interpreter dalam thread yang sama hingga satu jam.

Bagaimana harga File Search di API?

File Search dikenai biaya $0,10/GB penyimpanan vector store per hari (GB pertama penyimpanan gratis). Ukuran vector store didasarkan pada ukuran akhir vector store setelah file Anda diparsing, di-chunk, dan di-embed.

Vector store apa pun yang dibuat sebelum 17 April 2024 akan gratis hingga akhir 2024, setelah itu akan:

  • Ditagih dengan tarif saat ini (saat ini $0,10/GB/hari) jika telah digunakan setidaknya sekali dalam sebuah Run yang dibuat setelah 17 April 2024.

  • Dihapus jika belum digunakan dalam satu Run pun antara 17 April 2024 dan 31 Desember 2024 — ini untuk menghindari Anda ditagih atas vector store yang mungkin Anda buat sebelum perubahan harga ini diumumkan tetapi tidak pernah digunakan.

Apakah ada batas jumlah assistant yang bisa saya buat?

Tidak ada batas jumlah assistant yang dapat dibuat oleh sebuah organisasi.

Apakah streaming tersedia di API?

Ya, streaming tersedia di Assistants API.

Apakah mode JSON tersedia di Assistants API?

Ya, mode JSON tersedia di Assistants API melalui parameter response_format pada objek Assistants atau Run.

Apakah Assistants API juga akan mengelola request untuk pemanggilan fungsi pihak ketiga?

Tidak. Walaupun function calling memungkinkan model memilih tool dan memformat request untuk tool tersebut, eksekusi pemanggilan ke tool pihak ketiga tidak dikelola oleh OpenAI.

Bagaimana data yang saya kirim ke OpenAI ditangani?

Seperti halnya platform kami yang lain, data dan file yang dikirim ke OpenAI API tidak pernah digunakan untuk melatih model kami dan Anda dapat menghapus data Anda kapan pun diperlukan. Data yang diunggah ke Assistants API disimpan tanpa batas waktu hingga pengguna menghapusnya secara manual.

Apakah DALL-E tersedia melalui Assistants API?

Saat ini, DALL-E tidak tersedia.

Apakah ada UI untuk Assistants API?

Anda dapat melihat Playground untuk Assistants API. Pastikan Anda berada pada tampilan Assistants di sidebar kiri dan menggunakan model yang kompatibel dengan Tool yang ingin Anda aktifkan.

Playground Assistants view editing MyQuickstartAssistant with gpt-3.5-turbo and Code interpreter enabled

Berapa batas karakter untuk instruksi assistant di Assistants API?

Instruksi sistem yang digunakan assistant memiliki panjang maksimum 256.000 karakter.

Saya mendapatkan error seperti “The server had an error while processing your request. Sorry about that! You can retry your request, or contact us through our help center at help.openai.com if the error persists. “ Apa yang harus saya lakukan?

Jika Anda mendapatkan error ini, bisa jadi prompt Anda tidak disusun dengan benar. Jika Anda terus mencoba ulang request dan tetap gagal, berikut beberapa hal yang bisa dicoba:

  1. pastikan untuk menyusun ulang prompt Anda agar memperlakukan perintah yang mirip fungsi sebagai fungsi

  2. tambahkan perintah apa pun di prompt Anda sebagai sebuah fungsi ke tools

Mengapa tool File Search saya tidak bekerja dengan baik?

Saat menggunakan tool File Search, kami menyarankan untuk mengatur max_prompt_tokens tidak kurang dari 20.000. Untuk percakapan yang lebih panjang atau beberapa interaksi dengan File Search, pertimbangkan untuk menaikkan batas ini menjadi 50.000, atau idealnya menghapus batas max_prompt_tokens sama sekali untuk mendapatkan hasil berkualitas tertinggi. Baca lebih lanjut di sini.

Bagaimana cara memberikan masukan?

Kami ingin mendengar masukan Anda di Developer Forum kami, melalui Help Center di help.openai.com, atau di Twitter @OpenAIDevs.

Apakah artikel ini membantu?