Veelgestelde vragen over Assistants API (v2)

Op 11 maart 2025 hebben we de bouwstenen van ons nieuwe Agents-platform uitgebracht. Zie voor details onze API-documentatie voor onze Responses API, Tools waaronder Web Search, File Search en Computer Use, en onze Agents SDK met Tracing. Op basis van jullie feedback op de Assistants API-bèta hebben we belangrijke verbeteringen opgenomen in de Responses API. Zodra we volledige functiepariteit bereiken, kondigen we later dit jaar een uitfaseringsplan voor de Assistants API aan, met als beoogde einddatum de eerste helft van 2026.

Wat is de Assistants API?

Met de Assistants API kunnen ontwikkelaars eenvoudig krachtige AI-assistants in hun apps bouwen. Deze API neemt de noodzaak weg om gespreksgeschiedenis te beheren en voegt toegang toe tot door OpenAI gehoste tools zoals Code-interpreter en File Search. De API ondersteunt ook verbeterd functies aanroepen voor tools van derden.

Kan ik Assistants API v1 bèta nog gebruiken?

Nee. Sinds 18 december 2024 hebben gebruikers geen toegang meer tot de v1-versie van de Assistant API-bèta. We ondersteunen momenteel alleen v2. Bekijk deze migratiehandleiding om je API-aanroepen van v1 naar v2 om te zetten

Hoe krijg ik toegang?

De Assistants API is beschikbaar voor iedereen met een OpenAI API-account, maar is verouderd en wordt in augustus 2026 verwijderd. Gebruik voor nieuwe projecten in plaats daarvan de Responses API. Als je de Assistants API al gebruikt, plan dan je migratie naar de Responses API. Je hebt nog steeds toegang tot bestaande assistants in de Assistants Playground zolang de API beschikbaar blijft.

Wat is een Assistant?

Een assistant vertegenwoordigt een speciaal gebouwde AI die de modellen van OpenAI gebruikt en toegang heeft tot bestanden, permanente threads kan bijhouden en tools kan aanroepen.

Wat is een thread?

Een thread is een gesprekssessie tussen een assistant en een gebruiker. Threads vereenvoudigen applicatieontwikkeling door de berichtgeschiedenis op te slaan en deze in te korten wanneer het gesprek te lang wordt voor de contextlengte van het model.

Wat is de File Search-tool?

De tool `file_search` implementeert standaard verschillende best practices voor retrieval om je te helpen de juiste gegevens uit je bestanden te halen en de antwoorden van het model te verbeteren. Lees voor meer informatie onze ontwikkelaarsdocumentatie.

Standaard gebruikt de tool file_search de volgende instellingen:

Chunkgrootte: 800 tokens
Chunkoverlap: 400 tokens
Embeddingmodel: `text-embedding-3-large` met 256 dimensies
Maximumaantal chunks toegevoegd aan context: 20

Wat zijn de beperkingen voor het uploaden van bestanden?

De beperkingen voor het uploaden van een bestand zijn:

512 MB per bestand
5 mln. tokens per bestand
10.000 bestanden per vector store
1 vector store per assistant
1 vector store per thread

De totale opslaglimiet voor elk project in een organisatie is 100 GB.

Wat zijn de beperkingen van de File Search-tool?

Er zijn een paar bekende beperkingen waarvoor we de komende maanden ondersteuning willen toevoegen:

Er is momenteel geen manier om de instellingen voor chunking, embedding of retrieval aan te passen.
We ondersteunen het parseren van afbeeldingen in documenten niet.
We ondersteunen geen retrievals voor gestructureerde bestandsindelingen (zoals .csv- of .jsonl-bestanden). Bekijk de ondersteunde bestandstypen.

Wat zijn de volumelimieten voor de Assistants API?

De volumelimieten voor de Assistants API zijn niet gekoppeld aan gebruiksniveau en model. In plaats daarvan zijn er standaardlimieten per aanvraagtype, met een paar uitzonderingen:

GET: 1000 RPM
POST: 300 RPM

DELETE: 300 aanvragen per minuut

Hoe wordt Code-interpreter in de API geprijsd?

Code-interpreter kost $0,03 per sessie. Als je assistent Code-interpreter gelijktijdig in twee verschillende threads aanroept, worden er twee Code-interpreter-sessies gemaakt (2 * $0,03). Elke sessie is standaard één uur actief. Dit betekent dat je deze kosten maar één keer betaalt als je gebruiker tot één uur lang instructies blijft geven aan Code-interpreter in dezelfde thread.

Hoe wordt File Search in de API geprijsd?

File Search kost $0,10/GB aan vector store-opslag per dag (de eerste GB opslag is gratis). De grootte van de vector store is gebaseerd op de uiteindelijke grootte van de vector store nadat je bestand is geparseerd, in chunks is verdeeld en is embedded.

Alle vector stores die vóór 17 april 2024 zijn gemaakt, zijn gratis tot eind 2024. Daarna worden ze:

Gefactureerd tegen de huidige tarieven (momenteel $0,10/GB/dag) als ze minstens één keer zijn gebruikt in een Run die na 17 april 2024 is gemaakt.
Verwijderd als ze niet zijn gebruikt in één enkele Run tussen 17 april 2024 en 31 december 2024 — dit is om te voorkomen dat je wordt gefactureerd voor vector stores die je mogelijk hebt gemaakt voordat deze prijswijziging werd aangekondigd, maar nooit hebt gebruikt.

Is er een limiet voor het aantal assistants dat ik kan maken?

Er is geen limiet voor het aantal assistants dat een organisatie kan maken.

Is streaming beschikbaar in de API?

Ja, streaming is beschikbaar in de Assistants API.

Is de JSON-modus beschikbaar in de Assistants API?

Ja, de JSON-modus is beschikbaar in de Assistants API via de parameter response_format op de Assistants- of Run-objecten.

Beheert de Assistants API ook aanvragen voor functieaanroepen van derden?

Nee. Hoewel functies aanroepen het model in staat stelt tools te selecteren en aanvragen ervoor op te maken, wordt het uitvoeren van aanroepen naar tools van derden niet door OpenAI beheerd.

Hoe worden de gegevens verwerkt die ik naar OpenAI stuur?

Net als bij de rest van ons platform worden gegevens en bestanden die naar de OpenAI API worden gestuurd nooit gebruikt om onze modellen te trainen en kun je je gegevens verwijderen wanneer dat nodig is. De gegevens die naar de Assistants API worden geüpload, worden voor onbepaalde tijd opgeslagen totdat een gebruiker ze handmatig verwijdert.

Is DALL-E beschikbaar via de Assistants API?

Op dit moment is DALL-E niet beschikbaar.

Is er een UI voor de Assistants API?

Je kunt de Playground voor de Assistants API bekijken. Zorg ervoor dat je in de weergave Assistants in de linkerzijbalk bent en een model gebruikt dat compatibel is met de Tools die je wilt inschakelen.

Playground Assistants view editing MyQuickstartAssistant with gpt-3.5-turbo and Code interpreter enabled

Wat is de tekenlimiet voor assistant-instructies in de Assistants API?

Het veld voor assistant-instructies heeft een maximale lengte van 256.000 tekens.

Ik krijg een foutmelding zoals: “De server heeft een fout ondervonden tijdens het verwerken van je verzoek. Sorry daarvoor! Je kunt je verzoek opnieuw proberen, of contact met ons opnemen via ons helpcentrum op help.openai.com als de fout blijft optreden. ” Wat moet ik doen?

Als je deze fout krijgt, kan dit betekenen dat je prompt niet correct is ingesteld. Als je het verzoek blijft proberen en het mislukt, kun je het volgende proberen:

zorg ervoor dat je je prompt herstructureert om functieachtige opdrachten als functies te behandelen
voeg eventuele opdrachten in je prompt als functie toe aan tools

Waarom werkt mijn File Search-tool niet goed?

Wanneer je de File Search-tool gebruikt, raden we aan max_prompt_tokens in te stellen op minimaal 20.000. Voor langere gesprekken of meerdere interacties met File Search kun je overwegen deze limiet te verhogen naar 50.000, of idealiter de limieten voor max_prompt_tokens helemaal te verwijderen voor resultaten van de hoogste kwaliteit. Lees hier meer.

Hoe kan ik feedback geven?

We horen graag je feedback op ons Developer Forum, via het helpcentrum op help.openai.com of op Twitter @OpenAIDevs.