Per 11 maart 2025 hebben we de bouwstenen van ons nieuwe Agents-platform uitgebracht. Zie voor meer informatie onze API-documentatie voor onze Responses API, Tools waaronder Web Search, File Search en Computer Use, en onze Agents SDK met Tracing. Op basis van jullie feedback op de Assistants API-bèta hebben we belangrijke verbeteringen verwerkt in de Responses API. Zodra we volledige functionele gelijkwaardigheid hebben bereikt, kondigen we later dit jaar een uitfaseringsplan voor de Assistants API aan, met als doel de uitfasering in de eerste helft van 2026 af te ronden.
Wat is de Assistants API?
Met de Assistants API kunnen ontwikkelaars eenvoudig krachtige AI-assistenten bouwen binnen hun apps. Deze API maakt het niet meer nodig om de gespreksgeschiedenis te beheren en voegt toegang toe tot door OpenAI gehoste tools zoals Code-interpreter en File Search. De API ondersteunt ook verbeterd functies aanroepen voor tools van derden.
Kan ik Assistants API v1 beta nog steeds gebruiken?
Nee. Sinds 18 december 2024 hebben gebruikers geen toegang meer tot de v1-versie van de Assistant API-bèta. Momenteel ondersteunen we alleen v2. Bekijk deze migratiehandleiding om je API-calls van v1 naar v2 om te zetten
Hoe krijg ik er toegang toe?
De Assistants API is beschikbaar voor iedereen met een OpenAI API-account. Je kunt ook aan de slag via de Assistants Playground.
Wat is een Assistant?
Een assistant is een doelgerichte AI die gebruikmaakt van de models van OpenAI en toegang kan krijgen tot bestanden, persistente threads kan onderhouden en tools kan aanroepen.
Wat is een Thread?
Een thread is een gesprekssessie tussen een assistant en een gebruiker. Threads vereenvoudigen de ontwikkeling van applicaties door de berichtgeschiedenis op te slaan en die af te kappen wanneer het gesprek te lang wordt voor de contextlengte van het model.
Wat is de File Search-tool?
De tool file_search implementeert standaard verschillende best practices voor retrieval om je te helpen de juiste gegevens uit je bestanden te halen en zo de antwoorden van het model te verrijken. Lees voor meer informatie onze documentatie voor ontwikkelaars.
Standaard gebruikt de tool file_search de volgende instellingen:
Chunkgrootte: 800 tokens
Overlap tussen chunks: 400 tokens
Embedding-model:
text-embedding-3-largemet 256 dimensiesMaximum aantal chunks toegevoegd aan context: 20
Wat zijn de beperkingen voor het uploaden van bestanden?
De beperkingen voor het uploaden van een bestand zijn:
512 MB per bestand
5M tokens per bestand
10k bestanden per vector store
1 vector store per assistant
1 vector store per thread
De totale opslaglimiet voor elk project binnen een organisatie is 100 GB.
Wat zijn de beperkingen van de File Search-tool?
We kennen enkele beperkingen waarvoor we de komende maanden ondersteuning proberen toe te voegen:
Er is momenteel geen manier om de instellingen voor chunking, embeddings of retrieval te wijzigen.
We ondersteunen het parseren van afbeeldingen binnen documenten niet.
We ondersteunen geen retrieval over gestructureerde bestandsformaten (zoals .csv- of .jsonl-bestanden). Zie ondersteunde bestandstypen.
Wat zijn de rate limits voor de Assistants API?
De rate limits voor de Assistants API zijn niet gekoppeld aan usage tier en model. In plaats daarvan zijn er standaardlimieten per type request, met een paar uitzonderingen:
GET: 1000 RPM
POST: 300 RPM
POST naar
/v1/threads/<thread_id>/runs: 200 RPMPOST naar
/v1/threads/runs: 200 RPM
DELETE: 300 requests per minuut
Hoe worden de kosten voor Code-interpreter in de API berekend?
Code-interpreter kost $0.03 per sessie. Als je assistant Code-interpreter gelijktijdig aanroept in twee verschillende threads, ontstaan er twee Code-interpreter-sessies (2 * $0.03). Elke sessie is standaard één uur actief. Dat betekent dat je deze kosten maar één keer betaalt als je gebruiker binnen diezelfde thread tot maximaal één uur lang instructies blijft geven aan Code-interpreter.
Hoe worden de kosten voor File Search in de API berekend?
File Search kost $0.10/GB per dag aan opslag van vector stores (de eerste GB opslag is gratis). De grootte van de vector store is gebaseerd op de uiteindelijke grootte nadat je bestand is geparseerd, in chunks is verdeeld en van embeddings is voorzien.
Alle vector stores die vóór 17 april 2024 zijn aangemaakt, blijven gratis tot eind 2024. Daarna worden ze:
Gefactureerd tegen de huidige tarieven (momenteel $0.10/GB/dag) als ze minstens één keer zijn gebruikt in een Run die na 17 april 2024 is aangemaakt.
Verwijderd als ze niet één keer zijn gebruikt in een Run tussen 17 april 2024 en 31 december 2024 — dit om te voorkomen dat je betaalt voor vector stores die je mogelijk hebt aangemaakt voordat deze prijswijziging werd aangekondigd, maar nooit hebt gebruikt.
Is er een limiet aan het aantal assistants dat ik kan maken?
Er is geen limiet aan het aantal assistants dat een organisatie kan maken.
Is streaming beschikbaar in de API?
Ja, streaming is beschikbaar in de Assistants API.
Is de JSON-modus beschikbaar in de Assistants API?
Ja, de JSON-modus is beschikbaar in de Assistants API via de parameter response_format op de Assistants- of Run-objecten.
Beheert de Assistants API ook verzoeken voor functie-aanroepen van derden?
Nee. Hoewel functies aanroepen het model in staat stelt tools te selecteren en verzoeken daarvoor op te maken, wordt het uitvoeren van calls naar tools van derden niet door OpenAI beheerd.
Hoe wordt omgegaan met de gegevens die ik naar OpenAI stuur?
Net als voor de rest van ons platform geldt dat gegevens en bestanden die naar de OpenAI API worden gestuurd, nooit worden gebruikt om onze models te trainen, en je kunt je gegevens verwijderen wanneer je maar wilt. De gegevens die naar de Assistants API worden geüpload, worden voor onbepaalde tijd opgeslagen totdat een gebruiker ze handmatig verwijdert.
Is DALL-E beschikbaar via de Assistants API?
Op dit moment is DALL-E niet beschikbaar.
Is er een gebruikersinterface voor de Assistants API?
Je kunt de Playground voor de Assistants API bekijken. Zorg ervoor dat je in de weergave Assistants in de linkerzijbalk zit en een model gebruikt dat compatibel is met de Tools die je wilt inschakelen.

Wat is de tekenlimiet voor assistant-instructies in de Assistants API?
De systeeminstructies die de assistant gebruikt, hebben een maximale lengte van 256.000 tekens.
Ik krijg een foutmelding zoals: „The server had an error while processing your request. Sorry about that! You can retry your request, or contact us through our help center at help.openai.com if the error persists. “ Wat moet ik doen?
Als je deze fout krijgt, kan dat betekenen dat je prompt niet goed is ingesteld. Als je het verzoek blijft opnieuw proberen en het mislukt, zijn hier een paar dingen die je kunt proberen:
zorg dat je je prompt herstructureert zodat functieachtige opdrachten als functies worden behandeld
voeg eventuele opdrachten in je prompt als functie toe aan
tools
Waarom werkt mijn File Search-tool niet goed?
Wanneer je de File Search-tool gebruikt, raden we aan max_prompt_tokens in te stellen op minstens 20.000. Voor langere gesprekken of meerdere interacties met File Search kun je overwegen deze limiet te verhogen naar 50.000, of idealiter de limieten van max_prompt_tokens helemaal te verwijderen om resultaten van de hoogste kwaliteit te krijgen. Lees hier meer.
Hoe kan ik feedback geven?
We horen graag je feedback op ons Developer Forum, via het helpcentrum op help.openai.com, of op Twitter @OpenAIDevs.
