FAQ sur l’API Assistants (v2)

Au 11 mars 2025, nous avons publié les éléments de base de notre nouvelle plateforme Agents. Pour plus de détails, consultez notre documentation API pour notre API Responses, les outils comprenant Web Search, File Search et Computer Use, ainsi que notre SDK Agents avec Tracing. Sur la base de vos retours sur la version bêta de l’API Assistants, nous avons intégré des améliorations clés dans l’API Responses. Une fois la parité complète des fonctionnalités atteinte, nous annoncerons un plan d’abandon de l’API Assistants plus tard cette année, avec une date cible de fin de prise en charge au premier semestre 2026.

Qu’est-ce que l’API Assistants ?

L’API Assistants permet aux développeurs de créer facilement de puissants assistants AI dans leurs applications. Cette API supprime la nécessité de gérer l’historique des conversations et ajoute l’accès à des outils hébergés par OpenAI comme l’Interpréteur de code et File Search. L’API prend également en charge un appel de fonction amélioré pour les outils tiers.

Puis-je encore utiliser Assistants API v1 bêta ?

Non. Depuis le 18 décembre 2024, les utilisateurs n’ont plus accès à la version v1 bêta de l’API Assistant. Nous ne prenons actuellement en charge que v2. Veuillez consulter ce guide de migration pour convertir vos appels API de v1 vers v2

Comment y accéder ?

L’API Assistants est disponible pour toute personne disposant d’un compte API OpenAI, mais elle est obsolète et sera supprimée en août 2026. Pour les nouveaux projets, utilisez plutôt l’API Responses. Si vous utilisez déjà l’API Assistants, planifiez votre migration vers l’API Responses. Vous pouvez toujours accéder aux assistants existants dans l’Assistants Playground tant que l’API reste disponible.

Qu’est-ce qu’un Assistant ?

Un assistant représente une AI conçue pour un objectif précis, qui utilise les modèles d’OpenAI et peut accéder à des fichiers, conserver des threads persistants et appeler des outils.

Qu’est-ce qu’un thread ?

Un thread est une session de conversation entre un assistant et un utilisateur. Les threads simplifient le développement d’applications en stockant l’historique des messages et en le tronquant lorsque la conversation devient trop longue pour la longueur de contexte du modèle.

Qu’est-ce que l’outil File Search ?

L’outil `file_search` applique automatiquement plusieurs bonnes pratiques de récupération pour vous aider à extraire les bonnes données de vos fichiers afin d’enrichir les réponses du modèle. Pour plus d’informations, veuillez lire notre documentation développeur.

Par défaut, l’outil file_search utilise les paramètres suivants :

Taille des chunks : 800 tokens
Chevauchement des chunks : 400 tokens
Modèle d’embedding : `text-embedding-3-large` à 256 dimensions
Nombre maximal de chunks ajoutés au contexte : 20

Quelles sont les restrictions pour le téléversement de fichiers ?

Les restrictions pour téléverser un fichier sont les suivantes :

512 Mo par fichier
5 M de tokens par fichier
10 000 fichiers par vector store
1 vector store par assistant
1 vector store par thread

La limite de stockage globale pour chaque projet d’une organisation est de 100 Go.

Quelles sont les limites de l’outil File Search ?

Nous avons quelques limites connues dont nous prévoyons d’ajouter la prise en charge dans les mois à venir :

Il n’existe actuellement aucun moyen de modifier les paramètres de découpage, d’embedding ou de récupération.
Nous ne prenons pas en charge l’analyse des images dans les documents.
Nous ne prenons pas en charge les récupérations dans des formats de fichiers structurés (comme les fichiers .csv ou .jsonl). Consultez les types de fichiers pris en charge.

Quelles sont les limites de débit de l’API Assistants ?

Les limites de débit de l’API Assistants ne sont pas liées au niveau d’utilisation ni au modèle. À la place, il existe des limites par défaut selon le type de requête, avec quelques exceptions :

GET : 1000 RPM
POST : 300 RPM

DELETE : 300 requêtes par minute

Comment l’Interpréteur de code est-il facturé dans l’API ?

L’Interpréteur de code est facturé 0,03 $ par session. Si votre assistant appelle l’Interpréteur de code simultanément dans deux threads différents, cela créera deux sessions de l’Interpréteur de code (2 * 0,03 $). Chaque session est active par défaut pendant une heure, ce qui signifie que vous ne paierez ces frais qu’une seule fois si votre utilisateur continue à donner des instructions à l’Interpréteur de code dans le même thread pendant une heure au maximum.

Comment File Search est-il facturé dans l’API ?

File Search est facturé 0,10 $/Go de stockage de vector store par jour (le premier Go de stockage est gratuit). La taille du vector store est basée sur la taille obtenue du vector store une fois votre fichier analysé, découpé et intégré.

Tous les vector stores créés avant le 17 avril 2024 seront gratuits jusqu’à la fin de 2024, après quoi ils seront soit :

Facturés aux tarifs en vigueur (actuellement 0,10 $/Go/jour) s’ils ont été utilisés au moins une fois dans un Run créé après le 17 avril 2024.
Supprimés s’ils n’ont pas été utilisés dans un seul Run entre le 17 avril 2024 et le 31 décembre 2024 — afin d’éviter que vous soyez facturé pour des vector stores que vous avez pu créer avant l’annonce de ce changement de tarification, mais jamais utilisés.

Existe-t-il une limite au nombre d’assistants que je peux créer ?

Il n’y a pas de limite au nombre d’assistants qu’une organisation peut créer.

Le streaming est-il disponible sur l’API ?

Oui, le streaming est disponible sur l’API Assistants.

Le mode JSON est-il disponible dans l’API Assistants ?

Oui, le mode JSON est disponible dans l’API Assistants via le paramètre response_format sur les objets Assistants ou Run.

L’API Assistants gérera-t-elle aussi les requêtes d’appels de fonction tiers ?

Non. Bien que l’appel de fonction permette au modèle de sélectionner des outils et de formater les requêtes qui leur sont destinées, l’exécution d’appels vers des outils tiers n’est pas gérée par OpenAI.

Comment les données que j’envoie à OpenAI sont-elles traitées ?

Comme pour le reste de notre plateforme, les données et fichiers transmis à l’API OpenAI ne sont jamais utilisés pour entraîner nos modèles et vous pouvez supprimer vos données quand vous en avez besoin. Les données téléversées vers l’API Assistants sont stockées indéfiniment jusqu’à ce qu’un utilisateur les supprime manuellement.

DALL-E est-il disponible via l’API Assistants ?

Pour le moment, DALL-E n’est pas disponible.

Existe-t-il une interface utilisateur pour l’API Assistants ?

Vous pouvez consulter le Playground pour l’API Assistants. Assurez-vous d’être dans la vue Assistants de la barre latérale gauche et d’utiliser un modèle compatible avec les outils que vous souhaitez activer.

Playground Assistants view editing MyQuickstartAssistant with gpt-3.5-turbo and Code interpreter enabled

Quelle est la limite de caractères pour les instructions de l’assistant dans l’API Assistants ?

Le champ des instructions de l’assistant a une longueur maximale de 256 000 caractères.

J’obtiens une erreur telle que « Le serveur a rencontré une erreur lors du traitement de votre requête. Désolé pour cela ! Vous pouvez réessayer votre requête ou nous contacter via notre centre d’aide à l’adresse help.openai.com si l’erreur persiste. » Que dois-je faire ?

Si vous obtenez cette erreur, cela peut signifier que votre prompt n’est pas configuré correctement. Si vous continuez à réessayer la requête et qu’elle échoue, voici quelques éléments à essayer :

assurez-vous de restructurer votre prompt pour traiter toute commande de type fonction comme une fonction
ajoutez toutes les commandes de votre prompt en tant que fonction à tools

Pourquoi mon outil File Search ne fonctionne-t-il pas bien ?

Lors de l’utilisation de l’outil File Search, nous recommandons de définir max_prompt_tokens sur au moins 20 000. Pour les conversations plus longues ou les interactions multiples avec File Search, envisagez d’augmenter cette limite à 50 000 ou, idéalement, de supprimer complètement les limites max_prompt_tokens pour obtenir les résultats de meilleure qualité. En savoir plus ici.

Comment puis-je donner mon avis ?

Nous serions ravis de recevoir vos commentaires sur notre Forum des développeurs, via le centre d’aide à l’adresse help.openai.com, ou sur Twitter @OpenAIDevs.