FAQ sur l’API Assistants (v2)

Depuis le 11 mars 2025, nous avons publié les composants de base de notre nouvelle plateforme Agents. Pour plus de détails, consultez notre documentation d’API pour notre API Responses, les outils comprenant Web Search, File Search et Computer Use, ainsi que notre SDK Agents avec Tracing. D’après vos commentaires sur la version bêta de l’API Assistants, nous avons intégré des améliorations clés à l’API Responses. Une fois la parité complète des fonctionnalités atteinte, nous annoncerons un plan d’obsolescence de l’API Assistants plus tard cette année, avec une date cible de retrait au cours du premier semestre de 2026.

Qu’est-ce que l’API Assistants ?

L’API Assistants permet aux développeurs de créer facilement de puissants assistants AI dans leurs applications. Cette API élimine la nécessité de gérer l’historique des conversations et ajoute l’accès à des outils hébergés par OpenAI comme l’interpréteur de code et File Search. L’API prend également en charge l’appel de fonction amélioré pour les outils de tiers.

Puis-je encore utiliser l’API Assistants v1 bêta ?

Non. Depuis le 18 décembre 2024, les utilisateurs n’ont plus accès à la version v1 de l’API Assistant bêta. Nous ne prenons actuellement en charge que la v2. Veuillez consulter ce guide de migration pour convertir vos appels d’API de v1 à v2.

Comment y accéder ?

L’API Assistants est accessible à toute personne ayant un compte d’API OpenAI, mais elle est obsolète et sera supprimée en août 2026. Pour les nouveaux projets, utilisez plutôt l’API Responses. Si vous utilisez déjà l’API Assistants, planifiez votre migration vers l’API Responses. Vous pouvez toujours accéder aux assistants existants dans le Playground Assistants tant que l’API demeure disponible.

Qu’est-ce qu’un assistant ?

Un assistant représente une AI conçue pour un usage précis qui utilise les modèles d’OpenAI et peut accéder à des fichiers, conserver des fils de discussion persistants et appeler des outils.

Qu’est-ce qu’un fil de discussion ?

Un fil de discussion est une session de conversation entre un assistant et un utilisateur. Les fils de discussion simplifient le développement d’applications en stockant l’historique des messages et en le tronquant lorsque la conversation devient trop longue pour la longueur de contexte du modèle.

Qu’est-ce que l’outil File Search ?

L’outil `file_search` met en œuvre d’emblée plusieurs pratiques exemplaires de récupération pour vous aider à extraire les bonnes données de vos fichiers afin d’enrichir les réponses du modèle. Pour en savoir plus, veuillez lire notre documentation pour les développeurs.

Par défaut, l’outil file_search utilise les paramètres suivants :

Taille des blocs : 800 tokens
Chevauchement des blocs : 400 tokens
Modèle d’intégration : `text-embedding-3-large` à 256 dimensions
Nombre maximal de blocs ajoutés au contexte : 20

Quelles sont les restrictions pour le téléversement de fichiers ?

Les restrictions pour téléverser un fichier sont les suivantes :

512 Mo par fichier
5 M de tokens par fichier
10 000 fichiers par magasin vectoriel
1 magasin vectoriel par assistant
1 magasin vectoriel par fil de discussion

La limite de stockage globale pour chaque projet d’une organisation est de 100 Go.

Quelles sont les limites de l’outil File Search ?

Nous connaissons quelques limites pour lesquelles nous travaillons à ajouter une prise en charge au cours des prochains mois :

Il n’existe actuellement aucun moyen de modifier les paramètres de découpage, d’intégration ou de récupération.
Nous ne prenons pas en charge l’analyse des images dans les documents.
Nous ne prenons pas en charge les récupérations dans les formats de fichiers structurés (comme les fichiers .csv ou .jsonl). Consultez les types de fichiers pris en charge.

Quelles sont les limites de débit de l’API Assistants ?

Les limites de débit de l’API Assistants ne sont pas liées au niveau d’utilisation et au modèle. Il existe plutôt des limites par défaut selon le type de requête, avec quelques exceptions :

GET : 1 000 RPM
POST : 300 RPM

DELETE : 300 requêtes par minute

Comment l’interpréteur de code est-il tarifé dans l’API ?

L’interpréteur de code est facturé 0,03 $ par session. Si votre assistant appelle l’interpréteur de code simultanément dans deux fils de discussion différents, cela crée deux sessions d’interpréteur de code (2 * 0,03 $). Chaque session est active par défaut pendant une heure, ce qui signifie que vous ne payez ces frais qu’une seule fois si votre utilisateur continue de donner des instructions à l’interpréteur de code dans le même fil de discussion pendant jusqu’à une heure.

Comment File Search est-il tarifé dans l’API ?

File Search est facturé 0,10 $/Go de stockage de magasin vectoriel par jour (le premier Go de stockage est gratuit). La taille du magasin vectoriel est basée sur la taille obtenue du magasin vectoriel une fois votre fichier analysé, découpé et intégré.

Tous les magasins vectoriels créés avant le 17 avril 2024 seront gratuits jusqu’à la fin de 2024, après quoi ils seront soit :

Facturés aux tarifs en vigueur (actuellement 0,10 $/Go/jour) s’ils ont été utilisés au moins une fois dans un Run créé après le 17 avril 2024.
Supprimés s’ils n’ont pas été utilisés dans un seul Run entre le 17 avril 2024 et le 31 décembre 2024 — ceci vise à éviter que vous soyez facturé pour des magasins vectoriels que vous avez peut-être créés avant l’annonce de ce changement de tarification, mais jamais utilisés.

Y a-t-il une limite au nombre d’assistants que je peux créer ?

Il n’y a aucune limite au nombre d’assistants qu’une organisation peut créer.

La diffusion en continu est-elle disponible dans l’API ?

Oui, la diffusion en continu est disponible dans l’API Assistants.

Le mode JSON est-il disponible dans l’API Assistants ?

Oui, le mode JSON est disponible dans l’API Assistants au moyen du paramètre response_format sur les objets Assistants ou Run.

L’API Assistants gérera-t-elle aussi les requêtes pour les appels de fonction de tiers ?

Non. Bien que l’appel de fonction permette au modèle de sélectionner des outils et de formater les requêtes qui leur sont destinées, l’exécution des appels aux outils de tiers n’est pas gérée par OpenAI.

Comment les données que j’envoie à OpenAI sont-elles traitées ?

Comme pour le reste de notre plateforme, les données et les fichiers transmis à l’API OpenAI ne sont jamais utilisés pour entraîner nos modèles, et vous pouvez supprimer vos données lorsque vous en avez besoin. Les données téléversées vers l’API Assistants sont stockées indéfiniment jusqu’à ce qu’un utilisateur les supprime manuellement.

DALL-E est-il disponible via l’API Assistants ?

Pour le moment, DALL-E n’est pas disponible.

Existe-t-il une interface utilisateur pour l’API Assistants ?

Vous pouvez consulter le Playground pour l’API Assistants. Assurez-vous d’être dans la vue Assistants de la barre latérale gauche et d’utiliser un modèle compatible avec les outils que vous souhaitez activer.

Playground Assistants view editing MyQuickstartAssistant with gpt-3.5-turbo and Code interpreter enabled

Quelle est la limite de caractères pour les instructions de l’assistant dans l’API Assistants ?

Le champ des instructions de l’assistant a une longueur maximale de 256 000 caractères.

J’obtiens une erreur comme « Le serveur a rencontré une erreur lors du traitement de votre demande. Désolé pour cela ! Vous pouvez réessayer votre requête ou nous contacter par l’intermédiaire de notre centre d’assistance à l’adresse help.openai.com si l’erreur persiste. » Que dois-je faire ?

Si vous obtenez cette erreur, cela peut signifier que votre invite n’est pas configurée correctement. Si vous continuez de réessayer la requête et qu’elle échoue, voici quelques éléments à essayer :

assurez-vous de restructurer votre invite pour traiter toute commande semblable à une fonction comme une fonction
ajoutez toute commande de votre invite comme fonction à tools

Pourquoi mon outil File Search ne fonctionne-t-il pas bien ?

Lorsque vous utilisez l’outil File Search, nous recommandons de définir max_prompt_tokens à au moins 20 000. Pour les conversations plus longues ou les interactions multiples avec File Search, envisagez d’augmenter cette limite à 50 000 ou, idéalement, de supprimer complètement les limites max_prompt_tokens afin d’obtenir les résultats de la plus haute qualité. Pour en savoir plus, cliquez ici.

Comment puis-je fournir des commentaires ?

Nous aimerions recevoir vos commentaires sur notre forum des développeurs, via le centre d’assistance à l’adresse help.openai.com, ou sur Twitter @OpenAIDevs.