OpenAI
Cette page a été traduite automatiquement. Afficher l’article original en anglais.

FAQ sur l’API Assistants (v2)

Dernière mise à jour : yesterday

Depuis le 11 mars 2025, nous avons publié les briques de base de notre nouvelle plateforme Agents. Pour plus de détails, consultez notre documentation API pour notre API Responses, les outils, notamment Web Search, File Search et Computer Use, ainsi que notre Agents SDK avec le Tracing. Sur la base de vos retours sur la bêta de l’API Assistants, nous avons intégré des améliorations clés dans l’API Responses. Une fois la parité fonctionnelle complète atteinte, nous annoncerons plus tard cette année un plan de dépréciation de l’API Assistants, avec une date d’arrêt cible au premier semestre 2026.

Qu’est-ce que l’API Assistants ?

L’API Assistants permet aux développeurs de créer facilement de puissants assistants IA au sein de leurs applications. Cette API élimine la nécessité de gérer l’historique des conversations et donne accès à des outils hébergés par OpenAI comme Code Interpreter et File Search. L’API prend également en charge un appel de fonctions amélioré pour des outils tiers.

Puis-je encore utiliser la bêta v1 de l’API Assistants ?

Non. Depuis le 18 décembre 2024, les utilisateurs n’ont plus accès à la version v1 de la bêta de l’API Assistants. Nous ne prenons actuellement en charge que la v2. Veuillez consulter ce guide de migration pour convertir vos appels API de la v1 vers la v2

Comment y accéder ?

L’API Assistants est disponible pour toute personne disposant d’un compte OpenAI API. Vous pouvez également démarrer via l’Assistants Playground.

Qu’est-ce qu’un Assistant ?

Un assistant représente une IA conçue pour un usage spécifique, qui utilise les modèles d’OpenAI et peut accéder à des fichiers, maintenir des threads persistants et appeler des outils.

Qu’est-ce qu’un Thread ?

Un thread est une session de conversation entre un assistant et un utilisateur. Les threads simplifient le développement d’applications en stockant l’historique des messages et en le tronquant lorsque la conversation devient trop longue pour la longueur de contexte du modèle.

Qu’est-ce que l’outil File Search ?

L’outil file_search implémente plusieurs bonnes pratiques de retrieval prêtes à l’emploi pour vous aider à extraire les bonnes données de vos fichiers afin d’enrichir les réponses du modèle. Pour en savoir plus, veuillez consulter notre documentation développeur.

Par défaut, l’outil file_search utilise les paramètres suivants :

  • Taille des segments : 800 tokens

  • Chevauchement des segments : 400 tokens

  • Modèle d’embedding : text-embedding-3-large en 256 dimensions

  • Nombre maximal de segments ajoutés au contexte : 20

Quelles sont les restrictions pour le téléversement de fichiers ?

Les restrictions pour téléverser un fichier sont :

  • 512 Mo par fichier

  • 5M tokens par fichier

  • 10k fichiers par base vectorielle

  • 1 base vectorielle par assistant

  • 1 base vectorielle par thread

La limite de stockage globale pour chaque projet au sein d’une organisation est de 100 Go.

Quelles sont les limitations de l’outil File Search ?

Nous avons quelques limitations connues, pour lesquelles nous travaillons à ajouter une prise en charge dans les prochains mois :

  1. Il n’existe actuellement aucun moyen de modifier les paramètres de segmentation, d’embedding ou de retrieval.

  2. Nous ne prenons pas en charge l’analyse des images dans les documents.

  3. Nous ne prenons pas en charge le retrieval sur des formats de fichiers structurés (comme les fichiers .csv ou .jsonl). Voir les types de fichiers pris en charge.

Quelles sont les limites de débit pour l’API Assistants ?

Les limites de débit de l’API Assistants ne sont pas liées au palier d’utilisation et au modèle. À la place, il existe des limites par défaut selon le type de requête, avec quelques exceptions :

  • GET : 1000 RPM

  • POST : 300 RPM

    • POST vers /v1/threads/<thread_id>/runs : 200 RPM

    • POST vers /v1/threads/runs : 200 RPM

  • DELETE : 300 requêtes par minute

Comment Code Interpreter est-il facturé dans l’API ?

Code Interpreter est facturé 0,03 $ / session. Si votre assistant appelle Code Interpreter simultanément dans deux threads différents, cela créera deux sessions Code Interpreter (2 * 0,03 $). Chaque session est active par défaut pendant une heure, ce qui signifie que vous ne paierez ces frais qu’une seule fois si votre utilisateur continue de donner des instructions à Code Interpreter dans le même thread pendant jusqu’à une heure.

Comment File Search est-il facturé dans l’API ?

File Search est facturé 0,10 $/Go de stockage de base vectorielle par jour (le premier Go de stockage est gratuit). La taille de la base vectorielle est basée sur la taille résultante une fois votre fichier analysé, segmenté et vectorisé (embedded).

Toutes les bases vectorielles créées avant le 17 avril 2024 seront gratuites jusqu’à la fin de 2024, après quoi elles seront soit :

  • Facturées aux tarifs en vigueur (actuellement 0,10 $/Go/jour) si elles ont été utilisées au moins une fois dans un Run créé après le 17 avril 2024.

  • Supprimées si elles n’ont été utilisées dans aucun Run entre le 17 avril 2024 et le 31 décembre 2024 — afin d’éviter que vous ne soyez facturé pour des bases vectorielles que vous auriez pu créer avant l’annonce de ce changement de tarification, mais jamais utilisées.

Y a-t-il une limite au nombre d’assistants que je peux créer ?

Il n’y a pas de limite au nombre d’assistants qu’une organisation peut créer.

Le streaming est-il disponible sur l’API ?

Oui, le streaming est disponible sur l’API Assistants.

Le mode JSON est-il disponible dans l’API Assistants ?

Oui, le mode JSON est disponible sur l’API Assistants via le paramètre response_format sur les objets Assistants ou Run.

L’API Assistants gérera-t-elle aussi les requêtes pour des appels de fonctions tiers ?

Non. Bien que l’appel de fonctions permette au modèle de sélectionner des outils et de formater des requêtes pour eux, l’exécution des appels vers des outils tiers n’est pas gérée par OpenAI.

Comment les données que j’envoie à OpenAI sont-elles traitées ?

Comme pour le reste de notre plateforme, les données et fichiers transmis à l’API OpenAI ne sont jamais utilisés pour entraîner nos modèles et vous pouvez supprimer vos données quand vous le souhaitez. Les données téléversées vers l’API Assistants sont stockées indéfiniment jusqu’à ce qu’un utilisateur les supprime manuellement.

DALL-E est-il disponible via l’API Assistants ?

Pour le moment, DALL-E n’est pas disponible.

Existe-t-il une interface utilisateur pour l’API Assistants ?

Vous pouvez consulter le Playground pour l’API Assistants. Assurez-vous d’être dans la vue Assistants dans la barre latérale gauche et d’utiliser un modèle compatible avec les outils que vous souhaitez activer.

Playground Assistants view editing MyQuickstartAssistant with gpt-3.5-turbo and Code interpreter enabled

Quelle est la limite de caractères pour les instructions de l’assistant dans l’API Assistants ?

Les instructions système que l’assistant utilise ont une longueur maximale de 256 000 caractères.

J’obtiens une erreur du type « The server had an error while processing your request. Sorry about that! You can retry your request, or contact us through our help center at help.openai.com if the error persists. » Que dois-je faire ?

Si vous obtenez cette erreur, cela peut signifier que votre prompt n’est pas correctement configuré. Si vous réessayez la requête et qu’elle échoue, voici quelques pistes à essayer :

  1. assurez-vous de restructurer votre prompt afin de traiter toute commande de type fonction comme une fonction

  2. ajoutez toutes les commandes de votre prompt en tant que fonction dans tools

Pourquoi mon outil File Search ne fonctionne-t-il pas bien ?

Lorsque vous utilisez l’outil File Search, nous recommandons de définir max_prompt_tokens à au moins 20 000. Pour des conversations plus longues ou des interactions multiples avec File Search, envisagez d’augmenter cette limite à 50 000, ou idéalement, de supprimer complètement les limites max_prompt_tokens afin d’obtenir les résultats de la meilleure qualité. En savoir plus ici.

Comment puis-je donner mon avis ?

Nous serions ravis de recueillir vos retours sur notre Forum développeurs, via le Centre d’aide à l’adresse help.openai.com, ou sur Twitter @OpenAIDevs.

Cet article vous a-t-il été utile ?