Assistants API (v2) – FAQ | OpenAI Help Center

Am 11. März 2025 haben wir die Bausteine unserer neuen Agents-Plattform veröffentlicht. Weitere Informationen findest du in unserer API-Dokumentation zur Responses API, zu Tools wie Web Search, File Search und Computer Use sowie zu unserem Agents SDK mit Tracing. Auf Grundlage deines Feedbacks zur Beta der Assistants API haben wir wichtige Verbesserungen in die Responses API integriert. Sobald vollständige Funktionsgleichheit erreicht ist, kündigen wir später in diesem Jahr einen Plan zur Einstellung der Assistants API an, mit dem Ziel, sie in der ersten Hälfte des Jahres 2026 abzuschalten.

Was ist die Assistants API?

Mit der Assistants API können Entwickler:innen auf einfache Weise leistungsstarke AI-Assistants in ihren Apps erstellen. Diese API nimmt dir die Verwaltung des Unterhaltungsverlaufs ab und bietet Zugriff auf von OpenAI gehostete Tools wie Code Interpreter und File Search. Die API unterstützt außerdem verbesserten Funktionsaufruf für Drittanbieter-Tools.

Kann ich die Assistants API v1 beta weiterhin verwenden?

Nein. Seit dem 18. Dezember 2024 haben Nutzer:innen keinen Zugriff mehr auf die Version v1 der Assistant API beta. Wir unterstützen derzeit nur v2. Sieh dir bitte diesen Migrationsleitfaden an, um deine API-Aufrufe von v1 auf v2 umzustellen.

Wie greife ich darauf zu?

Die Assistants API ist für alle mit einem OpenAI-API-Konto verfügbar, ist jedoch veraltet und wird im August 2026 entfernt. Verwende für neue Projekte stattdessen die Responses API. Wenn du die Assistants API bereits verwendest, plane deine Migration zur Responses API. Du kannst weiterhin im Assistants Playground auf bestehende Assistants zugreifen, solange die API verfügbar bleibt.

Was ist ein Assistant?

Ein Assistant ist eine speziell entwickelte AI, die OpenAIs Modelle nutzt, auf Dateien zugreifen, persistente Threads verwalten und Tools aufrufen kann.

Was ist ein Thread?

Ein Thread ist eine Unterhaltungssitzung zwischen einem Assistant und einer nutzenden Person. Threads vereinfachen die Anwendungsentwicklung, indem sie den Nachrichtenverlauf speichern und kürzen, wenn die Unterhaltung für die Kontextlänge des Modells zu lang wird.

Was ist das File-Search-Tool?

Das Tool `file_search` implementiert mehrere bewährte Retrieval-Verfahren direkt mit, damit du die richtigen Daten aus deinen Dateien extrahieren und die Antworten des Modells damit erweitern kannst. Weitere Informationen findest du in unserer Entwicklerdokumentation.

Standardmäßig verwendet das file_search-Tool die folgenden Einstellungen:

Chunk-Größe: 800 Token
Chunk-Überlappung: 400 Token
Embedding-Modell: `text-embedding-3-large` mit 256 Dimensionen
Maximale Anzahl von Chunks, die dem Kontext hinzugefügt werden: 20

Welche Einschränkungen gelten für Datei-Uploads?

Für das Hochladen einer Datei gelten folgende Einschränkungen:

512 MB pro Datei
5 Mio. Token pro Datei
10.000 Dateien pro Vektorspeicher
1 Vektorspeicher pro Assistant
1 Vektorspeicher pro Thread

Das gesamte Speicherlimit pro Projekt in einer Organisation beträgt 100 GB.

Welche Einschränkungen hat das File-Search-Tool?

Es gibt einige bekannte Einschränkungen, an deren Unterstützung wir in den kommenden Monaten arbeiten:

Derzeit gibt es keine Möglichkeit, die Einstellungen für Chunking, Einbettung oder Retrieval zu ändern.
Das Parsen von Bildern innerhalb von Dokumenten wird nicht unterstützt.
Retrievals über strukturierte Dateiformate wie .csv- oder .jsonl-Dateien werden nicht unterstützt. Sieh dir die unterstützten Dateitypen an.

Welche Ratenlimits gelten für die Assistants API?

Die Ratenlimits für die Assistants API sind nicht an Nutzungsstufe und Modell gebunden. Stattdessen gelten Standardlimits je Anfragetyp, mit einigen Ausnahmen:

GET: 1000 RPM
POST: 300 RPM

DELETE: 300 Anfragen pro Minute

Wie wird Code Interpreter in der API abgerechnet?

Code Interpreter kostet 0,03 $ pro Sitzung. Wenn dein Assistant Code Interpreter gleichzeitig in zwei verschiedenen Threads aufruft, entstehen dadurch zwei Code-Interpreter-Sitzungen (2 * 0,03 $). Jede Sitzung ist standardmäßig eine Stunde aktiv. Das bedeutet, dass du diese Gebühr nur einmal zahlst, wenn dein:e Nutzer:in Code Interpreter im selben Thread bis zu einer Stunde lang weiter Anweisungen gibt.

Wie wird File Search in der API abgerechnet?

File Search kostet 0,10 $/GB Vektorspeicher pro Tag; das erste GB Speicher ist kostenlos. Die Größe des Vektorspeichers basiert auf der resultierenden Größe des Vektorspeichers, nachdem deine Datei geparst, in Chunks aufgeteilt und eingebettet wurde.

Alle Vektorspeicher, die vor dem 17. April 2024 erstellt wurden, bleiben bis Ende 2024 kostenlos. Danach werden sie entweder:

Zu den aktuellen Preisen abgerechnet (derzeit 0,10 $/GB/Tag), wenn sie mindestens einmal in einem Run verwendet wurden, der nach dem 17. April 2024 erstellt wurde.
Gelöscht, wenn sie zwischen dem 17. April 2024 und dem 31. Dezember 2024 in keinem einzigen Run verwendet wurden – so vermeiden wir, dass dir Vektorspeicher berechnet werden, die du möglicherweise vor der Ankündigung dieser Preisänderung erstellt, aber nie genutzt hast.

Gibt es eine Begrenzung dafür, wie viele Assistants ich erstellen kann?

Es gibt keine Begrenzung dafür, wie viele Assistants eine Organisation erstellen kann.

Ist Streaming in der API verfügbar?

Ja, Streaming ist in der Assistants API verfügbar.

Ist der JSON-Modus in der Assistants API verfügbar?

Ja, der JSON-Modus ist in der Assistants API über den Parameter response_format für Assistants- oder Run-Objekte verfügbar.

Verwaltet die Assistants API auch Anfragen für Funktionsaufrufe an Drittanbieter?

Nein. Funktionsaufruf ermöglicht dem Modell zwar, Tools auszuwählen und Anfragen dafür zu formatieren, die Ausführung von Aufrufen an Drittanbieter-Tools wird jedoch nicht von OpenAI verwaltet.

Wie werden die Daten behandelt, die ich an OpenAI sende?

Wie auf unserer übrigen Plattform werden Daten und Dateien, die an die OpenAI API übergeben werden, niemals zum Trainieren unserer Modelle verwendet. Du kannst deine Daten jederzeit löschen. Die in die Assistants API hochgeladenen Daten werden unbegrenzt gespeichert, bis sie von einer nutzenden Person manuell gelöscht werden.

Ist DALL-E über die Assistants API verfügbar?

Derzeit ist DALL-E nicht verfügbar.

Gibt es eine Benutzeroberfläche für die Assistants API?

Du kannst dir den Playground für die Assistants API ansehen. Achte darauf, dass du in der linken Seitenleiste die Ansicht Assistants geöffnet hast und ein Modell verwendest, das mit den Tools kompatibel ist, die du aktivieren möchtest.

Playground Assistants view editing MyQuickstartAssistant with gpt-3.5-turbo and Code interpreter enabled

Welche Zeichenbegrenzung gilt für Assistant-Anweisungen in der Assistants API?

Das Feld für Assistant-Anweisungen hat eine maximale Länge von 256.000 Zeichen.

Ich erhalte eine Fehlermeldung wie „Beim Verarbeiten deiner Anfrage ist auf dem Server ein Fehler aufgetreten. Entschuldige bitte! Du kannst deine Anfrage erneut versuchen oder uns über unser Hilfecenter unter help.openai.com kontaktieren, wenn der Fehler weiterhin auftritt. “ Was soll ich tun?

Wenn du diese Fehlermeldung erhältst, kann das bedeuten, dass dein Prompt nicht korrekt eingerichtet ist. Wenn du die Anfrage wiederholt versuchst und sie weiterhin fehlschlägt, probiere Folgendes aus:

Strukturiere deinen Prompt so um, dass funktionsähnliche Befehle als Funktionen behandelt werden.
Füge alle Befehle in deinem Prompt als Funktion zu tools hinzu.

Warum funktioniert mein File-Search-Tool nicht gut?

Bei der Verwendung des File-Search-Tools empfehlen wir, max_prompt_tokens auf mindestens 20.000 festzulegen. Bei längeren Unterhaltungen oder mehreren Interaktionen mit File Search solltest du dieses Limit auf 50.000 erhöhen oder es idealerweise ganz entfernen, um Ergebnisse in höchster Qualität zu erhalten. Lies hier mehr dazu.

Wie kann ich Feedback geben?

Wir freuen uns über dein Feedback in unserem Developer Forum, über das Hilfecenter unter help.openai.com oder auf Twitter unter @OpenAIDevs.

Assistants API (v2) – FAQ