FAQ sull’API Assistants (v2)

A partire dall’11 marzo 2025, abbiamo rilasciato i componenti fondamentali della nostra nuova piattaforma Agents. Per i dettagli, consulta la documentazione API per la nostra Responses API, gli strumenti tra cui Web Search, File Search e Computer Use, nonché il nostro Agents SDK con Tracing. In base al tuo feedback sulla beta dell’API Assistants, abbiamo integrato miglioramenti chiave nella Responses API. Dopo aver raggiunto la piena parità di funzionalità, annunceremo un piano di deprecazione dell’API Assistants più avanti quest’anno, con una data di dismissione prevista nella prima metà del 2026.

Che cos’è l’API Assistants?

L’API Assistants consente agli sviluppatori di creare facilmente potenti assistenti AI all’interno delle proprie app. Questa API elimina la necessità di gestire la cronologia delle conversazioni e aggiunge l’accesso a strumenti ospitati da OpenAI come Code Interpreter e File Search. L’API supporta inoltre una chiamata di funzioni migliorata per strumenti di terze parti.

Posso ancora usare Assistants API v1 beta?

No. Dal 18 dicembre 2024, gli utenti non hanno più accesso alla versione v1 della beta dell’API Assistant. Attualmente supportiamo solo v2. Consulta questa guida alla migrazione per convertire le chiamate API da v1 a v2

Come posso accedervi?

L’API Assistants è disponibile per chiunque abbia un account API OpenAI, ma è deprecata e verrà rimossa ad agosto 2026. Per i nuovi progetti, usa invece la Responses API. Se usi già l’API Assistants, pianifica la migrazione alla Responses API. Puoi ancora accedere agli assistenti esistenti nell’Assistants Playground finché l’API rimane disponibile.

Che cos’è un assistente?

Un assistente rappresenta un’AI creata per uno scopo specifico che usa i modelli di OpenAI e può accedere ai file, mantenere thread persistenti e chiamare strumenti.

Che cos’è un thread?

Un thread è una sessione di conversazione tra un assistente e un utente. I thread semplificano lo sviluppo delle applicazioni archiviando la cronologia dei messaggi e troncandola quando la conversazione diventa troppo lunga per la lunghezza del contesto del modello.

Che cos’è lo strumento File Search?

Lo strumento `file_search` implementa diverse best practice di recupero pronte all’uso per aiutarti a estrarre i dati corretti dai tuoi file e arricchire le risposte del modello. Per maggiori informazioni, leggi la nostra documentazione per sviluppatori.

Per impostazione predefinita, lo strumento file_search usa le seguenti impostazioni:

Dimensione del chunk: 800 token
Sovrapposizione dei chunk: 400 token
Modello di embedding: `text-embedding-3-large` a 256 dimensioni
Numero massimo di chunk aggiunti al contesto: 20

Quali sono le restrizioni per il caricamento dei file?

Le restrizioni per il caricamento di un file sono:

512 MB per file
5 milioni di token per file
10.000 file per vector store
1 vector store per assistente
1 vector store per thread

Il limite di archiviazione complessivo per ogni progetto in un’organizzazione è di 100 GB.

Quali sono le limitazioni dello strumento File Search?

Abbiamo alcune limitazioni note per le quali stiamo lavorando ad aggiungere il supporto nei prossimi mesi:

Attualmente non è possibile modificare le impostazioni di chunking, embedding o recupero.
Non supportiamo l’analisi delle immagini all’interno dei documenti.
Non supportiamo i recuperi su formati di file strutturati (come file .csv o .jsonl). Consulta i tipi di file supportati.

Quali sono i limiti di richieste per l’API Assistants?

I limiti di richieste per l’API Assistants non sono legati al livello di utilizzo e al modello. Esistono invece limiti predefiniti per tipo di richiesta, con un paio di eccezioni:

GET: 1000 RPM
POST: 300 RPM

DELETE: 300 richieste al minuto

Qual è il prezzo di Code Interpreter nell’API?

Code Interpreter ha un prezzo di 0,03 $ per sessione. Se il tuo assistente chiama Code Interpreter contemporaneamente in due thread diversi, verranno create due sessioni di Code Interpreter (2 * 0,03 $). Ogni sessione è attiva per impostazione predefinita per un’ora; ciò significa che pagherai questa tariffa una sola volta se l’utente continua a inviare istruzioni a Code Interpreter nello stesso thread per un massimo di un’ora.

Qual è il prezzo di File Search nell’API?

File Search ha un prezzo di 0,10 $/GB di spazio di archiviazione del vector store al giorno (il primo GB di spazio è gratuito). La dimensione del vector store si basa sulla dimensione risultante del vector store dopo che il file è stato analizzato, suddiviso in chunk e sottoposto a embedding.

Tutti i vector store creati prima del 17 aprile 2024 saranno gratuiti fino alla fine del 2024, dopodiché saranno:

Fatturati alle tariffe correnti (attualmente 0,10 $/GB/giorno) se sono stati usati almeno una volta in un Run creato dopo il 17 aprile 2024.
Eliminati se non sono stati usati in alcun Run tra il 17 aprile 2024 e il 31 dicembre 2024: questo serve a evitare che ti vengano addebitati vector store che potresti aver creato prima dell’annuncio di questa modifica dei prezzi ma mai usato.

Esiste un limite al numero di assistenti che posso creare?

Non esiste un limite al numero di assistenti che un’organizzazione può creare.

Lo streaming è disponibile nell’API?

Sì, lo streaming è disponibile nell’API Assistants.

La modalità JSON è disponibile nell’API Assistants?

Sì, la modalità JSON è disponibile nell’API Assistants tramite il parametro response_format negli oggetti Assistants o Run.

L’API Assistants gestirà anche le richieste per chiamate di funzioni di terze parti?

No. Sebbene la chiamata di funzioni consenta al modello di selezionare strumenti e formattare le richieste per essi, l’esecuzione delle chiamate a strumenti di terze parti non è gestita da OpenAI.

Come vengono gestiti i dati che invio a OpenAI?

Come per il resto della nostra piattaforma, i dati e i file passati all’API OpenAI non vengono mai usati per addestrare i nostri modelli e puoi eliminare i tuoi dati ogni volta che lo richiedi. I dati caricati nell’API Assistants vengono archiviati a tempo indeterminato finché un utente non li elimina manualmente.

DALL-E è disponibile tramite l’API Assistants?

Al momento, DALL-E non è disponibile.

Esiste un’interfaccia utente per l’API Assistants?

Puoi consultare il Playground per l’API Assistants. Assicurati di essere nella vista Assistants nella barra laterale sinistra e di usare un modello compatibile con gli strumenti che desideri attivare.

Playground Assistants view editing MyQuickstartAssistant with gpt-3.5-turbo and Code interpreter enabled

Qual è il limite di caratteri per le istruzioni dell’assistente nell’API Assistants?

Il campo delle istruzioni dell’assistente ha una lunghezza massima di 256.000 caratteri.

Ricevo un errore come «Il server ha riscontrato un errore durante l’elaborazione della richiesta. Ci dispiace! Puoi riprovare la richiesta oppure contattarci tramite il nostro Centro assistenza all’indirizzo help.openai.com se l’errore persiste. » Cosa devo fare?

Se ricevi questo errore, potrebbe significare che il tuo prompt non è configurato correttamente. Se continui a riprovare la richiesta e questa non va a buon fine, ecco alcune cose da provare:

assicurati di ristrutturare il prompt in modo da trattare eventuali comandi simili a funzioni come funzioni
aggiungi eventuali comandi nel prompt come funzione a tools

Perché il mio strumento File Search non funziona bene?

Quando usi lo strumento File Search, consigliamo di impostare max_prompt_tokens su un valore non inferiore a 20.000. Per conversazioni più lunghe o più interazioni con File Search, valuta di aumentare questo limite a 50.000 oppure, idealmente, di rimuovere del tutto i limiti di max_prompt_tokens per ottenere risultati della massima qualità. Leggi di più qui.

Come posso fornire feedback?

Ci piacerebbe ricevere il tuo feedback sul nostro Forum per sviluppatori, tramite il Centro assistenza all’indirizzo help.openai.com oppure su Twitter @OpenAIDevs.