OpenAI
Ez az oldal gépi fordítással készült. Tekintsd meg az eredeti angol nyelvű cikket.

API-hibák és késleltetés hibaelhárítása

Ez a cikk bemutatja, hogyan használhatók a Service Health és a Usage irányítópultok a gyakori hibák és késleltetési problémák elhárítására az OpenAI API használata során.

Frissítve: 7 days ago

Fontos hivatkozások

Kezdje a megfelelő alapértelmezésekkel

Amikor megnyitja a Service Health irányítópultot, az alapértelmezés szerint ezt mutatja:

  • Minden projekt

  • Az elmúlt 30 nap

  • Óránkénti felbontás

Ez a nézet csak tájékozódásra hasznos. Az érdemi hibaelhárításhoz mindig szűrés szükséges.

Szűrés a vizsgálat előtt

A helyes szűrés a legfontosabb lépés. A legtöbb félreértelmezés modellek, szintek vagy projektek keveréséből adódik.

Szűrés modell szerint (egyszerre egyre)

Mindig egyetlen modellre szűrjön.

Miért:

  • Az alacsony forgalmú modellek problémáit elfedheti a nagyobb volumenű forgalom

  • A nagy volumenű modellek miatt a helyi problémák globálisnak tűnhetnek

  • A különböző modelleknek eltérő teljesítménycéljaik vannak

Megjegyzés: több modell kiválasztása összesíti őket — nem vált közöttük.

Szűrés szolgáltatási szint szerint

Ha egynél több szintet használ (standard, prioritási, skálázási), mindig arra a szintre szűrjön, amelyet vizsgál.

Miért:

  • A szintek eltérő teljesítményjellemzőkkel rendelkeznek

  • A prioritási és skálázási szintek meghatározott SLA-kkal rendelkeznek

  • A szintek keverése elfedi a fizetős szint teljesítményét

Ez különösen fontos a késleltetéselemzésnél.

Szűrés projekt szerint

Alapértelmezés szerint a Service Health minden projektet megjelenít.

Hibaelhárításhoz szűrjön arra a projektre vagy projektekre, ahol a problémát észlelték.

Miért:

  • Egyetlen nagy volumenű projekt dominálhatja a metrikákat.

  • A kisebb érintett projekteket elfedheti a nem kapcsolódó forgalom.

Csak akkor hagyja kiválasztva a „Minden projekt” lehetőséget, ha úgy véli, hogy a probléma valóban az egész szervezetet érinti.

Hibák elhárítása

A HTTP-kérések nézet használata

Hibák vizsgálatához:

  1. Szűrjön modell és szolgáltatási szint szerint.

  2. Nyissa meg a HTTP Requests lapot az Uptime lap helyett.

Ez a nézet a kérések teljes számát és a hibaszámokat mutatja HTTP-állapotkód szerint. Nagyítson percszintű felbontásra a részletes kiugrások vagy változások azonosításához.

Hibaarányokat értelmezzen, ne darabszámokat

Bármely éles rendszerben várhatók hibák. A nyers összesítések helyett a hibák százalékos arányára összpontosítson.

Minél nagyobb a teljes volumene, annál nagyobb lehet a hibák száma még rendkívül alacsony hibaarány mellett is.

Amikor a hibák hiányoznak a Service Healthből

Ha ügyféloldali hibákat lát, de nincs megfelelő adat a Service Healthben:

  • A kérések valószínűleg nem érték el az OpenAI-t.

  • A probléma általában upstream oldalon van (időtúllépések, proxyk, hálózatkezelés).

Ez gyakori agresszív ügyféloldali időtúllépések esetén.

Késleltetés elhárítása

A késleltetéselemzés a meghatározott SLA-kkal rendelkező prioritási és skálázási szinteken a legértelmesebb. A standard szint nagyobb késleltetési ingadozást mutathat, és nincs garantált késleltetése.

Fő metrikák

Az egyes metrikák megtekintéséhez kattintson a megfelelő lapra:

  • Tokensebesség: Másodpercenként generált tokenek; független az utasítás méretétől.

  • Kérés időtartama: A kérés teljes időtartama; erősen befolyásolja a kimenet mérete és az érvelés.

  • Első tokenig eltelt idő (TTFT): Az első token generálásáig eltelt idő; erősen befolyásolja a nem gyorsítótárazott bemeneti utasítás mérete és az érvelés.

Mindig tekintse át a P50 / P75 / P95 percentiliseket. Az átlagok elfedhetik a valós felhasználói hatást.

6. A késleltetés korrelálása a tokenhasználattal

A Service Health megmutatja, mikor változott a viselkedés. A használati adatok segítenek megmagyarázni, miért.

A Használati irányítópulton tegye a következőket, hogy biztosan a Service Health irányítópulton látható nézethez releváns adatokat nézze:

  • Szűrjön ugyanarra a projektre és modellre.

  • Csoportosítson szolgáltatási szint szerint, ha alkalmazható.

  • Összpontosítson a kimeneti tokenekre, amelyek a leginkább befolyásolják a késleltetést.

Mélyebb elemzéshez exportálja az Activity Data adatokat, és vizsgálja meg a kérésenkénti tokeneket időben.

7. Mit osszon meg az ügyfélszolgálattal (ha szükséges)

Ha kapcsolatba lép az ügyfélszolgálattal, adja meg:

  • Érintett szervezeti azonosítók (fontos)

  • Érintett végpontok, például Chat Completions vagy Responses (fontos)

  • Érintett modellek (fontos)

  • Hogy ez Skálázási vagy prioritási szinten történik-e (fontos)

  • Időtartományok időzónával a késleltetéshez vagy hibákhoz (fontos)

  • Releváns x-request-id vagy X-Client-Request-Id, ha rendelkezésre áll

  • Időbélyegek időzónával, vagy legalább a dátum a megadott kérésekhez

Ha rendelkezésre áll, ezt is adja meg:

  • A kérésekhez kapcsolódó projektazonosító

  • Érintettek-e az adatok tárolási helyére vonatkozó kérések, és melyek azok

  • Az Ön által látott trendek leírása

A probléma típusához adja meg:

  • Hibák: A sikertelen vagy hibát adó kérések hozzávetőleges százaléka, válaszkódok, hibaüzenetek, valamint hogy mennyi ideig tartott a hibaválasz megérkezése.

  • Késleltetés: Mely percentilisek érintettek (P50 / P90 / P95 / P99), mennyivel magasabbak az ügyfél alapértékéhez képest, valamint lassú kérések példái küldési és fogadási időbélyegekkel.

  • Mindkettő: Képernyőképek vagy táblázat hiba- vagy késleltetési adatokról, valamint hogyan állapította meg, hogy a hibaarányok vagy a késleltetés a vártnál magasabbak voltak.

Gyakori hibaelhárítási forgatókönyvek

Időtúllépések történnek, de a Service Health normálisnak tűnik

Lehetséges ok: a kérések időtúllépés miatt megszakadnak, mielőtt elérnék az OpenAI-t.

Ellenőrizze:

  • Ügyfél- vagy proxyoldali időtúllépési beállítások

  • Helyi hálózati vagy terheléselosztói változások

  • 499-es hibák jelenléte a Service Health irányítópulton (ezek a saját rendszereiben 5xx hibaként jelenhetnek meg).

A késleltetés telepítés nélkül nőtt

Lehetséges ok: nőtt a kimeneti tokenek mérete vagy az érvelés használata, illetve a forgalom a szolgáltatási szintek között eltolódott.

Ellenőrizze:

  • Kérésenkénti átlagos kimeneti tokenek a Használati irányítópulton (az adatok letöltése, majd a kimeneti tokenek összes kéréssel való elosztása szükséges).

  • A Request Time és TTFT percentilisek a Service Health irányítópulton.

A prioritási vagy Skálázási szint lassúnak tűnik

Lehetséges ok: a metrikák több szint adatait keverik, így a standard szintű forgalom elfedi a fizetős szint teljesítményét.

Ellenőrizze:

  • A szűrők egyetlen szintre és modellre vannak korlátozva.

  • Tokensebesség összehasonlítása a szintek között.

5XX hibák hirtelen megugrása

Valószínű ok: átmeneti hibák, amelyek a forgalom kis százalékát érintik.

Ellenőrizze:

  • Hibaarány százaléka

  • Változott-e ugyanakkor a forgalom volumene

A probléma csak egy projektet érint

Valószínű ok: projektspecifikus konfiguráció vagy használati minta.

Ellenőrizze:

  • Projektszintű szűrés

  • Összehasonlítás a nem érintett projektekkel

Végső tanulságok

  • A metrikák értelmezése előtt szükség szerint szűrjön modellre, szintre és projektre.

  • Késleltetéselemzéshez percentiliseket használjon, ne átlagokat.

  • Kis hibaarányok várhatók.

  • A hiányzó adatok általában upstream problémákra utalnak.

  • A használati adatok segíthetnek megmagyarázni, miért változott a késleltetés; a Service Health azt mutatja, mikor változott a viselkedés.

Hasznos volt ez a cikk?