OpenAI
Тази страница е машинно преведена. Вижте оригиналната статия на английски език.

Оптимизиране на латентността с API моделите на OpenAI

Научете кои фактори влияят на времето за отговор

Актуализирано: 9 days ago

Латентността на заявка за генериране на отговор се влияе най-вече от два фактора: модела и броя генерирани токени. Моля, прочетете актуализираната ни документация за насоки относно подобряване на латентността.

Беше ли Ви полезна тази статия?