OpenAI
Тази страница е машинно преведена. Вижте оригиналната статия на английски език.

Оптимизиране на латентността с API моделите на OpenAI

Научете кои фактори влияят на времето за отговор

Актуализирано: 15 days ago

Латентността на заявка за завършване се влияе главно от два фактора: моделът и броят генерирани токени. Моля, прочетете актуализираната ни документация за насоки за подобряване на латентността.

Беше ли Ви полезна тази статия?