Las secuencias de detención se usan para hacer que el modelo deje de generar tokens en un punto deseado, como el final de una oración o de una lista. Con la API para completar chats, puedes especificar el parámetro stop y pasar la secuencia. La respuesta del modelo no contendrá la secuencia de detención, y puedes pasar hasta cuatro secuencias de detención.
Ejemplo simple:
En este ejemplo de chat simple, se usa una secuencia de detención: la palabra “world”. El mensaje del sistema y el mensaje del usuario están diseñados para intentar que el modelo genere “Hello world”; cuando el texto generado llega a la secuencia de detención exacta “world”, la respuesta se detiene antes de incluir esa secuencia de detención, por lo que la salida devuelta es el texto anterior a “world” (que se muestra como “Hello” en el playground).
Puedes explorar otros ejemplos de secuencias de detención con el playground de chat de OpenAI.
