Se a sua temperature estiver definida acima de 0, o modelo vai gerar saídas com alguma aleatoriedade, então é esperado ver completions diferentes. Quando você quiser resultados consistentes e repetíveis, use temperature = 0.
Se a temperature já estiver em 0 e os resultados ainda forem diferentes, estas são as causas mais comuns:
Diferenças no prompt
Verifique se o prompt é exatamente o mesmo nos dois ambientes. Até um único espaço a mais, uma quebra de linha ou um caractere oculto pode causar uma saída diferente.
Incompatibilidade de parâmetros
Garanta que todos os parâmetros relevantes estejam iguais entre o Playground e as requisições da API:
temperaturetop_pmax_tokensfrequency_penaltypresence_penalty
Confirme também que o nome do modelo é idêntico. Modelos diferentes naturalmente vão produzir saídas diferentes, mesmo com o mesmo prompt e as mesmas configurações.
Predefinições do Playground vs. padrões da API
O Playground pode aplicar algumas configurações padrão. Na API, se você omitir um parâmetro, ela usará o próprio padrão, que pode não corresponder ao comportamento do Playground. Para garantir consistência, defina explicitamente todos os parâmetros na sua requisição à API.
Diferenças de formatação ou codificação
Garanta que a requisição que você envia para a API seja idêntica ao prompt no Playground. Diferenças podem ocorrer por causa de:
Escapamento de JSON
Finais de linha ou indentação
Espaços em branco extras
Se você já conferiu tudo isso e ainda está vendo discrepâncias, peça ajuda no Fórum da Comunidade, onde usuários podem ter passado por problemas parecidos ou podem ajudar a investigar o seu caso específico.
