Playgroundを使ってテキストを生成すると、潜在的にセンシティブまたは不安全な出力を検出しやすくするために、内容はOpenAIのモデレーションシステムによって自動的にチェックされます。
これにより、安全な出力の一部が、まれに不安全だと誤判定されることがあります。
これは本当に有害なコンテンツを見逃すリスクを減らすのに役立つ一方で、 誤検知(false positive)が発生する場合があります。
出力が誤判定された場合の対処
Playgroundが安全な出力を誤ってフラグ付けしたと思われる場合は、次を行ってください。
モデレーション警告の横にある低評価(サムズダウン)アイコンをクリックします。
必要に応じて任意のフィードバックを追加します。
慎重さを優先する理由
モデレーションシステムは、有害なコンテンツを見逃す可能性を最小化するように調整されています。
本当に不安全な応答を見逃すよりも、多めに検知するほうが望ましいためです。
