Playground を使ってテキストを生成すると、そのコンテンツは、潜在的にセンシティブまたは安全でない出力の検出に役立てるため、OpenAI のモデレーションシステムによって自動的にチェックされます。
つまり、安全な出力の一部が、ときどき安全でないものとして誤分類される場合があります。これにより、真に有害なコンテンツを見逃すリスクを減らせますが、誤検出につながる可能性があります。
出力が誤分類された場合の対処
Playground が安全な出力を誤ってフラグ付けしたと思われる場合:
モデレーション警告の横にある低評価アイコンをクリックします。
必要に応じて、任意のフィードバックを入力します。
慎重さを優先する理由
モデレーションシステムは、有害なコンテンツを見逃す可能性を最小限に抑えるよう調整されています。
真に危険な応答を見逃すよりも、多めに検出するほうがよいと考えています。
