OpenAI
このページは機械翻訳されています。元の英語の記事を表示

Playground の出力が安全でないと誤分類される理由

Playground の出力が安全でないと誤ってフラグ付けされることがある理由と、誤分類を報告する方法をご確認ください。

更新日: 9 days ago

Playground を使ってテキストを生成すると、そのコンテンツは、潜在的にセンシティブまたは安全でない出力の検出に役立てるため、OpenAI のモデレーションシステムによって自動的にチェックされます。

つまり、安全な出力の一部が、ときどき安全でないものとして誤分類される場合があります。これにより、真に有害なコンテンツを見逃すリスクを減らせますが、誤検出につながる可能性があります。

出力が誤分類された場合の対処

Playground が安全な出力を誤ってフラグ付けしたと思われる場合:

  • モデレーション警告の横にある低評価アイコンをクリックします。

  • 必要に応じて、任意のフィードバックを入力します。

慎重さを優先する理由

  • モデレーションシステムは、有害なコンテンツを見逃す可能性を最小限に抑えるよう調整されています。

  • 真に危険な応答を見逃すよりも、多めに検出するほうがよいと考えています。

この記事は役に立ちましたか?