Wir glauben an eine verantwortungsvolle, iterative Entwicklung und Bereitstellung als Mittel, um sichere Künstliche Allgemeine Intelligenz zu erreichen. Wir führen umfangreiche Tests und Abmilderungsmaßnahmen in den Bereichen Sicherheit und Alignment durch, bevor wir ein Modell überhaupt der Öffentlichkeit zur Verfügung stellen. Außerdem verfügen wir über automatisierte und menschliche Systeme, die dabei helfen, problematische Inhalte zu erkennen, die in unseren Diensten für Einzelpersonen wie ChatGPT und GPTs erscheinen. Im Folgenden skizzieren wir einige dieser Maßnahmen.

ChatGPT und ImageGen

Wir verwenden automatisierte Tools, wie etwa eine interne Version unserer /moderations-API, um Inhalte (Prompt, Ausgaben, Uploads) zu erkennen, die schädlich sein oder gegen unsere Nutzungsrichtlinien verstoßen könnten. Wenn wir problematische Inhalte erkennen, warnen wir dich in der Regel, dass deine Inhalte möglicherweise gegen unsere Nutzungsrichtlinien verstoßen, oder wir hindern das Modell daran, auf deinen Prompt zu antworten. Wir können außerdem verhindern, dass der Chat mit dem problematischen Prompt oder der Ausgabe geteilt wird. In sehr wenigen Ausnahmefällen können wir dein Konto wegen schwerwiegenden Fehlverhaltens auch sperren.Wir nehmen auch Meldungen von Personen über problematische Inhalte auf ChatGPT entgegen. Wir verwenden eine Kombination aus automatisierten Systemen und einem geschulten Expertenteam, um diese Meldungen zu überprüfen.

ChatGPT: Wenn jemand einen Chat teilt, von dem du glaubst, dass er problematische Inhalte enthält, kannst du ihn auch bei uns melden.

Weitere Informationen dazu, wie du Inhalte direkt in ChatGPT melden kannst, findest du in diesem Artikel.

GPTs

Wir verwenden außerdem automatisierte Tools wie unsere /moderation API, um festzustellen, ob ein GPT potenziell problematisch ist. Wenn wir problematische Inhalte im Zusammenhang mit dem GPT feststellen, ergreifen wir Maßnahmen, z. B. indem wir verhindern, dass der GPT verbreitet wird. Der Builder kann die Konfiguration des GPT oder der API bearbeiten, um die problematischen Inhalte zu entfernen, oder über einen produktinternen Ablauf Einspruch gegen die Entscheidung einlegen. In sehr wenigen Ausnahmefällen können wir außerdem das Konto des Builders bei besonders schwerwiegendem Fehlverhalten sperren.Wir nehmen auch Meldungen von Personen zu problematischen GPTs entgegen. Wenn du einen GPT siehst, von dem du glaubst, dass er gegen unsere Nutzungsrichtlinien verstößt oder anderweitig problematische Inhalte widerspiegelt, kannst du ihn auch uns melden. Wir verwenden eine Kombination aus automatisierten Systemen und einem geschulten Expertenteam, um diese Meldungen zu überprüfen.

Wie wir problematische Inhalte in unseren Diensten für Privatpersonen erkennen

ChatGPT und ImageGen

GPTs

War dieser Artikel hilfreich?