Wir glauben an eine verantwortungsvolle, iterative Entwicklung und Bereitstellung als Weg zu sicherer künstlicher allgemeiner Intelligenz. Bevor wir ein Modell überhaupt öffentlich bereitstellen, führen wir umfangreiche Sicherheits- und Alignment-Tests sowie Risikominderungsmaßnahmen durch. Außerdem verfügen wir über automatisierte und menschliche Systeme, die dabei helfen, problematische Inhalte zu erkennen, die in unseren Diensten für Einzelpersonen wie ChatGPT und GPTs auftauchen. Einige dieser Maßnahmen beschreiben wir im Folgenden.
ChatGPT, ImageGen und SORA
Wir nutzen automatisierte Tools, etwa eine interne Version unserer /moderations API, um Inhalte (Prompts, Vervollständigungen, Uploads) zu erkennen, die schädlich sein könnten oder gegen unsere Nutzungsrichtlinien verstoßen. Wenn wir problematische Inhalte erkennen, warnen wir dich in der Regel entweder, dass deine Inhalte gegen unsere Nutzungsrichtlinien verstoßen könnten, oder wir verhindern, dass das Modell auf deinen Prompt antwortet. Wir können außerdem verhindern, dass der Chat mit dem problematischen Prompt oder der problematischen Vervollständigung geteilt wird. In sehr begrenzten Ausnahmefällen können wir dein Konto bei besonders schwerwiegendem Fehlverhalten auch sperren.
Wir nehmen auch Meldungen von Menschen zu problematischen Inhalten in ChatGPT und SORA entgegen. Zur Prüfung dieser Meldungen nutzen wir eine Kombination aus automatisierten Systemen und einem geschulten Expertenteam.
ChatGPT: Wenn jemand einen Chat teilt, von dem du glaubst, dass er problematische Inhalte enthält, kannst du ihn auch bei uns melden.
SORA: Wenn du in deinem Feed ein Video oder Bild siehst, von dem du glaubst, dass es problematische Inhalte enthält, kannst du es bei uns melden.
Weitere Details dazu, wie du Inhalte direkt in ChatGPT oder SORA melden kannst, findest du in diesem Artikel.
GPTs
Wir nutzen außerdem automatisierte Tools wie unsere /moderation API, um zu prüfen, ob ein GPT potenziell problematisch ist. Wenn wir problematische Inhalte im Zusammenhang mit dem GPT feststellen, ergreifen wir Maßnahmen, z. B. indem wir verhindern, dass er verteilt wird. Der Builder kann die Konfiguration des GPT oder der API bearbeiten, um die problematischen Inhalte zu entfernen, oder die Entscheidung über einen In-Product-Prozess anfechten. In sehr begrenzten Ausnahmefällen können wir das Konto des Builders bei besonders schwerwiegendem Fehlverhalten auch sperren.
Wir nehmen auch Meldungen von Menschen zu problematischen GPTs entgegen. Wenn du einen GPT siehst, von dem du glaubst, dass er gegen unsere Nutzungsrichtlinien verstößt oder anderweitig problematische Inhalte widerspiegelt, kannst du ihn auch bei uns melden. Zur Prüfung dieser Meldungen nutzen wir eine Kombination aus automatisierten Systemen und einem geschulten Expertenteam.
