Wierzymy w odpowiedzialny, iteracyjny rozwój i wdrażanie jako sposób na osiągnięcie bezpiecznej ogólnej sztucznej inteligencji. Przed udostępnieniem modelu publicznie prowadzimy szeroko zakrojone testy bezpieczeństwa i zgodności oraz działania ograniczające ryzyko, a także stosujemy zautomatyzowane systemy i wsparcie ludzi, aby wykrywać problematyczne treści pojawiające się w naszych usługach dla użytkowników indywidualnych, takich jak ChatGPT i GPTs. Poniżej opisujemy część tych działań.
ChatGPT, ImageGen i SORA
Używamy zautomatyzowanych narzędzi, takich jak wewnętrzna wersja naszego API /moderations, do wykrywania treści (poleceń, odpowiedzi, przesłanych plików), które mogą być szkodliwe lub naruszać nasze Zasady użytkowania. Jeśli wykryjemy problematyczne treści, zazwyczaj albo ostrzeżemy Cię, że Twoje treści mogą naruszać nasze zasady użytkowania, albo zablokujemy modelowi odpowiedź na Twoje polecenie. Możemy też uniemożliwić udostępnienie czatu zawierającego problematyczne polecenie lub odpowiedź. W bardzo ograniczonym zakresie okoliczności możemy również zablokować Twoje konto za rażące naruszenia.
Przyjmujemy również zgłoszenia od ludzi dotyczące problematycznych treści w ChatGPT i SORA. Do ich weryfikacji używamy połączenia zautomatyzowanych systemów i przeszkolonego zespołu ekspertów.
ChatGPT: Jeśli ktoś udostępni czat, który Twoim zdaniem zawiera problematyczne treści, możesz także zgłosić go nam.
SORA: Jeśli widzisz film lub obraz w swoim feedzie, który Twoim zdaniem zawiera problematyczne treści, możesz zgłosić to nam.
Aby uzyskać więcej informacji o zgłaszaniu treści bezpośrednio w ChatGPT lub SORA, zobacz ten artykuł.
GPTs
Używamy również zautomatyzowanych narzędzi, takich jak nasze API /moderation, aby sprawdzić, czy GPT jest potencjalnie problematyczny. Jeśli wykryjemy problematyczne treści powiązane z GPT, podejmiemy działania, na przykład uniemożliwimy jego dystrybucję. Twórca może edytować konfigurację GPT lub API, aby usunąć problematyczne treści, albo odwołać się od decyzji za pośrednictwem odpowiedniego procesu w produkcie. W bardzo ograniczonym zakresie okoliczności możemy również zablokować konto twórcy za rażące naruszenia.
Przyjmujemy również zgłoszenia od ludzi dotyczące problematycznych GPT. Jeśli widzisz GPT, który Twoim zdaniem narusza nasze zasady użytkowania lub w inny sposób zawiera problematyczne treści, możesz także zgłosić go nam. Do weryfikacji tych zgłoszeń używamy połączenia zautomatyzowanych systemów i przeszkolonego zespołu ekspertów.
