OpenAI
Тази страница е машинно преведена. Вижте оригиналната статия на английски език.

Как идентифицираме проблемно съдържание в услугите ни за физически лица

Актуализирано: 13 days ago

Вярваме в отговорното, поетапно разработване и внедряване като средство за постигане на безопасен изкуствен общ интелект. Извършваме значителен обем тестове и мерки за ограничаване в областта на безопасността и съгласуваността, преди изобщо да пуснем даден модел за обществено ползване, а също така разполагаме с автоматизирани и човешки системи, които помагат да се открива проблемно съдържание, появяващо се в нашите услуги за физически лица като ChatGPT и GPTs. По-долу описваме част от тези усилия.

ChatGPT, ImageGen и SORA

Използваме автоматизирани инструменти, като вътрешна версия на нашия /moderations API, за да откриваме съдържание (подкани, завършвания, качени файлове), което може да е вредно или да нарушава нашите Политики за използване. Ако открием проблемно съдържание, обикновено или ще ви предупредим, че съдържанието ви може да нарушава нашите политики за използване, или ще блокираме модела да отговори на вашата подкана. Може също така да предотвратим споделянето на чата с проблемната подкана или завършване. При много ограничен набор от обстоятелства може също да забраним акаунта ви за особено тежко поведение.

Приемаме и сигнали от хора за проблемно съдържание в ChatGPT и SORA. Използваме комбинация от автоматизирани системи и обучен екип от експерти, за да преглеждаме тези сигнали.

  • ChatGPT: Ако някой сподели чат, който според вас съдържа проблемно съдържание, можете също да ни го съобщите.

  • SORA: Ако видите видео или изображение в своя feed, което според вас съдържа проблемно съдържание, можете да ни го съобщите.

За повече подробности относно това как да съобщавате съдържание директно в ChatGPT или SORA, вижте тази статия.

GPTs

Използваме също автоматизирани инструменти като нашия /moderation API, за да проверим дали даден GPT е потенциално проблемен. Ако открием проблемно съдържание, свързано с GPT, ще предприемем действия, като например да предотвратим разпространението му. Създателят може да редактира конфигурацията на GPT или API, за да премахне проблемното съдържание, или да обжалва решението чрез поток в продукта. При много ограничен набор от обстоятелства може също да забраним акаунта на създателя за особено тежко поведение.

Приемаме и сигнали от хора за проблемни GPTs. Ако видите GPT, който според вас нарушава нашите политики за използване или по друг начин отразява проблемно съдържание, можете също да ни го съобщите. Използваме комбинация от автоматизирани системи и обучен екип от експерти, за да преглеждаме тези сигнали.

Беше ли Ви полезна тази статия?