Вярваме в отговорното, итеративно разработване и внедряване като средство за постигане на безопасен изкуствен общ интелект. Извършваме значителен обем тестове и смекчаване във връзка с безопасността и съгласуването, преди изобщо да пуснем модел за обществеността, а също така разполагаме с автоматизирани и човешки системи, които помагат за откриването на проблемно съдържание, появяващо се в нашите услуги за физически лица, като ChatGPT и GPTs. По-долу очертаваме някои от тези усилия.

ChatGPT и ImageGen

Използваме автоматизирани инструменти, като например вътрешна версия на нашия /moderations API, за да откриваме съдържание (подкани, завършвания, качени файлове), което може да е вредно или да нарушава нашите Правила за използване. Ако открием проблемно съдържание, обикновено или ще ви предупредим, че съдържанието ви може да нарушава нашите правила за използване, или ще блокираме модела да отговори на вашата подкана. Може също да предотвратим споделянето на чата с проблемната подкана или завършване. В много ограничен набор от обстоятелства може също да забраним акаунта ви заради особено тежко поведение.

Приемаме и сигнали от хора за проблемно съдържание в ChatGPT. Използваме комбинация от автоматизирани системи и обучен екип от експерти, за да преглеждаме тези сигнали.

ChatGPT: Ако някой сподели чат, за който смятате, че съдържа проблемно съдържание, можете също да ни го докладвате.

За повече подробности как да докладвате съдържание директно в ChatGPT, вижте тази статия.

GPTs

Използваме и автоматизирани инструменти, като нашия /moderation API, за да проверим дали даден GPT е потенциално проблемен. Ако открием проблемно съдържание, свързано с GPT, ще предприемем действия, като например да предотвратим разпространението му. Създателят може да редактира конфигурацията на GPT или API, за да премахне проблемното съдържание, или да обжалва решението чрез процес в продукта. В много ограничен набор от обстоятелства може също да забраним акаунта на създателя заради особено тежко поведение.

Приемаме и сигнали от хора за проблемни GPTs. Ако видите GPT, за който смятате, че нарушава нашите правила за използване или по друг начин отразява проблемно съдържание, можете също да ни го докладвате. Използваме комбинация от автоматизирани системи и обучен екип от експерти, за да преглеждаме тези сигнали.

Как идентифицираме проблемно съдържание в услугите ни за физически лица

ChatGPT и ImageGen

GPTs

Беше ли Ви полезна тази статия?