Chúng tôi tin vào việc phát triển và triển khai có trách nhiệm, theo từng bước lặp, như một phương tiện để đạt được trí tuệ nhân tạo tổng hợp an toàn. Chúng tôi thực hiện rất nhiều hoạt động kiểm thử và giảm thiểu rủi ro về an toàn và căn chỉnh trước khi ra mắt bất kỳ mô hình nào cho công chúng, đồng thời chúng tôi cũng có các hệ thống tự động và do con người vận hành để giúp phát hiện nội dung có vấn đề xuất hiện trên các dịch vụ dành cho cá nhân của chúng tôi như ChatGPT và GPT. Chúng tôi trình bày một số nỗ lực đó bên dưới.

ChatGPT và ImageGen

Chúng tôi sử dụng các công cụ tự động, chẳng hạn như phiên bản nội bộ của /moderations API, để phát hiện nội dung (câu lệnh, phần hoàn tất, nội dung tải lên) có thể gây hại hoặc vi phạm Chính sách sử dụng của chúng tôi. Nếu phát hiện nội dung có vấn đề, thông thường chúng tôi sẽ cảnh báo bạn rằng nội dung của bạn có thể vi phạm chính sách sử dụng của chúng tôi hoặc chặn mô hình phản hồi câu lệnh của bạn. Chúng tôi cũng có thể ngăn không cho chia sẻ cuộc trò chuyện có câu lệnh hoặc phần hoàn tất có vấn đề. Trong một số trường hợp rất hạn chế, chúng tôi cũng có thể cấm tài khoản của bạn vì hành vi nghiêm trọng.

Chúng tôi cũng tiếp nhận báo cáo của con người về nội dung có vấn đề trên ChatGPT. Chúng tôi sử dụng kết hợp các hệ thống tự động và một đội ngũ chuyên gia được đào tạo để xem xét các báo cáo này.

ChatGPT: Nếu ai đó chia sẻ một cuộc trò chuyện mà bạn cho rằng có nội dung có vấn đề, bạn cũng có thể báo cáo cho chúng tôi.

Để biết thêm chi tiết về cách báo cáo nội dung trực tiếp trong ChatGPT, hãy xem bài viết này.

GPT

Chúng tôi cũng sử dụng các công cụ tự động như /moderation API của chúng tôi để xem một GPT có khả năng có vấn đề hay không. Nếu phát hiện nội dung có vấn đề liên quan đến GPT, chúng tôi sẽ hành động, chẳng hạn như ngăn không cho phân phối GPT đó. Người tạo có thể chỉnh sửa cấu hình của GPT hoặc API để loại bỏ nội dung có vấn đề, hoặc có thể khiếu nại quyết định thông qua một quy trình trong sản phẩm. Trong một số trường hợp rất hạn chế, chúng tôi cũng có thể cấm tài khoản của người tạo vì hành vi nghiêm trọng.

Chúng tôi cũng tiếp nhận báo cáo của con người về các GPT có vấn đề. Nếu bạn thấy một GPT mà bạn cho rằng đang vi phạm chính sách sử dụng của chúng tôi hoặc phản ánh nội dung có vấn đề theo cách khác, bạn cũng có thể báo cáo cho chúng tôi. Chúng tôi sử dụng kết hợp các hệ thống tự động và một đội ngũ chuyên gia được đào tạo để xem xét các báo cáo này.

Cách chúng tôi xác định nội dung có vấn đề trên các dịch vụ dành cho cá nhân

ChatGPT và ImageGen

GPT

Bài viết này có hữu ích không?