OpenAI
Trang này được dịch bằng máy học. Xem bài viết gốc bằng tiếng Anh.

Cách chúng tôi xác định nội dung có vấn đề trên các dịch vụ dành cho cá nhân

Đã cập nhật: 16 days ago

Chúng tôi tin vào việc phát triển và triển khai có trách nhiệm, theo từng bước lặp, như một cách để đạt được trí tuệ nhân tạo tổng hợp an toàn. Chúng tôi thực hiện một lượng đáng kể kiểm thửgiảm thiểu về an toàn và sự liên kết trước khi ra mắt một mô hình cho công chúng, đồng thời chúng tôi cũng có các hệ thống tự động và con người để giúp phát hiện nội dung có vấn đề xuất hiện trên các dịch vụ dành cho cá nhân như ChatGPT và GPTs. Chúng tôi trình bày một số nỗ lực đó dưới đây.

ChatGPT, ImageGen và SORA

Chúng tôi sử dụng các công cụ tự động, chẳng hạn như phiên bản nội bộ của API /moderations, để phát hiện nội dung (câu lệnh, nội dung hoàn thành, tệp tải lên) có thể gây hại hoặc vi phạm Chính sách sử dụng của chúng tôi. Nếu phát hiện nội dung có vấn đề, chúng tôi thường sẽ cảnh báo rằng nội dung của bạn có thể vi phạm chính sách sử dụng của chúng tôi hoặc chặn mô hình phản hồi câu lệnh của bạn. Chúng tôi cũng có thể ngăn cuộc trò chuyện có câu lệnh hoặc nội dung hoàn thành có vấn đề được chia sẻ. Trong một số rất ít trường hợp, chúng tôi cũng có thể khóa tài khoản của bạn vì hành vi đặc biệt nghiêm trọng.

Chúng tôi cũng tiếp nhận báo cáo của con người về nội dung có vấn đề trên ChatGPT và SORA. Chúng tôi sử dụng kết hợp các hệ thống tự động và một đội ngũ chuyên gia được đào tạo để xem xét các báo cáo này.

  • ChatGPT: Nếu ai đó chia sẻ một cuộc trò chuyện mà bạn cho là chứa nội dung có vấn đề, bạn cũng có thể báo cáo cho chúng tôi.

  • SORA: Nếu bạn thấy một video hoặc hình ảnh trên bảng tin mà bạn cho là chứa nội dung có vấn đề, bạn có thể báo cáo cho chúng tôi.

Để biết thêm chi tiết về cách báo cáo nội dung trực tiếp trong ChatGPT hoặc SORA, hãy xem bài viết này.

GPTs

Chúng tôi cũng sử dụng các công cụ tự động như API /moderation để xem liệu một GPT có khả năng có vấn đề hay không. Nếu phát hiện nội dung có vấn đề liên quan đến GPT, chúng tôi sẽ thực hiện hành động, chẳng hạn như ngăn GPT đó được phân phối. Người tạo có thể chỉnh sửa cấu hình của GPT hoặc API để loại bỏ nội dung có vấn đề hoặc khiếu nại quyết định đó thông qua một quy trình trong sản phẩm. Trong một số rất ít trường hợp, chúng tôi cũng có thể khóa tài khoản của người tạo vì hành vi đặc biệt nghiêm trọng.

Chúng tôi cũng tiếp nhận báo cáo của con người về các GPT có vấn đề. Nếu bạn thấy một GPT mà bạn cho là đang vi phạm chính sách sử dụng của chúng tôi hoặc thể hiện nội dung có vấn đề theo cách khác, bạn cũng có thể báo cáo cho chúng tôi. Chúng tôi sử dụng kết hợp các hệ thống tự động và một đội ngũ chuyên gia được đào tạo để xem xét các báo cáo này.

Bài viết này có hữu ích không?