OpenAI
Trang này được dịch bằng máy học. Xem bài viết gốc bằng tiếng Anh.

Tóm tắt Dữ liệu Huấn luyện theo Mục 3111 Bộ luật Dân sự California

Đã cập nhật: 3 days ago

OpenAI cung cấp các hệ thống AI tạo sinh công khai tại bang California. Chúng tôi phát triển các hệ thống này bằng nhiều nguồn dữ liệu khác nhau, bao gồm dữ liệu công khai, dữ liệu mà chúng tôi hợp tác với bên thứ ba để truy cập, và thông tin do người dùng hoặc các huấn luyện viên và nhà nghiên cứu là con người cung cấp hoặc tạo ra. Chúng tôi cũng phát triển các hệ thống của mình bằng dữ liệu tổng hợp.



Chúng tôi sử dụng dữ liệu để giúp các hệ thống của mình hiểu rõ hơn ngôn ngữ của con người và thế giới. Từ đó, các hệ thống của chúng tôi có thể nâng cao khả năng sáng tạo của con người, thúc đẩy khám phá khoa học và nghiên cứu y học, đồng thời giúp hàng trăm triệu người cải thiện cuộc sống hằng ngày. Các hệ thống của chúng tôi được phát triển trên các bộ dữ liệu chứa hàng nghìn tỷ token nội dung văn bản, hình ảnh, âm thanh và nghe nhìn.



Chúng tôi sử dụng một tập dữ liệu đa dạng để phát triển các hệ thống của mình, bao gồm dữ liệu có thể được bảo hộ bản quyền và dữ liệu thuộc phạm vi công cộng. Mặc dù chúng tôi thực hiện các bước để giảm lượng thông tin cá nhân trong các bộ dữ liệu huấn luyện của mình, một phần dữ liệu của chúng tôi có thể bao gồm thông tin cá nhân và thông tin tổng hợp về người tiêu dùng theo định nghĩa tại Mục 1798.140 Bộ luật Dân sự California. Người dùng của chúng tôi có thể chọn không cho phép sử dụng nội dung của họ cho mục đích huấn luyện, cũng như yêu cầu xóa một số thông tin cá nhân nhất định khỏi các phản hồi của ChatGPT, bằng cách sử dụng Cổng thông tin về quyền riêng tư của chúng tôi. Chúng tôi sử dụng nhiều kỹ thuật khác nhau để xử lý các bộ dữ liệu nhằm cải thiện hiệu suất và độ chính xác của các mô hình.



Chúng tôi bắt đầu thu thập dữ liệu để phát triển các hệ thống của mình vào khoảng năm 2018, và chúng tôi vẫn tiếp tục thu thập dữ liệu cho đến ngày nay. Chúng tôi lần đầu tiên sử dụng các bộ dữ liệu của mình để phát triển hệ thống vào năm 2021.



Thông tin bổ sung về quá trình phát triển các hệ thống của chúng tôi có thể được tìm thấy trong các thẻ hệ thống của chúng tôi.

Bài viết này có hữu ích không?