Tìm hiểu thêm về cách chúng tôi phát triển các mô hình và ứng dụng chúng trong các sản phẩm như ChatGPT

Các mô hình nền tảng của OpenAI, bao gồm những mô hình vận hành ChatGPT, được phát triển bằng ba nguồn thông tin chính: (1) thông tin công khai trên internet, (2) thông tin mà chúng tôi hợp tác với bên thứ ba để truy cập, và (3) thông tin do người dùng, huấn luyện viên con người và nhà nghiên cứu của chúng tôi cung cấp hoặc tạo ra.

Việc phát triển các mô hình nền tảng như những mô hình được dùng trong ChatGPT gồm nhiều giai đoạn, bao gồm chuẩn bị dữ liệu huấn luyện, đào tạo trước và đào tạo sau, cũng như liên tục đánh giá và cải thiện sau khi triển khai. Các loại thông tin khác nhau có thể được sử dụng ở những giai đoạn này cho nhiều mục đích, bao gồm cải thiện hiệu suất, độ tin cậy và độ an toàn của mô hình.

Bài viết này cung cấp thông tin tổng quan về những thông tin chúng tôi sử dụng để hỗ trợ phát triển các mô hình này, cách chúng tôi thu thập và sử dụng thông tin đó theo luật về quyền riêng tư, cũng như các biện pháp bảo vệ mà chúng tôi áp dụng trong suốt quá trình huấn luyện. Để hiểu cách chúng tôi thu thập và sử dụng thông tin từ người dùng dịch vụ của mình, bao gồm cách từ chối cho phép sử dụng các cuộc trò chuyện ChatGPT để hỗ trợ cải thiện mô hình của chúng tôi, vui lòng xem chính sách quyền riêng tư của chúng tôi và bài viết này trong trung tâm trợ giúp.

ChatGPT là gì và hoạt động như thế nào?

ChatGPT là một dịch vụ dựa trên trí tuệ nhân tạo mà bạn có thể truy cập qua internet hoặc ứng dụng. Bạn có thể dùng ChatGPT cho nhiều tác vụ, bao gồm sắp xếp và tóm tắt thông tin, hỗ trợ dịch thuật, hỗ trợ lập trình, nghiên cứu và phân tích, hoàn thành các tác vụ nhiều bước trên nhiều công cụ, phân tích hoặc tạo hình ảnh, khơi gợi sáng tạo và ý tưởng, cũng như các hoạt động hằng ngày khác. ChatGPT được thiết kế để hiểu và phản hồi các câu hỏi cũng như hướng dẫn của người dùng bằng cách học các mẫu hình từ lượng lớn thông tin, bao gồm văn bản, hình ảnh, âm thanh và video.

Trong quá trình huấn luyện, mô hình phân tích các mối quan hệ trong dữ liệu này—chẳng hạn cách các từ thường xuất hiện cùng nhau trong ngữ cảnh—và dùng hiểu biết đó để dự đoán từ có khả năng xuất hiện tiếp theo nhất khi tạo phản hồi, từng từ một. Văn bản có thể được chuyển đổi thành các đơn vị nhỏ hơn, đôi khi gọi là “token”, có thể đại diện cho cả từ, một phần của từ hoặc dấu câu. Token là các khối cấu thành văn bản mà mô hình xử lý. Tương tự, các mô hình tạo những dạng nội dung khác, như hình ảnh, học các mẫu hình về cách các điểm ảnh liên hệ với nhau và với chú thích đi kèm trong dữ liệu huấn luyện.

Ví dụ, trong quá trình học của mô hình (được gọi là “huấn luyện”), mô hình có thể được giao nhiệm vụ hoàn thành một câu như: “Thay vì rẽ trái, cô ấy rẽ ___.” Ở giai đoạn đầu huấn luyện, các phản hồi của mô hình phần lớn là ngẫu nhiên. Tuy nhiên, khi mô hình xử lý và học từ một lượng lớn văn bản, mô hình nhận diện mẫu hình tốt hơn và dự đoán chính xác hơn từ tiếp theo có khả năng xuất hiện nhất. Quá trình này được lặp lại trên hàng triệu câu để tinh chỉnh khả năng hiểu và cải thiện độ chính xác của mô hình.

Vì có nhiều cách hợp lý để hoàn thành một câu—chẳng hạn “Thay vì rẽ trái, cô ấy rẽ phải”, “quay vòng” hoặc “quay lại”—nên cách mô hình phản hồi luôn có một yếu tố ngẫu nhiên nhất định. Do đó, cùng một câu hỏi có thể cho ra các câu trả lời khác nhau ở những lần truy vấn khác nhau.

Các mô hình học máy gồm những tập hợp số rất lớn, được gọi là “trọng số” hoặc “tham số”, cùng với mã diễn giải và sử dụng các con số đó. Các mô hình này không lưu trữ hoặc giữ lại bản sao của dữ liệu mà chúng được huấn luyện trên đó. Thay vào đó, khi mô hình học, giá trị các tham số của mô hình được điều chỉnh đôi chút để phản ánh những mẫu hình mà mô hình đã xác định. Trong ví dụ trước, mô hình đã cải thiện từ việc dự đoán các từ ngẫu nhiên sang đưa ra dự đoán chính xác hơn—không phải bằng cách lưu trữ các câu huấn luyện, mà bằng cách cập nhật các tham số nội bộ của mình. Mô hình không giữ lại bản sao của các câu, hình ảnh hoặc âm thanh mà mô hình xử lý trong quá trình huấn luyện. ChatGPT không “sao chép và dán” từ dữ liệu huấn luyện—tương tự như cách một giáo viên, sau khi nghiên cứu kỹ lưỡng, có thể giải thích các khái niệm nhờ hiểu mối quan hệ giữa các ý tưởng mà không ghi nhớ hoặc tái tạo nguyên văn tài liệu gốc. Khi tạo phản hồi cho yêu cầu của người dùng, mô hình sử dụng các trọng số đã học này để dự đoán và tạo nội dung mới.

Loại thông tin nào được dùng để dạy ChatGPT?

Đối với nội dung internet công khai, chúng tôi chỉ sử dụng thông tin có thể truy cập tự do và công khai trên internet. Thông tin này có thể bao gồm các trang web công khai, diễn đàn công khai, blog công khai, bài đăng công khai và nội dung trực tuyến công khai khác. Ví dụ, nếu bạn tham gia một diễn đàn thảo luận trực tuyến công khai hoặc đăng một blog công khai hay bài đăng khác ở chế độ công khai, chúng tôi có thể sử dụng nội dung có thể truy cập công khai đó cho mục đích huấn luyện mô hình. Tuy nhiên, chúng tôi thực hiện các bước để giảm việc xử lý thông tin cá nhân trong quá trình huấn luyện. Khi thu thập nội dung internet công khai, chúng tôi không cố ý thu thập dữ liệu từ các nguồn được biết là nằm sau tường phí hoặc từ dark web. Ngoài ra, chúng tôi áp dụng bộ lọc để loại bỏ những tài liệu mà chúng tôi không muốn mô hình của mình học từ đó, chẳng hạn như ngôn từ thù ghét, nội dung người lớn, các trang tổng hợp thông tin cá nhân và thư rác. Phần thông tin còn lại sau đó được dùng để huấn luyện các mô hình của chúng tôi.

Chủ sở hữu trang web có thể quản lý việc nội dung công khai trên trang của họ có được truy cập để dùng cho huấn luyện hay không bằng cách sử dụng các công cụ kiểm soát web tiêu chuẩn như robots.txt để không cho phép GPTBot, công cụ có thể thu thập nội dung công khai nhằm hỗ trợ huấn luyện mô hình của chúng tôi. Chúng tôi cung cấp hướng dẫn để giúp chủ sở hữu trang web quản lý cách trang và nội dung của họ tương tác với các hệ thống AI của chúng tôi.

Chúng tôi cũng sử dụng thông tin từ các đối tác bên thứ ba để hỗ trợ huấn luyện và cải thiện các mô hình của mình. Thông tin này có thể bao gồm thông tin trong các tập dữ liệu mà chúng tôi truy cập thông qua thỏa thuận với bên thứ ba, cũng như thông tin do huấn luyện viên con người và nhà nghiên cứu cung cấp hoặc tạo ra, khi được phép theo các chính sách và thỏa thuận của chúng tôi. Điều này giúp cải thiện chất lượng, độ an toàn và hiệu suất của các mô hình của chúng tôi. Các nguồn này có thể bao gồm văn bản, hình ảnh, âm thanh, video hoặc các loại dữ liệu khác, tùy thuộc vào tập dữ liệu.

Chúng tôi cũng ngày càng sử dụng dữ liệu tổng hợp trong một số quy trình huấn luyện. Ví dụ, chúng tôi có thể sử dụng thông tin và các mô hình của mình để tạo câu lệnh tổng hợp, ví dụ đa ngôn ngữ hoặc tài liệu huấn luyện khác. Dữ liệu tổng hợp có thể giúp cải thiện hiệu suất mô hình, bao gồm bằng cách bổ sung dữ liệu huấn luyện ở những lĩnh vực dữ liệu thưa thớt hoặc mất cân bằng, và cũng có thể hỗ trợ các phương pháp phát triển mô hình tăng cường quyền riêng tư.

Thông tin cá nhân có được dùng để dạy ChatGPT không?

Một phần đáng kể nội dung trực tuyến liên quan đến thông tin về con người, vì vậy dữ liệu huấn luyện của chúng tôi có thể vô tình bao gồm thông tin cá nhân. Tuy nhiên, chúng tôi thực hiện các bước để giảm việc xử lý thông tin cá nhân trong quá trình huấn luyện.

Chúng tôi dùng dữ liệu huấn luyện để phát triển các năng lực của mô hình—chẳng hạn như dự đoán, suy luận và giải quyết vấn đề—chứ không phải để xây dựng hồ sơ về cá nhân, liên hệ với họ hoặc cá nhân hóa quảng cáo cho họ.

Trong một số trường hợp, các mô hình có thể học từ thông tin cá nhân để hiểu cách các yếu tố như tên và địa chỉ hoạt động trong ngôn ngữ, hoặc để nhận diện nhân vật công chúng và các thực thể nổi tiếng. Điều này giúp mô hình tạo ra các phản hồi chính xác hơn và phù hợp hơn với ngữ cảnh.

Thông tin cá nhân được bảo vệ như thế nào trong quá trình huấn luyện?

Chúng tôi chủ động thực hiện các bước để hạn chế việc xử lý thông tin cá nhân trong quá trình huấn luyện. Ví dụ, chúng tôi loại trừ các nguồn đã biết là tổng hợp lượng lớn dữ liệu cá nhân, áp dụng bộ lọc để giảm thông tin cá nhân trong quá trình huấn luyện, đồng thời thực hiện các bước để xác định và loại bỏ nội dung trùng lặp nhằm giảm nguy cơ lặp lại dữ liệu huấn luyện. Ngoài ra, chúng tôi huấn luyện các mô hình của mình tránh phản hồi các yêu cầu cung cấp thông tin riêng tư hoặc nhạy cảm về cá nhân.

Thời gian chúng tôi lưu giữ thông tin

Chúng tôi chỉ lưu giữ thông tin trong dữ liệu huấn luyện trong khoảng thời gian hợp lý cần thiết cho các mục đích được mô tả trong bài viết này và chính sách quyền riêng tư của chúng tôi, bao gồm phát triển và cải thiện các mô hình của chúng tôi cũng như cho các mục đích nghiên cứu khoa học liên quan. Việc lưu giữ được xem xét định kỳ để bảo đảm vẫn cần thiết, và thay đổi tùy theo loại thông tin cũng như cách thông tin được sử dụng. Khi xác định thời gian lưu giữ, chúng tôi cân nhắc các yếu tố như mục đích xử lý thông tin, số lượng, bản chất và mức độ nhạy cảm của thông tin, nguy cơ gây hại tiềm ẩn từ việc sử dụng hoặc tiết lộ trái phép, cũng như mọi nghĩa vụ pháp lý mà chúng tôi phải tuân thủ.

Việc phát triển ChatGPT tuân thủ luật về quyền riêng tư như thế nào?

Chúng tôi sử dụng thông tin huấn luyện một cách hợp pháp. Các mô hình nền tảng của chúng tôi vận hành nhiều ứng dụng hữu ích—bao gồm công cụ hỗ trợ khả năng tiếp cận, hỗ trợ khách hàng, phát triển phần mềm, giáo dục được cá nhân hóa và nghiên cứu khoa học. Những năng lực này phụ thuộc vào dữ liệu huấn luyện quy mô lớn, bao gồm thông tin công khai và thông tin từ các đối tác bên thứ ba. Chúng tôi áp dụng các biện pháp bảo vệ trong suốt quá trình huấn luyện, bao gồm các bước được thiết kế để giảm việc xử lý thông tin cá nhân trong quá trình huấn luyện và giảm thiểu rủi ro, như được mô tả trong bài viết này. Chúng tôi dựa trên lợi ích hợp pháp theo các luật về quyền riêng tư như GDPR để thu thập và sử dụng thông tin cá nhân có trong thông tin huấn luyện, bao gồm việc huấn luyện và cải thiện các mô hình của chúng tôi cho người dùng và xã hội rộng lớn hơn, phù hợp với sứ mệnh bảo đảm trí tuệ nhân tạo tổng hợp mang lại lợi ích cho tất cả mọi người, như được giải thích chi tiết hơn trong chính sách quyền riêng tư của chúng tôi. Chúng tôi đã hoàn thành đánh giá tác động bảo vệ dữ liệu để giúp bảo đảm rằng chúng tôi đang thu thập và sử dụng thông tin này một cách hợp pháp và có trách nhiệm.

Khi thông tin có thể được chia sẻ hoặc chuyển giao

Chúng tôi không “bán” thông tin cá nhân, và chỉ tiết lộ thông tin cá nhân trong dữ liệu huấn luyện trong những trường hợp hạn chế được mô tả trong chính sách quyền riêng tư của chúng tôi. Ví dụ, chúng tôi có thể chia sẻ thông tin với các công ty liên kết, nhà cung cấp và nhà cung cấp dịch vụ hỗ trợ việc phát triển, kiểm thử và cải thiện các mô hình của chúng tôi. Chúng tôi cũng có thể tiết lộ thông tin khi tin tưởng một cách thiện chí rằng hành động đó là cần thiết để tuân thủ nghĩa vụ pháp lý hoặc để bảo vệ quyền, sự an toàn và bảo mật của chúng tôi cũng như của người dùng, nhân viên hoặc công chúng, như được mô tả trong chính sách quyền riêng tư của chúng tôi.

Vì hạ tầng của chúng tôi mang tính toàn cầu, thông tin cá nhân trong dữ liệu huấn luyện có thể được xử lý tại các quốc gia ngoài EEA, Thụy Sĩ hoặc Vương quốc Anh (bao gồm cả Hoa Kỳ). Khi điều này xảy ra, chúng tôi áp dụng các biện pháp bảo vệ phù hợp, chẳng hạn như quyết định công nhận mức độ bảo vệ tương đương hoặc điều khoản hợp đồng tiêu chuẩn, như được mô tả trong chính sách quyền riêng tư của chúng tôi.

Quyền của bạn và cách thực hiện

Chúng tôi phản hồi các yêu cầu phản đối và các yêu cầu tương tự về quyền. Do học ngôn ngữ, phản hồi của ChatGPT đôi khi có thể bao gồm thông tin cá nhân về những cá nhân có thông tin cá nhân xuất hiện nhiều lần trên internet công khai (ví dụ: nhân vật công chúng). Cá nhân ở một số khu vực pháp lý nhất định có thể phản đối việc các mô hình của chúng tôi xử lý thông tin cá nhân của họ hoặc gửi các yêu cầu khác về quyền của chủ thể dữ liệu thông qua Cổng thông tin về quyền riêng tư của chúng tôi. Bạn cũng có thể thực hiện các quyền này bằng cách liên hệ với privacy@openai.com.

Để giúp chúng tôi đánh giá và phản hồi yêu cầu của bạn, vui lòng cung cấp đủ thông tin để chúng tôi hiểu yêu cầu của bạn liên quan đến thông tin cá nhân nào, chẳng hạn như tên của bạn, các URL liên quan, ví dụ cụ thể về kết quả đầu ra của mô hình hoặc những chi tiết khác giúp xác định vấn đề. Trong một số trường hợp, chúng tôi có thể yêu cầu bạn xác minh danh tính hoặc xác nhận rằng thông tin đó liên quan đến bạn trước khi chúng tôi có thể hành động. Bạn có thể tìm thêm thông tin về cách gửi các yêu cầu này, bao gồm các phương pháp hay nhất và cách yêu cầu được xem xét, trong bài viết trong Trung tâm Trợ giúp của chúng tôi về việc xóa dữ liệu cá nhân khỏi ChatGPT. Chúng tôi xem xét các yêu cầu theo luật về quyền riêng tư hiện hành và phản hồi trong thời hạn pháp lý áp dụng.

Xin lưu ý rằng, theo luật về quyền riêng tư, một số quyền có thể không phải là tuyệt đối. Ví dụ, chúng tôi có thể không thực hiện được yêu cầu khi không thể xác minh thông tin liên quan, khi yêu cầu không liên quan đến thông tin cá nhân do OpenAI xử lý, khi có ngoại lệ được áp dụng hoặc khi chúng tôi có lý do hợp pháp khác để làm như vậy. Các yêu cầu được đánh giá theo từng trường hợp và có thể cần cân bằng quyền riêng tư với những cân nhắc quan trọng khác, chẳng hạn như quyền tự do biểu đạt và lợi ích công cộng.

Tuy nhiên, chúng tôi nỗ lực ưu tiên bảo vệ thông tin cá nhân và tuân thủ mọi luật về quyền riêng tư hiện hành. Nếu bạn cảm thấy chúng tôi chưa giải quyết thỏa đáng một vấn đề, bạn có quyền nộp khiếu nại lên cơ quan giám sát tại địa phương của mình.

Để biết thêm thông tin về các phương thức của OpenAI liên quan đến thông tin cá nhân mà chúng tôi thu thập từ bạn hoặc về bạn khi bạn sử dụng trang web, ứng dụng và dịch vụ của chúng tôi, vui lòng xem chính sách quyền riêng tư của chúng tôi.

ChatGPT và các mô hình nền tảng của chúng tôi được phát triển như thế nào

ChatGPT là gì và hoạt động như thế nào?

Loại thông tin nào được dùng để dạy ChatGPT?

Thông tin cá nhân có được dùng để dạy ChatGPT không?

Việc phát triển ChatGPT tuân thủ luật về quyền riêng tư như thế nào?

Bài viết này có hữu ích không?