OpenAI
หน้านี้แปลด้วยระบบอัตโนมัติ ดูต้นฉบับภาษาอังกฤษ.

ChatGPT และโมเดลฐานรากของเราพัฒนาอย่างไร

เรียนรู้เพิ่มเติมเกี่ยวกับวิธีที่เราพัฒนาโมเดลของเราและนำไปใช้ในผลิตภัณฑ์อย่าง ChatGPT

อัปเดตล่าสุด: 6 hours ago

หมายเหตุ: การเก็บรักษาข้อมูลสำหรับบริการบางอย่างอาจได้รับผลกระทบจากพัฒนาการทางกฎหมายล่าสุด โปรดดูรายละเอียดเพิ่มเติมในบล็อกโพสต์ของเรา

โมเดลพื้นฐานของ OpenAI รวมถึงโมเดลที่ขับเคลื่อน ChatGPT ได้รับการพัฒนาโดยใช้แหล่งข้อมูลหลักสามแหล่ง ได้แก่ (1) ข้อมูลที่เปิดเผยต่อสาธารณะบนอินเทอร์เน็ต (2) ข้อมูลที่เราเป็นพันธมิตรกับบุคคลที่สามเพื่อเข้าถึง และ (3) ข้อมูลที่ผู้ใช้ ผู้ฝึกสอนที่เป็นมนุษย์ และนักวิจัยของเราให้หรือสร้างขึ้น

บทความนี้ให้ภาพรวมของข้อมูลที่เปิดเผยต่อสาธารณะซึ่งเราใช้เพื่อช่วยพัฒนาโมเดลเหล่านี้ รวมถึงวิธีที่เราเก็บรวบรวมและใช้ข้อมูลดังกล่าวโดยปฏิบัติตามกฎหมายความเป็นส่วนตัว เพื่อทำความเข้าใจว่าเราเก็บรวบรวมและใช้ข้อมูลจากผู้ใช้บริการของเราอย่างไร รวมถึงวิธีเลือกไม่ให้ใช้การสนทนาใน ChatGPT เพื่อช่วยสอนโมเดลของเรา โปรดดูนโยบายความเป็นส่วนตัวและบทความศูนย์ช่วยเหลือนี้ของเรา

ChatGPT คืออะไรและทำงานอย่างไร

ChatGPT เป็นบริการที่ใช้ปัญญาประดิษฐ์ ซึ่งคุณสามารถเข้าถึงได้ผ่านอินเทอร์เน็ต คุณสามารถใช้ ChatGPT สำหรับงานได้หลากหลาย รวมถึงการจัดระเบียบและสรุปข้อมูล ช่วยแปลภาษา วิเคราะห์หรือสร้างรูปภาพ จุดประกายความคิดสร้างสรรค์และไอเดีย ตลอดจนกิจกรรมในชีวิตประจำวันอื่นๆ ChatGPT ได้รับการออกแบบมาให้เข้าใจและตอบคำถามกับคำสั่งของผู้ใช้ โดยเรียนรู้รูปแบบจากข้อมูลจำนวนมาก รวมถึงข้อความ รูปภาพ เสียง และวิดีโอ ระหว่างการเทรน โมเดลจะวิเคราะห์ความสัมพันธ์ภายในข้อมูลนี้ เช่น คำต่างๆ มักปรากฏร่วมกันในบริบทอย่างไร และใช้ความเข้าใจนั้นเพื่อคาดการณ์คำถัดไปที่น่าจะเป็นไปได้มากที่สุดเมื่อสร้างคำตอบ ทีละคำ ในทำนองเดียวกัน โมเดลที่สร้างเนื้อหารูปแบบอื่น เช่น รูปภาพ จะเรียนรู้รูปแบบว่าพิกเซลสัมพันธ์กันอย่างไร และสัมพันธ์กับคำบรรยายที่เกี่ยวข้องในข้อมูลการเทรนอย่างไร

ตัวอย่างเช่น ระหว่างกระบวนการเรียนรู้ของโมเดล (ที่เรียกว่า “การเทรน”) โมเดลอาจได้รับงานให้เติมประโยค เช่น “แทนที่จะเลี้ยวซ้าย เธอเลี้ยว ___” ในช่วงต้นของการเทรน คำตอบของโมเดลส่วนใหญ่จะเป็นแบบสุ่ม อย่างไรก็ตาม เมื่อโมเดลประมวลผลและเรียนรู้จากข้อความจำนวนมาก โมเดลจะเก่งขึ้นในการจดจำรูปแบบและคาดการณ์คำถัดไปที่น่าจะเป็นไปได้มากที่สุด กระบวนการนี้ทำซ้ำกับประโยคนับล้าน เพื่อปรับแต่งความเข้าใจของโมเดลและปรับปรุงความแม่นยำ

เนื่องจากมีหลายวิธีที่เป็นไปได้ในการเติมประโยคให้สมบูรณ์ เช่น “แทนที่จะเลี้ยวซ้าย เธอเลี้ยวขวา” “กลับตัว” หรือ “ย้อนกลับ” จึงมีองค์ประกอบของความสุ่มอยู่โดยเนื้อแท้ในวิธีที่โมเดลตอบสนอง ด้วยเหตุนี้ คำถามเดียวกันอาจให้คำตอบที่แตกต่างกันในการสอบถามแต่ละครั้ง

โมเดลแมชชีนเลิร์นนิงประกอบด้วยชุดตัวเลขขนาดใหญ่ที่เรียกว่า “น้ำหนัก” หรือ “พารามิเตอร์” พร้อมกับโค้ดที่ตีความและใช้ตัวเลขเหล่านั้น โมเดลเหล่านี้ไม่ได้จัดเก็บหรือเก็บสำเนาข้อมูลที่ใช้เทรนไว้ แต่เมื่อโมเดลเรียนรู้ ค่าของพารามิเตอร์จะถูกปรับเล็กน้อยเพื่อสะท้อนรูปแบบที่โมเดลระบุได้ ในตัวอย่างก่อนหน้า โมเดลพัฒนาจากการคาดการณ์คำแบบสุ่มไปสู่การคาดการณ์ที่แม่นยำยิ่งขึ้น ไม่ใช่ด้วยการจัดเก็บประโยคที่ใช้เทรน แต่ด้วยการอัปเดตพารามิเตอร์ภายในของโมเดลเอง โมเดลไม่ได้เก็บสำเนาประโยค รูปภาพ หรือเสียงที่ประมวลผลระหว่างการเทรนไว้ ChatGPT ไม่ได้ “คัดลอกและวาง” จากข้อมูลการเทรนของตน คล้ายกับครูที่หลังจากศึกษาอย่างมากแล้ว สามารถอธิบายแนวคิดต่างๆ ได้ด้วยการเข้าใจความสัมพันธ์ระหว่างไอเดีย โดยไม่ต้องท่องจำหรือทำซ้ำสื่อเดิมทุกคำ เมื่อสร้างคำตอบต่อคำขอของผู้ใช้ โมเดลจะใช้น้ำหนักที่เรียนรู้เหล่านี้เพื่อคาดการณ์และสร้างเนื้อหาใหม่

ข้อมูลสาธารณะประเภทใดที่ใช้สอน ChatGPT

สำหรับเนื้อหาบนอินเทอร์เน็ตที่เปิดเผยต่อสาธารณะ เราใช้เฉพาะข้อมูลที่เข้าถึงได้อย่างเสรีและเปิดกว้างบนอินเทอร์เน็ตเท่านั้น เราไม่ได้ตั้งใจรวบรวมข้อมูลจากแหล่งที่ทราบว่าอยู่หลังเพย์วอลล์หรือจากดาร์กเว็บ นอกจากนี้ เรายังใช้ตัวกรองเพื่อนำเนื้อหาที่เราไม่ต้องการให้โมเดลของเราเรียนรู้ออก เช่น วาจาสร้างความเกลียดชัง เนื้อหาสำหรับผู้ใหญ่ เว็บไซต์ที่รวบรวมข้อมูลส่วนบุคคล และสแปม จากนั้นข้อมูลที่เหลือจะถูกนำไปใช้เทรนโมเดลของเรา

ข้อมูลส่วนบุคคลถูกใช้เพื่อสอน ChatGPT หรือไม่

เนื้อหาออนไลน์ส่วนสำคัญเกี่ยวข้องกับข้อมูลเกี่ยวกับผู้คน ดังนั้นข้อมูลการเทรนของเราอาจมีข้อมูลส่วนบุคคลรวมอยู่โดยบังเอิญ อย่างไรก็ตาม เราไม่ได้ตั้งใจเก็บรวบรวมข้อมูลส่วนบุคคลเพื่อวัตถุประสงค์ในการเทรนโมเดลของเรา

เราใช้ข้อมูลการเทรนเพื่อพัฒนาความสามารถของโมเดล เช่น การคาดการณ์ การให้เหตุผล และการแก้ปัญหา ไม่ใช่เพื่อสร้างโปรไฟล์ผู้ใช้ ติดต่อบุคคล หรือใช้เป็นส่วนหนึ่งของความพยายามด้านโฆษณาหรือการตลาดของเรา

ในบางกรณี โมเดลอาจเรียนรู้จากข้อมูลส่วนบุคคลเพื่อเข้าใจว่าองค์ประกอบอย่างชื่อและที่อยู่ทำงานอย่างไรในภาษา หรือเพื่อจดจำบุคคลสาธารณะและองค์กรที่เป็นที่รู้จัก สิ่งนี้ช่วยให้โมเดลสร้างคำตอบที่แม่นยำและเหมาะสมกับบริบทมากขึ้น

เราดำเนินการอย่างจริงจังเพื่อจำกัดการประมวลผลข้อมูลส่วนบุคคลระหว่างการเทรน ตัวอย่างเช่น เราไม่รวมแหล่งที่รวบรวมข้อมูลส่วนบุคคลจำนวนมาก และเราเทรนโมเดลของเราให้หลีกเลี่ยงการตอบคำขอข้อมูลส่วนตัวหรือข้อมูลที่ละเอียดอ่อนเกี่ยวกับบุคคล

การพัฒนา ChatGPT ปฏิบัติตามกฎหมายความเป็นส่วนตัวอย่างไร

เราใช้ข้อมูลการเทรนอย่างถูกต้องตามกฎหมาย โมเดลพื้นฐานของเราขับเคลื่อนแอปพลิเคชันที่เป็นประโยชน์หลากหลาย ตั้งแต่การสร้างเนื้อหาและการสนับสนุนลูกค้า ไปจนถึงการพัฒนาซอฟต์แวร์ การศึกษาแบบเฉพาะบุคคล และการวิจัยทางวิทยาศาสตร์ ความสามารถเหล่านี้ต้องอาศัยข้อมูลสำหรับการเทรนโมเดลขนาดใหญ่ ข้อมูลที่ใช้เทรนโมเดลของเราเป็นข้อมูลที่เปิดเผยต่อสาธารณะ และไม่ได้มีเจตนาก่อให้เกิดอันตรายต่อบุคคล เราอ้างอิงการเก็บรวบรวมและใช้ข้อมูลส่วนบุคคลที่รวมอยู่ในข้อมูลการเทรนบนผลประโยชน์โดยชอบด้วยกฎหมายภายใต้กฎหมายความเป็นส่วนตัว เช่น GDPR ตามที่อธิบายโดยละเอียดเพิ่มเติมในนโยบายความเป็นส่วนตัวของเรา เราได้ทำการประเมินผลกระทบด้านการคุ้มครองข้อมูลแล้ว เพื่อช่วยให้มั่นใจว่าเรากำลังเก็บรวบรวมและใช้ข้อมูลนี้อย่างถูกต้องตามกฎหมายและมีความรับผิดชอบ


เราตอบสนองต่อคำขอคัดค้านและสิทธิที่คล้ายกัน. จากการเรียนรู้ภาษา บางครั้งคำตอบของ ChatGPT อาจมีข้อมูลส่วนบุคคลเกี่ยวกับบุคคลที่ข้อมูลส่วนบุคคลของเขาปรากฏหลายครั้งบนอินเทอร์เน็ตสาธารณะ (เช่น บุคคลสาธารณะ) บุคคลในเขตอำนาจศาลบางแห่งสามารถคัดค้านการประมวลผลข้อมูลส่วนบุคคลของตนโดยโมเดลของเรา หรือยื่นคำขอเกี่ยวกับสิทธิของเจ้าของข้อมูลอื่นๆ ผ่านพอร์ทัลความเป็นส่วนตัวของเรา คุณยังสามารถใช้สิทธิเหล่านี้ได้โดยติดต่อไปที่ dsar@openai.com

โปรดทราบว่า ตามกฎหมายความเป็นส่วนตัว สิทธิบางอย่างอาจไม่ใช่สิทธิที่เด็ดขาด เราอาจปฏิเสธคำขอหากเรามีเหตุผลที่ชอบด้วยกฎหมายในการดำเนินการเช่นนั้น อย่างไรก็ตาม เรามุ่งมั่นที่จะให้ความสำคัญกับการคุ้มครองข้อมูลส่วนบุคคล และปฏิบัติตามกฎหมายความเป็นส่วนตัวที่เกี่ยวข้องทั้งหมด หากคุณรู้สึกว่าเราไม่ได้จัดการปัญหาอย่างเพียงพอ คุณมีสิทธิยื่นเรื่องร้องเรียนต่อหน่วยงานกำกับดูแลในพื้นที่ของคุณ


สำหรับข้อมูลเพิ่มเติมเกี่ยวกับแนวทางปฏิบัติของ OpenAI เกี่ยวกับข้อมูลส่วนบุคคลที่เราเก็บรวบรวมจากคุณหรือเกี่ยวกับคุณเมื่อคุณใช้เว็บไซต์ แอปพลิเคชัน และบริการของเรา โปรดดูนโยบายความเป็นส่วนตัวของเรา

บทความนี้มีประโยชน์หรือไม่