Catatan: Artikel ini memberikan ikhtisar tingkat tinggi. Informasi untuk penyiapan teknis dapat ditemukan di situs web gpt-oss, GitHub, Hugging Face, dan OpenAI Cookbook.
Ikhtisar
Memperkenalkan dua model penalaran open‑weight: gpt‑oss‑120b dan gpt‑oss‑20b. Model ini berjalan di infrastruktur yang Anda kendalikan, atau melalui penyedia hosting.
Catatan: Model-model ini tidak disajikan melalui OpenAI API dan tidak tersedia di ChatGPT.
Mengapa open‑weight
Pilihan dan kontrol: Jalankan model on‑premises atau di cloud privat Anda, pertahankan residensi data, dan sesuaikan performa sesuai kebutuhan.
Kustomisasi: Fine‑tune atau adaptasikan model dengan tooling terbuka pilihan Anda.
Ketersediaan dan lisensi
Lisensi: Apache 2.0 memungkinkan penggunaan, modifikasi, dan redistribusi yang luas, termasuk penggunaan komersial (dengan mematuhi kebijakan penggunaan gpt-oss kami).
Serving: Tidak tersedia melalui OpenAI API, sehingga harga API dan batas laju (rate limit) tidak berlaku.
Kompatibilitas: Dapat dijalankan dengan stack inferensi terbuka umum seperti vLLM, Ollama, llama.cpp, serta di lingkungan GPU cloud atau yang dikelola sendiri.
Memulai
Untuk mendapatkan bobot model dan sumber daya pendukung, Anda dapat:
Mengunjungi situs web gpt-oss untuk ikhtisar dan tautan langsung.
Mengunduh bobot dari koleksi Hugging Face — hub komunitas tempat Anda dapat menemukan kedua model, melihat contoh penggunaan, dan (opsional) menjalankan inferensi langsung melalui layanan Hugging Face.
Mengakses repo GitHub kami untuk kode inferensi referensi.
Menggunakan panduan di OpenAI Cookbook untuk penyiapan dengan runtime yang didukung seperti Ollama, vLLM, dan Transformers. Cookbook juga mencakup instruksi langkah demi langkah untuk menjalankan secara lokal, menggunakan runtime umum, dan—jika didukung—melakukan fine‑tune pada model gpt‑oss.
gpt‑oss‑safeguard (pratinjau riset)
gpt‑oss‑safeguard adalah sepasang model penalaran keamanan open‑weight yang dibangun di atas gpt‑oss. Model ini dirancang untuk klasifikasi keamanan berbasis kebijakan dan tugas trust & safety terkait yang Anda jalankan di infrastruktur yang Anda kendalikan. Seperti model gpt‑oss lainnya, bobot ini tidak disajikan melalui OpenAI API maupun ChatGPT.
Model khusus teks dengan skema structured output referensi (mis., putusan kebijakan, rasional).
Bawa kebijakan Anda sendiri: model menafsirkan kebijakan tertulis Anda sehingga dapat menggeneralisasi lintas produk dengan rekayasa yang minimal.
Keputusan berbasis penalaran: jejak penalaran opsional untuk membantu debugging dan audit (ditujukan untuk developer dan praktisi keamanan, bukan untuk ditampilkan ke end user).
Upaya penalaran yang dapat dikonfigurasi: pilih rendah / sedang / tinggi untuk menyeimbangkan latensi vs. kedalaman.
Lisensi: Apache 2.0 (lihat Ketersediaan dan lisensi di bawah).
gpt‑oss‑safeguard cocok untuk pemfilteran input/output untuk LLM, pelabelan konten online, serta pelabelan batch offline atau alur kerja peninjauan. Untuk aplikasi umum (chat, agen, dll.), kami merekomendasikan model inti gpt‑oss.
Anda dapat menyesuaikan skema sesuai kebutuhan. Silakan merujuk ke OpenAI Cookbook untuk panduan prompting dan contoh.
Varian model & ukuran
| Model | Penggunaan yang dituju | Catatan |
| gpt‑oss‑safeguard‑120b | Produksi, penalaran keamanan berkapasitas tinggi | 117B parameter (≈5.1B aktif). Dirancang agar muat pada satu GPU 80 GB (mis., NVIDIA H100; juga berjalan di GPU dengan memori lebih besar seperti AMD MI300X). |
| gpt‑oss‑safeguard‑20b | Latensi lebih rendah / lingkungan terbatas | 21B parameter (≈3.6B aktif). |
Kedua model ini di‑fine‑tune dari gpt‑oss tanpa perubahan arsitektur. Keduanya menggunakan template chat yang sama seperti gpt‑oss; Anda bisa mempertahankan setup yang sudah ada. Pola prompting yang direkomendasikan adalah menaruh kebijakan Anda dalam pesan developer dan konten yang akan dievaluasi dalam pesan user.
Dukungan dan komunitas
Penerapan open‑weight dikelola sendiri dan diservis sendiri. Berikut tempat mendapatkan dukungan:
Pertanyaan, diskusi, tips: Gunakan halaman model Hugging Face untuk berinteraksi dengan komunitas.
Bug yang dapat direproduksi di kode inferensi referensi OpenAI: Buka issue di repo GitHub gpt-oss.
Masalah dengan runtime pihak ketiga (mis., vLLM, Ollama, llama.cpp): Gunakan issue tracker, forum, atau proses dukungan milik proyek terkait.
OpenAI tidak menyediakan bantuan, implementasi langsung (hands‑on), atau dukungan debugging untuk setup, konfigurasi, lingkungan, atau aplikasi open‑weight apa pun yang di‑host sendiri maupun di‑host oleh pihak ketiga.
Kami akan terus beriterasi bersama komunitas untuk meningkatkan tooling keamanan terbuka, termasuk melalui ROOST Model Community (RMC). RMC mempertemukan praktisi dan peneliti keamanan untuk berbagi praktik terbaik dalam mengintegrasikan model AI open source ke dalam alur kerja keamanan, termasuk hasil evaluasi dan masukan model. Kunjungi repo GitHub RMC untuk mempelajari lebih lanjut tentang kemitraan ini dan cara ikut terlibat.
Dukungan dan komunitas
Penerapan open‑weight dikelola sendiri dan diservis sendiri. Berikut tempat mendapatkan dukungan:
Pertanyaan, diskusi, tips: Gunakan halaman model Hugging Face untuk berinteraksi dengan komunitas.
Bug yang dapat direproduksi di kode inferensi referensi OpenAI: Buka issue di repo GitHub gpt-oss.
Masalah dengan runtime pihak ketiga (mis., vLLM, Ollama, llama.cpp): Gunakan issue tracker, forum, atau proses dukungan milik proyek terkait.
OpenAI tidak menyediakan bantuan, implementasi langsung (hands‑on), atau dukungan debugging untuk setup, konfigurasi, lingkungan, atau aplikasi open‑weight apa pun yang di‑host sendiri maupun di‑host oleh pihak ketiga.
Privasi dan keamanan
Privasi dan data
Model-model ini dirancang untuk berjalan di infrastruktur yang Anda kendalikan (on‑premises atau di cloud Anda atau partner hosting). OpenAI tidak menerima atau memproses data yang Anda kirim ke model-model yang di‑host sendiri ini kecuali Anda secara eksplisit membagikannya kepada OpenAI, atau menggunakan salah satu partner hosting terkelola kami.
Keamanan
Model-model ini telah melalui pelatihan dan pengujian keamanan yang ekstensif. Untuk detail selengkapnya, lihat kartu model dan laporan teknis kami.
Melaporkan pelanggaran konten
Jika Anda yakin konten yang dihasilkan dengan model gpt‑oss melanggar kebijakan kami, Anda dapat melaporkannya melalui formulir Laporkan Konten. Harap berikan detail sebanyak mungkin untuk membantu tim kami meninjau pengajuan Anda.
Tanya Jawab
Apakah model ini gratis?
Bobot model gpt-oss gratis untuk diunduh dan digunakan di bawah lisensi Apache 2.0 serta kebijakan penggunaan gpt-oss. Namun, Anda bertanggung jawab atas biaya apa pun yang terkait dengan menjalankannya — seperti komputasi, penyimpanan, atau biaya hosting pihak ketiga. Harga untuk hal tersebut akan bergantung pada infrastruktur atau penyedia yang Anda pilih.
Apakah model ini “open source”?
Kami menggunakan istilah open models atau open-weight untuk menunjukkan bahwa bobot terlatih tersedia untuk publik di bawah lisensi Apache 2.0 yang permisif serta kebijakan penggunaan gpt-oss. Artinya, Anda dapat mengunduh model, menjalankannya di infrastruktur Anda sendiri atau dengan framework hosting yang didukung, dan menyesuaikan atau melakukan fine‑tune.
Model terbuka memberi developer dan organisasi kontrol serta fleksibilitas yang lebih besar. Anda dapat memilih lokasi hosting, mengadaptasikan model untuk use case tertentu, dan mendapatkan manfaat dari lisensi yang memungkinkan penggunaan, modifikasi, dan redistribusi yang luas. Walaupun bobot terlatihnya terbuka, sebagian infrastruktur atau tooling di sekitarnya dapat tetap bersifat proprietari milik penyedianya.
Bisakah saya mengakses model ini melalui OpenAI API atau ChatGPT?
Tidak. Model-model ini tidak disajikan di OpenAI API dan tidak muncul di ChatGPT.
Bisakah saya melakukan fine‑tune pada model?
Ya. Anda dapat melakukan fine‑tune menggunakan tools open‑source dan infrastruktur pilihan Anda. Kami tidak menawarkan fine‑tune melalui OpenAI API untuk model-model ini.
Apakah model open‑weight lebih murah daripada menggunakan API?
Biaya bervariasi tergantung infrastruktur, beban kerja, dan pendekatan operasional. Self‑hosting bisa lebih murah dalam beberapa kasus, sementara API Platform kami mungkin lebih efisien jika memperhitungkan hosting, pemeliharaan, dan upgrade.
Fitur apa yang didukung model ini?
Saat ini model-model ini adalah model penalaran khusus teks. Runtime umum mendukung streaming, function calling, dan structured output. Periksa dokumentasi runtime Anda untuk kemampuan yang tepat.
Apa bedanya ini dengan ModAPI?
Ini adalah model penalaran yang sangat mumpuni yang memungkinkan Anda membawa kebijakan Anda sendiri. Model ini dapat bekerja berdampingan dengan ModAPI, tetapi kemungkinan bukan pengganti untuk use case yang membutuhkan latensi rendah.
