Hinweis: Dieser Artikel bietet einen allgemeinen Überblick. Informationen zur technischen Einrichtung finden Sie auf der gpt-oss-Website, auf GitHub, bei Hugging Face und in den OpenAI Cookbooks.
Überblick
Einführung von zwei Open-Weight-Reasoning-Modellen: gpt‑oss‑120b und gpt‑oss‑20b. Sie laufen auf von Ihnen kontrollierter Infrastruktur oder über Hosting-Anbieter.
Hinweis: Diese Modelle werden nicht über die OpenAI API bereitgestellt und sind in ChatGPT nicht verfügbar.
Warum Open-Weights
Auswahl und Kontrolle: Führen Sie Modelle On-Premises oder in Ihrer privaten Cloud aus, wahren Sie die Datenresidenz und passen Sie die Leistung an Ihre Anforderungen an.
Anpassung: Passen Sie die Modelle per Fine-Tuning an oder adaptieren Sie sie mit Ihren bevorzugten offenen Tools.
Verfügbarkeit und Lizenzierung
Lizenz: Apache 2.0 erlaubt eine breite Nutzung, Änderung und Weiterverbreitung, einschließlich kommerzieller Nutzung (vorbehaltlich unserer gpt-oss-Nutzungsrichtlinie).
Serving: Nicht über die OpenAI API verfügbar, daher gelten API-Preise und Ratenlimits nicht.
Kompatibilität: Kann mit gängigen offenen Inferenz-Stacks wie vLLM, Ollama, llama.cpp sowie in Cloud- oder selbst verwalteten GPU-Umgebungen ausgeführt werden.
Erste Schritte
Um die Modellgewichte und unterstützende Ressourcen zu erhalten, können Sie:
Besuchen Sie die gpt-oss-Website für einen Überblick und direkte Links.
Laden Sie Gewichte aus der Hugging Face-Sammlung herunter — einem Community-Hub, in dem Sie beide Modelle finden, Nutzungsbeispiele ansehen und optional Inferenz direkt über die Dienste von Hugging Face ausführen können.
Greifen Sie auf unser GitHub-Repository für Referenz-Inferenzcode zu.
Nutzen Sie Anleitungen im OpenAI Cookbook für die Einrichtung mit unterstützten Runtimes wie Ollama, vLLM und Transformers. Das Cookbook enthält außerdem Schritt-für-Schritt-Anleitungen für die lokale Ausführung, die Nutzung gängiger Runtimes und — sofern unterstützt — das Fine-Tuning von gpt‑oss-Modellen.
gpt‑oss‑safeguard (Research Preview)
gpt‑oss‑safeguard ist ein Paar Open-Weight-Safety-Reasoning-Modelle, das auf gpt‑oss aufbaut. Sie sind für richtlinienbasierte Sicherheitsklassifizierung und verwandte Trust-&-Safety-Aufgaben konzipiert, die Sie auf von Ihnen kontrollierter Infrastruktur ausführen. Wie andere gpt‑oss-Modelle werden diese Gewichte nicht über die OpenAI API oder ChatGPT bereitgestellt.
Nur-Text-Modelle mit Referenzschemas für strukturierte Ausgaben (z. B. Richtlinienurteil, Begründung).
Eigene Richtlinie mitbringen: Das Modell interpretiert Ihre schriftliche Richtlinie, sodass es mit minimalem Engineering produktübergreifend generalisieren kann.
Begründete Entscheidungen: optionale Reasoning-Traces zur Unterstützung von Debugging und Audits (für Entwickler:innen und Sicherheitsexpert:innen vorgesehen, nicht zur Anzeige für Endnutzer:innen).
Konfigurierbarer Reasoning-Aufwand: Wählen Sie low / medium / high, um Latenz gegen Tiefe abzuwägen.
Lizenz: Apache 2.0 (siehe Verfügbarkeit und Lizenzierung unten).
gpt‑oss‑safeguard eignet sich gut für Input-/Output-Filtering für LLMs, Online-Content-Labeling sowie Offline-Batch-Labeling oder Review-Workflows. Für allgemeine Anwendungen (Chat, Agents usw.) empfehlen wir die zentralen gpt‑oss-Modelle.
Sie können das Schema an Ihre Anforderungen anpassen. Anleitungen zum Prompting und Beispiele finden Sie im OpenAI Cookbook.
Modellvarianten und Größen
| Modell | Vorgesehene Nutzung | Hinweise | | gpt‑oss‑safeguard‑120b | Produktion, Safety-Reasoning mit hoher Kapazität | 117 Mrd. Parameter (≈5,1 Mrd. aktiv). Ausgelegt für eine <br>einzelne 80-GB-GPU<br> (z. B. NVIDIA H100; läuft auch auf GPUs mit größerem Speicher wie AMD MI300X). | | gpt‑oss‑safeguard‑20b | Niedrigere Latenz / eingeschränkte Umgebungen | 21 Mrd. Parameter (≈3,6 Mrd. aktiv). |
Beide Modelle wurden aus gpt‑oss ohne Architekturänderung per Fine-Tuning angepasst. Sie verwenden dasselbe Chat-Template wie gpt‑oss; Sie können Ihr bestehendes Setup beibehalten. Ein empfohlenes Prompting-Muster besteht darin, Ihre Richtlinie in einer Developer-Nachricht und den zu bewertenden Inhalt in einer User-Nachricht zu platzieren.
Support und Community
Open-Weight-Bereitstellungen werden selbst verwaltet und betreut. Hier erhalten Sie Support:
Fragen, Diskussion, Tipps: Nutzen Sie die Hugging Face-Modellseiten, um mit der Community in Kontakt zu treten.
Reproduzierbare Fehler im Referenz-Inferenzcode von OpenAI: Öffnen Sie ein Issue im gpt-oss-GitHub-Repository.
Probleme mit einer Drittanbieter-Runtime (z. B. vLLM, Ollama, llama.cpp): Nutzen Sie den Issue-Tracker, die Foren oder den Supportprozess des jeweiligen Projekts.
OpenAI bietet keine Unterstützung, praktische Implementierung oder Debugging-Support für selbst gehostete oder von Drittanbietern gehostete Open-Weight-Setups, Konfigurationen, Umgebungen oder Anwendungen.
Wir werden die offenen Safety-Tools weiterhin gemeinsam mit der Community verbessern, unter anderem über die ROOST Model Community (RMC). Die RMC bringt Sicherheitsexpert:innen und Forschende zusammen, um Best Practices für die Implementierung von Open-Source-KI-Modellen in Safety-Workflows zu teilen, einschließlich Evaluationsergebnissen und Modellfeedback. Besuchen Sie das RMC-GitHub-Repository, um mehr über diese Partnerschaft und Beteiligungsmöglichkeiten zu erfahren.
Support und Community
Open-Weight-Bereitstellungen werden selbst verwaltet und betreut. Hier erhalten Sie Support:
Fragen, Diskussion, Tipps: Nutzen Sie die Hugging Face-Modellseiten, um mit der Community in Kontakt zu treten.
Reproduzierbare Fehler im Referenz-Inferenzcode von OpenAI: Öffnen Sie ein Issue im gpt-oss-GitHub-Repository.
Probleme mit einer Drittanbieter-Runtime (z. B. vLLM, Ollama, llama.cpp): Nutzen Sie den Issue-Tracker, die Foren oder den Supportprozess des jeweiligen Projekts.
OpenAI bietet keine Unterstützung, praktische Implementierung oder Debugging-Support für selbst gehostete oder von Drittanbietern gehostete Open-Weight-Setups, Konfigurationen, Umgebungen oder Anwendungen.
Datenschutz und Sicherheit
Datenschutz und Daten
Diese Modelle sind dafür konzipiert, auf Infrastruktur zu laufen, die Sie kontrollieren (On-Premises oder in Ihrer Cloud bzw. bei Ihrem Hosting-Partner). OpenAI empfängt oder verarbeitet die Daten, die Sie an diese selbst gehosteten Modelle senden, nicht, es sei denn, Sie teilen sie ausdrücklich mit OpenAI oder nutzen einen unserer verwalteten Hosting-Partner.
Sicherheit
Diese Modelle wurden umfassend auf Sicherheit trainiert und getestet. Weitere Details finden Sie in unserer Modellkarte und im technischen Bericht.
Melden von Inhaltsverstößen
Wenn Sie der Meinung sind, dass mit gpt‑oss-Modellen generierte Inhalte gegen unsere Richtlinien verstoßen, können Sie dies über unser Formular zum Melden von Inhalten melden. Bitte geben Sie so viele Details wie möglich an, damit unser Team Ihre Meldung prüfen kann.
FAQ
Sind diese Modelle kostenlos?
Die gpt-oss-Modellgewichte können unter der Apache-2.0-Lizenz und der gpt-oss-Nutzungsrichtlinie kostenlos heruntergeladen und genutzt werden. Sie sind jedoch für alle Kosten verantwortlich, die mit dem Betrieb verbunden sind — etwa für Rechenleistung, Speicher oder Drittanbieter-Hosting-Gebühren. Die Preise dafür hängen von der von Ihnen gewählten Infrastruktur oder dem Anbieter ab.
Sind diese Modelle „Open Source“?
Wir verwenden den Begriff offene Modelle oder Open-Weight , um anzugeben, dass die trainierten Gewichte unter der permissiven Apache-2.0-Lizenz und der gpt-oss-Nutzungsrichtlinie öffentlich verfügbar sind. Das bedeutet, dass Sie die Modelle herunterladen, auf Ihrer eigenen Infrastruktur oder mit unterstützten Hosting-Frameworks ausführen und sie anpassen oder per Fine-Tuning optimieren können.
Offene Modelle geben Entwickler:innen und Organisationen mehr Kontrolle und Flexibilität. Sie können wählen, wo Sie hosten, die Modelle für bestimmte Anwendungsfälle anpassen und von einer Lizenzierung profitieren, die eine breite Nutzung, Änderung und Weiterverbreitung erlaubt. Während die trainierten Gewichte offen sind, können einige umgebende Infrastrukturen oder Tools Eigentum ihrer Anbieter bleiben.
Kann ich über die OpenAI API oder ChatGPT auf diese Modelle zugreifen?
Nein. Diese Modelle werden nicht in der OpenAI API bereitgestellt und erscheinen nicht in ChatGPT.
Kann ich die Modelle per Fine-Tuning anpassen?
Ja. Sie können Fine-Tuning mit Open-Source-Tools und Ihrer bevorzugten Infrastruktur durchführen. Wir bieten für diese Modelle kein Fine-Tuning über OpenAI APIs an.
Sind Open-Weight-Modelle günstiger als die Nutzung der API?
Die Kosten variieren je nach Infrastruktur, Workload und Betriebsansatz. Self-Hosting kann in manchen Fällen günstiger sein, während unsere API Platform effizienter sein kann, wenn Hosting, Wartung und Upgrades berücksichtigt werden.
Welche Funktionen unterstützen diese Modelle?
Diese Modelle sind derzeit reine Text-Reasoning-Modelle. Gängige Runtimes unterstützen Streaming, Funktionsaufrufe und strukturierte Ausgaben. Prüfen Sie die Dokumentation Ihrer Runtime für die genauen Funktionen.
Worin unterscheidet sich dies von ModAPI?
Dies ist ein sehr leistungsfähiges Reasoning-Modell, das es Ihnen ermöglicht, Ihre eigene Richtlinie einzubringen. Es kann zusammen mit ModAPI eingesetzt werden, ist aber wahrscheinlich kein Ersatz für Anwendungsfälle mit niedriger Latenz.
