Poznámka: Tento článek poskytuje přehled na vysoké úrovni. Informace k technickému nastavení najdete na webu gpt-oss, GitHubu, Hugging Face a v OpenAI Cookbooks.

Přehled

Představujeme dva modely s uvažováním a otevřenými vahami: gpt‑oss‑120b a gpt‑oss‑20b. Běží na infrastruktuře, kterou řídíte, nebo prostřednictvím poskytovatelů hostingu.

Poznámka: Tyto modely nejsou poskytovány prostřednictvím OpenAI API a nejsou dostupné v ChatGPT.

Proč otevřené váhy

Volba a kontrola: Spouštějte modely on‑premises nebo ve svém privátním cloudu, zachovejte datovou rezidenci a přizpůsobte výkon svým potřebám.
Přizpůsobení: Dolaďujte nebo přizpůsobujte modely pomocí vámi preferovaných otevřených nástrojů.

Dostupnost a licencování

Licence: Apache 2.0 umožňuje široké použití, úpravy a redistribuci, včetně komerčního použití (s výhradou našich zásad použití gpt-oss).
Poskytování: Není dostupné prostřednictvím OpenAI API, takže ceny API ani limity frekvence požadavků se neuplatňují.
Kompatibilita: Lze spouštět s běžnými otevřenými inferenčními stacky, jako jsou vLLM, Ollama, llama.cpp, a v cloudových nebo samostatně spravovaných prostředích s GPU.

Začínáme

Chcete-li získat váhy modelu a podpůrné zdroje, můžete:

Navštívit web gpt-oss s přehledem a přímými odkazy.
Stáhnout váhy z kolekce Hugging Face — komunitního centra, kde najdete oba modely, příklady použití a volitelně můžete spustit inferenci přímo prostřednictvím služeb Hugging Face.
Získat přístup k našemu repozitáři GitHub s referenčním inferenčním kódem.
Použít průvodce v OpenAI Cookbook pro nastavení s podporovanými runtime, jako jsou Ollama, vLLM a Transformers. Cookbook obsahuje také podrobné pokyny pro lokální spouštění, používání běžných runtime a — tam, kde je to podporováno — dolaďování modelů gpt‑oss.

gpt‑oss‑safeguard (výzkumná ukázka)

gpt‑oss‑safeguard je dvojice bezpečnostních modelů s uvažováním a otevřenými vahami postavených na gpt‑oss. Jsou navrženy pro bezpečnostní klasifikaci založenou na zásadách a související úlohy důvěry a bezpečnosti, které spouštíte na infrastruktuře, již řídíte. Stejně jako jiné modely gpt‑oss nejsou tyto váhy poskytovány přes OpenAI API ani ChatGPT.

Pouze textové modely s referenčními schématy strukturovaných výstupů (např. verdikt podle zásad, odůvodnění).
Přineste si vlastní zásady: model interpretuje vaše psané zásady, aby se dokázal generalizovat napříč produkty s minimem inženýrské práce.
Odůvodněná rozhodnutí: volitelné stopy uvažování na podporu ladění a auditů (určeno pro vývojáře a bezpečnostní specialisty, ne pro zobrazení koncovým uživatelům).
Konfigurovatelné úsilí uvažování: zvolte nízké / střední / vysoké pro vyvážení latence a hloubky.
Licence: Apache 2.0 (viz Dostupnost a licencování níže).

gpt‑oss‑safeguard se dobře hodí pro filtrování vstupů/výstupů LLM, označování online obsahu a offline dávkové označování nebo kontrolní pracovní postupy. Pro obecné aplikace (chat, agenti apod.) doporučujeme základní modely gpt‑oss.

Schéma můžete přizpůsobit svým potřebám. Průvodce promptováním a příklady najdete v OpenAI Cookbook.

Varianty a velikosti modelů

Model	Zamýšlené použití	Poznámky
gpt‑oss‑safeguard‑120b	Produkční bezpečnostní uvažování s vysokou kapacitou	117B parametrů (≈5,1B aktivních). Navrženo tak, aby se vešlo na jednu GPU s 80 GB paměti (např. NVIDIA H100; běží také na GPU s větší pamětí, jako je AMD MI300X).
gpt‑oss‑safeguard‑20b	Prostředí s nižší latencí / omezenými zdroji	21B parametrů (≈3,6B aktivních).

Oba modely jsou doladěny z gpt‑oss beze změny architektury. Používají stejnou chatovací šablonu jako gpt‑oss; stávající nastavení můžete ponechat. Doporučený vzor promptování je umístit vaše zásady do zprávy vývojáře a obsah k vyhodnocení do zprávy uživatele.

Podpora a komunita

Nasazení s otevřenými vahami si spravujete a obsluhujete sami. Podporu získáte zde:

Otázky, diskuse, tipy: Ke komunikaci s komunitou použijte stránky modelů na Hugging Face.
Reprodukovatelné chyby v referenčním inferenčním kódu OpenAI: Otevřete issue v repozitáři GitHub gpt-oss.
Problémy s runtime třetí strany (např. vLLM, Ollama, llama.cpp): Použijte tracker issues, fóra nebo proces podpory příslušného projektu.

OpenAI neposkytuje asistenci, praktickou implementaci ani podporu ladění pro žádná self‑hostovaná nebo třetí stranou hostovaná nastavení, konfigurace, prostředí či aplikace s otevřenými vahami.

Budeme dál iterovat s komunitou na zlepšování otevřených bezpečnostních nástrojů, mimo jiné prostřednictvím ROOST Model Community (RMC). RMC sdružuje bezpečnostní specialisty a výzkumníky, aby sdíleli osvědčené postupy pro implementaci open source AI modelů do bezpečnostních pracovních postupů, včetně výsledků hodnocení a zpětné vazby k modelům. Navštivte repozitář RMC na GitHubu, kde se dozvíte více o tomto partnerství a možnostech zapojení.

Podpora a komunita

Nasazení s otevřenými vahami si spravujete a obsluhujete sami. Podporu získáte zde:

Otázky, diskuse, tipy: Ke komunikaci s komunitou použijte stránky modelů na Hugging Face.
Reprodukovatelné chyby v referenčním inferenčním kódu OpenAI: Otevřete issue v repozitáři GitHub gpt-oss.
Problémy s runtime třetí strany (např. vLLM, Ollama, llama.cpp): Použijte tracker issues, fóra nebo proces podpory příslušného projektu.

Soukromí a bezpečnost

Soukromí a data

Tyto modely jsou navrženy tak, aby běžely na infrastruktuře, kterou řídíte (on‑premises, ve vašem cloudu nebo u hostingového partnera). OpenAI nepřijímá ani nezpracovává data, která těmto self‑hostovaným modelům posíláte, pokud je s OpenAI výslovně nesdílíte nebo nepoužijete některého z našich spravovaných hostingových partnerů.

Bezpečnost

Tyto modely prošly rozsáhlým bezpečnostním tréninkem a testováním. Další podrobnosti najdete v naší kartě modelu a technické zprávě.

Nahlášení porušení pravidel obsahu

Pokud se domníváte, že obsah vygenerovaný pomocí modelů gpt‑oss porušuje naše zásady, můžete jej nahlásit prostřednictvím našeho formuláře pro nahlášení obsahu. Uveďte prosím co nejvíce podrobností, abyste našemu týmu pomohli vaše podání posoudit.

Časté dotazy

Jsou tyto modely zdarma?

Váhy modelů gpt-oss lze zdarma stáhnout a používat podle licence Apache 2.0 a podle zásad používání pro gpt-oss. Nesete však odpovědnost za veškeré náklady spojené s jejich provozem — například za výpočetní prostředky, úložiště nebo poplatky za hosting u třetích stran. Jejich cena bude záviset na vámi zvolené infrastruktuře nebo poskytovateli.

Jsou tyto modely „open source“?

Termín open modely nebo s otevřenými vahami používáme k označení toho, že natrénované váhy jsou veřejně dostupné pod permisivní licencí Apache 2.0 a zásadami použití gpt-oss. To znamená, že si modely můžete stáhnout, spouštět je na vlastní infrastruktuře nebo s podporovanými hostingovými frameworky a upravovat či dolaďovat je.

Open modely dávají vývojářům a organizacím větší kontrolu a flexibilitu. Můžete si vybrat, kde je hostovat, přizpůsobit modely konkrétním případům použití a využít licenci umožňující široké použití, úpravy a redistribuci. Přestože jsou natrénované váhy otevřené, některá okolní infrastruktura nebo nástroje mohou zůstat proprietární pro své poskytovatele.

Mohu k těmto modelům přistupovat přes OpenAI API nebo ChatGPT?

Ne. Tyto modely nejsou poskytovány v OpenAI API a nezobrazují se v ChatGPT.

Mohu modely dolaďovat?

Ano. Dolaďování můžete provádět pomocí open‑source nástrojů a vámi preferované infrastruktury. U těchto modelů nenabízíme dolaďování prostřednictvím API OpenAI.

Jsou modely s otevřenými vahami levnější než použití API?

Náklady se liší podle infrastruktury, zátěže a provozního přístupu. Self‑hosting může být v některých případech levnější, zatímco naše API Platform může být efektivnější po započtení hostingu, údržby a upgradů.

Jaké funkce tyto modely podporují?

Tyto modely jsou v současnosti pouze textové modely s uvažováním. Běžné runtime podporují streamování, volání funkce a strukturované výstupy. Přesné možnosti najdete v dokumentaci svého runtime.

Jak se to liší od ModAPI?

Jde o vysoce schopný model s uvažováním, který vám umožňuje přinést si vlastní zásady. Může fungovat společně s ModAPI, ale pravděpodobně nenahrazuje případy použití s nízkou latencí.

OpenAI open-weight modely (gpt-oss)

Přehled

Proč otevřené váhy

Dostupnost a licencování

Začínáme

gpt‑oss‑safeguard (výzkumná ukázka)

Varianty a velikosti modelů

Podpora a komunita

Podpora a komunita

Soukromí a bezpečnost

Soukromí a data

Bezpečnost

Nahlášení porušení pravidel obsahu

Časté dotazy

Jsou tyto modely zdarma?

Jsou tyto modely „open source“?

Mohu k těmto modelům přistupovat přes OpenAI API nebo ChatGPT?

Mohu modely dolaďovat?

Jsou modely s otevřenými vahami levnější než použití API?

Jaké funkce tyto modely podporují?

Jak se to liší od ModAPI?

Byl tento článek užitečný?