Poznámka: Tento článek poskytuje přehled na vysoké úrovni. Informace k technickému nastavení najdete na webu gpt-oss, GitHubu, Hugging Face a v OpenAI Cookbooks.
Přehled
Představujeme dva modely s uvažováním a otevřenými vahami: gpt‑oss‑120b a gpt‑oss‑20b. Běží na infrastruktuře, kterou řídíte, nebo prostřednictvím poskytovatelů hostingu.
Poznámka: Tyto modely nejsou poskytovány prostřednictvím OpenAI API a nejsou dostupné v ChatGPT.
Proč otevřené váhy
Volba a kontrola: Spouštějte modely on‑premises nebo ve svém privátním cloudu, zachovejte datovou rezidenci a přizpůsobte výkon svým potřebám.
Přizpůsobení: Dolaďujte nebo přizpůsobujte modely pomocí vámi preferovaných otevřených nástrojů.
Dostupnost a licencování
Licence: Apache 2.0 umožňuje široké použití, úpravy a redistribuci, včetně komerčního použití (s výhradou našich zásad použití gpt-oss).
Poskytování: Není dostupné prostřednictvím OpenAI API, takže ceny API ani limity frekvence požadavků se neuplatňují.
Kompatibilita: Lze spouštět s běžnými otevřenými inferenčními stacky, jako jsou vLLM, Ollama, llama.cpp, a v cloudových nebo samostatně spravovaných prostředích s GPU.
Začínáme
Chcete-li získat váhy modelu a podpůrné zdroje, můžete:
Navštívit web gpt-oss s přehledem a přímými odkazy.
Stáhnout váhy z kolekce Hugging Face — komunitního centra, kde najdete oba modely, příklady použití a volitelně můžete spustit inferenci přímo prostřednictvím služeb Hugging Face.
Získat přístup k našemu repozitáři GitHub s referenčním inferenčním kódem.
Použít průvodce v OpenAI Cookbook pro nastavení s podporovanými runtime, jako jsou Ollama, vLLM a Transformers. Cookbook obsahuje také podrobné pokyny pro lokální spouštění, používání běžných runtime a — tam, kde je to podporováno — dolaďování modelů gpt‑oss.
gpt‑oss‑safeguard (výzkumná ukázka)
gpt‑oss‑safeguard je dvojice bezpečnostních modelů s uvažováním a otevřenými vahami postavených na gpt‑oss. Jsou navrženy pro bezpečnostní klasifikaci založenou na zásadách a související úlohy důvěry a bezpečnosti, které spouštíte na infrastruktuře, již řídíte. Stejně jako jiné modely gpt‑oss nejsou tyto váhy poskytovány přes OpenAI API ani ChatGPT.
Pouze textové modely s referenčními schématy strukturovaných výstupů (např. verdikt podle zásad, odůvodnění).
Přineste si vlastní zásady: model interpretuje vaše psané zásady, aby se dokázal generalizovat napříč produkty s minimem inženýrské práce.
Odůvodněná rozhodnutí: volitelné stopy uvažování na podporu ladění a auditů (určeno pro vývojáře a bezpečnostní specialisty, ne pro zobrazení koncovým uživatelům).
Konfigurovatelné úsilí uvažování: zvolte nízké / střední / vysoké pro vyvážení latence a hloubky.
Licence: Apache 2.0 (viz Dostupnost a licencování níže).
gpt‑oss‑safeguard se dobře hodí pro filtrování vstupů/výstupů LLM, označování online obsahu a offline dávkové označování nebo kontrolní pracovní postupy. Pro obecné aplikace (chat, agenti apod.) doporučujeme základní modely gpt‑oss.
Schéma můžete přizpůsobit svým potřebám. Průvodce promptováním a příklady najdete v OpenAI Cookbook.
Varianty a velikosti modelů
| Model | Zamýšlené použití | Poznámky |
|---|---|---|
| gpt‑oss‑safeguard‑120b | Produkční bezpečnostní uvažování s vysokou kapacitou | 117B parametrů (≈5,1B aktivních). Navrženo tak, aby se vešlo na jednu GPU s 80 GB paměti (např. NVIDIA H100; běží také na GPU s větší pamětí, jako je AMD MI300X). |
| gpt‑oss‑safeguard‑20b | Prostředí s nižší latencí / omezenými zdroji | 21B parametrů (≈3,6B aktivních). |
Oba modely jsou doladěny z gpt‑oss beze změny architektury. Používají stejnou chatovací šablonu jako gpt‑oss; stávající nastavení můžete ponechat. Doporučený vzor promptování je umístit vaše zásady do zprávy vývojáře a obsah k vyhodnocení do zprávy uživatele.
Podpora a komunita
Nasazení s otevřenými vahami si spravujete a obsluhujete sami. Podporu získáte zde:
Otázky, diskuse, tipy: Ke komunikaci s komunitou použijte stránky modelů na Hugging Face.
Reprodukovatelné chyby v referenčním inferenčním kódu OpenAI: Otevřete issue v repozitáři GitHub gpt-oss.
Problémy s runtime třetí strany (např. vLLM, Ollama, llama.cpp): Použijte tracker issues, fóra nebo proces podpory příslušného projektu.
OpenAI neposkytuje asistenci, praktickou implementaci ani podporu ladění pro žádná self‑hostovaná nebo třetí stranou hostovaná nastavení, konfigurace, prostředí či aplikace s otevřenými vahami.
Budeme dál iterovat s komunitou na zlepšování otevřených bezpečnostních nástrojů, mimo jiné prostřednictvím ROOST Model Community (RMC). RMC sdružuje bezpečnostní specialisty a výzkumníky, aby sdíleli osvědčené postupy pro implementaci open source AI modelů do bezpečnostních pracovních postupů, včetně výsledků hodnocení a zpětné vazby k modelům. Navštivte repozitář RMC na GitHubu, kde se dozvíte více o tomto partnerství a možnostech zapojení.
Podpora a komunita
Nasazení s otevřenými vahami si spravujete a obsluhujete sami. Podporu získáte zde:
Otázky, diskuse, tipy: Ke komunikaci s komunitou použijte stránky modelů na Hugging Face.
Reprodukovatelné chyby v referenčním inferenčním kódu OpenAI: Otevřete issue v repozitáři GitHub gpt-oss.
Problémy s runtime třetí strany (např. vLLM, Ollama, llama.cpp): Použijte tracker issues, fóra nebo proces podpory příslušného projektu.
OpenAI neposkytuje asistenci, praktickou implementaci ani podporu ladění pro žádná self‑hostovaná nebo třetí stranou hostovaná nastavení, konfigurace, prostředí či aplikace s otevřenými vahami.
Soukromí a bezpečnost
Soukromí a data
Tyto modely jsou navrženy tak, aby běžely na infrastruktuře, kterou řídíte (on‑premises, ve vašem cloudu nebo u hostingového partnera). OpenAI nepřijímá ani nezpracovává data, která těmto self‑hostovaným modelům posíláte, pokud je s OpenAI výslovně nesdílíte nebo nepoužijete některého z našich spravovaných hostingových partnerů.
Bezpečnost
Tyto modely prošly rozsáhlým bezpečnostním tréninkem a testováním. Další podrobnosti najdete v naší kartě modelu a technické zprávě.
Nahlášení porušení pravidel obsahu
Pokud se domníváte, že obsah vygenerovaný pomocí modelů gpt‑oss porušuje naše zásady, můžete jej nahlásit prostřednictvím našeho formuláře pro nahlášení obsahu. Uveďte prosím co nejvíce podrobností, abyste našemu týmu pomohli vaše podání posoudit.
Časté dotazy
Jsou tyto modely zdarma?
Váhy modelů gpt-oss lze zdarma stáhnout a používat podle licence Apache 2.0 a podle zásad používání pro gpt-oss. Nesete však odpovědnost za veškeré náklady spojené s jejich provozem — například za výpočetní prostředky, úložiště nebo poplatky za hosting u třetích stran. Jejich cena bude záviset na vámi zvolené infrastruktuře nebo poskytovateli.
Jsou tyto modely „open source“?
Termín open modely nebo s otevřenými vahami používáme k označení toho, že natrénované váhy jsou veřejně dostupné pod permisivní licencí Apache 2.0 a zásadami použití gpt-oss. To znamená, že si modely můžete stáhnout, spouštět je na vlastní infrastruktuře nebo s podporovanými hostingovými frameworky a upravovat či dolaďovat je.
Open modely dávají vývojářům a organizacím větší kontrolu a flexibilitu. Můžete si vybrat, kde je hostovat, přizpůsobit modely konkrétním případům použití a využít licenci umožňující široké použití, úpravy a redistribuci. Přestože jsou natrénované váhy otevřené, některá okolní infrastruktura nebo nástroje mohou zůstat proprietární pro své poskytovatele.
Mohu k těmto modelům přistupovat přes OpenAI API nebo ChatGPT?
Ne. Tyto modely nejsou poskytovány v OpenAI API a nezobrazují se v ChatGPT.
Mohu modely dolaďovat?
Ano. Dolaďování můžete provádět pomocí open‑source nástrojů a vámi preferované infrastruktury. U těchto modelů nenabízíme dolaďování prostřednictvím API OpenAI.
Jsou modely s otevřenými vahami levnější než použití API?
Náklady se liší podle infrastruktury, zátěže a provozního přístupu. Self‑hosting může být v některých případech levnější, zatímco naše API Platform může být efektivnější po započtení hostingu, údržby a upgradů.
Jaké funkce tyto modely podporují?
Tyto modely jsou v současnosti pouze textové modely s uvažováním. Běžné runtime podporují streamování, volání funkce a strukturované výstupy. Přesné možnosti najdete v dokumentaci svého runtime.
Jak se to liší od ModAPI?
Jde o vysoce schopný model s uvažováním, který vám umožňuje přinést si vlastní zásady. Může fungovat společně s ModAPI, ale pravděpodobně nenahrazuje případy použití s nízkou latencí.
