OpenAI
Táto stránka bola strojovo preložená. Prečítaj si pôvodný článok v angličtine.

OpenAI modely s otvorenými váhami (gpt-oss)

Zistite viac o modeloch OpenAI s otvorenými váhami (gpt-oss) a o tom, kde získať podporu

Aktualizované: 15 days ago

Poznámka: Tento článok poskytuje všeobecný prehľad. Informácie o technickom nastavení nájdete na webe gpt-oss, GitHub, Hugging Face a v OpenAI Cookbooks.

Prehľad

Predstavujeme dva uvažovacie modely s otvorenými váhami: gpt‑oss‑120b a gpt‑oss‑20b. Bežia na infraštruktúre, ktorú ovládate, alebo cez poskytovateľov hostingu.

Poznámka: Tieto modely sa neposkytujú prostredníctvom OpenAI API a nie sú dostupné v ChatGPT.

Prečo otvorené váhy

  • Voľba a kontrola: Spúšťajte modely lokálne alebo vo svojom súkromnom cloude, zachovajte rezidenciu údajov a prispôsobte výkon svojim potrebám.

  • Prispôsobenie: Dolaďte alebo prispôsobte modely pomocou preferovaných otvorených nástrojov.

Dostupnosť a licencovanie

  • Licencia: Apache 2.0 umožňuje široké používanie, úpravy a redistribúciu vrátane komerčného použitia (v súlade s našimi zásadami používania gpt-oss).

  • Poskytovanie: Nie sú dostupné cez OpenAI API, takže ceny API a limity požiadaviek sa neuplatňujú.

  • Kompatibilita: Možno ich spúšťať s bežnými otvorenými inferenčnými stackmi, ako sú vLLM, Ollama, llama.cpp, a v cloudových alebo vlastne spravovaných GPU prostrediach.

Začíname

Ak chcete získať váhy modelu a podporné zdroje, môžete:

  • Navštíviť web gpt-oss, kde nájdete prehľad a priame odkazy.

  • Stiahnuť váhy z kolekcie Hugging Face — komunitného centra, kde nájdete oba modely, príklady použitia a voliteľne môžete spustiť inferenciu priamo cez služby Hugging Face.

  • Získať prístup k nášmu repozitáru GitHub s referenčným inferenčným kódom.

  • Použiť návody v OpenAI Cookbook na nastavenie s podporovanými runtime prostrediami, ako sú Ollama, vLLM a Transformers. Cookbook obsahuje aj podrobné pokyny na lokálne spúšťanie, používanie bežných runtime prostredí a — tam, kde je to podporované — dolaďovanie modelov gpt‑oss.

gpt‑oss‑safeguard (výskumná ukážka)

gpt‑oss‑safeguard je dvojica bezpečnostných uvažovacích modelov s otvorenými váhami postavených na gpt‑oss. Sú navrhnuté na bezpečnostnú klasifikáciu založenú na zásadách a súvisiace úlohy dôvery a bezpečnosti, ktoré spúšťate na infraštruktúre, ktorú ovládate. Podobne ako iné modely gpt‑oss, ani tieto váhy sa neposkytujú cez OpenAI API ani ChatGPT.

  • Iba textové modely s referenčnými schémami štruktúrovaných výstupov (napr. verdikt podľa zásad, odôvodnenie).

  • Prineste si vlastné zásady: model interpretuje vaše písomné zásady, aby sa mohol zovšeobecňovať naprieč produktmi s minimom inžinierstva.

  • Odôvodnené rozhodnutia: voliteľné stopy uvažovania na pomoc pri ladení a auditoch (určené pre vývojárov a bezpečnostných odborníkov, nie na zobrazenie koncovým používateľom).

  • Konfigurovateľné úsilie uvažovania: vyberte nízke / stredné / vysoké na vyváženie latencie a hĺbky.

  • Licencia: Apache 2.0 (pozrite si Dostupnosť a licencovanie nižšie).

gpt‑oss‑safeguard je vhodný na filtrovanie vstupov/výstupov pre LLM, označovanie online obsahu a offline dávkové označovanie alebo pracovné postupy kontroly. Pre všeobecné aplikácie (chat, agenti atď.) odporúčame základné modely gpt‑oss.

Schému môžete prispôsobiť svojim potrebám. Návody na príkazy a príklady nájdete v OpenAI Cookbook.

Varianty modelov a veľkosť

ModelZamýšľané použitiePoznámky
gpt‑oss‑safeguard‑120bProdukčné bezpečnostné uvažovanie s vysokou kapacitou117 mld. parametrov (≈5,1 mld. aktívnych). Navrhnuté tak, aby sa zmestili na

jednu 80 GB GPU
(napr. NVIDIA H100; fungujú aj na GPU s väčšou pamäťou, ako je AMD MI300X).
gpt‑oss‑safeguard‑20bProstredia s nižšou latenciou / obmedzenými zdrojmi21 mld. parametrov (≈3,6 mld. aktívnych).

Oba modely sú doladené z gpt‑oss bez zmeny architektúry. Používajú rovnakú šablónu chatu ako gpt‑oss; existujúce nastavenie si môžete ponechať. Odporúčaný vzor príkazu je umiestniť vaše zásady do správy vývojára a obsah na vyhodnotenie do správy používateľa.

Podpora a komunita

Nasadenia s otvorenými váhami si spravujete a obsluhujete sami. Podporu získate tu:

  • Otázky, diskusia, tipy: Na zapojenie do komunity použite stránky modelov na Hugging Face.

  • Reprodukovateľné chyby v referenčnom inferenčnom kóde OpenAI: Otvorte issue v repozitári GitHub pre gpt-oss.

  • Problémy s runtime prostredím tretej strany (napr. vLLM, Ollama, llama.cpp): Použite sledovanie problémov, fóra alebo proces podpory príslušného projektu.

OpenAI neposkytuje pomoc, praktickú implementáciu ani podporu pri ladení pre žiadne self‑hostované alebo treťou stranou hostované nastavenia, konfigurácie, prostredia či aplikácie s otvorenými váhami.

Budeme pokračovať v iteráciách s komunitou s cieľom zlepšovať otvorené bezpečnostné nástroje, a to aj prostredníctvom ROOST Model Community (RMC). RMC spája bezpečnostných odborníkov a výskumníkov, aby zdieľali osvedčené postupy pri implementácii open source AI modelov do bezpečnostných pracovných postupov vrátane výsledkov hodnotení a spätnej väzby k modelom. Navštívte repozitár RMC na GitHub, kde sa dozviete viac o tomto partnerstve a o tom, ako sa zapojiť.

Podpora a komunita

Nasadenia s otvorenými váhami si spravujete a obsluhujete sami. Podporu získate tu:

  • Otázky, diskusia, tipy: Na zapojenie do komunity použite stránky modelov na Hugging Face.

  • Reprodukovateľné chyby v referenčnom inferenčnom kóde OpenAI: Otvorte issue v repozitári GitHub pre gpt-oss.

  • Problémy s runtime prostredím tretej strany (napr. vLLM, Ollama, llama.cpp): Použite sledovanie problémov, fóra alebo proces podpory príslušného projektu.

OpenAI neposkytuje pomoc, praktickú implementáciu ani podporu pri ladení pre žiadne self‑hostované alebo treťou stranou hostované nastavenia, konfigurácie, prostredia či aplikácie s otvorenými váhami.

Súkromie a bezpečnosť

Súkromie a údaje

Tieto modely sú navrhnuté tak, aby bežali na infraštruktúre, ktorú ovládate (lokálne alebo vo vašom cloude či u hostingového partnera). OpenAI neprijíma ani nespracúva údaje, ktoré odosielate týmto self‑hostovaným modelom, pokiaľ ich výslovne nezdieľate s OpenAI alebo nepoužijete jedného z našich spravovaných hostingových partnerov.

Bezpečnosť

Tieto modely prešli rozsiahlym bezpečnostným tréningom a testovaním. Ďalšie podrobnosti nájdete v našej karte modelu a technickej správe.

Nahlasovanie porušení týkajúcich sa obsahu

Ak sa domnievate, že obsah vygenerovaný modelmi gpt‑oss porušuje naše zásady, môžete ho nahlásiť prostredníctvom nášho formulára na nahlásenie obsahu. Uveďte čo najviac podrobností, aby náš tím mohol vaše podanie posúdiť.

Časté otázky

Sú tieto modely bezplatné?

Váhy modelov gpt-oss si môžete bezplatne stiahnuť a používať na základe licencie Apache 2.0 a zásad používania gpt-oss. Zodpovedáte však za všetky náklady spojené s ich prevádzkou — napríklad výpočtový výkon, úložisko alebo poplatky za hosting tretej strany. Ceny budú závisieť od zvolenej infraštruktúry alebo poskytovateľa.

Sú tieto modely „s otvoreným zdrojovým kódom“?

Používame pojem otvorené modely alebo s otvorenými váhami na označenie toho, že natrénované váhy sú verejne dostupné na základe permisívnej licencie Apache 2.0 a zásad používania gpt-oss. To znamená, že si modely môžete stiahnuť, spúšťať ich na vlastnej infraštruktúre alebo s podporovanými hostingovými rámcami a prispôsobiť alebo doladiť ich.

Otvorené modely poskytujú vývojárom a organizáciám väčšiu kontrolu a flexibilitu. Môžete si vybrať, kde ich budete hostovať, prispôsobiť modely konkrétnym prípadom použitia a využiť licencovanie, ktoré umožňuje široké používanie, úpravy a redistribúciu. Hoci sú natrénované váhy otvorené, časť okolitej infraštruktúry alebo nástrojov môže zostať proprietárna pre ich poskytovateľov.

Môžem k týmto modelom pristupovať cez OpenAI API alebo ChatGPT?

Nie. Tieto modely sa neposkytujú v OpenAI API a nezobrazujú sa v ChatGPT.

Môžem modely doladiť?

Áno. Dolaďovať môžete pomocou open‑source nástrojov a preferovanej infraštruktúry. Pre tieto modely neponúkame dolaďovanie cez OpenAI API.

Sú modely s otvorenými váhami lacnejšie než používanie API?

Náklady sa líšia podľa infraštruktúry, pracovného zaťaženia a prevádzkového prístupu. Self‑hosting môže byť v niektorých prípadoch lacnejší, zatiaľ čo naša API Platform môže byť efektívnejšia, ak zohľadníte hosting, údržbu a inovácie.

Aké funkcie tieto modely podporujú?

Tieto modely sú momentálne iba textové uvažovacie modely. Bežné runtime prostredia podporujú streamovanie, volanie funkcie a štruktúrované výstupy. Presné možnosti si overte v dokumentácii svojho runtime prostredia.

Ako sa to líši od ModAPI?

Ide o veľmi schopný uvažovací model, ktorý vám umožňuje priniesť si vlastné zásady. Môže fungovať v súčinnosti s ModAPI, ale pravdepodobne nenahradí prípady použitia s nízkou latenciou.

Bol tento článok užitočný?