Uwaga: Ten artykuł zawiera ogólne omówienie. Informacje dotyczące konfiguracji technicznej można znaleźć w witrynie gpt-oss, na GitHubie, w Hugging Face oraz w OpenAI Cookbooks.
Omówienie
Przedstawiamy dwa modele rozumujące z otwartymi wagami: gpt‑oss‑120b i gpt‑oss‑20b. Działają na infrastrukturze, którą kontrolujesz, lub za pośrednictwem dostawców hostingu.
Uwaga: Te modele nie są udostępniane przez OpenAI API i nie są dostępne w ChatGPT.
Dlaczego otwarte wagi
Wybór i kontrola: uruchamiaj modele lokalnie lub w swojej prywatnej chmurze, zachowuj rezydencję danych i dostosowuj wydajność do swoich potrzeb.
Dostosowywanie: dostrajaj lub adaptuj modele za pomocą preferowanych otwartych narzędzi.
Dostępność i licencjonowanie
Licencja: Apache 2.0 pozwala na szerokie użycie, modyfikację i redystrybucję, w tym użycie komercyjne (z zastrzeżeniem naszych zasad użytkowania gpt-oss).
Udostępnianie: niedostępne przez API OpenAI, więc ceny API i limity zapytań nie mają zastosowania.
Zgodność: można uruchamiać z popularnymi otwartymi stosami wnioskowania, takimi jak vLLM, Ollama, llama.cpp, oraz w środowiskach GPU w chmurze lub zarządzanych samodzielnie.
Pierwsze kroki
Aby uzyskać wagi modelu i materiały pomocnicze, możesz:
Odwiedzić witrynę gpt-oss, aby zobaczyć omówienie i bezpośrednie linki.
Pobrać wagi z kolekcji Hugging Face — centrum społeczności, w którym znajdziesz oba modele, zobaczysz przykłady użycia i opcjonalnie uruchomisz wnioskowanie bezpośrednio przez usługi Hugging Face.
Uzyskać dostęp do naszego repozytorium GitHub z referencyjnym kodem wnioskowania.
Skorzystać z przewodników w OpenAI Cookbook, aby skonfigurować obsługiwane środowiska wykonawcze, takie jak Ollama, vLLM i Transformers. Cookbook zawiera też instrukcje krok po kroku dotyczące uruchamiania lokalnego, korzystania z popularnych środowisk wykonawczych oraz — tam, gdzie jest to obsługiwane — dostrajania modeli gpt‑oss.
gpt‑oss‑safeguard (wersja badawcza)
gpt‑oss‑safeguard to para modeli rozumujących bezpieczeństwa z otwartymi wagami zbudowanych na bazie gpt‑oss. Są przeznaczone do opartej na zasadach klasyfikacji bezpieczeństwa oraz powiązanych zadań z zakresu zaufania i bezpieczeństwa, uruchamianych na infrastrukturze, którą kontrolujesz. Podobnie jak inne modele gpt‑oss, te wagi nie są udostępniane przez API OpenAI ani ChatGPT.
Modele wyłącznie tekstowe z referencyjnymi schematami ustrukturyzowanych danych wyjściowych (np. werdykt dotyczący zasad, uzasadnienie).
Własne zasady: model interpretuje Twoje spisane zasady, dzięki czemu może uogólniać na różne produkty przy minimalnej pracy inżynieryjnej.
Uzasadnione decyzje: opcjonalne ślady rozumowania ułatwiające debugowanie i audyty (przeznaczone dla deweloperów oraz specjalistów ds. bezpieczeństwa, nie do wyświetlania użytkownikom końcowym).
Konfigurowalny wysiłek rozumowania: wybierz niski / średni / wysoki, aby zrównoważyć opóźnienie i głębokość.
Licencja: Apache 2.0 (zobacz poniżej Dostępność i licencjonowanie).
gpt‑oss‑safeguard dobrze sprawdza się w filtrowaniu wejść/wyjść LLM, oznaczaniu treści online oraz przepływach pracy związanych z etykietowaniem lub przeglądem wsadowym offline. Do zastosowań ogólnych (czat, agenty itd.) zalecamy podstawowe modele gpt‑oss.
Możesz dostosować schemat do swoich potrzeb. Przewodniki dotyczące poleceń i przykłady znajdziesz w OpenAI Cookbook.
Warianty i rozmiary modeli
| Model | Przeznaczenie | Uwagi |
|---|---|---|
| gpt‑oss‑safeguard‑120b | Produkcja, wysokowydajne rozumowanie dotyczące bezpieczeństwa | 117 mld parametrów (≈5,1 mld aktywnych). Zaprojektowany tak, aby mieścił się na jednym GPU 80 GB (np. NVIDIA H100; działa też na GPU z większą pamięcią, takich jak AMD MI300X). |
| gpt‑oss‑safeguard‑20b | Mniejsze opóźnienia / środowiska z ograniczeniami | 21 mld parametrów (≈3,6 mld aktywnych). |
Oba modele są dostrojone z gpt‑oss bez zmiany architektury. Używają tego samego szablonu czatu co gpt‑oss; możesz zachować obecną konfigurację. Zalecany wzorzec poleceń polega na umieszczeniu zasad w wiadomości dewelopera, a treści do oceny w wiadomości użytkownika.
Wsparcie i społeczność
Wdrożeniami z otwartymi wagami zarządza się samodzielnie i samodzielnie je obsługuje. Oto gdzie można uzyskać wsparcie:
Pytania, dyskusje, wskazówki: korzystaj ze stron modeli w Hugging Face, aby kontaktować się ze społecznością.
Powtarzalne błędy w referencyjnym kodzie wnioskowania OpenAI: zgłoś problem w repozytorium GitHub gpt-oss.
Problemy ze środowiskiem wykonawczym innej firmy (np. vLLM, Ollama, llama.cpp): skorzystaj z narzędzia do zgłaszania problemów, forów lub procesu wsparcia danego projektu.
OpenAI nie zapewnia pomocy, praktycznego wdrożenia ani wsparcia w debugowaniu żadnych samodzielnie hostowanych ani hostowanych przez firmy trzecie konfiguracji, środowisk czy aplikacji z otwartymi wagami.
Będziemy nadal współpracować ze społecznością, aby ulepszać otwarte narzędzia bezpieczeństwa, m.in. poprzez ROOST Model Community (RMC). RMC łączy specjalistów i badaczy ds. bezpieczeństwa, aby dzielili się najlepszymi praktykami wdrażania modeli AI open source w przepływach pracy dotyczących bezpieczeństwa, w tym wynikami ewaluacji i opiniami o modelach. Odwiedź repozytorium RMC na GitHubie, aby dowiedzieć się więcej o tym partnerstwie i sposobach zaangażowania.
Wsparcie i społeczność
Wdrożeniami z otwartymi wagami zarządza się samodzielnie i samodzielnie je obsługuje. Oto gdzie można uzyskać wsparcie:
Pytania, dyskusje, wskazówki: korzystaj ze stron modeli w Hugging Face, aby kontaktować się ze społecznością.
Powtarzalne błędy w referencyjnym kodzie wnioskowania OpenAI: zgłoś problem w repozytorium GitHub gpt-oss.
Problemy ze środowiskiem wykonawczym innej firmy (np. vLLM, Ollama, llama.cpp): skorzystaj z narzędzia do zgłaszania problemów, forów lub procesu wsparcia danego projektu.
OpenAI nie zapewnia pomocy, praktycznego wdrożenia ani wsparcia w debugowaniu żadnych samodzielnie hostowanych ani hostowanych przez firmy trzecie konfiguracji, środowisk czy aplikacji z otwartymi wagami.
Prywatność i bezpieczeństwo
Prywatność i dane
Te modele zaprojektowano do działania na infrastrukturze, którą kontrolujesz (lokalnie albo w Twojej chmurze lub u partnera hostingowego). OpenAI nie otrzymuje ani nie przetwarza danych wysyłanych do tych samodzielnie hostowanych modeli, chyba że wyraźnie udostępnisz je OpenAI lub skorzystasz z jednego z naszych zarządzanych partnerów hostingowych.
Bezpieczeństwo
Te modele przeszły rozbudowane szkolenie i testy bezpieczeństwa. Więcej szczegółów znajdziesz w naszej karcie modelu i raporcie technicznym.
Zgłaszanie naruszeń dotyczących treści
Jeśli uważasz, że treść wygenerowana za pomocą modeli gpt‑oss narusza nasze zasady, możesz zgłosić ją przez nasz formularz zgłaszania treści. Podaj jak najwięcej szczegółów, aby pomóc naszemu zespołowi przeanalizować Twoje zgłoszenie.
FAQ
Czy te modele są bezpłatne?
Wagi modeli gpt-oss można bezpłatnie pobierać i używać na licencji Apache 2.0 oraz zgodnie z zasadami użytkowania gpt-oss. Odpowiadasz jednak za wszelkie koszty związane z ich uruchamianiem — takie jak koszty obliczeń, pamięci masowej czy hostingu u firm trzecich. Ich ceny będą zależeć od wybranej infrastruktury lub dostawcy.
Czy te modele są „open source”?
Używamy terminów open modele lub modele z otwartymi wagami , aby wskazać, że wytrenowane wagi są publicznie dostępne na permisywnej licencji Apache 2.0 oraz zgodnie z zasadami użytkowania gpt-oss. Oznacza to, że możesz pobierać modele, uruchamiać je na własnej infrastrukturze lub za pomocą obsługiwanych platform hostingowych oraz dostosowywać albo dostrajać je.
Open modele dają deweloperom i organizacjom większą kontrolę i elastyczność. Możesz wybrać miejsce hostingu, dostosować modele do konkretnych zastosowań i korzystać z licencjonowania, które pozwala na szerokie użycie, modyfikację i redystrybucję. Choć wytrenowane wagi są otwarte, część otaczającej infrastruktury lub narzędzi może pozostać własnościowa u ich dostawców.
Czy mogę uzyskać dostęp do tych modeli przez API OpenAI lub ChatGPT?
Nie. Te modele nie są udostępniane w API OpenAI i nie pojawiają się w ChatGPT.
Czy mogę dostrajać modele?
Tak. Możesz dostrajać je za pomocą narzędzi open source i preferowanej infrastruktury. Nie oferujemy dostrajania tych modeli przez API OpenAI.
Czy modele z otwartymi wagami są tańsze niż korzystanie z API?
Koszty różnią się w zależności od infrastruktury, obciążenia i podejścia operacyjnego. Samodzielny hosting może w niektórych przypadkach być tańszy, natomiast nasza platforma API może być bardziej efektywna po uwzględnieniu hostingu, utrzymania i aktualizacji.
Jakie funkcje obsługują te modele?
Te modele są obecnie wyłącznie tekstowymi modelami rozumującymi. Popularne środowiska wykonawcze obsługują strumieniowanie, wywołanie funkcji i ustrukturyzowane dane wyjściowe. Dokładne możliwości sprawdź w dokumentacji swojego środowiska wykonawczego.
Czym różni się to od ModAPI?
To bardzo wydajny model rozumujący, który pozwala użyć własnych zasad. Może działać razem z ModAPI, ale prawdopodobnie nie zastąpi go w zastosowaniach wymagających małych opóźnień.
