Примітка: ця стаття містить загальний огляд. Інформацію для технічного налаштування можна знайти на сайті gpt-oss, GitHub, Hugging Face та в OpenAI Cookbooks.
Огляд
Представляємо дві моделі міркування з відкритими вагами: gpt‑oss‑120b і gpt‑oss‑20b. Вони працюють на інфраструктурі, яку ви контролюєте, або через хостинг-провайдерів.
Примітка: Ці моделі не надаються через OpenAI API і недоступні в ChatGPT.
Навіщо відкриті ваги
Вибір і контроль: запускайте моделі локально або у своїй приватній хмарі, дотримуйтеся вимог до локалізації даних і налаштовуйте продуктивність під свої потреби.
Кастомізація: донавчайте або адаптуйте моделі за допомогою бажаних відкритих інструментів.
Доступність і ліцензування
Ліцензія: Apache 2.0 дозволяє широке використання, модифікацію та повторне розповсюдження, зокрема комерційне використання (відповідно до нашої політики використання gpt-oss).
Обслуговування: недоступні через OpenAI API, тому ціни API та ліміти запитів не застосовуються.
Сумісність: можна запускати з поширеними відкритими стеками інференсу, як-от vLLM, Ollama, llama.cpp, а також у хмарних або самостійно керованих GPU-середовищах.
Початок роботи
Щоб отримати ваги моделі та допоміжні ресурси, ви можете:
Відвідати сайт gpt-oss, щоб переглянути огляд і прямі посилання.
Завантажити ваги з колекції Hugging Face — центру спільноти, де можна знайти обидві моделі, переглянути приклади використання та за бажанням запускати інференс безпосередньо через сервіси Hugging Face.
Отримати доступ до нашого репозиторію GitHub з еталонним кодом інференсу.
Використовуйте посібники в OpenAI Cookbook для налаштування з підтримуваними середовищами виконання, як-от Ollama, vLLM і Transformers. Cookbook також містить покрокові інструкції для локального запуску, використання поширених середовищ виконання та — де це підтримується — тонкого налаштування моделей gpt‑oss.
gpt‑oss‑safeguard (дослідницький попередній перегляд)
gpt‑oss‑safeguard — це пара моделей міркування для безпеки з відкритими вагами, побудованих на основі gpt‑oss. Вони призначені для класифікації безпеки на основі політик і пов’язаних завдань довіри та безпеки, які ви виконуєте на інфраструктурі, що контролюєте. Як і інші моделі gpt‑oss, ці ваги не надаються через OpenAI API або ChatGPT.
Моделі лише для тексту з еталонними схемами структурованих результатів (наприклад, вердикт політики, обґрунтування).
Використовуйте власну політику: модель інтерпретує вашу письмову політику, щоб узагальнювати її для різних продуктів із мінімальною інженерною роботою.
Обґрунтовані рішення: необов’язкові трасування міркувань для полегшення налагодження й аудитів (призначені для розробників і фахівців із безпеки, а не для показу кінцевим користувачам).
Налаштовуване зусилля міркування: виберіть низьке / середнє / високе, щоб збалансувати затримку й глибину.
Ліцензія: Apache 2.0 (див. Доступність і ліцензування нижче).
gpt‑oss‑safeguard добре підходить для фільтрації вводу/виводу для LLM, маркування онлайн-контенту та офлайн-пакетного маркування або робочих процесів перевірки. Для загальних застосунків (чат, агенти тощо) ми рекомендуємо основні моделі gpt‑oss.
Ви можете адаптувати схему до своїх потреб. Зверніться до OpenAI Cookbook по посібники щодо запитів і приклади.
Варіанти моделей і розміри
| Модель | Призначення | Примітки |
|---|---|---|
| gpt‑oss‑safeguard‑120b | Виробниче використання, високопродуктивне міркування для безпеки | 117 млрд параметрів (≈5,1 млрд активних). Спроєктовано для роботи на одному GPU з 80 ГБ пам’яті (наприклад, NVIDIA H100; також працює на GPU з більшим обсягом пам’яті, як-от AMD MI300X). |
| gpt‑oss‑safeguard‑20b | Нижча затримка / обмежені середовища | 21 млрд параметрів (≈3,6 млрд активних). |
Обидві моделі донавчені з gpt‑oss без змін архітектури. Вони використовують той самий шаблон чату, що й gpt‑oss; ви можете зберегти наявне налаштування. Рекомендований шаблон запитів — розмістити вашу політику в повідомленні розробника, а контент для оцінювання — у повідомленні користувача.
Підтримка та спільнота
Розгортання з відкритими вагами керуються й обслуговуються самостійно. Ось де можна отримати підтримку:
Запитання, обговорення, поради: використовуйте сторінки моделей Hugging Face, щоб взаємодіяти зі спільнотою.
Відтворювані помилки в еталонному коді інференсу OpenAI: відкрийте issue в репозиторії GitHub gpt-oss.
Проблеми зі стороннім середовищем виконання (наприклад, vLLM, Ollama, llama.cpp): скористайтеся трекером issue, форумами або процесом підтримки відповідного проєкту.
OpenAI не надає допомогу, практичну реалізацію чи підтримку з налагодження для будь-яких самостійно розміщених або розміщених у сторонніх провайдерів налаштувань, конфігурацій, середовищ чи застосунків з відкритими вагами.
Ми й надалі співпрацюватимемо зі спільнотою, щоб покращувати відкриті інструменти безпеки, зокрема через ROOST Model Community (RMC). RMC об’єднує фахівців із безпеки та дослідників для обміну найкращими практиками впровадження AI моделей із відкритим кодом у робочі процеси безпеки, зокрема результатами оцінювання та відгуками про моделі. Відвідайте репозиторій RMC GitHub, щоб дізнатися більше про це партнерство й те, як долучитися.
Підтримка та спільнота
Розгортання з відкритими вагами керуються й обслуговуються самостійно. Ось де можна отримати підтримку:
Запитання, обговорення, поради: використовуйте сторінки моделей Hugging Face, щоб взаємодіяти зі спільнотою.
Відтворювані помилки в еталонному коді інференсу OpenAI: відкрийте issue в репозиторії GitHub gpt-oss.
Проблеми зі стороннім середовищем виконання (наприклад, vLLM, Ollama, llama.cpp): скористайтеся трекером issue, форумами або процесом підтримки відповідного проєкту.
OpenAI не надає допомогу, практичну реалізацію чи підтримку з налагодження для будь-яких самостійно розміщених або розміщених у сторонніх провайдерів налаштувань, конфігурацій, середовищ чи застосунків з відкритими вагами.
Конфіденційність і безпека
Конфіденційність і дані
Ці моделі розроблені для роботи на інфраструктурі, яку ви контролюєте (локально, у вашій хмарі або в хостинг-партнера). OpenAI не отримує й не обробляє дані, які ви надсилаєте цим самостійно розміщеним моделям, якщо ви явно не поділитеся ними з OpenAI або не скористаєтеся одним із наших керованих хостинг-партнерів.
Безпека
Ці моделі пройшли широке навчання та тестування з безпеки. Докладніше див. у нашій картці моделі та технічному звіті.
Повідомлення про порушення щодо контенту
Якщо ви вважаєте, що контент, згенерований моделями gpt‑oss, порушує наші політики, ви можете повідомити про це через нашу форму Report Content. Надайте якомога більше деталей, щоб допомогти нашій команді розглянути ваше звернення.
Поширені запитання
Чи безкоштовні ці моделі?
Ваги моделей gpt-oss можна безкоштовно завантажувати й використовувати за ліцензією Apache 2.0 і політикою використання gpt-oss. Однак ви несете відповідальність за будь-які витрати, пов’язані з їх запуском, — як-от обчислення, сховище або плата за сторонній хостинг. Ціни на це залежатимуть від обраної вами інфраструктури або провайдера.
Чи є ці моделі «open source»?
Ми використовуємо термін open models або з відкритими вагами , щоб вказати, що навчені ваги публічно доступні за дозвільною ліцензією Apache 2.0 і політикою використання gpt-oss. Це означає, що ви можете завантажувати моделі, запускати їх на власній інфраструктурі або за допомогою підтримуваних фреймворків хостингу, а також налаштовувати чи донавчати їх.
Open models дають розробникам і організаціям більше контролю та гнучкості. Ви можете вибирати, де розміщувати моделі, адаптувати їх для конкретних сценаріїв використання та користуватися ліцензією, що дозволяє широке використання, модифікацію й повторне розповсюдження. Хоча навчені ваги відкриті, частина навколишньої інфраструктури або інструментів може залишатися пропрієтарною власністю їхніх постачальників.
Чи можу я отримати доступ до цих моделей через OpenAI API або ChatGPT?
Ні. Ці моделі не надаються в OpenAI API і не відображаються в ChatGPT.
Чи можу я донавчати моделі?
Так. Ви можете донавчати їх за допомогою інструментів із відкритим кодом і обраної вами інфраструктури. Ми не пропонуємо донавчання цих моделей через API OpenAI.
Чи моделі з відкритими вагами дешевші, ніж використання API?
Витрати залежать від інфраструктури, робочого навантаження та операційного підходу. Самостійне розміщення в деяких випадках може бути дешевшим, тоді як наша API Platform може бути ефективнішою з урахуванням хостингу, обслуговування й оновлень.
Які функції підтримують ці моделі?
Наразі ці моделі є текстовими моделями міркування. Поширені середовища виконання підтримують потокове передавання, виклик функцій і структуровані результати. Перевірте документацію свого середовища виконання, щоб дізнатися точні можливості.
Чим це відрізняється від ModAPI?
Це дуже потужна модель міркування, яка дає змогу використовувати власну політику. Вона може працювати разом із ModAPI, але, ймовірно, не замінить його для сценаріїв із низькою затримкою.
