Примечание: Эта статья даёт обзор на высоком уровне. Информацию по технической настройке можно найти на сайте gpt-oss, в GitHub, на Hugging Face и в OpenAI Cookbook.
Обзор
Представляем две модели для рассуждений с открытыми весами: gpt‑oss‑120b и gpt‑oss‑20b. Они работают на инфраструктуре, которой вы управляете, либо через хостинг‑провайдеров.
Примечание: Эти модели не доступны через OpenAI API и недоступны в ChatGPT.
Зачем открытые веса
Выбор и контроль: запускайте модели on‑premises или в своём приватном облаке, сохраняйте размещение данных в нужной юрисдикции и настраивайте производительность под свои задачи.
Кастомизация: дообучайте или адаптируйте модели с помощью предпочитаемых вами открытых инструментов.
Доступность и лицензирование
Лицензия: Apache 2.0 допускает широкое использование, модификацию и распространение, включая коммерческое (с учётом нашей gpt-oss политики использования).
Развёртывание: недоступно через OpenAI API, поэтому цены и лимиты запросов API не применяются.
Совместимость: можно запускать в распространённых открытых стеках инференса, таких как vLLM, Ollama, llama.cpp, а также в облачных или самостоятельно управляемых GPU‑окружениях.
Начало работы
Чтобы получить веса моделей и сопутствующие ресурсы, вы можете:
Посетить сайт gpt-oss — там есть обзор и прямые ссылки.
Скачать веса из коллекции Hugging Face — это комьюнити‑хаб, где можно найти обе модели, посмотреть примеры использования и при желании запускать инференс напрямую через сервисы Hugging Face.
Открыть наш репозиторий GitHub со справочным кодом для инференса.
Использовать руководства в OpenAI Cookbook по настройке в поддерживаемых рантаймах вроде Ollama, vLLM и Transformers. В Cookbook также есть пошаговые инструкции по локальному запуску, использованию распространённых рантаймов и — где поддерживается — дообучению моделей gpt‑oss.
gpt‑oss‑safeguard (research preview)
gpt‑oss‑safeguard — это пара моделей для safety‑рассуждений с открытыми весами, построенных поверх gpt‑oss. Они предназначены для классификации безопасности на основе политик и связанных задач доверия и безопасности (trust & safety), которые вы запускаете на инфраструктуре под своим контролем. Как и другие модели gpt‑oss, эти веса не доступны через OpenAI API или ChatGPT.
Только текстовые модели со справочными схемами структурированного вывода (например, вердикт по политике, обоснование).
Ваша политика — ваши правила: модель интерпретирует вашу письменную политику, чтобы обобщать на разные продукты при минимальных инженерных затратах.
Обоснованные решения: опциональные трассы рассуждений для упрощения отладки и аудитов (предназначено для разработчиков и специалистов по безопасности, а не для отображения конечным пользователям).
Настраиваемая интенсивность рассуждений: выбирайте low / medium / high, чтобы балансировать задержку и глубину.
Лицензия: Apache 2.0 (см. Доступность и лицензирование ниже).
gpt‑oss‑safeguard хорошо подходит для фильтрации входов/выходов для LLM, онлайн‑маркировки контента, а также офлайн пакетной разметки или процессов ревью. Для общих приложений (чат, агенты и т. п.) мы рекомендуем базовые модели gpt‑oss.
Вы можете адаптировать схему под свои нужды. Руководства по промптингу и примеры смотрите в OpenAI Cookbook.
Варианты моделей и размерность
| Модель | Предназначение | Примечания |
| gpt‑oss‑safeguard‑120b | Продакшен, safety‑рассуждения высокой мощности | 117B параметров (≈5.1B активных). Спроектирована так, чтобы помещаться на один GPU на 80 GB (например, NVIDIA H100; также работает на GPU с большей памятью, таких как AMD MI300X). |
| gpt‑oss‑safeguard‑20b | Меньшая задержка / ограниченные окружения | 21B параметров (≈3.6B активных). |
Обе модели дообучены на базе gpt‑oss без изменения архитектуры. Они используют тот же шаблон чата, что и gpt‑oss; вы можете сохранить текущую конфигурацию. Рекомендуемый паттерн промптинга — поместить вашу политику в developer‑сообщение, а контент для оценки — в user‑сообщение.
Поддержка и сообщество
Развёртывания с открытыми весами вы разворачиваете и обслуживаете самостоятельно. Вот где можно получить поддержку:
Вопросы, обсуждения, советы: используйте страницы моделей на Hugging Face, чтобы общаться с сообществом.
Воспроизводимые баги в эталонном коде инференса OpenAI: откройте issue в репозитории gpt-oss на GitHub.
Проблемы со сторонним рантаймом (например, vLLM, Ollama, llama.cpp): используйте трекер задач, форумы или процесс поддержки соответствующего проекта.
OpenAI не предоставляет помощь, практическую реализацию или поддержку отладки для любых self‑hosted или размещённых у сторонних провайдеров конфигураций open‑weight: сетапов, настроек, окружений или приложений.
Мы продолжим развивать открытые инструменты для safety вместе с сообществом, в том числе через ROOST Model Community (RMC). RMC объединяет практиков и исследователей в области безопасности, чтобы делиться лучшими практиками внедрения open source AI‑моделей в safety‑процессы, включая результаты оценок и обратную связь по моделям. Посетите репозиторий RMC на GitHub, чтобы узнать больше об этом партнёрстве и о том, как присоединиться.
Поддержка и сообщество
Развёртывания с открытыми весами вы разворачиваете и обслуживаете самостоятельно. Вот где можно получить поддержку:
Вопросы, обсуждения, советы: используйте страницы моделей на Hugging Face, чтобы общаться с сообществом.
Воспроизводимые баги в эталонном коде инференса OpenAI: откройте issue в репозитории gpt-oss на GitHub.
Проблемы со сторонним рантаймом (например, vLLM, Ollama, llama.cpp): используйте трекер задач, форумы или процесс поддержки соответствующего проекта.
OpenAI не предоставляет помощь, практическую реализацию или поддержку отладки для любых self‑hosted или размещённых у сторонних провайдеров конфигураций open‑weight: сетапов, настроек, окружений или приложений.
Конфиденциальность и безопасность
Конфиденциальность и данные
Эти модели разработаны для работы на инфраструктуре под вашим контролем (on-premises или в вашем облаке, либо у партнёра по хостингу). OpenAI не получает и не обрабатывает данные, которые вы отправляете в эти self-hosted модели, если только вы явно не поделитесь ими с OpenAI или не используете одного из наших партнёров по управляемому хостингу.
Безопасность
Эти модели прошли обширное обучение и тестирование по безопасности. Подробнее см. в нашей карточке модели и техническом отчёте.
Сообщение о нарушениях контента
Если вы считаете, что контент, сгенерированный моделями gpt‑oss, нарушает наши политики, вы можете сообщить об этом через нашу форму Report Content. Пожалуйста, предоставьте как можно больше деталей, чтобы помочь нашей команде рассмотреть ваше обращение.
FAQ
Эти модели бесплатны?
Веса моделей gpt-oss можно бесплатно скачать и использовать по лицензии Apache 2.0 и политике использования gpt-oss. Однако вы оплачиваете все расходы, связанные с их запуском — например, вычисления, хранение данных или сборы за хостинг у третьих сторон. Стоимость будет зависеть от выбранной вами инфраструктуры или провайдера.
Эти модели — «open source»?
Мы используем термины open models или open-weight , чтобы обозначить, что обученные веса публично доступны по разрешительной лицензии Apache 2.0 и политике использования gpt-oss. Это означает, что вы можете скачать модели, запускать их на своей инфраструктуре или с поддерживаемыми фреймворками хостинга, а также кастомизировать или дообучать их.
Open‑модели дают разработчикам и организациям больше контроля и гибкости. Вы можете выбрать, где хостить, адаптировать модели под конкретные сценарии и пользоваться лицензированием, которое допускает широкое использование, модификацию и распространение. Хотя обученные веса открыты, часть сопутствующей инфраструктуры или инструментов может оставаться проприетарной у их провайдеров.
Могу ли я получить доступ к этим моделям через OpenAI API или ChatGPT?
Нет. Эти модели не доступны в OpenAI API и не отображаются в ChatGPT.
Могу ли я дообучить модели?
Да. Вы можете дообучать их с помощью open‑source инструментов и на предпочитаемой инфраструктуре. Мы не предлагаем дообучение этих моделей через API OpenAI.
Модели с открытыми весами дешевле, чем использование API?
Затраты зависят от инфраструктуры, нагрузки и операционного подхода. Self‑hosting в некоторых случаях может быть дешевле, тогда как наша платформа API может оказаться эффективнее, если учитывать хостинг, обслуживание и обновления.
Какие функции поддерживают эти модели?
Сейчас это текстовые модели для рассуждений. Распространённые рантаймы поддерживают стриминг, вызов функций и структурированные ответы. Точные возможности уточняйте в документации вашего рантайма.
Чем это отличается от ModAPI?
Это очень мощная модель для рассуждений, которая позволяет использовать вашу собственную политику. Она может работать в паре с ModAPI, но, вероятно, не заменит его в сценариях, где важна низкая задержка.
