Примечание: эта статья содержит общий обзор. Информацию по технической настройке можно найти на сайте gpt-oss, GitHub, Hugging Face и в OpenAI Cookbooks.
Обзор
Представляем две модели рассуждений с открытыми весами: gpt‑oss‑120b и gpt‑oss‑20b. Они работают на инфраструктуре, которую вы контролируете, или через хостинг-провайдеров.
Примечание: эти модели не предоставляются через OpenAI API и недоступны в ChatGPT.
Почему открытые веса
Выбор и контроль: запускайте модели локально или в своем частном облаке, сохраняйте резидентность данных и настраивайте производительность под свои потребности.
Кастомизация: дообучайте или адаптируйте модели с помощью предпочитаемых открытых инструментов.
Доступность и лицензирование
Лицензия: Apache 2.0 разрешает широкое использование, изменение и повторное распространение, включая коммерческое использование (при соблюдении нашей политики использования gpt-oss).
Предоставление: недоступны через OpenAI API, поэтому цены API и лимиты запросов не применяются.
Совместимость: можно запускать с распространенными открытыми стеками инференса, такими как vLLM, Ollama, llama.cpp, а также в облачных или самостоятельно управляемых GPU-средах.
Начало работы
Чтобы получить веса модели и вспомогательные ресурсы, вы можете:
Посетить сайт gpt-oss для обзора и прямых ссылок.
Скачать веса из коллекции Hugging Face — центра сообщества, где можно найти обе модели, посмотреть примеры использования и при желании запускать инференс напрямую через сервисы Hugging Face.
Получить доступ к нашему репозиторию GitHub с эталонным кодом инференса.
Используйте руководства в OpenAI Cookbook для настройки с поддерживаемыми средами выполнения, такими как Ollama, vLLM и Transformers. Cookbook также включает пошаговые инструкции по локальному запуску, использованию распространенных сред выполнения и — там, где поддерживается, — дообучению моделей gpt‑oss.
gpt‑oss‑safeguard (исследовательская предварительная версия)
gpt‑oss‑safeguard — это пара моделей рассуждений для безопасности с открытыми весами, построенных на базе gpt‑oss. Они предназначены для классификации безопасности на основе политик и связанных задач доверия и безопасности, которые вы выполняете на контролируемой вами инфраструктуре. Как и другие модели gpt‑oss, эти веса не предоставляются через OpenAI API или ChatGPT.
Только текстовые модели с эталонными схемами структурированных ответов (например, решение по политике, обоснование).
Используйте собственную политику: модель интерпретирует вашу письменную политику, чтобы обобщать ее на разные продукты при минимальной инженерной работе.
Обоснованные решения: необязательные трассы рассуждений для помощи в отладке и аудитах (предназначены для разработчиков и специалистов по безопасности, а не для показа конечным пользователям).
Настраиваемые усилия рассуждений: выберите низкий / средний / высокий уровень для компромисса между задержкой и глубиной.
Лицензия: Apache 2.0 (см. Доступность и лицензирование ниже).
gpt‑oss‑safeguard хорошо подходит для фильтрации ввода/вывода LLM, маркировки онлайн-контента, а также пакетной офлайн-маркировки или рабочих процессов проверки. Для приложений общего назначения (чат, агенты и т. д.) мы рекомендуем основные модели gpt‑oss.
Вы можете адаптировать схему под свои потребности. Руководства по промптингу и примеры см. в OpenAI Cookbook.
Варианты моделей и размеры
| Модель | Предполагаемое использование | Примечания |
|---|---|---|
| gpt‑oss‑safeguard‑120b | Продакшен, высокопроизводительные рассуждения для безопасности | 117B параметров (≈5.1B активных). Рассчитана на размещение на одном GPU 80 ГБ (например, NVIDIA H100; также работает на GPU с большей памятью, таких как AMD MI300X). |
| gpt‑oss‑safeguard‑20b | Среды с меньшей задержкой / ограниченными ресурсами | 21B параметров (≈3.6B активных). |
Обе модели дообучены на основе gpt‑oss без изменения архитектуры. Они используют тот же шаблон чата, что и gpt‑oss; вы можете сохранить существующую настройку. Рекомендуемый шаблон промптинга — поместить вашу политику в сообщение разработчика, а оцениваемый контент — в сообщение пользователя.
Поддержка и сообщество
Развертывания с открытыми весами управляются и обслуживаются самостоятельно. Где получить поддержку:
Вопросы, обсуждения, советы: используйте страницы моделей Hugging Face, чтобы взаимодействовать с сообществом.
Воспроизводимые ошибки в эталонном коде инференса OpenAI: откройте issue в репозитории GitHub gpt-oss.
Проблемы со сторонней средой выполнения (например, vLLM, Ollama, llama.cpp): используйте трекер ошибок, форумы или процесс поддержки соответствующего проекта.
OpenAI не предоставляет помощь, практическую реализацию или поддержку в отладке для любых самостоятельно размещенных или размещенных у третьих сторон конфигураций, сред, приложений или установок с открытыми весами.
Мы продолжим совместную работу с сообществом над улучшением открытых инструментов безопасности, в том числе через ROOST Model Community (RMC). RMC объединяет специалистов по безопасности и исследователей для обмена лучшими практиками внедрения моделей AI с открытым исходным кодом в рабочие процессы безопасности, включая результаты оценок и обратную связь по моделям. Посетите репозиторий RMC на GitHub, чтобы узнать больше об этом партнерстве и о том, как принять участие.
Поддержка и сообщество
Развертывания с открытыми весами управляются и обслуживаются самостоятельно. Где получить поддержку:
Вопросы, обсуждения, советы: используйте страницы моделей Hugging Face, чтобы взаимодействовать с сообществом.
Воспроизводимые ошибки в эталонном коде инференса OpenAI: откройте issue в репозитории GitHub gpt-oss.
Проблемы со сторонней средой выполнения (например, vLLM, Ollama, llama.cpp): используйте трекер ошибок, форумы или процесс поддержки соответствующего проекта.
OpenAI не предоставляет помощь, практическую реализацию или поддержку в отладке для любых самостоятельно размещенных или размещенных у третьих сторон конфигураций, сред, приложений или установок с открытыми весами.
Конфиденциальность и безопасность
Конфиденциальность и данные
Эти модели предназначены для запуска на инфраструктуре, которую вы контролируете (локально, в вашем облаке или у хостинг-партнера). OpenAI не получает и не обрабатывает данные, которые вы отправляете этим самостоятельно размещенным моделям, если только вы явно не поделитесь ими с OpenAI или не используете одного из наших управляемых хостинг-партнеров.
Безопасность
Эти модели прошли всестороннее обучение и тестирование на безопасность. Подробнее см. нашу карточку модели и технический отчет.
Сообщение о нарушениях в контенте
Если вы считаете, что контент, созданный с помощью моделей gpt‑oss, нарушает наши правила, вы можете сообщить об этом через нашу форму Report Content. Пожалуйста, предоставьте как можно больше деталей, чтобы помочь нашей команде рассмотреть вашу заявку.
Часто задаваемые вопросы
Эти модели бесплатны?
Веса моделей gpt-oss можно бесплатно скачивать и использовать по лицензии Apache 2.0 и политике использования gpt-oss. Однако вы несете ответственность за любые расходы, связанные с их запуском, — например, за вычисления, хранение или оплату стороннего хостинга. Цены на это будут зависеть от выбранной вами инфраструктуры или поставщика.
Эти модели являются «open source»?
Мы используем термин открытые модели или с открытыми весами для обозначения того, что обученные веса общедоступны по разрешительной лицензии Apache 2.0 и политике использования gpt-oss. Это означает, что вы можете скачать модели, запускать их на собственной инфраструктуре или с поддерживаемыми фреймворками хостинга, а также настраивать или дообучать их.
Открытые модели дают разработчикам и организациям больше контроля и гибкости. Вы можете выбирать, где их размещать, адаптировать модели для конкретных сценариев и пользоваться лицензированием, допускающим широкое использование, изменение и повторное распространение. Хотя обученные веса открыты, часть окружающей инфраструктуры или инструментов может оставаться проприетарной у их поставщиков.
Могу ли я получить доступ к этим моделям через OpenAI API или ChatGPT?
Нет. Эти модели не предоставляются в OpenAI API и не отображаются в ChatGPT.
Можно ли дообучать модели?
Да. Вы можете выполнять дообучение с помощью инструментов с открытым исходным кодом и предпочитаемой инфраструктуры. Мы не предлагаем дообучение этих моделей через API OpenAI.
Модели с открытыми весами дешевле, чем использование API?
Затраты зависят от инфраструктуры, рабочей нагрузки и операционного подхода. В некоторых случаях самостоятельный хостинг может быть дешевле, тогда как наша API Platform может быть эффективнее с учетом хостинга, обслуживания и обновлений.
Какие функции поддерживают эти модели?
В настоящее время это только текстовые модели рассуждений. Распространенные среды выполнения поддерживают потоковую передачу, вызов функций и структурированные ответы. Точные возможности см. в документации вашей среды выполнения.
Чем это отличается от ModAPI?
Это высокоэффективная модель рассуждений, которая позволяет использовать собственную политику. Она может работать совместно с ModAPI, но, вероятно, не заменит его для сценариев с низкой задержкой.
