OpenAI의 오픈 웨이트 모델(gpt-oss)과 지원을 받을 수 있는 곳을 알아보세요

참고: 이 문서는 개략적인 개요를 제공합니다. 기술 설정 정보는 gpt-oss 웹사이트, GitHub, Hugging Face 및 OpenAI Cookbooks에서 확인할 수 있습니다.

개요

두 가지 오픈 웨이트 추론 모델인 gpt‑oss‑120b와 gpt‑oss‑20b를 소개합니다. 이 모델들은 사용자가 제어하는 인프라에서 실행하거나 호스팅 제공업체를 통해 실행할 수 있습니다.

참고: 이 모델들은 OpenAI API를 통해 제공되지 않으며 ChatGPT에서 사용할 수 없습니다.

오픈 웨이트를 선택하는 이유

선택과 제어: 모델을 온프레미스 또는 프라이빗 클라우드에서 실행하고, 데이터 레지던시를 유지하며, 필요에 맞게 성능을 조정할 수 있습니다.
맞춤화: 선호하는 오픈 도구를 사용해 모델을 파인튜닝하거나 조정할 수 있습니다.

제공 여부 및 라이선스

라이선스: Apache 2.0은 상업적 사용을 포함해 폭넓은 사용, 수정, 재배포를 허용합니다(당사의 gpt-oss 사용 정책 적용).
서빙: OpenAI API를 통해 제공되지 않으므로 API 가격 및 요청 한도가 적용되지 않습니다.
호환성: vLLM, Ollama, llama.cpp와 같은 일반적인 오픈 추론 스택, 그리고 클라우드 또는 자체 관리 GPU 환경에서 실행할 수 있습니다.

시작하기

모델 가중치와 지원 리소스를 받으려면 다음을 할 수 있습니다.

개요와 직접 링크는 gpt-oss 웹사이트를 방문하세요.
Hugging Face 컬렉션에서 가중치를 다운로드하세요. 이 커뮤니티 허브에서 두 모델을 모두 찾고, 사용 예시를 확인하며, 선택적으로 Hugging Face 서비스에서 직접 추론을 실행할 수 있습니다.
참조 추론 코드는 GitHub 리포지토리에서 확인하세요.
Ollama, vLLM, Transformers와 같은 지원 런타임으로 설정하려면 OpenAI Cookbook의 가이드를 사용하세요. Cookbook에는 로컬 실행, 일반 런타임 사용, 지원되는 경우 gpt‑oss 모델 파인튜닝을 위한 단계별 지침도 포함되어 있습니다.

gpt‑oss‑safeguard(연구 미리보기)

gpt‑oss‑safeguard는 gpt‑oss 위에 구축된 한 쌍의 오픈 웨이트 안전 추론 모델입니다. 이 모델들은 사용자가 제어하는 인프라에서 실행하는 정책 기반 안전 분류 및 관련 신뢰 및 안전 작업을 위해 설계되었습니다. 다른 gpt‑oss 모델과 마찬가지로, 이러한 가중치는 OpenAI API나 ChatGPT를 통해 제공되지 않습니다.

참조 구조화된 출력값 스키마(예: 정책 판정, 근거)를 갖춘 텍스트 전용 모델입니다.
사용자 정책 적용: 모델이 사용자가 작성한 정책을 해석하므로 최소한의 엔지니어링으로 여러 제품에 일반화할 수 있습니다.
추론 기반 결정: 디버깅과 감사에 도움이 되는 선택적 추론 추적을 제공합니다(최종 사용자 표시가 아니라 개발자와 안전 실무자를 위한 것입니다).
구성 가능한 추론 노력: 낮음/중간/높음 중 선택하여 지연 시간과 깊이 간의 균형을 조정할 수 있습니다.
라이선스: Apache 2.0(아래 제공 여부 및 라이선스 참조).

gpt‑oss‑safeguard는 LLM의 입력/출력 필터링, 온라인 콘텐츠 라벨링, 오프라인 일괄 라벨링 또는 검토 워크플로에 적합합니다. 일반 애플리케이션(채팅, 에이전트 등)에는 핵심 gpt‑oss 모델을 권장합니다.

필요에 맞게 스키마를 조정할 수 있습니다. 프롬프트 작성 가이드와 예시는 OpenAI Cookbook을 참조하세요.

모델 변형 및 크기 산정

모델	용도	참고
gpt‑oss‑safeguard‑120b	프로덕션용 고용량 안전 추론	117B 파라미터(활성 ≈5.1B). 단일 80GB GPU 에 맞도록 설계되었습니다(예: NVIDIA H100; AMD MI300X와 같이 메모리가 더 큰 GPU에서도 실행 가능).
gpt‑oss‑safeguard‑20b	낮은 지연 시간 / 제약된 환경	21B 파라미터(활성 ≈3.6B).

두 모델 모두 아키텍처 변경 없이 gpt‑oss에서 파인튜닝되었습니다. gpt‑oss와 동일한 채팅 템플릿을 사용하므로 기존 설정을 유지할 수 있습니다. 권장 프롬프트 패턴은 정책을 개발자 메시지에 넣고 평가할 콘텐츠를 사용자 메시지에 넣는 것입니다.

지원 및 커뮤니티

오픈 웨이트 배포는 자체 관리 및 자체 지원 방식입니다. 지원은 다음에서 받을 수 있습니다.

질문, 토론, 팁: Hugging Face 모델 페이지를 사용해 커뮤니티와 소통하세요.
OpenAI의 참조 추론 코드에서 재현 가능한 버그: gpt-oss GitHub 리포지토리에 이슈를 등록하세요.
타사 런타임(예: vLLM, Ollama, llama.cpp) 관련 문제: 해당 프로젝트의 이슈 트래커, 포럼 또는 지원 절차를 이용하세요.

OpenAI는 자체 호스팅 또는 타사 호스팅 오픈 웨이트 설정, 구성, 환경 또는 애플리케이션에 대해 지원, 실무 구현 또는 디버깅 지원을 제공하지 않습니다.

ROOST Model Community(RMC)를 통해서도 커뮤니티와 함께 계속 반복 개선하여 오픈 안전 도구를 향상해 나가겠습니다. RMC는 안전 실무자와 연구자들이 모여 평가 결과와 모델 피드백을 포함해 오픈 소스 AI 모델을 안전 워크플로에 구현하기 위한 모범 사례를 공유합니다. 이 파트너십과 참여 방법에 대해 자세히 알아보려면 RMC GitHub 리포지토리를 방문하세요.

지원 및 커뮤니티

오픈 웨이트 배포는 자체 관리 및 자체 지원 방식입니다. 지원은 다음에서 받을 수 있습니다.

질문, 토론, 팁: Hugging Face 모델 페이지를 사용해 커뮤니티와 소통하세요.
OpenAI의 참조 추론 코드에서 재현 가능한 버그: gpt-oss GitHub 리포지토리에 이슈를 등록하세요.
타사 런타임(예: vLLM, Ollama, llama.cpp) 관련 문제: 해당 프로젝트의 이슈 트래커, 포럼 또는 지원 절차를 이용하세요.

OpenAI는 자체 호스팅 또는 타사 호스팅 오픈 웨이트 설정, 구성, 환경 또는 애플리케이션에 대해 지원, 실무 구현 또는 디버깅 지원을 제공하지 않습니다.

개인정보 보호 및 안전

개인정보 보호 및 데이터

이 모델들은 사용자가 제어하는 인프라(온프레미스, 사용자의 클라우드 또는 호스팅 파트너)에서 실행되도록 설계되었습니다. 사용자가 명시적으로 OpenAI와 공유하거나 OpenAI의 관리형 호스팅 파트너 중 하나를 사용하지 않는 한, OpenAI는 이러한 자체 호스팅 모델에 보내는 데이터를 수신하거나 처리하지 않습니다.

안전

이 모델들은 광범위한 안전 학습과 테스트를 거쳤습니다. 자세한 내용은 모델 카드와 기술 보고서를 참조하세요.

콘텐츠 위반 신고

gpt‑oss 모델로 생성된 콘텐츠가 당사 정책을 위반한다고 생각되면 콘텐츠 신고 양식을 통해 신고할 수 있습니다. 제출 내용을 팀에서 검토하는 데 도움이 되도록 가능한 한 많은 세부 정보를 제공해 주세요.

FAQ

이 모델들은 무료인가요?

gpt-oss 모델 가중치는 Apache 2.0 라이선스 및 gpt-oss 사용 정책에 따라 무료로 다운로드하고 사용할 수 있습니다. 다만 컴퓨팅, 스토리지 또는 타사 호스팅 비용 등 실행과 관련된 모든 비용은 사용자가 부담해야 합니다. 해당 비용은 선택한 인프라 또는 제공업체에 따라 달라집니다.

이 모델들은 “오픈 소스”인가요?

우리는 학습된 가중치가 허용적인 Apache 2.0 라이선스와 gpt-oss 사용 정책에 따라 공개되어 있음을 나타내기 위해 오픈 모델 또는 오픈 웨이트라는 용어를 사용합니다. 이는 모델을 다운로드하고, 자체 인프라 또는 지원되는 호스팅 프레임워크에서 실행하며, 맞춤화하거나 파인튜닝할 수 있음을 의미합니다.

오픈 모델은 개발자와 조직에 더 큰 제어권과 유연성을 제공합니다. 호스팅 위치를 선택하고, 특정 사용 사례에 맞게 모델을 조정하며, 폭넓은 사용, 수정, 재배포를 허용하는 라이선스의 혜택을 누릴 수 있습니다. 학습된 가중치는 공개되어 있지만, 주변 인프라나 도구 중 일부는 제공업체의 독점으로 남아 있을 수 있습니다.

OpenAI API 또는 ChatGPT를 통해 이 모델들에 접근할 수 있나요?

아니요. 이 모델들은 OpenAI API에서 제공되지 않으며 ChatGPT에 표시되지 않습니다.

모델을 파인튜닝할 수 있나요?

예. 오픈 소스 도구와 선호하는 인프라를 사용해 파인튜닝할 수 있습니다. 이 모델들에 대해서는 OpenAI API를 통한 파인튜닝을 제공하지 않습니다.

오픈 웨이트 모델이 API를 사용하는 것보다 더 저렴한가요?

비용은 인프라, 워크로드, 운영 방식에 따라 달라집니다. 자체 호스팅이 경우에 따라 더 저렴할 수 있지만, 호스팅, 유지 관리, 업그레이드를 고려하면 API Platform이 더 효율적일 수 있습니다.

이 모델들은 어떤 기능을 지원하나요?

이 모델들은 현재 텍스트 전용 추론 모델입니다. 일반적인 런타임은 스트리밍, 함수 호출, 구조화된 출력값을 지원합니다. 정확한 기능은 사용 중인 런타임의 문서를 확인하세요.

이것은 ModAPI와 어떻게 다른가요?

이는 사용자가 자체 정책을 적용할 수 있는 고성능 추론 모델입니다. ModAPI와 함께 사용할 수 있지만, 낮은 지연 시간이 필요한 사용 사례의 대체재는 아닐 가능성이 높습니다.

OpenAI 오픈 웨이트 모델(gpt-oss)

개요

오픈 웨이트를 선택하는 이유

제공 여부 및 라이선스

시작하기

gpt‑oss‑safeguard(연구 미리보기)

모델 변형 및 크기 산정

지원 및 커뮤니티

지원 및 커뮤니티

개인정보 보호 및 안전

개인정보 보호 및 데이터

안전

콘텐츠 위반 신고

FAQ

이 모델들은 무료인가요?

이 모델들은 “오픈 소스”인가요?

OpenAI API 또는 ChatGPT를 통해 이 모델들에 접근할 수 있나요?

모델을 파인튜닝할 수 있나요?

오픈 웨이트 모델이 API를 사용하는 것보다 더 저렴한가요?

이 모델들은 어떤 기능을 지원하나요?

이것은 ModAPI와 어떻게 다른가요?

이 문서가 도움이 되었나요?