OpenAI
Denne siden ble maskinoversatt. Se den opprinnelige engelske artikkelen.

OpenAI open-weight-modeller (gpt-oss)

Les om OpenAIs open-weight-modeller (gpt-oss) og hvor du kan få støtte

Oppdatert: 11 days ago

Merk: Denne artikkelen gir en overordnet oversikt. Informasjon om teknisk oppsett finner du på gpt-oss-nettstedet, GitHub, Hugging Face og OpenAI Cookbooks.

Oversikt

Vi introduserer to resonneringsmodeller med åpne vekter: gpt‑oss‑120b og gpt‑oss‑20b. De kjører på infrastruktur du kontrollerer, eller gjennom hosting-leverandører.

Merk: Disse modellene leveres ikke gjennom OpenAI API og er ikke tilgjengelige i ChatGPT.

Hvorfor åpne vekter

  • Valg og kontroll: Kjør modeller lokalt eller i din private sky, behold dataresidens og tilpass ytelsen etter behovene dine.

  • Tilpasning: Finjuster eller tilpass modellene med de åpne verktøyene du foretrekker.

Tilgjengelighet og lisensiering

  • Lisens: Apache 2.0 tillater bred bruk, endring og videredistribusjon, inkludert kommersiell bruk (underlagt vår gpt-oss-brukspolicy).

  • Betjening: Ikke tilgjengelig gjennom OpenAI API, så API-priser og bruksgrenser gjelder ikke.

  • Kompatibilitet: Kan kjøres med vanlige åpne inferensstakker som vLLM, Ollama, llama.cpp, og i skybaserte eller selvadministrerte GPU-miljøer.

Kom i gang

For å få modellvektene og støtteressursene kan du:

  • Besøke gpt-oss-nettstedet for en oversikt og direkte lenker.

  • Laste ned vekter fra Hugging Face-samlingen – et fellesskapssenter der du kan finne begge modellene, se brukseksempler og eventuelt kjøre inferens direkte gjennom Hugging Face sine tjenester.

  • Få tilgang til vårt GitHub-repo for referansekode for inferens.

  • Bruke veiledninger i OpenAI Cookbook for oppsett med støttede kjøremiljøer som Ollama, vLLM og Transformers. Cookbook inneholder også trinnvise instruksjoner for å kjøre lokalt, bruke vanlige kjøremiljøer og – der det støttes – finjustere gpt‑oss-modeller.

gpt‑oss‑safeguard (forskningsforhåndsvisning)

gpt‑oss‑safeguard er et par resonneringsmodeller for sikkerhet med åpne vekter bygget oppå gpt‑oss. De er utformet for policybasert sikkerhetsklassifisering og relaterte oppgaver innen tillit og sikkerhet som du kjører på infrastruktur du kontrollerer. I likhet med andre gpt‑oss-modeller tilbys ikke disse vektene gjennom OpenAI API eller ChatGPT.

  • Modeller kun for tekst med referanseskjemaer for strukturerte utdata (f.eks. policyvurdering, begrunnelse).

  • Ta med din egen policy: Modellen tolker den skriftlige policyen din, slik at den kan generalisere på tvers av produkter med minimal utviklingsinnsats.

  • Resonnerte beslutninger: valgfrie resonneringsspor som hjelp ved feilsøking og revisjoner (ment for utviklere og sikkerhetsutøvere, ikke for visning til sluttbrukere).

  • Konfigurerbar resonneringsinnsats: Velg lav / middels / høy for å balansere ventetid mot dybde.

  • Lisens: Apache 2.0 (se Tilgjengelighet og lisensiering nedenfor).

gpt‑oss‑safeguard egner seg godt til filtrering av inndata/utdata for LLM-er, merking av nettinnhold og arbeidsflyter for frakoblet batchmerking eller gjennomgang. For generelle applikasjoner (chat, agenter osv.) anbefaler vi de sentrale gpt‑oss-modellene.

Du kan tilpasse skjemaet til dine behov. Se OpenAI Cookbook for veiledninger om prompting og eksempler.

Modellvarianter & størrelser

ModellTiltenkt brukMerknader
gpt‑oss‑safeguard‑120bProduksjon, sikkerhetsresonnering med høy kapasitet117B parametere (≈5,1B aktive). Utformet for å få plass på en

enkelt 80 GB GPU
(f.eks. NVIDIA H100; kjører også på GPU-er med større minne, som AMD MI300X).
gpt‑oss‑safeguard‑20bLavere latenstid / begrensede miljøer21B parametere (≈3,6B aktive).

Begge modellene er finjustert fra gpt‑oss uten endring i arkitekturen. De bruker samme chatmal som gpt‑oss; du kan beholde det eksisterende oppsettet ditt. Et anbefalt promptmønster er å plassere retningslinjene dine i en utviklermelding og innholdet som skal evalueres, i en brukermelding.

Støtte og fellesskap

Utrullinger med åpne vekter administreres og driftes av deg selv. Her kan du få støtte:

  • Spørsmål, diskusjon, tips: Bruk modellsidene på Hugging Face for å engasjere deg i fellesskapet.

  • Reproduserbare feil i OpenAIs referansekode for inferens: Opprett en sak i gpt-oss sitt GitHub-repo.

  • Problemer med et tredjeparts kjøremiljø (f.eks. vLLM, Ollama, llama.cpp): Bruk det aktuelle prosjektets feilsporer, forum eller støtteprosess.

OpenAI tilbyr ikke hjelp, praktisk implementering eller feilsøkingsstøtte for selvhostede eller tredjepartshostede oppsett, konfigurasjoner, miljøer eller applikasjoner med åpne vekter.

Vi vil fortsette å videreutvikle sammen med fellesskapet for å forbedre åpne sikkerhetsverktøy, blant annet gjennom ROOST Model Community (RMC). RMC samler sikkerhetsutøvere og forskere for å dele beste praksis for å implementere AI-modeller med åpen kildekode i sikkerhetsarbeidsflyter, inkludert evalueringsresultater og modelltilbakemeldinger. Besøk RMC GitHub-repoet for å lære mer om dette partnerskapet og hvordan du kan bidra.

Støtte og fellesskap

Utrullinger med åpne vekter administreres og driftes av deg selv. Her kan du få støtte:

  • Spørsmål, diskusjon, tips: Bruk modellsidene på Hugging Face for å engasjere deg i fellesskapet.

  • Reproduserbare feil i OpenAIs referansekode for inferens: Opprett en sak i gpt-oss sitt GitHub-repo.

  • Problemer med et tredjeparts kjøremiljø (f.eks. vLLM, Ollama, llama.cpp): Bruk det aktuelle prosjektets feilsporer, forum eller støtteprosess.

OpenAI tilbyr ikke hjelp, praktisk implementering eller feilsøkingsstøtte for selvhostede eller tredjepartshostede oppsett, konfigurasjoner, miljøer eller applikasjoner med åpne vekter.

Personvern og sikkerhet

Personvern og data

Disse modellene er utformet for å kjøre på infrastruktur du kontrollerer (lokalt, i din egen sky eller hos en hosting-partner). OpenAI mottar eller behandler ikke dataene du sender til disse selvhostede modellene, med mindre du eksplisitt deler dem med OpenAI eller bruker en av våre administrerte hosting-partnere.

Sikkerhet

Disse modellene gjennomgikk omfattende sikkerhetstrening og testing. Hvis du vil ha mer informasjon, kan du se vårt modellkort og vår tekniske rapport.

Rapportering av innholdsbrudd

Hvis du mener at innhold generert med gpt‑oss-modeller bryter retningslinjene våre, kan du rapportere det via vårt skjema for rapportering av innhold. Oppgi så mange detaljer som mulig for å hjelpe teamet vårt med å gjennomgå innsendingen din.

Vanlige spørsmål

Er disse modellene gratis?

Modellvektene for gpt-oss er gratis å laste ned og bruke under Apache 2.0-lisensen og gpt-oss sine retningslinjer for bruk. Du er imidlertid ansvarlig for eventuelle kostnader knyttet til å kjøre dem – for eksempel databehandling, lagring eller gebyrer for tredjeparts hosting. Prisene for dette avhenger av infrastrukturen eller leverandøren du velger.

Er disse modellene «åpen kildekode»?

Vi bruker begrepet open model eller modeller med åpne vekter for å angi at de trente vektene er offentlig tilgjengelige under den tillatende Apache 2.0-lisensen og gpt-oss sin brukspolicy. Dette betyr at du kan laste ned modellene, kjøre dem på egen infrastruktur eller med støttede hosting-rammeverk, og tilpasse eller finjustere dem.

Open model gir utviklere og organisasjoner større kontroll og fleksibilitet. Du kan velge hvor de skal hostes, tilpasse modellene til spesifikke bruksområder og dra nytte av lisensiering som tillater bred bruk, endring og videredistribusjon. Selv om de trente vektene er åpne, kan noe av den omkringliggende infrastrukturen eller verktøyene fortsatt være proprietære for leverandørene.

Kan jeg få tilgang til disse modellene gjennom OpenAI API eller ChatGPT?

Nei. Disse modellene tilbys ikke i OpenAI API og vises ikke i ChatGPT.

Kan jeg finjustere modellene?

Ja. Du kan finjustere ved hjelp av åpne kildekodeverktøy og den infrastrukturen du foretrekker. Vi tilbyr ikke finjustering gjennom OpenAI API-er for disse modellene.

Er modeller med åpne vekter billigere enn å bruke API-et?

Kostnadene varierer basert på infrastruktur, arbeidsbelastning og driftsmodell. Selvhosting kan være billigere i noen tilfeller, mens vår API-plattform kan være mer effektiv når man tar med hosting, vedlikehold og oppgraderinger i beregningen.

Hvilke funksjoner støtter disse modellene?

Disse modellene er for øyeblikket resonneringsmodeller kun for tekst. Vanlige kjøremiljøer støtter strømming, funksjonskall og strukturerte utdata. Sjekk dokumentasjonen for kjøremiljøet ditt for nøyaktige funksjoner.

Hvordan skiller dette seg fra ModAPI?

Dette er en svært kapabel resonneringsmodell som lar deg ta med din egen policy. Den kan fungere sammen med ModAPI, men er sannsynligvis ikke en erstatning for bruksområder med lav ventetid.

Var denne artikkelen nyttig?