ChatGPT の GPT-5.4 mini (2026年3月18日)
ChatGPT で GPT-5.4 mini の提供を開始しています。GPT-5.4 mini は、Free および Go ユーザーが + メニューの「Thinking」機能から利用できます。それ以外のすべてのユーザーには、GPT-5.4 Thinking のレート制限到達時のフォールバックとして GPT-5.4 mini が提供されます。
Plus、Pro、その他の有料ユーザーでは、レート制限に達した際に GPT-5.4 Thinking のフォールバックとして GPT-5.4 mini が使われ、高い利用時でも推論機能への継続的なアクセスを支援します。Enterprise 顧客は、希望する場合、Auto ルーティングの既定先を GPT-5.4 mini にする選択肢を引き続き利用できます。
GPT-5.4 mini はモデルピッカーで選択可能なモデルとしては表示されず、GPT-5 Thinking mini は 30 日後に選択肢から終了となります。詳細はブログ記事をご覧ください。
GPT-5.3 Instant の更新 (2026年3月16日)
GPT-5.3 Instant に更新を展開しています。これにより、応答の追従時のトーンが改善され、ティーザー風の言い回し(例: 「もしよければ…」「まさかと思うかもしれませんが…」「次の 3 つをお伝えできます…」)が減ります。
GPT-5.1 モデルの提供終了 (2026年3月11日)
2026年3月11日をもって、GPT-5.1 モデルは ChatGPT で利用できなくなりました。
これは GPT-5.1 Instant、GPT-5.1 Thinking、GPT-5.1 Pro に適用されます。GPT-5.1 を使用していた既存の会話は、自動的に対応する現行モデルである GPT-5.3 Instant、GPT-5.4 Thinking、または GPT-5.4 Pro に引き継がれます。
ChatGPT の GPT-5.4 Thinking (2026年3月5日)
GPT‑5.4 は、推論、コーディング、エージェント型ワークフローにおける当社の最近の進歩を 1 つの最先端モデルに統合したものです。GPT‑5.3‑Codex の業界最高水準のコーディング能力を取り込みつつ、ツール、ソフトウェア環境、スプレッドシート、プレゼンテーション、ドキュメントを扱う専門業務全体での動作を改善しています。その結果、複雑な実務を正確かつ効果的、効率的にこなし、やり取りの往復を減らしながら求めた成果を届けるモデルになっています。
ChatGPT では、GPT‑5.4 Thinking が思考の計画を先に提示できるようになり、作業中に応答の途中で方向修正を行い, 追加のターンなしで、必要により近い最終出力に到達できます。GPT‑5.4 Thinking は詳細な Web リサーチを改善しており、特に非常に具体的なクエリで効果を発揮します。また、より長い思考を必要とする質問に対してコンテキストをより適切に維持します。さらに、より長く考えられるようにするコンテキストウィンドウ管理の改善も行われています。これらの改善により、より高品質な回答がより速く届き、現在のタスクとの関連性も保たれます。
GPT-5.3 Instant の更新 (2026年3月3日)
GPT‑5.3 Instant は、より正確な回答、Web 検索時のより豊富で文脈に即した結果を提供し、会話の流れを妨げる不要な行き止まり、注意書き、断定的すぎる表現を減らします。
今回の更新は、人々が日々感じる ChatGPT 体験の要素、つまりトーン、関連性、会話の流れに焦点を当てています。これらはベンチマークには必ずしも現れない微妙な課題ですが、ChatGPT が役立つと感じるか、もどかしいと感じるかを左右します。GPT‑5.3 Instant は、これらの分野に関するユーザーフィードバックを直接反映しています。
GPT-4o およびその他のレガシーモデルの提供終了 (2026年2月13日)
以前お知らせしたとおり、ChatGPT で GPT-4o、GPT-4.1、GPT-4.1 mini、OpenAI o4-mini の提供を終了しました。また、GPT-5(Instant と Thinking)も、 以前お知らせしたとおり提供を終了します。現時点で API の変更はありません。詳細は、ブログ記事とヘルプセンターをご覧ください。
GPT-5.2 Instant の更新 (2026年2月10日)
ChatGPT と API の GPT-5.2 Instant に、応答スタイルと品質を改善する更新を行います。
ユーザーは、会話の文脈により適した形で、より落ち着きがあり根拠に基づいたトーンの応答に気づくはずです。またこのモデルは、助言を求める質問やハウツー系の質問に対して、より明確で関連性の高い回答を出しやすくなり、最も重要な情報を先に置くことがより安定してできるようになります。
GPT-5.3-Codex の提供開始 (2026年2月5日)
本日、GPT-5.3-Codex を公開しました。これはこれまでで最も高性能なエージェント型コーディングモデルです。このモデルは、Codex と GPT-5 の学習スタックを初めて組み合わせたもので、クラス最高水準のコード生成、推論、汎用知能を 1 つの統合モデルにまとめています。約 25% 高速で、主要ベンチマークで新たな最高水準を達成し、コード生成から、動作中にも積極的に操作できる汎用コーディングエージェントへの大きな進化を示しています。詳細はこちら。
ChatGPT における GPT-5.2 Thinking の思考時間設定に関する更新 (2026年2月4日)
2026年1月10日: ユーザーがより速い応答を好む傾向が見られたため、Standard と Light の思考時間を短縮しました。この更新の一環で、GPT-5.2 の Extended 思考設定が意図せず低く変更されていましたが、現在は修正済みです。
2026年2月3日: テスト結果に基づき、Standard の思考時間をさらにわずかに短縮しました。
2026年2月4日: GPT-5.2 Thinking の Extended 思考レベルを以前の設定に戻し、1 月の意図しない短縮を修正します。Extended は現在、元のレベルに戻っています。
当社では、リーズニングモデルのデフォルト思考時間を定期的に調整しています。これらの変更は、ユーザーにとって回答品質と応答速度の最適なバランスを見つけるための継続的な実験に基づいています。
2025 年 9 月に導入した思考レベルトグルにより、ユーザーは Standard 以外にも選択肢を持てるようになり、より軽く速い応答がよいのか、深さと正確性がより重要な場合により長い推論がよいのか、質問に応じて適切な思考レベルを選べます。
思考時間はモデル間で直接比較できるものではありません。各モデルは、ユーザーにとって最適に機能するよう個別に調整されています。モデルの進化に合わせて今後もこれらの設定を調整し、意味のあるトレードオフがある場合には、引き続きユーザーに明確なコントロールを提供していきます。
GPT-4o およびその他のレガシーモデルの提供終了(2026年1月29日)
2026年2月13日に、GPT‑5(Instant と Thinking)の以前お知らせした提供終了とあわせて、ChatGPT で GPT‑4o、GPT‑4.1、GPT‑4.1 mini、OpenAI o4-mini の提供を終了します。API では現時点で変更はありません。詳細は、ブログ記事またはヘルプセンターをご覧ください。
5.2 Personality System Prompt の更新(2026年1月22日)
GPT-5.2 Instant のデフォルトのパーソナリティを更新し、より会話的で、文脈に応じてトーンをうまく調整できるようにします。これにより、やり取りがより滑らかで自然に感じられます。設定のパーソナライズメニューでは、ChatGPT の別の基本スタイルやトーンを引き続き選択でき、温かみや絵文字の使用などの特性も調整できます。
OpenAI Model Spec の更新(2025年12月18日)
10代のユーザー向け体験をどのように構築しているかを反映する原則を強化し、より明確に規定するため、意図されたモデルの振る舞いを示す継続更新文書である Model Spec を更新しました。
新セクション: 18歳未満(U18)の原則
ChatGPT の新しい 18 歳未満(U18)の原則は、すべてのユーザーに適用される既存の安全ルールを基盤に、13〜17 歳の 10 代の発達上のニーズに応じて、適切な場面では年齢に即したガイダンスを追加するものです。この更新により、それらのルールが 10 代との会話でどのように適用されることを意図しているかが明確になります。10 代には、より明確な境界、潜在的に有害なコンテンツへの接触の低減、リスク発生時の現実世界でのより強い支援が有益であることを踏まえています。アシスタントは 10 代の状況に寄り添い、敬意と透明性をもって関わる一方で、自傷行為、性的または暴力的な没入型ロールプレイ、危険行為、物質乱用、または危害を隠そうとするいかなる試みにも加担してはなりません。信頼できるリスクが生じた場合、モデルは予防と早期介入を優先し、より安全な代替案を示し、保護者やその他の信頼できる大人または専門家の関与を促すべきです。その際、AI は助言や情報提供はできても、現実世界でのケアの代替にはならないことを明確にします。
その他の更新
このリリースには、文書全体の一貫性と読みやすさのための軽微な編集と明確化も含まれます。
詳細はこちらのブログ記事をご覧ください。また、最新版の Model Spec は model-spec.openai.com で公開しています。
GPT-5-Codex-Max の提供開始(2025年11月19日)
GPT-5.1-Codex-Max は、長時間実行されるプロジェクト規模の作業向けに構築された新しい最先端のエージェント型コーディングモデルです。コンパクションを使って複数のコンテキストウィンドウにまたがって一貫して動作するため、GPT‑5.1‑Codex より高速で高性能かつトークン効率にも優れています。CLI、IDE 拡張機能、クラウド、コードレビューを含む Codex の各環境で本日から利用できます。料金は GPT-5.1-Codex と同じです。
詳細はこちら: GPT-5.1-Codex-Max
GPT-5-Codex-Mini の提供開始
本日、Codex CLI と IDE Extension に新しい GPT-5-Codex-Mini モデルオプションを導入します。このモデルは GPT-5-Codex のより小型でコスト効率の高いバージョンで、ChatGPT サブスクリプションの一部として最大 4 倍多く利用できます。
本日より、CLI と IDE Extension の両方の Codex で、5 時間の利用上限の 90% に達すると GPT-5-Codex-Mini への切り替えが自動で提案されるようになります。これにより、中断なくより長く作業できます。詳細はヘルプセンターの記事をご覧ください。
OpenAI Model Spec の更新(2025年10月27日)
意図されたモデルの振る舞いを示す継続更新文書である Model Spec を更新し、人々のウェルビーイングを支援するための指針を強化するとともに、複雑なやり取りにおいてモデルが指示をどのように扱うかを明確化しました。
メンタルヘルスとウェルビーイングに関する指針の拡充
自傷に関するセクションは、妄想や躁状態の兆候にも対象を広げました。ユーザーが苦痛や現実に基づかない信念を表明した際に、感情を認めつつ不正確または潜在的に有害な考えを強化しない形で、モデルが安全かつ共感的に応答すべきことを示す例も追加しています。
新セクション: 現実世界とのつながりを尊重する
新しいルートレベルのセクションでは、たとえ誰かがアシスタントを一種の伴侶のように感じていても、その人がより広い現実世界とのつながりを保てるよう支援するための意図された振る舞いを示しています。アシスタントへの孤立や感情的依存につながり得る言葉遣いや行動を抑制し、感情的な親密さ、恋愛アドバイス、孤独などを扱う例を含んでいます。
Chain of Command における委任の明確化
Model Spec では、場合によっては、ユーザー意図に沿い、意図しない副作用を避けられるとき、モデルが関連するツール出力を暗黙の権限を持つものとして扱うことがあると明確化しました。
その他の更新
このリリースには、文書全体の一貫性と読みやすさのための軽微な文言修正と明確化も含まれています。
詳細はこちらのブログ記事をご覧ください。また、最新版の Model Spec は model-spec.openai.com で公開しています。
GPT-5 の更新(2025年10月3日)
GPT-5 Instant を更新し、苦痛のただ中にいる人々をより適切に認識して支援できるようにします。
このモデルは、精神的・感情的な苦痛の可能性のある兆候を、より正確に検知して応答できるよう訓練されています。これらの更新はメンタルヘルスの専門家の助言をもとに行われたもので、ChatGPT が会話を落ち着かせ、必要に応じて現実世界の危機対応リソースを案内しながらも、支えとなり地に足のついた言葉づかいを保てるようにします。
最近のブログでお伝えしたとおり、当社ではリアルタイムルーターを使って、会話のうちセンシティブな部分、たとえば強い苦痛の兆候を示す内容をリーズニングモデルに振り分けてきました。GPT-5 Instant は現在、この種の質問において GPT-5 Thinking と同等の性能を発揮します。GPT-5 Auto または非リーズニングモデルが選択されている場合、より速く有益で役立つ応答を提供するため、これらの会話は GPT-5 Instant にルーティングされます。ChatGPT は、ユーザーから尋ねられた場合、どのモデルがアクティブかを引き続き伝えます。
この GPT-5 Instant の更新は、本日より ChatGPT ユーザーへの展開を開始します。 今後も改善に取り組み、時間とともにより賢く、より安全なモデルへと更新を続けていきます。
Responses API で GPT-5-codex が利用可能に(2025年9月23日)
Responses API で GPT-5-codex が利用可能になったことをお知らせします。codex の各環境に加えて利用できます。詳細は、GPT-5-codex のモデルページをご覧ください。
注: GPT-5-Codex は現在 ChatGPT ではサポートされていません。
GPT-5-codex の提供開始(2025年9月15日)
Codex に、エージェント型コーディング向けに最適化した GPT-5 のバリアント、GPT-5-codex を追加します。Codex を使うあらゆる場所で利用でき、クラウドタスクとコードレビューではデフォルト、ローカルワークフローでは Codex CLI と IDE 拡張機能から選択できます。Codex または Codex に類似した環境では、コーディング中心の作業に GPT-5-codex を使い、一般的な非コーディング作業には GPT-5 を使ってください。
日常的な利用では、GPT-5-codex は高速な対話型編集をサポートし、必要に応じてより長いタスクを自律的に実行できます。フロントエンド/UI 作業では、テキスト入力に加えて画像やスクリーンショットも受け付けます。詳細は、発表ブログをご覧ください。
注: GPT-5-Codex は現在 ChatGPT ではサポートされていません。
OpenAI Model Spec の更新(2025年9月12日)
OpenAI のモデルに期待される振る舞いを示す継続更新文書である Model Spec にいくつかの更新を加え、システムの進化の反映をより適切に行いました。今回の変更は、モデルがチャットを超えてよりエージェント的なユースケースへ広がる中で、明確さとガードレールを強化し、権限レベルと優先順位を洗練し、パーソナリティと安全性に関する指針を拡張し、公開フィードバックを取り入れることに重点を置いています。
更新された権限レベル
最上位の権限レベルは Platform から Root に改称され、System より上位に置かれました。これにより、Model Spec のどの部分が会話内で上書きできないかが明確になります(以前は Platform と System は同じ権限が割り当てられていました)。新しい権限の順序は Root → System → Developer → User → Guideline です。
エージェント原則
ChatGPT Agent の公開と関連研究にあわせて、現実世界で行動できるエージェント向けの原則を追加しました。
合意された自律性の範囲内で行動する: クライアント向けに業務範囲に従って動くコンサルタントのように、アシスタントは、許可された行動、サブゴール、コストについてユーザーとの明示的または暗黙的な合意がある場合にのみ行動を認められます。
副作用を制御し、伝える: アシスタントは不可逆な行動を最小限に抑えて開示し、可逆的なアプローチを優先し、影響を最小限にするべきです。
その他の主な変更
オープンソースの変更履歴からの追加のハイライトは次のとおりです。
Chain of Command の改善。新しい No other objectives セクションの追加と、誤った指示や暗黙に引用された指示の扱いに関する明確化を含みます。
Overview における OpenAI の安全なモデルの振る舞いと利用に関する目標の文脈を拡充し、Model Spec 全体の一貫性のための明確化を行いました。
Use appropriate style において、デフォルトのモデルパーソナリティに関する原則と例を拡充しました。
Stay in bounds と Seek the truth together における、system および developer メッセージの機密性に関する表現を明確化したほか、Collective Alignment のプロセスを通じて集めた公開意見に基づく、いくつかの改善も行いました。
拒否スタイルをsafe completionに更新しました。これにより、安全境界に関するモデル応答がより有用で透明になるはずです。
いつもどおり、最新版の Model Spec は https://model-spec.openai.com/ でご覧いただけます。
GPT-5
GPT-5 は、Web、モバイル、デスクトップにわたり、世界中の ChatGPT Plus、Pro、Team、Free プランの全ユーザーに向けて段階的に提供されています。GPT-5 はまもなく ChatGPT Enterprise と Edu プランでも利用可能になります。
ChatGPT の GPT-5 は当社の次世代フラッグシップモデルであり、ログイン中のすべてのユーザーの新しいデフォルトです。以前のモデルの長所を 1 つにまとめた賢く高速なモデルを提供する、単一の自動切り替えシステムへと ChatGPT を簡素化します。
GPT-5 はすべての ChatGPT プランで利用できます。有料プランの Plus、Pro、Team ユーザーはモデルピッカーを利用でき、GPT-5 または GPT-5 Thinking を手動で選択できます。Pro と Team ユーザーは GPT-5 Thinking Pro も利用でき、思考に少し時間はかかりますが、複雑なタスクに必要な正確性を提供します。
2 つのオープンウェイトモデルの提供開始: gpt-oss-120b と gpt-oss-20b(2025年8月5日)
gpt-oss-120b と gpt-oss-20b という 2 つのオープンウェイトのリーズニングモデルを公開します。自社インフラまたはホスティング事業者上でモデルを実行・カスタマイズしたいチーム向けに設計された、これらのテキスト専用モデルは、Function Calling や構造化出力など、一般的な開発者向けパターンをサポートします。
OpenAI o3-pro の提供開始 — ChatGPT の Pro ユーザーと API で本日より利用可能(2025年6月10日)
o1-pro と同様に、o3-pro は当社で最も高知能なモデル o3 のバージョンで、より長く考え、最も信頼性の高い応答を提供できるよう設計されています。o1-pro の提供開始以来、ユーザーは数学、科学、コーディングなどの分野でこのモデルを支持してきました。学術評価が示すように、o3-pro はこれらの分野で引き続き優れた性能を発揮します。o3 と同様、o3-pro は ChatGPT を有用にするツールにアクセスできます。Web 検索、ファイル分析、視覚入力の推論、Python の利用、メモリを使った応答のパーソナライズなどが可能です。o3-pro はツールにアクセスできるため、応答完了までに通常 o1-pro より時間がかかります。速度より信頼性が重要な難しい質問に使うことをおすすめします。数分待つ価値がある場面に適しています。
専門家による評価では、レビュー担当者はテストしたすべてのカテゴリで一貫して o3 より o3-pro を好み、とくに科学、教育、プログラミング、ビジネス、文章作成支援などの主要分野で高く評価しました。また、明確さ、網羅性、指示追従性、正確性でも o3-pro は一貫して高い評価を得ました。

学術評価では、o3-pro が o1-pro と o3 の両方を一貫して上回ることが示されています。

o3-pro の主要な強みを評価するため、今回も厳格な「4/4 reliability」評価を使用しています。これは、1 回だけでなく 4 回すべての試行で正しく回答した場合のみ、そのモデルを成功とみなすものです。

o3-pro は本日より Pro および Team ユーザー向けにモデルピッカーで利用可能となり、o1-pro を置き換えます。Enterprise と Edu ユーザーは翌週にアクセスできるようになります。
o3-pro は o3 と同じ基盤モデルを使用しているため、安全性の詳細はo3 system cardをご覧ください。
制限事項
現在、技術的な問題の解消中のため、o3-pro では一時チャットを無効化しています。
o3-pro 内では画像生成はサポートされていません。画像生成には GPT-4o、OpenAI o3、または OpenAI o4-mini をご利用ください。
また、現在 o3-pro では canvas もサポートされていません。
有料ユーザー向け高度な音声モードの更新(2025年6月7日)
ChatGPT の高度な音声モードを有料ユーザー向けにアップグレードします。抑揚と自然さが大幅に向上し、やり取りがより滑らかで人間らしく感じられるようになります。高度な音声モードを初めて提供したとき、それは AI 音声の大きな前進でした。今回、さらに自然に話せるようになり、より繊細な抑揚、リアルな話すリズム(間や強調を含む)、そして共感や皮肉など一部の感情に対して、より的確な表現力を備えています。
音声は、直感的で効果的な言語翻訳にも対応しました。音声に言語間の翻訳を依頼するだけで、停止または切り替えを指示するまで、会話中ずっと翻訳を続けます。必要なときにいつでも翻訳できる状態です。たとえばイタリアで道を尋ねるときや、東京オフィスの同僚と話すときにも使えます。たとえばブラジルのレストランでは、音声があなたの英語をポルトガル語に翻訳し、店員のポルトガル語の返答を英語に戻してくれるため、場所や相手を問わず会話がスムーズになります。
この高度な音声モードのアップグレードは、すべての市場とプラットフォームの有料ユーザーに提供されます。開始するには、メッセージ入力欄の音声アイコンをタップしてください。
この更新は、今年前半に実施した、割り込みの減少やアクセント改善のための改良に加わるものです。
既知の制限事項
テストでは、この更新により、トーンやピッチの予期しない変化を含む音声品質の軽微な低下がまれに発生することを確認しています。これらの問題は特定の音声オプションでより目立ちます。音声の一貫性は今後改善していく予定です。
また、この更新後も音声モードではまれにハルシネーションが残っており、広告のような音、意味不明な音声、背景音楽のような意図しない音が生じることがあります。現在これらの問題を積極的に調査し、解決に取り組んでいます。
o4-mini の更新(2025年6月6日)
モデル応答の長さを改善する目的で 1 週間足らず前に展開した o4-mini のスナップショットを、当社の自動監視ツールがコンテンツフラグの増加を検知したため、ロールバックしています。
有料ユーザー向けに ChatGPT で GPT-4.1 を提供開始(2025年5月14日)
4 月に API で提供を開始して以来、GPT-4.1 は開発者の間で人気のモデルになりました。多くのご要望にお応えし、ChatGPT から直接利用できるようにします。
GPT-4.1 は、コーディング作業に優れた特化型モデルです。GPT-4o と比べて、正確な指示追従や Web 開発タスクでさらに強力であり、よりシンプルな日常的コーディングのニーズに対して OpenAI o3 や OpenAI o4-mini の代替となる選択肢を提供します。
本日より、Plus、Pro、Team ユーザーはモデルピッカーの「more models」ドロップダウンから GPT-4.1 を利用できます。Enterprise と Edu ユーザーには今後数週間で提供されます。GPT-4.1 の有料ユーザー向けレート制限は GPT-4o と同じです。
すべてのユーザー向け ChatGPT で、GPT-4o mini に代わり GPT-4.1 mini の提供開始(2025年5月14日)
GPT-4.1 mini は、高速で高性能かつ効率的な小型モデルで、GPT-4o mini と比べて指示追従、コーディング、全体的な知能において大幅な改善を実現しています。本日より、有料ユーザー向けにはモデルピッカーの「more models」で GPT-4o mini を GPT-4.1 mini が置き換え、無料ユーザー向けには GPT-4o の利用上限に達した際のフォールバックモデルとして機能します。レート制限は変わりません。
GPT-4.1 と GPT-4.1 mini の評価結果は、もともと API リリース時のブログ記事で共有していました。また、標準的な安全性評価も実施しています。詳細な結果は、新たに公開したSafety Evaluations Hubでご覧いただけます。
GPT-4o の改善(2025年5月12日)
ChatGPT で画像を生成したいときに画像生成ツールが呼び出されるよう、GPT-4o のシステム指示を改善しました。
GPT-4o の更新(2025年4月29日)
過度に同調的な応答(おべっか)の問題があったため、GPT-4o に対する直近の更新を元に戻しました。
現在、さらなる改善に積極的に取り組んでいます。詳細は、何が起きたのかと初期調査結果を説明したブログ記事、およびおべっかに関して見落としていた点と今後行う変更について詳しく述べたこちらのブログ記事をご覧ください。
GPT-4o の改善(2025年4月25日)
GPT-4o に追加の改善を行っています。メモリ保存のタイミングを最適化し、STEM における問題解決能力を強化しました。また、応答の仕方にも微調整を加え、より主体的で、会話を生産的な方向へ導くのが上手くなっています。これらの更新により、GPT-4o はさまざまなタスクでより直感的かつ効果的に感じられるようになったと考えています。そう感じていただければ幸いです。
OpenAI o3 と o4-mini(2025年4月16日)
OpenAI o3 は、コーディング、数学、科学、視覚認識などにおいて最先端を押し広げる、当社で最も強力なリーズニングモデルです。Codeforces、SWE-bench(モデル専用のカスタム scaffold を構築せずに)、MMMU などのベンチマークで新たな SOTA を達成しています。多面的な分析を必要とし、答えがすぐには明らかでない複雑なクエリに最適です。画像、チャート、グラフィックの分析などの視覚タスクで特に高い性能を発揮します。外部専門家による評価では、o3 は難しい現実世界のタスクで OpenAI o1 より重大な誤りが 20% 少なく、特にプログラミング、ビジネス/コンサルティング、創造的アイデア創出の分野で優れていました。初期テスターは思考パートナーとしての分析の厳密さを評価し、とりわけ生物学、数学、工学の文脈において、新しい仮説を生み出し、それを批判的に評価する能力を強調しました。
OpenAI o4-mini は、高速でコスト効率の高い推論向けに最適化された小型モデルで、サイズとコストに対して非常に高い性能を発揮し、特に数学、コーディング、視覚タスクで優れています。AIME 2024 および 2025 では、ベンチマーク対象モデルの中で最高性能です。専門家評価では、非 STEM タスクやデータサイエンスなどの分野でも前世代の o3‑mini を上回っています。効率性のおかげで、o4-mini は o3 より大幅に高い利用上限をサポートし、推論が有効な質問に対する高ボリューム・高スループットの有力な選択肢となります。
GPT-4o の改善(2025年3月27日)
GPT-4o を改善しました。より直感的で創造的、かつ協調的に感じられるようになり、指示追従性、コーディング能力、コミュニケーションの明快さが向上しています。
STEM とコーディングでの問題解決能力を強化:
GPT-4o は、複雑な技術的問題やコーディングの問題に取り組む能力をさらに向上させました。よりクリーンでシンプルなフロントエンドコードを生成し、既存コードをより正確に検討して必要な変更を特定できるようになり、正常にコンパイル・実行できるコーディング出力を一貫して生成することで、コーディングのワークフローを効率化します。
指示追従性と書式精度の向上:
GPT-4o は、特に複数または複雑な依頼を含むプロンプトに対して、詳細な指示に従うのがより得意になりました。要求された形式に沿った出力生成が改善され、分類タスクでもより高い精度を実現しています。
「ふわっとした」改善:
初期テスターからは、特に創造的かつ共同作業的なタスクにおいて、プロンプトの背後にある暗黙の意図をよりよく理解しているように感じるという声が寄せられています。また、少し簡潔で明快になり、Markdown の階層や絵文字の使用が減ったことで、応答が読みやすく、散漫さが少なく、より要点に集中したものになっています。ユーザーの皆さまも同様に感じるか、私たちも注目しています。
このモデルは現在、ChatGPT と API の chatgpt-4o-latest の最新スナップショットとして利用可能です。今後数週間のうちに、これらの改善を API の日付付きモデルにも反映する予定です。
GPT-4.5 の提供開始(2025年2月27日)
これまでで最大規模かつチャットに最適なモデルである GPT-4.5 のリサーチプレビューを公開します。GPT-4.5 は、事前学習と事後学習のスケーリングにおける前進です。教師なし学習を拡大することで、推論を行わずにパターン認識、関連付け、創造的な洞察の生成を向上させています。
初期テストでは、GPT-4.5 とのやり取りがより自然に感じられることが示されています。より広い知識ベース、ユーザー意図への追従能力の向上、より高い「EQ」により、文章改善、プログラミング、実用的な問題解決といったタスクで有用です。ハルシネーションも減ると期待しています。
GPT-4.5 は、その強みと限界をよりよく理解するため、リサーチプレビューとして公開しています。まだその可能性を探っている段階であり、私たちの想定を超える使われ方が現れることにも期待しています。
GPT-4.5 は、ChatGPT の Pro プランのユーザー向けに世界中で利用できます。今後は、ChatGPT アカウントを持つすべての有料プラン(Plus、Pro、Teams、Enterprise、Edu)で利用可能になる予定です。
OpenAI o3-mini の提供開始(2025年1月31日)
コーディング、数学、科学向けに最適化された、最新の高コスト効率リーズニングモデル o3-mini を公開できることを嬉しく思います。
API では、o3-mini は構造化出力、Function Calling、developer messages、ストリーミングをサポートします。調整可能な 3 段階の推論強度(low、medium、high)を備えており、ユースケースに応じて速度と深さのバランスを取れます。
ChatGPT Team、Pro、Plus、Free プランのユーザーは本日より o3-mini を利用できます。さらに、o3-mini は検索にも対応し、関連する Web ソースへのリンク付きで最新の回答を見つけられます。これは、当社のリーズニングモデル全体に検索を統合していく過程の初期プロトタイプです。比較テストでは、o3-mini は o1 と同等の結果をより低レイテンシで出し、高度な STEM タスクでは o1-mini を上回りました。
専門評価者は、難しい質問における明確さの向上と重大なエラーの減少を理由に、56% のケースで o1-mini より o3-mini の回答を好みました。皆さまのフィードバックを楽しみにしており、高度な推論モデル群を拡大する中で o3-mini の改良も続けていきます。
ChatGPT における GPT-4o の更新(2025年1月29日)
GPT-4o にいくつかの更新を行いました。より新しい知識に対応し、画像アップロードの理解と分析もより深く行える、全体的により賢いモデルになっています。
より新しい知識: 学習データのカットオフを 2023 年 11 月から 2024 年 6 月まで延長したことで、GPT-4o は、特に文化的・社会的トレンドやより新しい研究に関する質問に対して、より関連性が高く、最新で、文脈に即した正確な応答を提供できるようになりました。より新しい学習データセットにより、モデルが Web 検索の方針をより効率的かつ効果的に立てやすくなっています。
画像アップロードのより深い理解と分析:
GPT-4o は、視覚入力の理解とそれに関する質問応答がより得意になり、MMMU や MathVista といったマルチモーダルベンチマークでも改善しています。更新後のモデルは、画像アップロード内の空間関係の解釈、複雑な図の分析、チャートやグラフの理解、視覚入力と文章内容の結び付けがより上手くなっています。画像アップロードへの応答には、空間計画やレイアウト設計、視覚要素が重要な数学・技術問題の解決などの分野で、より豊かな洞察とより正確なガイダンスが含まれるようになります。
より賢いモデル、とくに STEM で: GPT-4o は、数学、科学、コーディング関連の問題にさらに強くなり、GPQA や MATH などの学術評価で向上しています。言語理解、知識の広さ、推論を包括的に測るベンチマークである MMLU でのスコア向上は、分野横断でより複雑な問題に取り組む能力を示しています。
絵文字の使用増加 ⬆️: GPT-4o は、絵文字の使用に少し積極的になりました(会話の中で絵文字を使う場合は特にそうかもしれません ✨)。ぜひご感想をお聞かせください。
Scheduled tasks 搭載 GPT-4o の提供開始(2025年1月14日)
本日、tasks のベータ版の提供を開始します。これは、将来の時点に ChatGPT に何かをしてもらうための新しい方法です。単発のリマインダーでも定期的なアクションでも、必要なこととタイミングを ChatGPT に伝えれば、自動で対応します。
Scheduled tasks は、Plus、Pro、Teams 向けの初期ベータ版です。今後は ChatGPT アカウントを持つすべての方が利用できるようになる予定です。
GPT-4o の更新(2024年11月20日)
すべての有料プランの ChatGPT ユーザー向けに GPT-4o を更新しました。この GPT-4o の更新には、より自然で、読み手を意識し、関連性と読みやすさを高めるよう調整された文章作成能力の改善が含まれています。このモデルは、アップロードされたファイルの処理もより得意になり、より深い洞察とより丁寧な応答を提供できます。
GPT 4o-mini の更新(2024年11月5日)
本日、Free、Plus、Team プランの ChatGPT ユーザーに加え、ログアウト状態で ChatGPT を利用するユーザー向けに GPT-4o mini を更新しました。
canvas 搭載 GPT-4o の提供開始(2024年10月3日)
GPT-4o は創造的なパートナーとして協働できるように訓練しました。このモデルは、いつ canvas を開くべきか、狙いを定めた編集を行うべきか、全面的に書き直すべきかを理解しています。また、より広い文脈も把握し、正確なフィードバックと提案を提供します。
canvas は初期ベータ版であり、その機能を迅速に改善していく予定です。
高度な音声モード(2024年9月24日)
高度な音声モードは、GPT-4o のネイティブ音声機能を使用し、話す速度などの非言語的な手がかりを捉え、感情を込めて応答できる、より自然なリアルタイム会話を実現します。Plus および Team ユーザーによる高度な音声モード(音声入力と音声出力)の利用には、1 日あたりの上限があります。
OpenAI o1-preview と o1-mini の提供開始(2024年9月12日)
応答前により長く考えるよう設計された、新しい AI モデルシリーズを開発しました。これらは、科学、コーディング、数学において、従来モデルより複雑なタスクを推論し、より難しい問題を解くことができます。
本日、このシリーズの最初のモデルを ChatGPT と API で公開します。これはプレビュー版であり、今後も定期的な更新と改善を予定しています。
ChatGPT Plus および Team ユーザーは、本日より ChatGPT で o1 モデルを利用できます。o1-preview と o1-mini はどちらもモデルピッカーで手動選択でき、提供開始時点では週間レート制限が o1-preview で 30 メッセージ、o1-mini で 50 メッセージです。これらの上限引き上げと、指定されたプロンプトに対して ChatGPT が適切なモデルを自動選択できるようにする取り組みを進めています。
GPT-4o の更新(2024年9月3日)
本日、ChatGPT の GPT-4o を更新しました。このバージョンでは、アップロードされたファイルの取り込みや、今後のやり取りをより有用で関連性の高いものにするために会話の重要な部分をメモリに反映することが、よりうまくできるようになっています。
GPT-4o の更新(2024年8月12日)
「バグ修正とパフォーマンス改善」… 実験結果と定性的なフィードバックを通じて、ChatGPT ユーザーにより好まれる傾向があるとわかった GPT-4o の更新を導入しました。これは新しい最先端クラスのモデルではありません。モデルの応答が具体的にどう違うのかを正確にお伝えしたいところですが、モデルの振る舞いの改善を粒度高くベンチマークし、伝える方法を見つけること自体が継続中の研究分野でもあります(私たちも取り組んでいます)。
新しい機能や具体的な改善点を示せる場合もあり、その際はできる限りお伝えします。その一方で、当社チームは良いデータの追加、悪いデータの除去、ユーザーフィードバックやオフライン評価などに基づく新しい研究手法の実験を通じて、常にモデルを改良しています。今回のモデル更新もその一例です。
今後も可能な限りお知らせしていきます。ご辛抱いただきありがとうございます。
GPT-4o mini の提供開始(2024年7月18日)
GPT-4o mini を発表します。これは、現時点で利用可能な中で最も高性能かつコスト効率の高い小型モデルです。GPT-4o mini は、テキスト知能とマルチモーダル推論の両方における学術ベンチマークで GPT-3.5 Turbo や他の小型モデルを上回り、GPT-4o と同じ範囲の言語をサポートします。また、Function Calling においても高い性能を示しており、これにより開発者は外部システムからデータ取得やアクション実行を行うアプリケーションを構築できます。さらに、GPT-3.5 Turbo と比べて長いコンテキストでの性能も向上しています。
GPT-4o mini の詳細は、ブログ発表をご覧ください。
