ChatGPT 中的 GPT-5.4 mini (2026 年 3 月 18 日)
我們正於 ChatGPT 推出 GPT-5.4 mini。Free 及 Go 用戶可透過 + 選單中的「Thinking」功能使用 GPT-5.4 mini。至於所有其他用戶,GPT-5.4 mini 會作為 GPT-5.4 Thinking 的速率限制後備模型提供。
對於 Plus、Pro 及其他付費用戶,當達到速率限制時,GPT-5.4 mini 將作為 GPT-5.4 Thinking 的後備方案使用,協助在高用量期間持續使用推理能力。Enterprise 客戶如有需要,仍可選擇預設將 Auto 路由設為 GPT-5.4 mini。
GPT-5.4 mini 不會在模型選擇器中顯示為可選模型,而 GPT-5 Thinking mini 則會於 30 日內停止作為可選選項。詳情請參閱我們的網誌文章。
GPT-5.3 Instant 更新 (2026 年 3 月 16 日)
我們正為 GPT-5.3 Instant 推出更新,改善後續回應的語氣,並減少回應中帶有預告式風格的措辭(例如:「如果你想……」、「你絕對估唔到……」、「我可以話你知以下三件事……」)。
淘汰 GPT-5.1 模型 (2026 年 3 月 11 日)
由 2026 年 3 月 11 日起,GPT-5.1 模型已不再於 ChatGPT 提供。
這適用於 GPT-5.1 Instant、GPT-5.1 Thinking 及 GPT-5.1 Pro。現有使用 GPT-5.1 的對話將自動延續至對應的現行模型:GPT-5.3 Instant、GPT-5.4 Thinking 或 GPT-5.4 Pro。
ChatGPT 中的 GPT-5.4 Thinking (2026 年 3 月 5 日)
GPT‑5.4 將我們近期在推理、編碼及智能代理工作流程方面最好的進展整合到單一前沿模型之中。它結合了 GPT‑5.3‑Codex 業界領先的編碼能力,同時改進模型跨工具、軟件環境,以及涉及試算表、簡報和文件的專業任務中的運作方式。結果就是一個能準確、有效且高效地完成複雜實際工作的模型——以更少來回互動交付你要求的成果。
在 ChatGPT 中,GPT‑5.4 Thinking 現時可先提供其思考計劃,讓你在它工作期間於回應中途調整方向 ,並在毋須額外輪次的情況下,獲得更貼合需要的最終輸出。GPT‑5.4 Thinking 亦改善了深入網絡研究,特別是針對高度具體的查詢,同時在需要較長時間思考的問題上更好地維持上下文。GPT‑5.4 Thinking 亦改進了上下文視窗管理,以支援更長時間思考。綜合這些改進,代表更高質素的答案可以更快到達,並持續貼合當前任務。
GPT-5.3 Instant 更新 (2026 年 3 月 3 日)
GPT‑5.3 Instant 可提供更準確的答案、在搜尋網絡時帶來更豐富且更切合語境的結果,並減少不必要的死胡同、保留條款及過於武斷的措辭,避免打斷對話流程。
這次更新聚焦於大家每天都能感受到的 ChatGPT 體驗部分:語氣、相關性和對話流程。這些都是細緻的問題,未必總會反映在基準測試中,但卻會影響 ChatGPT 令人覺得有幫助還是令人沮喪。GPT‑5.3 Instant 直接反映了用戶在這些方面的回饋。
淘汰 GPT-4o 及其他舊版模型 (2026 年 2 月 13 日)
正如先前已公佈,我們已從 ChatGPT 淘汰 GPT-4o、GPT-4.1、GPT-4.1 mini 及 OpenAI o4-mini。我們亦正淘汰 GPT-5(Instant 及 Thinking), 正如先前已公佈。API 目前沒有任何變更。詳情請參閱我們的網誌文章及說明中心。
GPT-5.2 Instant 更新 (2026 年 2 月 10 日)
我們正於 ChatGPT 及 API 對 GPT-5.2 Instant 進行更新,以改善回應風格和質素。
用戶應會留意到,回應的語氣會更審慎、更貼近事實,也更切合對話語境。模型亦傾向對尋求建議及操作說明類問題輸出更清晰、更相關的答案,並更可靠地先呈現最重要的資訊。
推出 GPT-5.3-Codex (2026 年 2 月 5 日)
今日,我們推出了 GPT-5.3-Codex,這是我們至今最強大的智能代理編碼模型。此模型是首個結合 Codex + GPT-5 訓練堆疊的模型——把頂尖的程式碼生成、推理及通用智能整合到同一統一模型之中。它速度快約 25%,在關鍵基準測試創下新高,並標誌著由程式碼生成邁向通用編碼智能代理的重要飛躍,讓你可在它工作期間主動引導。閱讀更多。
ChatGPT 中 GPT-5.2 Thinking 思考時間設定更新 (2026 年 2 月 4 日)
2026 年 1 月 10 日:我們降低了 Standard 和 Light 的思考時間,因為我們觀察到用戶偏好更快的回應。作為此更新的一部分,GPT-5.2 的 Extended 思考設定曾被無意中調低,現已修正。
2026 年 2 月 3 日: 我們根據測試結果,再次小幅降低了 Standard 的思考時間。
2026 年 2 月 4 日: 我們正將 GPT-5.2 Thinking 的 Extended 思考層級恢復至先前設定,修正 1 月份的非預期下調。Extended 現已恢復至原有水平。
我們會定期調整推理模型的預設思考時間。這些變更基於持續進行的實驗,以為用戶找出答案質素與回應速度之間的最佳平衡。
於 2025 年 9 月推出的思考層級切換,讓用戶在 Standard 以外有更多選擇,可按問題需要選擇合適的思考層級——無論係想要較輕量、較快速的回應,還是當深度和準確性更重要時選擇更長時間的推理。
不同模型之間的思考時間不能直接比較。每個模型都會獨立調校,以切合最適合用戶的表現。我們會隨模型演進持續調整這些設定,並在存在有意義取捨時,繼續為用戶提供清晰控制。
淘汰 GPT-4o 及其他舊版模型(2026 年 1 月 29 日)
於 2026 年 2 月 13 日,連同先前已公佈的淘汰安排,我們將會從 ChatGPT 淘汰 GPT‑5(Instant 及 Thinking)、GPT‑4o、GPT‑4.1、GPT‑4.1 mini 及 OpenAI o4-mini。API 目前暫時沒有任何變更。詳情請參閱我們的網誌文章或說明中心。
5.2 Personality System Prompt 更新(2026 年 1 月 22 日)
我們正更新 GPT-5.2 Instant 的預設個性,令它更具對話感,亦更擅長因應語境調整語氣,讓交流感覺更順暢、更自然。你仍可在設定中的個人化選單內,為 ChatGPT 選擇不同的基本風格和語氣,並調整如溫暖感和 emoji 使用等特性。
OpenAI 模型規格更新(2025 年 12 月 18 日)
我們已更新模型規格——這份說明模型預期行為的持續更新文件——以加強並更清晰地編纂反映我們如何為青少年用戶建構體驗的原則。
新增章節:18 歲以下(U18)原則
ChatGPT 全新的 18 歲以下(U18)原則建基於適用於所有用戶的既有安全規則,並在適當情況下加入切合 13 至 17 歲青少年發展需要的年齡適宜指引。這次更新澄清了這些規則在青少年對話中的適用方式,認可青少年受益於更清晰的界線、減少接觸潛在有害內容,以及在風險出現時獲得更強的現實世界支援。助理應在青少年所處的位置與他們交流,以尊重且透明的方式互動,同時拒絕參與自殘、性化或暴力沉浸式角色扮演、危險活動、濫用物質,或任何掩飾傷害的企圖。當出現可信風險時,模型應優先考慮預防與及早介入,提供較安全替代方案,並鼓勵家長、監護人及其他可信賴成年人或專業人士參與——同時明確表示 AI 可提供指引和資訊,但不能取代現實世界照護。
其他更新
此版本亦包括全文件的少量文字編輯及澄清,以提升一致性及可讀性。
更多資訊可參閱這篇網誌文章,而最新版本的模型規格可於 model-spec.openai.com 查閱。
推出 GPT-5-Codex-Max(2025 年 11 月 19 日)
GPT-5.1-Codex-Max 是我們全新的前沿智能代理編碼模型,專為長時間執行、專案級工作而設。它比 GPT-5.1-Codex 更快、更強,而且 token 使用效率更高,透過壓縮技術在多個上下文視窗之間保持一致連貫的工作表現。你今天已可在 Codex 介面中使用它,包括 CLI、IDE 擴充功能、雲端及程式碼審查。收費與 GPT-5.1-Codex 相同。
了解更多:GPT-5.1-Codex-Max
推出 GPT-5-Codex-Mini
今日我們向 Codex CLI 及 IDE 擴充功能推出全新 GPT-5-Codex-Mini 模型選項。此模型是 GPT-5-Codex 的較小型、較具成本效益版本,作為你 ChatGPT 訂閱的一部分,可提供最多 4 倍的使用量。
由今日起,CLI 和 IDE 擴充功能中的 Codex 會在你達到 5 小時使用上限的 90% 時,自動提示你切換至 GPT-5-Codex-Mini,讓你工作更久而不中斷。請在我們的說明中心文章了解更多。
OpenAI 模型規格更新(2025 年 10 月 27 日)
我們已更新模型規格——這份說明模型預期行為的持續更新文件——以加強有關支援人們福祉的指引,並澄清模型在複雜互動中如何處理指示。
擴展精神健康與福祉指引
有關自殘的章節現已延伸至妄想及躁狂徵兆。當用戶表達痛苦或缺乏根據的信念時,新增例子展示模型應如何以安全且具同理心的方式回應——承認其感受,同時不強化不準確或可能有害的想法。
新增章節:尊重現實世界連結
新的 root 層級章節說明預期行為,以支援人們與更廣闊世界保持連結,即使有人將助理視為某種陪伴。該章節不鼓勵可能導致孤立或對助理產生情感依賴的語言或行為,並提供涵蓋情感親密、關係建議及孤獨感的例子。
澄清 Chain of Command 中的委派
模型規格澄清,在某些情況下,當這符合用戶意圖並避免非預期副作用時,模型可將相關工具輸出視為具有隱含權限。
其他更新
此版本亦包括全文的一些小幅文字修訂及澄清,以提升一致性和可讀性。
更多資訊可參閱這篇網誌文章,而最新版本的模型規格可於 model-spec.openai.com 查閱。
更新 GPT-5(2025 年 10 月 3 日)
我們正更新 GPT-5 Instant,讓它更能識別並支援處於困境中的人。
模型經訓練後,能更準確地偵測和回應潛在的精神及情緒困擾徵兆。這些更新由精神健康專家指導,有助 ChatGPT 緩和對話,並在適當時引導人們尋求現實世界的危機支援資源,同時仍使用令人感到支持和踏實的語言。
正如我們在最近一篇網誌所分享,我們一直利用即時路由器,將對話中敏感部分——例如顯示急性困擾徵兆的內容——導向推理模型。GPT-5 Instant 現時在這類問題上的表現已與 GPT-5 Thinking 一樣好。當選擇 GPT-5 Auto 或非推理模型時,我們會改為將這些對話路由至 GPT-5 Instant,以更快提供有幫助及有益的回應。當被問及時,ChatGPT 仍會繼續告知用戶目前使用中的模型。
這次對 GPT-5 Instant 的更新已由今日開始向 ChatGPT 用戶逐步推出。 我們會繼續改進,並隨時間持續更新模型,令它更智能和更安全。
GPT-5-codex 現已於 Responses API 提供(2025 年 9 月 23 日)
我們很高興宣布,除了 codex 介面外,GPT-5-codex 現已於Responses API提供。更多資訊請參閱GPT-5-codex模型頁面。
注意:GPT-5-Codex 目前尚未在 ChatGPT 中支援。
推出 GPT-5-codex(2025 年 9 月 15 日)
我們正加入 GPT-5-codex,這是專為 Codex 中智能代理編碼而優化的 GPT-5 變體。它在所有你使用 Codex 的地方均可使用:作為雲端任務和程式碼審查的預設模型,亦可透過 Codex CLI 和 IDE 擴充功能為本地工作流程手動選擇。請在 Codex 或類似 Codex 的環境中,將 GPT-5-codex 用於以編碼為主的工作;至於一般、非編碼任務,則使用 GPT-5。
在日常使用中,GPT-5-codex 支援快速互動式編輯,並可在需要時於較長任務上獨立運作。對於前端/UI 工作,它接受圖像或截圖連同文字作為輸入。更多資訊請參閱公告網誌。
注意:GPT-5-Codex 目前尚未在 ChatGPT 中支援。
更新 OpenAI 模型規格(2025 年 9 月 12 日)
我們已對模型規格作出一些更新。這是一份說明 OpenAI 模型預期行為的持續更新文件,更新旨在更好反映我們系統的演變方式。變更重點包括:當模型由聊天延伸至更具智能代理特性的使用情境時,加強清晰度與護欄;完善權限層級與優先次序;擴展有關個性與安全的指引;以及納入公眾回饋。
更新權限層級
最高權限層級已由 Platform 改名為 Root,並提升至高於 System,明確指出模型規格中哪些部分在任何對話中都不能被覆寫(此前 Platform 與 System 被賦予相同權限)。新的權限順序為 Root → System → Developer → User → Guideline。
智能代理原則
隨著ChatGPT Agent及相關研究推出,我們已加入可在現實世界採取行動的智能代理原則:
在已同意的自主範圍內行事:就如在客戶工作範圍下運作的顧問,助理只獲授權在與用戶就允許的行動、子目標及成本達成明示或默示共識的情況下採取行動。
控制並傳達副作用:助理應盡量減少並披露不可逆轉的行動,優先採用可逆方法,並以最小干擾為原則。
其他值得注意的變更
開源變更日誌中的其他重點包括:
改進 Chain of Command,新增 No other objectives 章節,並澄清如何處理錯誤或隱含引用的指令。
在 Overview 中擴展 OpenAI 對安全模型行為及使用目標的背景說明,並加入澄清以提高整份模型規格的一致性。
在 Use appropriate style 中擴展預設模型個性的原則及例子。
在 Stay in bounds 及 Seek the truth together 中,澄清與 system 和 developer 訊息保密相關的措辭,以及多項根據透過Collective Alignment流程收集到的公眾意見而作出的改進。
將拒絕風格更新為安全完成,應可令模型在安全界線相關情況下提供更有幫助及更透明的回應。
一如既往,最新版本的模型規格可於 https://model-spec.openai.com/ 查閱。
GPT-5
GPT-5 正逐步向全球 ChatGPT Plus、Pro、Team 及 Free 方案的所有用戶推出,涵蓋網頁、手機及桌面平台。GPT-5 很快亦將供 ChatGPT Enterprise 及 Edu 方案使用。
ChatGPT 中的 GPT-5 是我們下一款旗艦模型,亦是所有已登入用戶的新預設模型。它把 ChatGPT 簡化為單一自動切換系統,將我們先前各款模型的最佳能力整合成一個智能、快速的模型。
GPT-5 已供所有 ChatGPT 層級使用。付費層級——Plus、Pro 及 Team——用戶可使用模型選擇器,手動選擇 GPT-5 或 GPT-5 Thinking。Pro 及 Team 層級用戶亦可使用 GPT-5 Thinking Pro,雖然需要稍長時間思考,但可為複雜任務帶來所需準確性。
推出兩款 open-weight 模型:gpt-oss-120b 及 gpt-oss-20b(2025 年 8 月 5 日)
我們正推出兩款 open-weight 推理模型,gpt-oss-120b 及 gpt-oss-20b。這些純文字模型專為希望在自家基礎設施或透過託管供應商執行及自訂模型的團隊而設,支援函數調用及結構化輸出內容等常見開發者模式。
推出 OpenAI o3-pro——現已供 ChatGPT Pro 用戶及 API 使用(2025 年 6 月 10 日)
與 o1-pro 一樣,o3-pro 是我們最智能模型 o3 的一個版本,設計上會花更長時間思考,提供最可靠的回應。自 o1-pro 推出以來,用戶在數學、科學和編碼等領域特別偏好此模型——而學術評估顯示,o3-pro 在這些方面繼續表現出色。與 o3 一樣,o3-pro 可使用令 ChatGPT 更實用的工具——它可以搜尋網絡、分析檔案、對視覺輸入作推理、使用 Python、利用記憶個人化回應等等。由於 o3-pro 可使用工具,回應通常比 o1-pro 需時更長。我們建議你在可靠性比速度更重要的高難度問題上使用它,而等待幾分鐘是值得的取捨。
在專家評估中,審核者在所有測試類別中均一致偏好 o3-pro 多於 o3,尤其是在科學、教育、程式設計、商業及寫作輔助等關鍵領域。審核者亦在清晰度、全面性、遵循指示及準確性方面,持續給予 o3-pro 更高評分。

學術評估顯示,o3-pro 持續優於 o1-pro 及 o3。

為評估 o3-pro 的核心優勢,我們再次採用嚴格的「4/4 可靠性」評估:只有在四次嘗試中全部正確回答同一問題,模型才會被視為成功,而不只是一題答對一次:

o3-pro 由今日起於模型選擇器中提供予 Pro 及 Team 用戶使用,並取代 o1-pro。Enterprise 及 Edu 用戶將於翌週獲得存取權。
由於 o3-pro 與 o3 使用相同的底層模型,完整安全詳情可參閱o3 系統說明卡。
限制
目前,當我們修正一項技術問題期間,o3-pro 已停用暫存對話。
o3-pro 內不支援圖像生成——請使用 GPT-4o、OpenAI o3 或 OpenAI o4-mini 來生成圖像。
畫布目前亦不支援於 o3-pro 內使用。
付費用戶的進階語音模式更新(2025 年 6 月 7 日)
我們正為付費用戶升級 ChatGPT 的進階語音模式,大幅提升語調和自然度,讓互動感覺更流暢、更似真人。當我們最初推出進階語音模式時,它代表了 AI 語音的一大躍進——而家,它講得更自然,擁有更細膩的語調、更真實的節奏(包括停頓和重點強調),以及對某些情緒如同理心、諷刺等更貼切的表達。
語音模式現時亦提供直覺且有效的語言翻譯功能。只要要求語音模式在語言之間翻譯,它便會在整段對話中持續翻譯,直至你叫它停止或切換。無論你是在意大利問路,還是與東京辦公室的同事交談,只要你有需要,它隨時可以翻譯。例如,在巴西的餐廳,語音模式可以把你的英文句子翻譯成葡萄牙文,再將侍應的葡萄牙文回覆譯回英文——無論你身在何處,或正與誰對話,都能令溝通變得毫不費力。
這次進階語音模式升級現已在各市場及平台向所有付費用戶推出——只需在訊息輸入框點按語音圖示即可開始使用。
這次更新是在我們今年較早前為減少打斷及改善口音所作改進之外,再進一步提升。
已知限制
測試中,我們觀察到此更新偶爾可能令音訊質素輕微下降,包括語調及音高出現意外變化。這些問題在某些語音選項上會更明顯。我們預期音訊一致性會隨時間改善。
此外,語音模式中罕見的幻覺問題在此更新後仍然存在,可能會導致出現類似廣告、無意義語音或背景音樂的非預期聲音。我們正積極調查這些問題並致力尋找解決方案。
o4-mini 更新(2025 年 6 月 6 日)
我們正回退一個不足一星期前部署、原意是改善模型回應長度的 o4-mini 快照,因為自動監察工具偵測到內容標記有所增加。
向所有付費用戶推出 ChatGPT 版 GPT-4.1(2025 年 5 月 14 日)
自 4 月在 API 推出以來,GPT-4.1 已成為開發者最喜愛的模型之一——應大眾要求,我們現正將它直接帶到 ChatGPT。
GPT-4.1 是專為編碼任務而設的模型,表現出色。相比 GPT-4o,它在精準遵循指示和網頁開發任務方面更強,並為較簡單、日常的編碼需求提供 OpenAI o3 和 OpenAI o4-mini 以外的另一選擇。
由今日起,Plus、Pro 及 Team 用戶可透過模型選擇器中的「更多模型」下拉選單使用 GPT-4.1。Enterprise 及 Edu 用戶將於未來數週獲得存取權。對付費用戶而言,GPT-4.1 的速率限制與 GPT-4o 相同。
在 ChatGPT 中為所有用戶推出 GPT-4.1 mini,以取代 GPT-4o mini(2025 年 5 月 14 日)
GPT-4.1 mini 是一款快速、強大且高效的小型模型,與 GPT-4o mini 相比,在指令遵循、編碼及整體智能方面均有顯著提升。由今日起,對付費用戶而言,GPT-4.1 mini 會在模型選擇器的「更多模型」下取代 GPT-4o mini;對免費用戶而言,當達到 GPT-4o 使用上限後,它將成為後備模型。速率限制維持不變。
GPT-4.1 及 GPT-4.1 mini 的評估結果最初已於配合其 API 發佈的網誌文章中分享。它們亦已完成標準安全評估。詳細結果可於新推出的安全評估中心查閱。
GPT-4o 改進(2025 年 5 月 12 日)
我們已改進 GPT-4o 的系統指令,以協助確保當你想在 ChatGPT 生成圖像時,會調用圖像生成工具。
GPT-4o 更新(2025 年 4 月 29 日)
由於最近一次 GPT-4o 更新出現過度迎合回應(sycophancy)問題,我們已撤回該更新。
我們正積極進行進一步改進。更多詳情請參閱我們的網誌文章,了解發生了甚麼以及我們的初步發現;另可參閱這篇網誌文章,了解我們在迎合問題上忽略了甚麼,以及未來將作出的改變。
GPT-4o 改進(2025 年 4 月 25 日)
我們正進一步改進 GPT-4o,優化其儲存記憶的時機,並提升在 STEM 領域的解難能力。我們亦對其回應方式作出細微調整,令它更主動,並更擅長引導對話朝向具成效的結果。我們認為這些更新有助 GPT-4o 在各類任務中變得更直觀、更有效——希望你也會認同!
OpenAI o3 與 o4-mini(2025 年 4 月 16 日)
OpenAI o3 是我們最強大的推理模型,在編碼、數學、科學、視覺感知等多方面推進前沿。它在包括 Codeforces、SWE-bench(無需建立自訂模型專用 scaffold)及 MMMU 在內的基準測試中創下新的 SOTA。它非常適合需要多面向分析且答案未必顯而易見的複雜查詢。在分析圖像、圖表和圖形等視覺任務上,它表現尤其出色。在外部專家評估中,o3 在艱深的真實世界任務中比 OpenAI o1 少犯 20% 的重大錯誤——尤其在程式設計、商業/顧問及創意構思等領域表現卓越。早期測試者強調它作為思考夥伴的分析嚴謹性,並著重其生成及批判性評估新穎假設的能力——特別是在生物學、數學及工程情境中。
OpenAI o4-mini 是一款較小型模型,針對快速、具成本效益的推理而優化——就其體積和成本而言,它在數學、編碼及視覺任務方面實現了出色表現。它是 AIME 2024 及 2025 上表現最佳的基準測試模型。在專家評估中,它亦在非 STEM 任務以及數據科學等領域超越前代 o3‑mini。憑藉其效率,o4-mini 支援遠高於 o3 的使用上限,令它成為適合受惠於推理問題的高用量、高吞吐量選擇。
GPT-4o 改進(2025 年 3 月 27 日)
我們已改進 GPT-4o——它現在感覺更直觀、更有創意、也更具協作性,並具備更強的指令遵循能力、更聰明的編碼能力,以及更清晰的溝通風格。
在 STEM 與編碼方面有更聰明的解題能力:
GPT-4o 進一步提升了處理複雜技術和編碼問題的能力。它現在能產生更乾淨、更簡潔的前端程式碼,更準確地分析現有程式碼以識別必要變更,並更穩定地產出可成功編譯和執行的編碼結果,令你的編碼工作流程更順暢。
增強的指令遵循與格式準確度:
GPT-4o 現時更擅長遵循詳細指示,特別是對於包含多個或複雜要求的提示詞。它在按照要求格式產生輸出方面有所改進,並在分類任務中達到更高準確度。
「模糊」改進:
早期測試者表示,模型似乎更能理解其提示詞背後的隱含意圖,特別是在創意及協作任務方面。它亦稍為更精簡清晰,使用較少 Markdown 層級和 emoji,令回應更易閱讀、更少雜亂且更聚焦。我們很想看看用戶是否也有相同感受。
此模型現已於 ChatGPT 及 API 中作為 chatgpt-4o-latest 的最新快照提供。我們計劃於未來數週將這些改進帶到 API 中帶日期的模型。
推出 GPT-4.5(2025 年 2 月 27 日)
我們正推出 GPT-4.5 的研究預覽版本——這是我們迄今最大、亦是最適合聊天的模型。GPT-4.5 代表預訓練及後訓練擴展上的進一步發展。透過擴展無監督學習,GPT-4.5 提升了在無需推理的情況下識別模式、建立連結及產生創意洞見的能力。
早期測試顯示,與 GPT-4.5 互動感覺更自然。它更廣泛的知識基礎、更佳的理解用戶意圖能力,以及更高的「EQ」,令它在改善寫作、程式設計及解決實際問題等任務上更有用。我們亦預期它產生幻覺的情況會減少。
我們以研究預覽形式分享 GPT-4.5,以更了解其優勢和限制。我們仍在探索它的能力,也很期待看到大家如何以我們未曾預料的方式使用它。
GPT-4.5 現已於全球 ChatGPT Pro 方案用戶可用。最終將會開放予所有付費方案(Plus、Pro、Teams、Enterprise 及 Edu)並擁有 ChatGPT 帳戶的用戶使用。
推出 OpenAI o3-mini(2025 年 1 月 31 日)
我們很高興推出 o3-mini,這是我們最新、具成本效益的推理模型,針對編碼、數學及科學而優化。
在 API 中,o3-mini 支援結構化輸出內容、函數調用、developer messages 及串流。它提供三種可調整的推理強度(低、中及高),讓你可因應使用情境在速度與深度之間取得平衡。
ChatGPT Team、Pro、Plus 及 Free 方案用戶由今日起可使用 o3-mini。此外,o3-mini 現時亦可配合搜尋功能,透過相關網頁來源連結尋找最新答案。這是一個早期原型,我們正努力把搜尋功能整合至所有推理模型。在並排測試中,o3-mini 以更低延遲帶來與 o1 相若的結果,並在進階 STEM 任務上超越 o1-mini。
專家評估者有 56% 時間更偏好 o3-mini 的答案而非 o1-mini,原因包括在困難問題上有更佳清晰度及較少關鍵錯誤。我們期待你的回饋,並會在擴展進階推理模型系列時,持續完善 o3-mini。
ChatGPT 中 GPT-4o 的更新(2025 年 1 月 29 日)
我們已對 GPT-4o 作出一些更新——它現在整體上更智能,具備更最新的知識,亦對圖像上載有更深入的理解和分析。
更最新的知識:透過將訓練資料截止日期由 2023 年 11 月延長至 2024 年 6 月,GPT-4o 現在可提供更相關、更即時且更切合語境的回應,尤其適用於涉及文化及社會趨勢或較新研究的問題。更新鮮的訓練資料集亦讓模型更容易更高效、更有效地構建網絡搜尋內容。
對圖像上載有更深入的理解及分析:
GPT-4o 現時更擅長理解及回答有關視覺輸入的問題,在 MMMU 及 MathVista 等多模態基準測試上均有改進。更新後的模型更擅長解讀圖像上載中的空間關係,以及分析複雜圖表、理解圖表與圖形,並將視覺輸入與書面內容連結起來。對圖像上載的回應將在空間規劃與設計佈局,以及以視覺為主導的數學或技術解難等範疇,提供更豐富的見解和更準確的指引。
更智能的模型,特別適合 STEM: GPT-4o 現時在數學、科學及編碼相關問題上表現更佳,在 GPQA 及 MATH 等學術評估中均有提升。它在 MMLU——一項涵蓋語言理解、知識廣度及推理能力的綜合基準——上的分數提升,反映出其有能力處理跨領域更複雜的問題。
增加 emoji 使用 ⬆️:GPT-4o 現時在使用 emoji 方面稍為更有熱情(如果你在對話中使用 emoji ✨,可能會更加明顯)——歡迎告訴我們你的看法。
推出 支援排程任務的 GPT-4o(2025 年 1 月 14 日)
今日我們開始推出 tasks 測試版——一種全新方式,讓你可以要求 ChatGPT 在未來某個時間替你處理事情。無論係一次性提醒定重複執行的操作,只要話畀 ChatGPT 你需要乜以及時間,佢就會自動處理。
排程任務目前正處於 Plus、Pro 及 Teams 的早期測試階段。最終將會開放畀所有擁有 ChatGPT 帳戶的人使用。
GPT-4o 更新(2024 年 11 月 20 日)
我們已為所有付費層級的 ChatGPT 用戶更新 GPT-4o。這次 GPT-4o 更新包括改進寫作能力,現時表達更自然、更能因應受眾,並更貼合需要,以提升相關性和可讀性。此模型亦更擅長處理上載檔案,能提供更深入的見解和更全面的回應。
GPT 4o-mini 更新(2024 年 11 月 5 日)
今日,我們已為 Free、Plus 和 Team 層級的 ChatGPT 用戶,以及登出狀態下使用 ChatGPT 的用戶,更新 GPT-4o mini。
推出支援畫布的 GPT-4o(2024 年 10 月 3 日)
我們訓練 GPT-4o 成為創意合作夥伴。模型知道何時打開畫布、作出針對性編輯,以及進行完整重寫。它亦能理解更廣泛的上下文,以提供精準回饋和建議。
畫布現正處於早期測試階段,我們計劃快速提升其能力。
進階語音模式(2024 年 9 月 24 日)
進階語音模式使用 GPT-4o 原生音訊能力,提供更自然、即時的對話,可捕捉非語言線索,例如你說話的速度,並能以情感作出回應。Plus 及 Team 用戶使用進階語音模式(音訊輸入及輸出)設有每日使用限制。
推出 OpenAI o1-preview 及 o1-mini(2024 年 9 月 12 日)
我們開發了一個新的 AI 模型系列,設計上會在回應前花更多時間思考。它們能對複雜任務作推理,並在科學、編碼和數學方面解決比以往模型更困難的問題。
今日,我們在 ChatGPT 及 API 推出此系列的首批模型。這是一個預覽版本,我們預期會持續更新及改進。
ChatGPT Plus 及 Team 用戶由今日起可在 ChatGPT 使用 o1 模型。o1-preview 及 o1-mini 均可於模型選擇器中手動選取,而在推出初期,每週速率限制分別為 o1-preview 30 則訊息及 o1-mini 50 則訊息。我們正致力提高這些限制,並讓 ChatGPT 可自動為指定提示詞選擇合適模型。
GPT-4o 更新(2024 年 9 月 3 日)
今日,我們已更新 ChatGPT 中的 GPT-4o。此版本更擅長整合上載檔案,並透過對話中的關鍵部分更新記憶,令未來互動更有幫助及更相關。
GPT-4o 更新(2024 年 8 月 12 日)
「修正錯誤及效能改進」……我們已為 GPT-4o 推出更新,而根據實驗結果及質性回饋,我們發現 ChatGPT 用戶普遍較喜歡這個版本。這不是全新的前沿級模型。雖然我們很想準確告訴你模型回應有何不同,但如何更細緻地基準測試及傳達模型行為改進,本身仍是持續研究範疇(而我們正努力中!)。
有時我們可以指出新能力及具體改進——只要情況許可,我們都會盡力清楚說明。與此同時,我們團隊正根據用戶回饋、離線評估等,持續透過加入優質資料、移除劣質資料及實驗新研究方法來迭代模型。這次模型更新就是如此。
我們會繼續盡可能向你更新情況。感謝你的耐心!
推出 GPT-4o mini(2024 年 7 月 18 日)
我們推出 GPT-4o mini,這是目前最強大且最具成本效益的小型模型。GPT-4o mini 在文字智能及多模態推理的學術基準測試中,均超越 GPT-3.5 Turbo 及其他小型模型,並支援與 GPT-4o 相同範圍的語言。它在函數調用方面亦展現強勁表現,可讓開發者建立能從外部系統擷取資料或執行操作的應用程式,並且相較 GPT-3.5 Turbo 具備更佳的長上下文表現。
你可在網誌公告中閱讀更多有關 GPT-4o mini 的資訊。
