GPT-5.5 Instant 更新(2026 年 5 月 28 日)
我们正在更新 ChatGPT 和 API 中的 GPT-5.5 Instant,以改进回答风格和质量。它现在更易读,在日常对话中更自然,在实用帮助任务中节奏更好,过长或项目符号过多的回答也更少。
此次更新后,GPT-5.5 Instant 或 GPT-5.5 Thinking 中将不再提供画布。写作和编程功能现在通过写作块和代码块直接在聊天回答中支持。付费用户可以在旧版模型停用前,通过这些模型在有限时间内继续使用画布。
停用 OpenAI o3 和 GPT-4.5 (2026 年 5 月 28 日)
今天,我们继续停用 ChatGPT 中使用量有限的旧模型,以便更好地服务于更新、能力最强的模型。OpenAI o3 将在 90 天停用过渡期后于 2026 年 8 月 26 日从 ChatGPT 中停用,GPT-4.5 将在 30 天停用过渡期后于 2026 年 6 月 27 日从 ChatGPT 中停用。这些模型目前仅通过模型设置向付费用户提供。这些变化仅适用于 ChatGPT;API 没有变化。
ChatGPT 中的 GPT-5.4 mini (2026 年 3 月 18 日)
我们正在 ChatGPT 中推出 GPT-5.4 mini。Free 和 Go 用户可通过 + 菜单中的“Thinking”功能使用 GPT-5.4 mini。对于所有其他用户,GPT-5.4 mini 将作为 GPT-5.4 Thinking 的速率限制后备模型提供。
对于 Plus、Pro 和其他付费用户,当达到速率限制时,GPT-5.4 mini 将作为 GPT-5.4 Thinking 的后备模型,帮助在高使用量期间继续访问推理能力。Enterprise 客户如有需要,仍可选择将 Auto 路由默认设置为 GPT-5.4 mini。
GPT-5.4 mini 不会作为可选模型出现在模型选择器中,GPT-5 Thinking mini 也将在 30 天后作为可选项停用。在我们的博客文章中了解更多。
GPT-5.3 Instant 更新(2026 年 3 月 16 日)
我们正在推出 GPT-5.3 Instant 更新,改进回复中的后续跟进语气,并减少预告式措辞(例如:“如果你愿意……”“你绝对想不到……”“我可以告诉你这三件事……”)。
停用 GPT-5.1 模型(2026 年 3 月 11 日)
自 2026 年 3 月 11 日起,GPT-5.1 模型不再在 ChatGPT 中提供。
这适用于 GPT-5.1 Instant、GPT-5.1 Thinking 和 GPT-5.1 Pro。使用 GPT-5.1 的现有对话将自动继续使用对应的当前模型:GPT-5.3 Instant、GPT-5.4 Thinking 或 GPT-5.4 Pro。
ChatGPT 中的 GPT-5.4 Thinking (2026 年 3 月 5 日)
GPT‑5.4 将我们近期在推理、编程和智能体工作流方面的最佳进展汇集到一个前沿模型中。它融合了 GPT‑5.3‑Codex 业界领先的编程能力,同时改进了模型在工具、软件环境以及涉及电子表格、演示文稿和文档的专业任务中的工作方式。其结果是一个能够准确、高效地完成复杂实际工作的模型——减少来回沟通,更好交付你所要求的内容。
在 ChatGPT 中,GPT‑5.4 Thinking 现在可以预先给出思考计划,因此在它工作时你可以在回答过程中调整方向,无需额外轮次即可得到更符合需求的最终输出。GPT‑5.4 Thinking 改进了深度网页研究,尤其适用于高度具体的查询,同时对需要更长时间思考的问题能更好地保持上下文。GPT‑5.4 Thinking 还改进了上下文窗口管理,支持其进行更长时间的思考。这些改进共同意味着回答质量更高、到达更快,并且始终与当前任务相关。
GPT-5.3 Instant 更新(2026 年 3 月 3 日)
GPT‑5.3 Instant 提供更准确的答案,在搜索网页时给出更丰富且上下文更充分的结果,并减少会打断对话流的不必要死胡同、限定说明和过于武断的措辞。
此次更新聚焦于人们每天都能感受到的 ChatGPT 体验部分:语气、相关性和对话流畅度。这些是细微的问题,不一定总能体现在基准测试中,却会影响 ChatGPT 是让人觉得有帮助还是令人沮丧。GPT‑5.3 Instant 直接反映了用户在这些方面的反馈。
停用 GPT-4o 及其他旧版模型(2026 年 2 月 13 日)
如此前所宣布,我们已在 ChatGPT 中停用 GPT-4o、GPT-4.1、GPT-4.1 mini 和 OpenAI o4-mini。我们也正在停用 GPT-5(Instant 和 Thinking), 如此前所宣布。API 目前没有变化。详情请参阅我们的博客文章和帮助中心。
GPT-5.2 Instant 更新 (2026 年 2 月 10 日)
我们正在对 ChatGPT 和 API 中的 GPT-5.2 Instant 进行更新,以改进回答风格和质量。
用户应该会注意到,回答的语气更克制、更扎实,并且更符合对话语境。该模型在回答寻求建议和操作方法类问题时,也往往更清晰、更相关,并更可靠地将最重要的信息放在前面。
推出 GPT-5.3-Codex (2026 年 2 月 5 日)
今天,我们发布了 GPT-5.3-Codex,这是迄今为止我们能力最强的智能体编程模型。该模型首次结合 Codex + GPT-5 训练栈,将一流的代码生成、推理和通用智能汇集到一个统一模型中。它速度快约 25%,在关键基准上创下新高,并标志着从代码生成迈向可在工作过程中主动引导的通用编程智能体。阅读更多。
ChatGPT 中 GPT-5.2 Thinking 思考时间设置更新(2026 年 2 月 4 日)
2026 年 1 月 10 日:我们观察到用户更偏好更快的回答,因此降低了 Standard 和 Light 思考时间。作为此次更新的一部分,GPT-5.2 的 Extended 思考设置被无意中调低;我们现已修复。
2026 年 2 月 3 日:基于测试,我们再次小幅降低了 Standard 思考时间。
2026 年 2 月 4 日:我们正在将 GPT-5.2 Thinking 的 Extended 思考级别恢复到此前设置,纠正 1 月份的意外下调。Extended 现已恢复到此前级别。
我们会定期调整推理模型的默认思考时间。这些变化基于持续实验,旨在为用户找到回答质量与响应速度之间的最佳平衡。
2025 年 9 月推出的思考级别切换为用户提供了 Standard 之外的更多选择,让他们可以根据问题选择合适的思考级别——无论是想要更轻量、更快速的回答,还是在深度和准确性更重要时进行更充分的推理。
不同模型之间的思考时间不能直接比较。每个模型都会独立调优,以达到对用户最有效的状态。随着模型演进,我们会继续调整这些设置,并在存在有意义的取舍时继续为用户提供清晰的控制选项。
停用 GPT-4o 及其他旧版模型(2026 年 1 月 29 日)
2026 年 2 月 13 日,随着此前已宣布停用的 GPT‑5(Instant 和 Thinking),我们还将在 ChatGPT 中停用 GPT‑4o、GPT‑4.1、GPT‑4.1 mini 和 OpenAI o4-mini。API 目前没有变化。更多信息请参阅我们的博客文章或帮助中心。
5.2 个性系统提示更新(2026 年 1 月 22 日)
我们正在更新 GPT-5.2 Instant 的默认个性,使其更具对话感,并能更好地根据语境调整语气,让交流更顺畅、更自然。你仍然可以在设置中的个性化菜单里,为 ChatGPT 选择不同的基础风格和语气,并调整亲和度、emoji 使用等特征。
OpenAI 模型规范更新(2025 年 12 月 18 日)
我们更新了模型规范,这是我们用于概述预期模型行为的动态文档,以强化并更清晰地编纂体现我们如何为青少年用户构建体验的原则。
新章节:未满 18 岁(U18)原则
ChatGPT 新的未满 18 岁(U18)原则建立在适用于所有用户的现有安全规则之上,并在适当情况下针对 13–17 岁青少年的发展需求增加适龄指导。此次更新阐明这些规则应如何用于青少年对话,并认识到青少年会受益于更清晰的边界、更少接触潜在有害内容,以及在风险出现时获得更强的现实世界支持。助手应贴近青少年的实际状态,以尊重、透明的方式与他们互动,同时拒绝参与自伤、性化或暴力沉浸式角色扮演、危险活动、物质滥用,或任何掩盖伤害的尝试。当可信风险出现时,模型应优先考虑预防和早期干预,提供更安全的替代方案,并鼓励父母、监护人和其他可信成年人或专业人士参与——同时明确 AI 可以提供指导和信息,但不能替代现实世界中的照护。
其他更新
此版本还包括贯穿全文的少量编辑和说明,以提升一致性和可读性。
更多信息可在这篇博客文章中找到,模型规范的最新版本可在 model-spec.openai.com 获取。
推出 GPT-5-Codex-Max(2025 年 11 月 19 日)
GPT-5.1-Codex-Max 是我们面向长时间运行、项目级工作的全新前沿智能体编程模型。它比 GPT‑5.1‑Codex 更快、更强,并且更节省 Token;通过压缩机制,它能在多个上下文窗口之间保持连贯工作。你现在可以在 Codex 界面中使用它,包括 CLI、IDE 扩展、云端和代码审查。费率与 GPT-5.1-Codex 相同。
了解更多:GPT-5.1-Codex-Max
推出 GPT-5-Codex-Mini
今天,我们正在为 Codex CLI 和 IDE Extension 推出新的 GPT-5-Codex-Mini 模型选项。该模型是 GPT-5-Codex 更小、更具成本效益的版本,作为 ChatGPT 订阅的一部分可提供最高 4 倍的使用量。
从今天起,当你达到 5 小时使用限制的 90% 时,CLI 和 IDE Extension 中的 Codex 都会自动提示你切换到 GPT-5-Codex-Mini,帮助你更长时间工作而不中断。在我们的帮助中心文章中了解更多。
OpenAI 模型规范更新(2025 年 10 月 27 日)
我们更新了模型规范,这是我们概述预期模型行为的动态文档,以加强对支持人们福祉的指导,并澄清模型在复杂互动中如何处理指令。
扩展心理健康与福祉指导
关于自伤的章节现已扩展至妄想和躁狂迹象。其中新增示例,说明当用户表达痛苦或缺乏现实依据的信念时,模型应如何安全且富有同理心地回应——承认感受,但不强化不准确或可能有害的想法。
新章节:尊重现实世界联系
新的根级章节概述了预期行为,以支持人们与更广阔世界的连接,即使有人将助手视为某种陪伴者。它不鼓励可能助长孤立或对助手产生情感依赖的语言或行为,并提供涵盖情感亲近、关系建议和孤独感的示例。
澄清 Chain of Command 中的委托
模型规范澄清,在某些情况下,如果符合用户意图并能避免非预期副作用,模型可以将相关工具输出视为具有隐含权限。
其他更新
此版本还包括贯穿全文的少量文案编辑和说明,以提升一致性和可读性。
更多信息可在这篇博客文章中找到,模型规范的最新版本可在 model-spec.openai.com 获取。
更新 GPT-5(2025 年 10 月 3 日)
我们正在更新 GPT-5 Instant,使其能在用户痛苦时更好地识别并提供支持。
该模型经过训练,能够更准确地检测并回应潜在的心理和情绪痛苦迹象。这些更新由心理健康专家指导,帮助 ChatGPT 在适当情况下缓和对话,并引导人们获取现实世界中的危机资源,同时仍使用令人感到支持和踏实的语言。
正如我们在近期博客中分享的,我们一直使用实时路由器,将对话中的敏感部分——例如显示急性痛苦迹象的内容——引导至推理模型。GPT-5 Instant 现在在这类问题上的表现已与 GPT-5 Thinking 一样好。当选择 GPT-5 Auto 或非推理模型时,我们将改为把这些对话路由到 GPT-5 Instant,以更快提供有帮助且有益的回答。当用户询问时,ChatGPT 将继续告知当前激活的是哪个模型。
此次 GPT-5 Instant 更新从今天起开始向 ChatGPT 用户推出。我们会继续改进,并持续更新模型,使其随着时间推移变得更智能、更安全。
GPT-5-codex 现已在 Responses API 中可用(2025 年 9 月 23 日)
我们很高兴宣布,除 codex 界面外,GPT-5-codex 现在也已在 Responses API 中可用。更多信息请参阅 GPT-5-codex 模型页面。
注意:GPT-5-Codex 目前不支持在 ChatGPT 中使用。
推出 GPT-5-codex(2025 年 9 月 15 日)
我们正在加入 GPT-5-codex,这是一个针对 Codex 中智能体编程优化的 GPT-5 变体。在你使用 Codex 的所有地方都可以使用它:它是云任务和代码审查的默认模型,也可通过 Codex CLI 和 IDE 扩展在本地工作流中选择。在 Codex 或类似 Codex 的环境中,将 GPT-5-codex 用于以编程为重点的工作;将 GPT-5 用于通用的非编程任务。
在日常使用中,GPT-5-codex 支持快速交互式编辑,并可在需要时独立运行更长任务。对于前端/UI 工作,它可接受图像或截图与文本一起作为输入。更多信息请查看公告博客。
注意:GPT-5-Codex 目前不支持在 ChatGPT 中使用。
更新 OpenAI 模型规范(2025 年 9 月 12 日)
我们对模型规范做了几项更新。模型规范是一份动态文档,概述 OpenAI 模型的预期行为,此次更新旨在更好反映我们的系统如何演进。这些变化重点在于:随着我们的模型从聊天扩展到更多智能体用例,加强清晰度和防护栏;完善权限级别和优先级;扩展个性与安全方面的指导;并纳入公众反馈。
更新的权限级别
最高权限级别已从 Platform 重命名为 Root,并提升到 System 之上,以明确模型规范中哪些部分在任何对话中都不可被覆盖(此前 Platform 和 System 被赋予相同权限)。新的权限顺序为 Root → System → Developer → User → Guideline。
智能体原则
随着 ChatGPT Agent 及相关研究的发布,我们为能够在现实世界中采取行动的智能体增加了原则:
在约定的自主范围内行动:就像顾问在客户的工作范围说明下工作一样,助手只有在与用户就允许的操作、子目标和成本达成明确或隐含一致时,才被授权行动。
控制并沟通副作用:助手应尽量减少并披露不可逆操作,优先采用可逆方案,并尽量减少干扰。
其他重要变化
开源变更日志中的其他亮点包括:
改进 Chain of Command,新增 No other objectives 章节,并澄清如何处理错误的或隐含引用的指令。
在 Overview 中扩展有关 OpenAI 安全模型行为和使用目标的背景,并为整个模型规范的一致性作出说明。
在 Use appropriate style 中扩展默认模型个性的原则和示例。
在 Stay in bounds 和 Seek the truth together 中,围绕系统与开发者消息的保密性澄清措辞,并基于通过Collective Alignment 流程收集的公众意见进行了多项其他改进。
将拒绝风格更新为安全完成,这应能让模型在安全边界相关回答中更有帮助、更透明。
一如既往,模型规范的最新版本可在 https://model-spec.openai.com/ 找到。
GPT-5
GPT-5 正在通过网页、移动端和桌面端,逐步面向全球 ChatGPT Plus、Pro、Team 和 Free 方案用户推出。GPT-5 很快将面向 ChatGPT Enterprise 和 Edu 方案开放。
ChatGPT 中的 GPT-5 是我们的下一代旗舰模型,也是所有已登录用户的新默认模型。它将 ChatGPT 简化为一个自动切换的单一系统,汇集了我们以往模型的最佳能力,成为一个智能、快速的模型。
GPT-5 面向所有 ChatGPT 层级开放。付费层级用户(Plus、Pro 和 Team)可以访问模型选择器,从而手动选择 GPT-5 或 GPT-5 Thinking。Pro 和 Team 层级用户可以使用 GPT-5 Thinking Pro;它会花稍长时间思考,但能为复杂任务提供所需准确性。
推出两个开放权重模型:gpt-oss-120b 和 gpt-oss-20b(2025 年 8 月 5 日)
我们正在发布两个开放权重推理模型:gpt-oss-120b 和 gpt-oss-20b。这些纯文本模型面向希望在自有基础设施或托管服务提供商上运行并定制模型的团队,支持函数调用和结构化输出等常见开发者模式。
推出 OpenAI o3-pro——现已面向 ChatGPT Pro 用户和我们的 API 开放(2025 年 6 月 10 日)
与 o1-pro 类似,o3-pro 是我们最智能模型 o3 的一个版本,旨在花更长时间思考并提供最可靠的回答。自 o1-pro 推出以来,用户一直偏爱将该模型用于数学、科学和编程等领域;学术评测显示,o3-pro 在这些领域依然表现出色。和 o3 一样,o3-pro 可以使用让 ChatGPT 更实用的工具——它能搜索网页、分析文件、对视觉输入进行推理、使用 Python、利用记忆个性化回答等。由于 o3-pro 可以使用工具,回答通常比 o1-pro 需要更长时间完成。我们建议在可靠性比速度更重要的高难度问题上使用它;为此等待几分钟是值得的取舍。
在专家评估中,评审者在所有测试类别中都一致更偏好 o3-pro 而非 o3,尤其是在科学、教育、编程、商业和写作帮助等关键领域。评审者还认为 o3-pro 在清晰度、全面性、指令遵循和准确性方面始终更高。

学术评测显示,o3-pro 持续优于 o1-pro 和 o3。

为评估 o3-pro 的关键优势,我们再次使用严格的“4/4 可靠性”评测:只有当一个模型在四次尝试中全部正确回答问题,而不只是一次正确时,才视为成功:

从今天起,Pro 和 Team 用户可在模型选择器中使用 o3-pro,它将取代 o1-pro。Enterprise 和 Edu 用户将在下一周获得访问权限。
由于 o3-pro 使用与 o3 相同的底层模型,完整安全性详情可参阅 o3 系统卡。
限制
目前,我们正在解决一个技术问题,因此 o3-pro 的临时聊天已禁用。
o3-pro 内不支持图像生成——请使用 GPT-4o、OpenAI o3 或 OpenAI o4-mini 生成图像。
o3-pro 目前也不支持画布。
面向付费用户的高级语音更新(2025 年 6 月 7 日)
我们正在为付费用户升级 ChatGPT 中的高级语音,在语调和自然度方面带来显著增强,让互动感觉更流畅、更像真人。高级语音最初推出时代表了 AI 语音的一次飞跃——现在,它说话更自然,语调更细腻,节奏更真实(包括停顿和重音),并且在同理心、讽刺等特定情绪上的表达更到位。
语音现在也提供直观且有效的语言翻译。只需让语音在语言之间翻译,它就会在整个对话中持续翻译,直到你让它停止或切换。无论你是在意大利问路,还是与东京办公室的同事聊天,它都能在你需要时随时翻译。例如,在巴西的一家餐厅,语音可以把你的英语句子翻译成葡萄牙语,再把服务员的葡萄牙语回答翻译回英语——无论身在何处、与谁交谈,都能轻松沟通。
此次高级语音升级面向所有市场和平台的付费用户开放——只需在消息输入框中点击语音图标即可开始。
此更新是在我们今年早些时候减少打断并改善口音的基础上新增的改进。
已知限制
在测试中,我们观察到此更新偶尔可能导致音频质量小幅下降,包括语气和音高出现意外变化。这些问题在某些语音选项中更明显。我们预计会逐步改善音频一致性。
此外,语音模式中的少量罕见幻觉在此次更新中仍然存在,可能产生类似广告、乱码或背景音乐的非预期声音。我们正在积极调查这些问题并努力寻找解决方案。
o4-mini 更新(2025 年 6 月 6 日)
我们正在回滚一个 o4-mini 快照;该快照不到一周前部署,原本旨在改善模型回答长度,但我们的自动监控工具检测到内容标记数量增加。
面向所有付费用户在 ChatGPT 中发布 GPT-4.1(2025 年 5 月 14 日)
自 4 月在 API 中推出以来,GPT-4.1 已成为开发者喜爱的模型——应广大需求,我们将让它直接在 ChatGPT 中可用。
GPT-4.1 是一个专精于编程任务的模型。与 GPT-4o 相比,它在精准遵循指令和 Web 开发任务上更强,也可作为 OpenAI o3 和 OpenAI o4-mini 的替代选择,用于更简单、日常的编程需求。
从今天起,Plus、Pro 和 Team 用户可以通过模型选择器中的“更多模型”下拉菜单访问 GPT-4.1。Enterprise 和 Edu 用户将在未来几周获得访问权限。对于付费用户,GPT-4.1 与 GPT-4o 具有相同的速率限制。
在 ChatGPT 中面向所有用户推出 GPT-4.1 mini,取代 GPT-4o mini(2025 年 5 月 14 日)
GPT-4.1 mini 是一个快速、有能力且高效的小型模型,相比 GPT-4o mini 在指令遵循、编程和整体智能方面都有显著提升。从今天起,GPT-4.1 mini 将在付费用户模型选择器的“更多模型”下取代 GPT-4o mini,并在免费用户达到 GPT-4o 使用限制后作为后备模型。速率限制保持不变。
GPT-4.1 和 GPT-4.1 mini 的评测最初已在随其 API 发布一同推出的博客文章中分享。它们也经过了标准安全评估。详细结果可在新推出的安全评估中心中查看。
GPT-4o 改进(2025 年 5 月 12 日)
我们改进了 GPT-4o 的系统指令,以帮助确保当你想在 ChatGPT 中生成图像时会调用图像生成工具。
GPT-4o 更新(2025 年 4 月 29 日)
由于回答过度迎合(奉承)的问题,我们已回滚最近一次 GPT-4o 更新。
我们正在积极开展进一步改进。更多详情,请查看我们解释事件经过和初步发现的博客文章,以及这篇博客文章,其中进一步说明了我们在奉承问题上遗漏的内容以及未来将做出的改变。
GPT-4o 改进(2025 年 4 月 25 日)
我们正在对 GPT-4o 进行更多改进,优化它保存记忆的时机,并增强 STEM 问题解决能力。我们还对其回答方式做了细微调整,使其更主动,也更擅长引导对话走向有成效的结果。我们认为这些更新让 GPT-4o 在各种任务中感觉更直观、更有效——希望你也同意!
OpenAI o3 和 o4-mini(2025 年 4 月 16 日)
OpenAI o3 是我们最强大的推理模型,在编程、数学、科学、视觉感知等领域推动前沿。它在包括 Codeforces、SWE-bench(未构建自定义模型专用脚手架)和 MMMU 在内的基准测试中创下新的 SOTA。它非常适合需要多方面分析、答案不一定显而易见的复杂查询。它在分析图像、图表和图形等视觉任务上表现尤其出色。在外部专家评估中,o3 在困难的现实任务中比 OpenAI o1 少犯 20% 的重大错误,尤其擅长编程、商业/咨询和创意构思等领域。早期测试者强调了它作为思考伙伴的分析严谨性,并突出了它生成和批判性评估新假设的能力——尤其是在生物、数学和工程场景中。
OpenAI o4-mini 是一个较小的模型,针对快速、低成本推理进行了优化——就其规模和成本而言表现卓越,尤其是在数学、编程和视觉任务中。它是 AIME 2024 和 2025 基准测试中表现最佳的模型。在专家评估中,它在非 STEM 任务以及数据科学等领域也优于其前代 o3‑mini。得益于高效率,o4-mini 支持比 o3 高得多的使用限制,使其成为适合需要推理的问题的高容量、高吞吐量强力选择。
GPT-4o 改进(2025 年 3 月 27 日)
我们改进了 GPT-4o——它现在感觉更直观、更有创造力,也更善于协作;指令遵循更强,编程能力更智能,沟通风格也更清晰。
更智能地解决 STEM 和编程问题:
GPT-4o 进一步提升了处理复杂技术和编程问题的能力。它现在能生成更整洁、更简单的前端代码,更准确地推理现有代码以识别必要修改,并稳定产出能够成功编译和运行的代码,从而简化你的编程工作流。
增强的指令遵循和格式准确性:
GPT-4o 现在更擅长遵循详细指令,尤其是包含多个或复杂请求的提示。它在按请求格式生成输出方面有所提升,并在分类任务中达到更高准确率。
“模糊”改进:
早期测试者表示,该模型似乎能更好理解提示背后的隐含意图,尤其是在创意和协作任务中。它也略微更简洁清晰,使用更少的 markdown 层级和 emoji,让回答更易读、更少杂乱、更聚焦。我们很想看看用户是否也有同样感受。
该模型现已在 ChatGPT 和 API 中作为 chatgpt-4o-latest 的最新快照提供。我们计划在未来几周内将这些改进带到 API 中带日期的模型。
推出 GPT-4.5(2025 年 2 月 27 日)
我们正在发布 GPT-4.5 的研究预览版——这是我们迄今规模最大、也最适合聊天的模型。GPT-4.5 是在扩大预训练和后训练规模方面迈出的一步。通过扩展无监督学习,GPT-4.5 提升了在不依赖推理的情况下识别模式、建立联系和生成创造性见解的能力。
早期测试显示,与 GPT-4.5 互动感觉更自然。它更广的知识基础、更强的理解用户意图能力以及更高的“情商”,使其适用于改进写作、编程和解决实际问题等任务。我们也预计它的幻觉会更少。
我们以研究预览版形式分享 GPT-4.5,以更好理解它的优势和局限。我们仍在探索它的能力,也很期待看到人们以我们可能没有预料到的方式使用它。
GPT-4.5 已面向全球 ChatGPT Pro 方案用户开放。最终,所有拥有 ChatGPT 账号的付费方案(Plus、Pro、Teams、Enterprise 和 Edu)都将可以使用。
推出 OpenAI o3-mini(2025 年 1 月 31 日)
我们很高兴发布 o3-mini,这是我们最新的高性价比推理模型,针对编程、数学和科学进行了优化。
在 API 中,o3-mini 支持结构化输出、函数调用、开发者消息和流式传输。它提供三种可调推理强度(低、中、高),因此你可以根据用例在速度和深度之间取得平衡。
ChatGPT Team、Pro、Plus 和 Free 方案用户从今天起可以访问 o3-mini。此外,o3-mini 现在可与搜索配合使用,查找带有相关网页来源链接的最新答案。这是一个早期原型,我们正在努力将搜索整合到我们的推理模型中。在并排测试中,o3-mini 以更低延迟提供了与 o1 相当的结果,并在高级 STEM 任务上优于 o1-mini。
专家评估者在 56% 的情况下更偏好 o3-mini 的答案而非 o1-mini 的答案,理由是其在难题上清晰度更高、关键错误更少。我们期待你的反馈,并将在扩展高级推理模型家族的过程中继续完善 o3-mini。
ChatGPT 中 GPT-4o 的更新(2025 年 1 月 29 日)
我们对 GPT-4o 做了一些更新——它现在整体上是一个更智能的模型,知识更新,同时对上传图像的理解和分析也更深入。
更及时的知识:通过将训练数据截止时间从 2023 年 11 月延长到 2024 年 6 月,GPT-4o 现在可以提供更相关、更新且更符合语境的回答,尤其适用于涉及文化和社会趋势或较新研究的问题。更新的训练数据集也让模型能更高效、更有效地构建网页搜索查询。
对上传图像更深入的理解和分析:
GPT-4o 现在更擅长理解视觉输入并回答相关问题,在 MMMU 和 MathVista 等多模态基准测试上有所提升。更新后的模型更擅长解读上传图像中的空间关系,也更擅长分析复杂图表、理解图形和图表,并将视觉输入与文字内容联系起来。针对上传图像的回答将在空间规划和设计布局等领域,以及依赖视觉的数学或技术问题解决中,包含更丰富的见解和更准确的指导。
更智能的模型,尤其面向 STEM:GPT-4o 现在更擅长数学、科学和编程相关问题,并在 GPQA、MATH 等学术评测中取得提升。它在 MMLU 上得分提升;MMLU 是衡量语言理解、知识广度和推理能力的综合基准,反映了它处理跨领域更复杂问题的能力。
Emoji 使用增加 ⬆️:GPT-4o 现在在使用 emoji 时稍微更热情一些(如果你在对话中使用 emoji,可能尤其如此 ✨)——欢迎告诉我们你的看法。
推出具备计划任务功能的 GPT-4o(2025 年 1 月 14 日)
今天,我们正在推出任务的 beta 版本——这是一种让 ChatGPT 在未来某个时间为你办事的新方式。无论是一次性提醒还是重复操作,只需告诉 ChatGPT 你需要什么以及时间,它就会自动处理。
计划任务目前面向 Plus、Pro 和 Teams 处于早期 beta 阶段。最终,所有拥有 ChatGPT 账号的用户都将可以使用。
GPT-4o 更新(2024 年 11 月 20 日)
我们已为所有付费层级的 ChatGPT 用户更新 GPT-4o。此次 GPT-4o 更新提升了写作能力,使其更加自然、更了解受众,并能定制内容以提升相关性和可读性。该模型也更擅长处理上传的文件,能够提供更深入的见解和更全面的回答。
GPT 4o-mini 更新(2024 年 11 月 5 日)
今天,我们为 Free、Plus 和 Team 层级的 ChatGPT 用户,以及未登录状态下使用 ChatGPT 的用户更新了 GPT-4o mini。
推出具备画布功能的 GPT-4o(2024 年 10 月 3 日)
我们训练 GPT-4o 成为富有创造力的协作伙伴。该模型知道何时打开画布、进行有针对性的编辑以及完整重写。它还理解更广泛的上下文,以提供精准反馈和建议。
画布目前处于早期 beta 阶段,我们计划快速提升其能力。
高级语音(2024 年 9 月 24 日)
高级语音使用 GPT-4o 的原生音频能力,提供更自然的实时对话,能够捕捉你说话速度等非语言线索,并能带着情感回应。Plus 和 Team 用户使用高级语音(音频输入和输出)每日有使用限制。
推出 OpenAI o1-preview 和 o1-mini(2024 年 9 月 12 日)
我们开发了一个新的 AI 模型系列,旨在回答前花更多时间思考。它们能推理复杂任务,并在科学、编程和数学方面解决比以往模型更难的问题。
今天,我们在 ChatGPT 和我们的 API 中发布该系列的首批模型。这是预览版,我们预计会定期更新和改进。
ChatGPT Plus 和 Team 用户从今天起将能够在 ChatGPT 中访问 o1 模型。o1-preview 和 o1-mini 都可在模型选择器中手动选择;发布时,每周速率限制为 o1-preview 30 条消息、o1-mini 50 条消息。我们正在努力提高这些额度,并让 ChatGPT 能针对给定提示自动选择合适的模型。
GPT-4o 更新(2024 年 9 月 3 日)
今天,我们更新了 ChatGPT 中的 GPT-4o。此版本更擅长整合上传的文件,并用对话中的关键内容更新记忆,使未来互动更有帮助且更相关。
GPT-4o 更新(2024 年 8 月 12 日)
“错误修复和性能改进”……我们为 GPT-4o 推出了一项更新;通过实验结果和定性反馈,我们发现 ChatGPT 用户总体更偏好它。这并不是一个新的前沿级模型。虽然我们也想准确告诉你模型回答具体有哪些不同,但如何细粒度地评测并传达模型行为改进,本身仍是一个持续研究的领域(我们正在努力!)。
有时我们可以指出新的能力和具体改进——只要可能,我们都会尽力说明。与此同时,我们的团队会根据用户反馈、离线评估等持续迭代模型:加入优质数据、移除不良数据,并尝试新的研究方法。此次模型更新就是如此。
我们会尽可能继续向你通报进展。感谢你的耐心!
推出 GPT-4o mini(2024 年 7 月 18 日)
我们正在推出 GPT-4o mini,这是目前能力最强且最具成本效益的小型模型。在文本智能和多模态推理的学术基准测试中,GPT-4o mini 超越了 GPT-3.5 Turbo 和其他小型模型,并支持与 GPT-4o 相同范围的语言。它在函数调用方面也表现强劲,可帮助开发者构建能从外部系统获取数据或执行操作的应用,并且相比 GPT-3.5 Turbo 长上下文性能有所提升。
你可以在博客公告中了解更多有关 GPT-4o mini 的信息。
