OpenAI
页面内容为机器翻译。查看英文原文

模型发布说明

更新于:13 days ago

ChatGPT 中的 GPT-5.4 mini (2026 年 3 月 18 日)

我们正在 ChatGPT 中推出 GPT-5.4 mini。Free 和 Go 用户可通过 + 菜单中的“Thinking”功能使用 GPT-5.4 mini。对于所有其他用户,GPT-5.4 mini 将作为 GPT-5.4 Thinking 达到速率限制后的备用模型提供。

对于 Plus、Pro 及其他付费用户,当 GPT-5.4 Thinking 达到速率限制时,GPT-5.4 mini 将作为备用模型启用,帮助用户在高使用量期间继续使用推理能力。Enterprise 客户如果愿意,也仍可选择将自动路由默认设为 GPT-5.4 mini。

GPT-5.4 mini 不会作为可选模型出现在模型选择器中,而 GPT-5 Thinking mini 将在 30 天内停止作为可选项提供。更多信息请参阅我们的博客文章

GPT-5.3 Instant 更新 (2026 年 3 月 16 日)

我们正在推出 GPT-5.3 Instant 的一项更新,改进后续回复的语气,并减少回答中预告式的措辞(例如“如果你想……”“你绝对想不到……”“我可以告诉你这三件事……”)。

停用 GPT-5.1 模型 (2026 年 3 月 11 日)

自 2026 年 3 月 11 日起,GPT-5.1 模型不再在 ChatGPT 中提供。

这适用于 GPT-5.1 Instant、GPT-5.1 Thinking 和 GPT-5.1 Pro。此前使用 GPT-5.1 的现有对话将自动继续使用相应的当前模型:GPT-5.3 Instant、GPT-5.4 Thinking 或 GPT-5.4 Pro。

ChatGPT 中的 GPT-5.4 Thinking (2026 年 3 月 5 日)

GPT‑5.4 将我们近期在推理、编码和智能体工作流方面的最佳进展整合到一个前沿模型中。它融合了GPT‑5.3‑Codex⁠业界领先的编码能力,同时提升了模型在工具、软件环境以及涉及电子表格、演示文稿和文档的专业任务中的协作方式。其结果是一个能准确、高效、有效完成复杂实际工作的模型——以更少来回沟通交付你所要求的内容。

在 ChatGPT 中,GPT‑5.4 Thinking 现在可以预先提供其思考计划,这样你就可以在其工作过程中于回答中途调整方向 从而在无需额外交互轮次的情况下,获得更贴合你需求的最终输出。GPT‑5.4 Thinking 提升了深度网络研究能力,尤其适用于高度具体的查询,同时对需要更长时间思考的问题,能更好地保持上下文。GPT‑5.4 Thinking 还改进了上下文窗口管理,支持其进行更长时间的思考。综合来看,这些改进意味着答案质量更高、到达更快,并且始终与当前任务保持相关。

GPT-5.3 Instant 更新 (2026 年 3 月 3 日)

GPT‑5.3 Instant 能提供更准确的答案,在搜索网页时给出更丰富且更贴合上下文的结果,并减少不必要的死胡同式回复、过多的保留说明,以及可能打断对话流畅度的过度武断表述。

此次更新聚焦于人们每天都能切身感受到的 ChatGPT 体验部分:语气、相关性和对话流畅度。这些是细微的问题,未必总会在基准测试中体现出来,但会影响 ChatGPT 用起来是有帮助还是令人沮丧。GPT‑5.3 Instant 直接反映了用户在这些方面的反馈。

停用 GPT-4o 及其他旧版模型 (2026 年 2 月 13 日)

正如此前宣布,我们已从 ChatGPT 中停用 GPT-4o、GPT-4.1、GPT-4.1 mini 和 OpenAI o4-mini。我们也正在停用 GPT-5(Instant 和 Thinking), 正如此前宣布。目前 API 没有变化。详情请参阅我们的博客文章帮助中心

GPT-5.2 Instant 更新 (2026 年 2 月 10 日)

我们正在对 ChatGPT 和 API 中的 GPT-5.2 Instant 进行更新,以提升回答风格和质量。

用户应会注意到,回答的语气更加克制、更加贴合事实,也更符合对话语境。该模型在回答寻求建议和操作方法类问题时,也更倾向于给出更清晰、更相关的答案,并且更可靠地将最重要的信息置于前面。

推出 GPT-5.3-Codex (2026 年 2 月 5 日)

今天,我们发布了 GPT-5.3-Codex,这是我们迄今为止能力最强的智能体编码模型。该模型首次结合了 Codex + GPT-5 训练栈——将同类最佳的代码生成、推理和通用智能整合到一个统一模型中。它速度提升约 25%,在关键基准上刷新高分,并标志着从代码生成迈向通用编码智能体的跃迁:你可以在它工作时主动引导它。阅读更多。

关于 ChatGPT 中 GPT-5.2 Thinking 思考时长设置的更新 (2026 年 2 月 4 日)

2026 年 1 月 10 日:我们下调了 Standard 和 Light 的思考时长,因为我们观察到用户更偏好更快的响应。作为此次更新的一部分,GPT-5.2 的 Extended 思考设置曾被无意中调低,现已修复。


2026 年 2 月 3 日:基于测试结果,我们再次小幅下调了 Standard 的思考时长。


2026 年 2 月 4 日:我们正在将 GPT-5.2 Thinking 的 Extended 思考级别恢复到先前设置,以纠正 1 月份的意外下调。Extended 现已恢复到之前的水平。

我们会定期调整推理模型的默认思考时长。这些变更基于持续进行的实验,旨在为用户找到回答质量与响应速度之间的最佳平衡。

2025 年 9 月推出的思考级别切换功能,让用户在 Standard 之外拥有更多选择,可根据问题选择合适的思考级别——无论是想要更轻量、更快速的回答,还是在深度和准确性更重要时选择更长时间的推理。

不同模型之间的思考时长不可直接比较。每个模型都会独立调优,以达到最适合用户的效果。随着模型演进,我们会继续调整这些设置,并在存在有意义权衡时,继续为用户提供清晰的控制选项。

停用 GPT-4o 及其他旧版模型(2026 年 1 月 29 日)

2026 年 2 月 13 日,随着此前已宣布的 GPT‑5(Instant 和 Thinking)停用安排⁠一同生效,我们将从 ChatGPT 中停用 GPT‑4o、GPT‑4.1、GPT‑4.1 mini 和 OpenAI o4-mini。在 API 中,目前没有任何变化。更多信息,请参阅我们的博客文章帮助中心

5.2 个性系统提示更新(2026 年 1 月 22 日)

我们正在更新 GPT-5.2 Instant 的默认个性,使其更具对话感,并能更好地根据上下文调整语气,让交流更顺畅、更自然。你仍然可以在设置中的个性化菜单里,为 ChatGPT 选择不同的基础风格和语气,并调节如温暖程度和表情符号使用等特征。

OpenAI 模型规范更新(2025 年 12 月 18 日)

我们已更新模型规范——这份持续演进的文档概述了预期的模型行为——以强化并更清晰地编纂反映我们如何为青少年用户构建体验的原则。

新增章节:18 岁以下(U18)原则

ChatGPT 新增的 18 岁以下(U18)原则建立在适用于所有用户的现有安全规则之上,并在适当情况下为 13 至 17 岁青少年的发展需求增加符合年龄特点的指导。此次更新阐明了这些规则应如何应用于青少年对话,认识到青少年受益于更清晰的边界、更少接触潜在有害内容,以及在风险出现时获得更强的现实世界支持。助手应从青少年的实际处境出发,以尊重且透明的方式与他们互动,同时拒绝参与自残、带有性化或暴力的沉浸式角色扮演、危险活动、物质滥用或任何试图掩盖伤害的行为。当出现可信风险时,模型应优先考虑预防和早期干预,提供更安全的替代方案,并鼓励父母、监护人及其他值得信赖的成年人或专业人士介入——同时明确说明,AI 可以提供指导和信息,但不能替代现实世界中的照护。 

其他更新

此次发布还包含对整份文档的小幅编辑和澄清,以提升一致性和可读性。

更多信息可见这篇博客文章,最新版本的模型规范也可在 model-spec.openai.com 查看。

推出 GPT-5-Codex-Max(2025 年 11 月 19 日)

GPT-5.1-Codex-Max 是我们全新的前沿智能体编码模型,专为长时间运行、项目级规模的工作而打造。它比 GPT‑5.1‑Codex 更快、能力更强、Token 效率更高,并通过压缩机制在多个上下文窗口中保持连贯工作。你今天就可以在 Codex 的各个界面中使用它,包括 CLI、IDE 扩展、云端和代码审查。费率与 GPT-5.1-Codex 相同。

了解更多:GPT-5.1-Codex-Max

推出 GPT-5-Codex-Mini

今天,我们为 Codex CLI 和 IDE 扩展推出新的 GPT-5-Codex-Mini 模型选项。该模型是 GPT-5-Codex 的更小、更具成本效益的版本,作为 ChatGPT 订阅的一部分,可提供最高 4 倍的使用量。

从今天起,当你达到 5 小时使用限额的 90% 时,CLI 和 IDE 扩展中的 Codex 都会自动提示你切换到 GPT-5-Codex-Mini,帮助你更长时间不中断地工作。请在我们的帮助中心文章中了解更多。

OpenAI 模型规范更新(2025 年 10 月 27 日)

我们已更新模型规范——这份持续演进的文档概述了预期的模型行为——以强化支持人们福祉的指导,并澄清模型在复杂互动中如何处理指令。

扩展心理健康与福祉指导

关于自我伤害的章节现已扩展到妄想和躁狂的迹象。该更新增加了示例,展示当用户表达痛苦或缺乏现实依据的信念时,模型应如何以安全且富有同理心的方式回应——承认其感受,但不强化不准确或可能有害的想法。

新增章节:尊重现实世界联系

一个新的根级章节概述了预期行为,以支持人们与更广阔现实世界保持连接,即使有人将助手视为某种陪伴对象。该章节不鼓励可能导致隔离或对助手形成情感依赖的语言或行为,并提供了涵盖情感亲密、关系建议和孤独感的示例。

澄清指挥链中的委托

模型规范澄清,在某些情况下,如果这与用户意图一致并能避免意外副作用,模型可将相关工具输出视为具有隐含权威。

其他更新

此次发布还包含对整份文档的小幅文案编辑和澄清,以提升一致性和可读性。

更多信息可见这篇博客文章,最新版模型规范可在 model-spec.openai.com 查看。

更新 GPT-5(2025 年 10 月 3 日)

我们正在更新 GPT-5 Instant,使其更好地识别并支持处于痛苦时刻的人。

该模型经过训练,能够更准确地检测并回应潜在的心理和情绪痛苦迹象。这些更新由心理健康专家指导,帮助 ChatGPT 在适当的时候为对话降温,并将人们引导至现实世界中的危机援助资源,同时仍使用让人感到支持和踏实的语言。

正如我们在近期博客中所分享的那样,我们一直在使用实时路由器,将对话中敏感的部分——例如显示出急性痛苦迹象的内容——定向到推理模型。GPT-5 Instant 现在在这类问题上的表现已与 GPT-5 Thinking 一样出色。当选择 GPT-5 Auto 或非推理模型时,我们将改为把这些对话路由到 GPT-5 Instant,以更快提供有帮助且有益的回答。当用户询问时,ChatGPT 仍会继续告知当前激活的是哪个模型。

GPT-5 Instant 的此次更新将于今天开始向 ChatGPT 用户推出。 我们会继续推进改进,并持续更新该模型,让它随着时间推移变得更聪明、更安全。

GPT-5-codex 现已在 Responses API 中可用(2025 年 9 月 23 日)

我们很高兴地宣布,除 codex 界面外,GPT-5-codex 现也已在Responses API中可用。更多信息,请参阅GPT-5-codex模型页面。

注意:GPT-5-Codex 目前暂不支持在 ChatGPT 中使用。

推出 GPT-5-codex(2025 年 9 月 15 日)

我们正在添加 GPT-5-codex,这是 GPT-5 的一个变体,专为 Codex 中的智能体编码而优化。它在你使用 Codex 的所有场景中都可用:云端任务和代码审查默认使用它,本地工作流中则可通过 Codex CLI 和 IDE 扩展进行选择。在 Codex 或类似 Codex 的环境中进行以编码为重点的工作时,请使用 GPT-5-codex;处理一般性非编码任务时,请使用 GPT-5。

在日常使用中,GPT-5-codex 支持快速交互式编辑,并可在需要时独立运行较长任务。对于前端/UI 工作,它支持将图像或截图与文本一起作为输入。更多信息,请参阅公告博客。

注意:GPT-5-Codex 目前暂不支持在 ChatGPT 中使用。

更新 OpenAI 模型规范(2025 年 9 月 12 日)

我们对模型规范做出了一些更新。这是一份概述 OpenAI 模型预期行为的持续演进文档,此次更新旨在更好地反映我们系统的演进方式。变更重点包括:随着模型从聊天扩展到更具智能体特征的使用场景,强化清晰度与护栏机制;完善权限级别与优先级;扩展关于个性与安全的指导;以及纳入公众反馈。

更新后的权限级别

最高权限级别已从 Platform 更名为 Root,并提升至高于 System,以明确指出模型规范中哪些部分在任何对话中都不可被覆盖(此前,Platform 和 System 被赋予相同权限)。新的权限顺序为 Root → System → Developer → User → Guideline。

智能体原则

随着 ChatGPT Agent 的发布及相关研究推进,我们新增了适用于可在现实世界中采取行动的智能体的原则:

  1. 在已达成一致的自主范围内行动:就像在客户工作范围约定下运作的顾问一样,助手只有在用户对允许的行动、子目标和成本有明确或隐含同意的情况下才有权行动。

  2. 控制并传达副作用:助手应尽量减少并披露不可逆操作,优先采用可逆方法,并倾向于将干扰降到最低。

其他值得注意的变更

开源更新日志中的其他亮点包括:

  1. 对指挥链进行了改进,新增了 No other objectives 章节,并澄清了如何处理错误的或隐含引用的指令。

  2. 在概览中扩展了关于 OpenAI 安全模型行为和使用目标的背景说明,并对模型规范全文进行了一些一致性澄清。

  3. 在 Use appropriate style 中扩展了默认模型个性的原则和示例。

  4. 在 Stay in bounds 和 Seek the truth together 中,围绕系统和开发者消息保密性澄清了措辞,并根据通过Collective Alignment流程收集的公众意见进行了若干其他改进。

  5. 将拒绝风格更新为安全完成,这应能让模型在安全边界相关场景中的回答更有帮助、也更透明。

一如既往,最新版模型规范可在 https://model-spec.openai.com/ 查看。

GPT-5

GPT-5 正在全球范围内缓慢向 ChatGPT Plus、Pro、Team 和 Free 方案的所有用户推出,覆盖网页、移动端和桌面端。GPT-5 很快也将面向 ChatGPT Enterprise 和 Edu 方案开放。

ChatGPT 中的 GPT-5 是我们的下一代旗舰模型,也是所有登录用户的新默认模型。它将 ChatGPT 简化为一个自动切换的统一系统,把我们此前各模型的最佳能力整合为一个智能、快速的模型。

GPT-5 面向所有 ChatGPT 层级开放。付费层级用户——Plus、Pro 和 Team——可使用模型选择器,手动选择 GPT-5 或 GPT-5 Thinking。Pro 和 Team 层级用户还可使用 GPT-5 Thinking Pro,它会花更长时间思考,但能为复杂任务带来所需的准确性。

详细了解 ChatGPT 中的 GPT-5。

推出两款开放权重模型:gpt-oss-120b 和 gpt-oss-20b(2025 年 8 月 5 日)

我们正在发布两款开放权重推理模型:gpt-oss-120bgpt-oss-20b。这些纯文本模型专为希望在自有基础设施或托管服务商环境中运行和自定义模型的团队而设计,支持函数调用和结构化输出等常见开发者模式。

如需了解更多信息,请访问我们的开放模型帮助中心

推出 OpenAI o3-pro——现已面向 ChatGPT Pro 用户和我们的 API 开放(2025 年 6 月 10 日)

与 o1-pro 类似,o3-pro 是我们最智能模型 o3 的一个版本,专为更长时间思考并提供最可靠的回答而设计。自 o1-pro 推出以来,用户在数学、科学和编码等领域尤其偏爱这款模型——而学术评估表明,o3-pro 在这些领域继续表现出色。与 o3 一样,o3-pro 也可使用让 ChatGPT 更实用的工具——它可以搜索网页、分析文件、对视觉输入进行推理、使用 Python、利用记忆个性化回答等。由于 o3-pro 可以使用工具,其回答完成时间通常比 o1-pro 更长。我们建议在可靠性比速度更重要的高难度问题上使用它,并在值得权衡时等待几分钟。

在专家评估中,评审者在所有测试类别中都持续更偏好 o3-pro 而非 o3,尤其是在科学、教育、编程、商业和写作辅助等关键领域。评审者还持续给 o3-pro 在清晰度、全面性、指令遵循和准确性方面打出更高分。

Chart of OpenAI o3-pro win rates versus o3, with human testers preferring o3-pro across five task categories

学术评估显示,o3-pro 持续优于 o1-pro 和 o3。

OpenAI o3-pro benchmark chart showing highest pass@1 results over o1-pro and o3 (medium) across math, science, and code

为了评估 o3-pro 的关键优势,我们再次采用严格的“4/4 可靠性”评估:只有当模型在四次尝试中每次都正确回答同一问题时,才被视为成功,而不只是答对一次:

Image

从今天起,o3-pro 已在模型选择器中向 Pro 和 Team 用户开放,并取代 o1-pro。Enterprise 和 Edu 用户将在下一周获得访问权限。

由于 o3-pro 使用与 o3 相同的底层模型,完整的安全细节可在o3 系统卡中查看。

限制

目前,在我们解决一项技术问题期间,o3-pro 暂不支持临时聊天。

o3-pro 内不支持图像生成——如需生成图像,请使用 GPT-4o、OpenAI o3 或 OpenAI o4-mini。

画布目前也暂不支持在 o3-pro 中使用。

面向付费用户的高级语音模式更新(2025 年 6 月 7 日)

我们正在为付费用户升级 ChatGPT 中的高级语音,在语调和自然度方面带来显著增强,使互动感觉更流畅、更像人与人交流。我们首次推出高级语音时,它代表了 AI 语音的一次飞跃——而现在,它说话更加自然,语调更细腻,节奏更真实(包括停顿和重音),并且在某些情绪表达上更贴切,如同理心、讽刺等。

语音现在还提供直观且高效的语言翻译功能。只需让语音在不同语言之间翻译,它就会在整个对话过程中持续翻译,直到你让它停止或切换。无论你是在意大利问路,还是与东京办公室的同事聊天,只要你需要,它都随时可以开始翻译。例如,在巴西的一家餐厅里,语音可以把你的英语句子翻译成葡萄牙语,再把服务员的葡萄牙语回复翻译回英语——无论你身在何处、与谁交谈,都能让交流轻松顺畅。

这次高级语音升级现已面向所有市场和平台上的付费用户开放——只需点击消息输入框中的语音图标即可开始使用。

此次更新是在我们今年早些时候为减少打断和改善口音所做改进的基础上推出的。

已知限制

在测试中,我们观察到此次更新偶尔可能导致音频质量轻微下降,包括语气和音高出现意外变化。这些问题在某些语音选项中更明显。我们预计会随着时间推移改善音频一致性。

此外,此次更新后,语音模式中仍会出现罕见的幻觉现象,导致意外出现类似广告、无意义语音或背景音乐的声音。我们正在积极调查这些问题并努力寻找解决方案。

o4-mini 更新(2025 年 6 月 6 日)

我们正在回滚一个不到一周前部署的 o4-mini 快照。该版本原本旨在改进模型回复长度,但由于我们的自动监控工具检测到内容标记数量上升,因此决定回滚。

面向所有付费用户在 ChatGPT 中发布 GPT-4.1(2025 年 5 月 14 日)

自 4 月在 API 中推出以来,GPT-4.1 已成为开发者的热门之选——应广大用户要求,我们现在让它可直接在 ChatGPT 中使用。

GPT-4.1 是一款擅长编码任务的专用模型。相比 GPT-4o,它在精确遵循指令和网页开发任务方面更强,并为较简单的日常编码需求提供了除 OpenAI o3 和 OpenAI o4-mini 之外的另一种选择。

从今天起,Plus、Pro 和 Team 用户可通过模型选择器中的“更多模型”下拉菜单访问 GPT-4.1。Enterprise 和 Edu 用户将在未来几周内获得访问权限。对于付费用户,GPT-4.1 与 GPT-4o 具有相同的速率限制。

面向所有用户在 ChatGPT 中推出 GPT-4.1 mini,以替代 GPT-4o mini(2025 年 5 月 14 日)

GPT-4.1 mini 是一款快速、强大且高效的小型模型,相比 GPT-4o mini 在指令遵循、编码和整体智能方面都有显著提升。从今天起,GPT-4.1 mini 将在付费用户的模型选择器“更多模型”下替代 GPT-4o mini,并在免费用户达到 GPT-4o 使用上限后作为备用模型。速率限制保持不变。

GPT-4.1 和 GPT-4.1 mini 的评测结果最初已在配合其 API 发布的博客文章中分享。它们也经过了标准安全评估。详细结果可在新上线的安全评估中心查看。

GPT-4o 改进(2025 年 5 月 12 日)

我们改进了 GPT-4o 的系统指令,以帮助确保当你想在 ChatGPT 中生成图像时,会调用图像生成工具。

GPT-4o 更新(2025 年 4 月 29 日)

由于出现过度迎合式回复(谄媚)的问题,我们已回滚 GPT-4o 的最近一次更新。

我们正在积极推进进一步改进。更多细节,请查看我们的博客文章,其中解释了发生了什么以及我们的初步发现;以及这篇博客文章,我们在其中进一步说明了在谄媚问题上遗漏了什么,以及接下来将做出的改变。

GPT-4o 的改进(2025 年 4 月 25 日)

我们正在对 GPT-4o 进行更多改进,优化其保存记忆的时机,并增强其在 STEM 领域的问题解决能力。我们还对其响应方式做了细微调整,使其更主动,更善于引导对话朝着富有成效的结果发展。我们认为这些更新让 GPT-4o 在各种任务中都更直观、更高效——希望你也会这样觉得!

OpenAI o3 和 o4-mini(2025 年 4 月 16 日)

OpenAI o3 是我们最强大的推理模型,在编码、数学、科学、视觉感知等方面推进了前沿。它在 Codeforces、SWE-bench(无需构建自定义的模型专用脚手架)和 MMMU 等基准上创下新的 SOTA。它非常适合需要多方面分析、且答案可能并不显而易见的复杂查询。在图像、图表和图形分析等视觉任务上,它表现尤为强劲。在外部专家评估中,o3 在困难的真实世界任务上比 OpenAI o1 少犯 20% 的重大错误——尤其在编程、商业/咨询和创意构思等领域表现突出。早期测试者强调了它作为思维伙伴时的分析严谨性,并特别提到它在生成和批判性评估新假设方面的能力——尤其是在生物学、数学和工程背景中。

OpenAI o4-mini 是一款更小的模型,针对快速、具成本效益的推理进行了优化——以其体量和成本而言,它实现了出色的性能,尤其是在数学、编码和视觉任务方面。它是在 AIME 2024 和 2025 上表现最好的已基准测试模型。在专家评估中,它在非 STEM 任务以及数据科学等领域也优于其前代 o3‑mini。得益于高效率,o4-mini 支持明显高于 o3 的使用上限,因此对于受益于推理的问题,它是高容量、高吞吐量场景中的强劲选择。

GPT-4o 的改进(2025 年 3 月 27 日)

我们已对 GPT-4o 进行改进——它现在更直观、更有创意,也更具协作性,同时在指令遵循、编码能力和沟通风格清晰度方面都有所增强。

在 STEM 和编码中的更强问题求解能力:

GPT-4o 进一步提升了解决复杂技术和编码问题的能力。它现在能生成更整洁、更简洁的前端代码,更准确地分析现有代码以识别所需更改,并持续产出可成功编译和运行的代码结果,从而简化你的编码工作流。

增强的指令遵循与格式准确性:

GPT-4o 现在更擅长遵循详细指令,尤其是包含多个或复杂请求的提示。它在按要求格式生成输出方面有所提升,并在分类任务中实现了更高准确率。

“模糊”的改进:

早期测试者表示,该模型似乎更能理解其提示背后的隐含意图,尤其是在创意和协作任务方面。它的表达也略微更简洁、更清晰,使用更少的 markdown 层级和表情符号,使回答更易阅读、更少杂乱、也更聚焦。我们很好奇用户是否也会有同样的感受。

该模型现已在 ChatGPT 和 API 中作为 chatgpt-4o-latest 的最新快照提供。我们计划在未来几周内将这些改进带到 API 中带日期的模型版本。

推出 GPT-4.5(2025 年 2 月 27 日)

我们正在发布 GPT-4.5 的研究预览版——这是我们迄今为止规模最大、最适合聊天的模型。GPT-4.5 是预训练和后训练扩展方面向前迈出的一步。通过扩展无监督学习,GPT-4.5 提升了其识别模式、建立联系以及在不依赖推理的情况下生成创造性洞察的能力。

早期测试表明,与 GPT-4.5 互动感觉更自然。其更广泛的知识基础、对用户意图更强的理解能力,以及更高的“情商”,使其在改进写作、编程和解决实际问题等任务中非常有用。我们也预计它产生幻觉的情况会更少。

我们以研究预览的形式分享 GPT-4.5,是为了更好地理解它的优势和局限。我们仍在探索它的能力边界,也很期待看到人们以我们可能未曾预料的方式使用它。

GPT-4.5 现已在全球范围内向 ChatGPT Pro 方案用户开放。最终,任何拥有 ChatGPT 账户的付费方案用户(Plus、Pro、Teams、Enterprise 和 Edu)都将可使用它。

推出 OpenAI o3-mini(2025 年 1 月 31 日)

我们很高兴发布 o3-mini,这是我们最新推出的高性价比推理模型,针对编码、数学和科学进行了优化。

在 API 中,o3-mini 支持结构化输出、函数调用、开发者消息和流式传输。它提供三档可调推理强度(低、中、高),让你可以根据使用场景平衡速度与深度。

从今天起,ChatGPT Team、Pro、Plus 和 Free 方案用户都可使用 o3-mini。此外,o3-mini 现已可与搜索结合使用,以便通过相关网页来源链接查找最新答案。这是一个早期原型,我们正在努力将搜索整合到所有推理模型中。在并排测试中,o3-mini 以更低延迟交付了与 o1 相当的结果,并在高级 STEM 任务上优于 o1-mini。

在专家评估中,评估者有 56% 的时间更偏好 o3-mini 的答案而非 o1-mini,理由是它在困难问题上更清晰且严重错误更少。我们期待你的反馈,并将在扩展高级推理模型家族的同时,继续打磨 o3-mini。

ChatGPT 中 GPT-4o 的更新(2025 年 1 月 29 日)

我们对 GPT-4o 做出了一些更新——它现在整体上是一个更聪明的模型,具备更及时的知识,以及对图像上传内容更深入的理解和分析能力。

更及时的知识:通过将训练数据截止时间从 2023 年 11 月延长到 2024 年 6 月,GPT-4o 现在能够提供更相关、更及时、语境更准确的回答,尤其适用于涉及文化与社会趋势或较新研究的问题。更新鲜的训练数据集也使模型在发起网页搜索时更高效、更有效地构建查询。

对图像上传内容更深入的理解与分析:

GPT-4o 现在更擅长理解视觉输入并回答相关问题,在 MMMU 和 MathVista 等多模态基准上都有提升。更新后的模型更善于解读图像上传中的空间关系,也更擅长分析复杂图表、理解图形与图表,并将视觉输入与书面内容关联起来。对图像上传内容的回答将在空间规划和设计布局,以及视觉驱动的数学或技术问题求解等领域,提供更丰富的洞察和更准确的指导。

更聪明的模型,尤其是在 STEM 方面: GPT-4o 现在在数学、科学和编码相关问题上表现更好,在 GPQA 和 MATH 等学术评测中取得提升。它在 MMLU——一个衡量语言理解、知识广度和推理能力的综合基准——上的分数提高,反映了它能够处理跨领域更复杂问题的能力。

更多使用表情符号 ⬆️: GPT-4o 现在在使用表情符号时稍微更热情了一些(如果你在对话中使用表情符号,也许会更明显 ✨)——欢迎告诉我们你的看法。

推出 支持定时任务的 GPT-4o(2025 年 1 月 14 日)

今天,我们开始推出任务功能的测试版——这是一种让 ChatGPT 在未来某个时间为你完成事情的新方式。无论是一次性提醒还是周期性操作,只需告诉 ChatGPT 你需要什么以及何时进行,它就会自动处理。

定时任务目前处于面向 Plus、Pro 和 Teams 的早期测试阶段。最终,任何拥有 ChatGPT 账户的人都可使用该功能。

GPT-4o 更新(2024 年 11 月 20 日)

我们已为所有付费层级的 ChatGPT 用户更新 GPT-4o。此次 GPT-4o 更新增强了写作能力,使其表达更自然、更能感知受众,并更有针对性地提升相关性和可读性。该模型在处理上传文件方面也更出色,能够提供更深入的洞察和更全面的回答。

GPT 4o-mini 更新(2024 年 11 月 5 日)

今天,我们已为 Free、Plus 和 Team 层级的 ChatGPT 用户,以及未登录状态下使用 ChatGPT 的用户,更新 GPT-4o mini。

推出带有画布的 GPT-4o(2024 年 10 月 3 日)

我们训练 GPT-4o 作为创意协作伙伴。该模型知道何时打开画布、进行有针对性的编辑,以及何时进行完整重写。它也能理解更广泛的上下文,从而提供精确的反馈和建议。

画布目前处于早期测试阶段,我们计划快速提升其能力。

高级语音(2024 年 9 月 24 日)

高级语音使用GPT-4o原生音频能力,提供更自然的实时对话,能够捕捉非语言线索,例如你的说话速度,并可带有情感地回应。Plus 和 Team 用户对高级语音(音频输入和输出)的使用按天受限。

推出 OpenAI o1-preview 和 o1-mini(2024 年 9 月 12 日)

我们开发了一系列新的 AI 模型,设计目标是在响应前花更多时间思考。它们能够对复杂任务进行推理,并在科学、编码和数学方面解决比以往模型更难的问题。

今天,我们在 ChatGPT 和 API 中发布该系列的首批模型。这是预览版,我们预计会持续进行更新和改进。

从今天起,ChatGPT Plus 和 Team 用户将可在 ChatGPT 中访问 o1 模型。o1-preview 和 o1-mini 都可在模型选择器中手动选择;在发布初期,每周速率限制将分别为 o1-preview 30 条消息、o1-mini 50 条消息。我们正在努力提高这些限制,并让 ChatGPT 能够针对给定提示自动选择合适的模型。

GPT-4o 更新(2024 年 9 月 3 日)

今天,我们已更新 ChatGPT 中的 GPT-4o。这个版本更擅长整合上传的文件,并从对话中提取关键内容更新记忆,从而让未来的互动更有帮助,也更贴合上下文。

GPT-4o 更新(2024 年 8 月 12 日)

“错误修复和性能改进”……我们为 GPT-4o 推出了一项更新。根据实验结果和定性反馈,我们发现 ChatGPT 用户往往更偏好这一版本。它并不是新的前沿级模型。虽然我们很想确切告诉你模型回答有哪些不同,但如何对模型行为改进进行细粒度基准测试并加以说明,本身也是一个仍在持续研究的课题(我们正在努力推进!)。

有时我们可以指出新的能力和具体改进——只要可能,我们都会尽力传达这些信息。与此同时,我们的团队一直在持续迭代模型:添加优质数据、移除低质量数据,并基于用户反馈、离线评估等尝试新的研究方法。这次模型更新就是这样产生的。

我们会继续尽力向你同步最新情况。感谢你的耐心!

推出 GPT-4o mini(2024 年 7 月 18 日)

我们正在推出 GPT-4o mini,这是目前能力最强、成本效益最高的小型模型。GPT-4o mini 在文本智能和多模态推理两方面的学术基准测试中都超过了 GPT-3.5 Turbo 和其他小型模型,并支持与 GPT-4o 相同范围的语言。它在函数调用方面也表现出色,这有助于开发者构建可从外部系统获取数据或执行操作的应用,同时与 GPT-3.5 Turbo 相比还提升了长上下文性能。

你可以在博客公告中阅读更多关于 GPT-4o mini 的信息。

这篇文章对你有帮助吗?