注意:某些服务的数据保留可能会受到近期法律进展的影响——详情请参阅我们的博客文章
常见问题
什么是语音聊天?
语音对话让你可以与 ChatGPT 进行口头交流,带来更具对话感、更自然的互动。你可以通过语音输入提问或展开讨论,并接收来自 ChatGPT 的语音回复。语音对话由原生多模态模型驱动,所有已登录用户都可以在 ChatGPT 移动应用和桌面网页 ChatGPT.com 上使用。
语音对话可能会出错,因此请核实重要信息。你可以在这里了解更多关于 ChatGPT 和准确性的信息。语音功能及其相关使用限制可能会发生变化。
如何开始语音对话?
在移动端
要开始语音对话,请选择屏幕右下角的语音图标:
ChatGPT 语音既可以显示为主聊天页面中的集成语音体验,也可以显示为独立模式(蓝色光球界面)。大多数 iOS 和 Android 用户默认会看到集成体验,但在我们逐步推出更新期间,部分账户可能暂时只有独立模式。你可以在“设置”→“语音”→“独立模式”中切换到独立模式(或切换回来)。
进行语音对话时,你可以点击屏幕左下角的麦克风图标,将麦克风静音或取消静音。
你可以点击屏幕右下角的退出图标结束对话。
如果你是第一次开始语音聊天,系统还会要求你选择一种声音。请注意,选择器中声音的音量可能与语音对话期间的音量不同。你可以随时在设置中更改声音,也可以在语音模式中通过右上角的自定义菜单进行更改。
请注意,使用此功能需要向 ChatGPT 应用授予麦克风权限。
在网页端
桌面网页 ChatGPT.com 提供语音对话功能。
要在 chatgpt.com 上开始语音对话,请选择提示窗口右侧的语音图标:

如果这是你第一次在浏览器中使用语音功能,你可能需要授予浏览器访问设备麦克风的权限。
进行语音对话时,你可以点击屏幕左下角的麦克风图标,将麦克风静音或取消静音。
你可以点击屏幕右下角的退出图标结束对话。
如果你是第一次开始语音聊天,系统还会要求你选择一种声音。请注意,选择器中声音的音量可能与语音对话期间的音量不同。
你可以随时在设置中更改声音,也可以在语音模式中通过右上角的自定义菜单进行更改。
进行语音对话时,如何向 ChatGPT 共享我的视频?
订阅用户可以在 iOS 和 Android 移动应用中使用视频功能。你可以在语音聊天期间随时点击屏幕底部的摄像头按钮,从设备共享视频。
你可以再次点击此按钮,停止与 ChatGPT 共享视频。
进行语音对话时,如何向 ChatGPT 分享照片或屏幕?
屏幕共享和图片上传目前仅对订阅用户在 iOS 和 Android 移动应用中开放。你可以点击三点按钮,并在弹出菜单中选择“共享屏幕”,将图片或屏幕分享给 ChatGPT。
选择拍照选项会打开你的相机,这样你就可以立即拍摄并上传到语音对话中。选择上传照片选项后,你可以从手机中的图片里选择并在语音对话中分享给 ChatGPT。
选择共享屏幕后,将会显示你手机的屏幕共享选项,让你能够把屏幕广播给 ChatGPT。
进行语音对话时,如何停止与 ChatGPT 共享我的屏幕?
开始屏幕共享后,你可以再次点击屏幕共享按钮,停止与 ChatGPT 共享屏幕。
如果你是在应用外进行屏幕共享,可以点击手机的系统指示器(Apple 会在屏幕顶部显示一个红点,Android 会在屏幕顶部显示一个绿色麦克风)。屏幕上会出现一个弹窗,提示你停止屏幕共享。或者,你也可以返回应用,直接点击屏幕共享按钮停止共享,或点击“x”按钮,这也会结束对话。
可用的语音选项有多少种?
ChatGPT 提供九种逼真的输出声音可供选择,每种都有独特的语调和个性:
Arbor - 随和且多变
Breeze - 生动且真诚
Cove - 沉稳且直接
Ember - 自信且乐观
Juniper - 开放且积极
Maple - 开朗且坦率
Sol - 老练且放松
Spruce - 平静且令人安心
Vale - 明快且好奇
我可以进行语音聊天(仅音频)多久?
对于订阅用户,你每天使用 ChatGPT 语音功能的时长几乎不受限制,且限制可能会变化。对这些用户而言,语音会话会自动以我们最先进的语音模型 GPT-4o 开始。当你用完当天所有 GPT-4o 分钟数后,仍可继续通过 GPT-4o mini 在语音模式中聊天。
对于采用灵活定价方案的企业用户,只要有额度消耗,使用 GPT-4o 的 ChatGPT 语音就是不限量的。进一步了解灵活定价方案。
对于已登录的 Free 用户,你使用 ChatGPT 语音功能由 GPT-4o mini 提供支持,每天上限为 2 小时。限制可能会变化。
Pro 订阅用户可无限量使用 GPT-4o 语音,但仍受防滥用护栏限制。了解更多关于我们的 Pro 套餐及相关限制的信息。
我在语音聊天中可以使用视频和屏幕共享多久?
对于每位用户,所有符合条件的套餐每天都对视频和屏幕共享功能设有使用限制。接近每日上限时,我们会向你发出提示。
对于订阅用户,一旦你达到 GPT-4o 语音的每日使用上限,系统将切换为 GPT-4o mini,并且在你的 GPT-4o 使用额度重置之前,你将无法再共享新的视频或屏幕共享内容。
视频和屏幕共享功能的使用还会按每次对话进行限制。如果你达到单次对话上限,可以开始新的聊天,继续使用视频和屏幕共享,直到达到你的总使用上限。
为什么我只看到蓝色光球语音界面?可以更改吗?
ChatGPT 语音既可以显示为主聊天页面中的集成语音体验,也可以显示为独立模式(蓝色光球界面)。大多数 iOS 和 Android 用户默认会看到集成体验,但在我们逐步推出更新期间,部分账户可能暂时只有独立模式。你可以在“设置”→“语音”→“独立模式”中切换到独立模式(或切换回来)。
当我在使用其他应用或手机锁屏时,可以在后台继续对话吗?
可以,你可以在设置中打开“后台对话”,让对话在后台继续进行。
如果你在开启后台对话设置后开始语音对话,对话会持续进行,直到发生以下情况之一:
你手动结束对话
你强制关闭应用
你达到每日使用上限(具体取决于你的 ChatGPT 套餐)
你的对话时长超过 1 小时
当你在后台使用 ChatGPT 应用进行屏幕共享时,屏幕共享会持续进行,直到发生上述任一情况、你关闭屏幕共享,或锁定屏幕。
有没有什么建议可以减少语音对话中的打断?
语音对话过程中偶尔可能会发生打断。我们建议你佩戴耳机进行语音对话。
在 iPhone 上,启用“语音隔离”麦克风模式有助于避免意外打断。你可以在进行语音对话时打开控制中心,选择“麦克风模式”,然后切换到“语音隔离”。
如果你仍然遇到问题,我们建议关闭并重新启动应用、调高助手音量,或移动到更安静的环境中。
我可以与 GPTs 进行语音对话吗?
可以,GPTs 支持语音对话。GPTs 有自己专属的语音选项,名为 Shimmer,与和 ChatGPT 进行语音对话时可用的九种输出声音明显不同。
请注意,语音模式尚不支持图像生成、文件上传或代码解释器等工具。GPTs 中的自定义操作在语音模式下也不可用。
如何在语音聊天期间更换声音?
你可以在设置中更改声音,也可以通过语音模式右上角的自定义菜单进行更改。
声音是按对话单独设置的。如果你在语音模式中更改声音,系统会提示你开始新的聊天。
为什么语音转写有时与我实际进行的对话不一致?
语音对话天生就是多模态的,允许你与模型之间直接进行音频交换。因此,当这些音频被转写时,转写内容可能并不总是与原始对话完全一致。
语音对话支持字幕吗?
在 iOS 和 Android 上,你可以在语音模式中点击右上角的“cc”按钮,为模型回复开启字幕。
退出语音对话后,转写内容会添加到你当前与 ChatGPT 的文本对话中。你可以在网页版 ChatGPT 应用左侧的聊天记录中,或 ChatGPT 移动应用左侧菜单中,回看你的对话转写。
我最多可以同时进行多少个语音对话?
你一次只能进行一个语音聊天。
为什么语音模式或听写检测出的语言与我说的不一样?
有时,你所说的语言可能无法在我们的语音输入功能中被准确识别。你可以口头纠正模型,让它改用你选择的语言。对于听写,你也可以在应用“设置”中指定首选语言,以获得更准确的识别。
点击屏幕左上角的两条线打开侧边栏,再点击底部你的姓名以打开“设置”。
在“设置”页面中,向下滚动到“语音”部分。点击“Main Language”下拉菜单以选择你的语言。
隐私与控制
你们会将我语音聊天中的音频和视频片段保留多久?
在语音对话中,你语音聊天中的音频和视频片段会与聊天记录中显示的转写内容一起存储。我们会在聊天记录中提供可视化标识,显示哪些聊天使用了高级语音模式:你只需查看灰显文本以及小麦克风或摄像头图标。
你语音聊天中消息对应的音频和视频片段会保留 30 天。删除聊天后,除非出于安全或法律原因需要保留,或者你之前曾与我们共享音频或视频片段用于训练模型,且该音频或视频片段已与账户解除关联,否则我们也会在 30 天内删除相关音频和视频片段。
聊天一旦删除便无法恢复。如果你想让某个聊天不再显示在聊天记录中,但仍保留在账户内,应使用归档功能。与已归档聊天相关联的音频和视频片段会继续保留。
请参阅这篇文章,了解内容可能如何被用于训练我们的模型,以及你可做出的选择。
如果你使用的是我们旧版的标准语音模式,ChatGPT 的音频片段会先被转写,然后我们才会生成回复。转写完成后,我们会删除音频片段,除非你选择共享音频片段来训练我们的模型。(注意:即使转写本身失败,音频片段也会被删除。)进一步了解如何共享你的音频来训练我们的模型。
你们会使用语音聊天中的音频或视频片段训练模型吗?
不会,除非你选择共享语音聊天中的音频或视频片段供我们训练模型。
如果你启用了为所有人改进模型,那么根据你的选择和套餐,我们可能会使用你语音聊天中的转写内容和其他文件(例如上传到对话中的图片)来训练我们的模型。但除非你已将相关音频或视频片段共享给我们用于模型训练,否则我们不会使用这些关联的音频或视频片段来训练模型。有关你的选择,请参阅了解更多。
共享音频或视频以训练我们的模型
默认情况下,我们不会使用语音聊天中的音频或视频片段(包括屏幕共享片段)来训练我们的模型。但 Free、Plus 和 Pro 用户可以在“数据控制”中启用为所有人改进模型,并打开包含你的音频录音和包含你的视频录制,以选择共享语音聊天中的音频和视频片段来帮助我们训练模型。
当我们邀请你共享音频和视频片段用于训练时,你也可以选择确认同意。
如果你已启用“为所有人改进模型”,即使你没有共享语音聊天中的音频或视频片段,我们仍可能使用你语音聊天中的转写内容和其他文件(例如上传到对话中的图片)来训练我们的模型。
谁可以共享音频和视频来训练模型?
使用 Free、Plus 和 Pro 套餐的 ChatGPT 用户可以从个人工作空间共享音频和/或视频。用户无法在 ChatGPT Business、Edu 和 Enterprise 工作空间中共享语音聊天的音频或视频。
如果我共享音频和视频用于训练模型,会发生什么?
如果你选择共享语音聊天中的音频和视频,今后我们将使用你对话中的音频和视频来训练我们的模型。进一步了解我们如何使用你的内容来训练模型,请参阅了解更多。为了将其用于训练,我们的团队可能需要查看你与我们共享的音频或视频片段。例如,我们团队中的人工审核人员可能会收听与“踩”反馈信号相关的音频录音,以识别 ChatGPT 可能误解所说内容的地方。
如何停止共享音频和视频?
你可以通过 ChatGPT 设置中的“数据控制”页面停止共享。只需关闭包含你的音频录音或包含你的视频录制开关,或者直接完全关闭为所有人改进模型。
如果我决定停止共享音频或视频,会发生什么?
如果你选择停止共享,新语音聊天中的音频或视频将不再用于训练我们的模型。此前已与你的账户解除关联的音频和视频,仍可能继续用于训练我们的模型。在将语音聊天中的音频或视频片段用于训练之前,我们会采取措施减少片段中包含的个人信息。
如果你停止共享语音聊天中的音频或视频,只要你启用了“为所有人改进模型”,我们仍可能使用这些聊天中的转写内容和其他文件(如上传的图片)来训练我们的模型。如需完全退出模型训练,请关闭为所有人改进模型。
我选择共享音频或视频用于模型训练,是设备级设置吗?
你选择是否共享语音聊天中的音频或视频用于模型训练,是与你的账户绑定的。如果你选择共享,那么这一选择也会应用到你已登录的其他设备。你可以通过 ChatGPT 中的“数据控制”设置停止共享音频或视频。
