OpenAI
页面内容为机器翻译。查看英文原文

语音模式常见问题

这份指南介绍如何使用 ChatGPT 语音聊天,包括设置和使用语音模式,以及了解其功能与限制。

更新于:3 days ago

注意:某些服务的数据保留可能会受到近期法律进展的影响——详情请参阅我们的博客文章

常见问题

什么是语音聊天?

语音对话让您可以与 ChatGPT 进行口头交流,实现更具对话感、更自然的互动。您可以通过语音输入提问或展开讨论,并收到 ChatGPT 的语音回复。语音对话由原生多模态模型提供支持,所有已登录用户都可在 ChatGPT 移动应用以及桌面网页 ChatGPT.com 上使用。

语音对话可能会出错,因此请核查重要信息。对于日期或时间敏感的问题,Voice 会使用您的设备或浏览器时区来理解“今天”或“明天”等词。如果答案看起来不对,请检查您的设备时区,或在问题中包含确切日期、时区或地点。您可以在此了解更多关于 ChatGPT 与准确性的信息。Voice 的访问权限及相关使用上限可能会发生变化。

如何开始语音对话?

在移动端

要开始语音对话,请选择屏幕右下角的“语音”图标:

ChatGPT message bar with Voice Mode button next to the microphone icon

ChatGPT 语音可以显示为主聊天页面内的语音体验,也可以显示为单独模式(蓝色圆球屏幕)。大多数 iOS 和 Android 用户默认会看到集成体验,但在我们推出更新期间,部分账号可能暂时只有单独模式。您可以在“设置”→“语音”→“单独模式”中切换到单独模式(或切换回来)。

进行语音对话时,您可以选择屏幕左下角的麦克风图标来静音或取消静音麦克风。

您可以按屏幕右下角的退出图标来结束对话。

如果您是首次开始语音聊天,系统还会要求您选择一种声音。请注意,声音选择器中的音量可能不同于语音对话期间的音量。您可以随时在设置中更改声音,也可以在语音模式中使用右上角的自定义菜单更改。

请注意,您需要向 ChatGPT 应用授予麦克风权限才能使用此功能。

在网页端

桌面网页端 ChatGPT.com 支持语音对话。

要在 chatgpt.com 开始语音对话,请选择提示输入框右侧的“语音”图标:

ChatGPT message bar with microphone and Voice Mode wave icon

如果这是您首次在浏览器中使用语音功能,可能需要授予浏览器访问您设备麦克风的权限。

进行语音对话时,您可以选择屏幕左下角的麦克风图标来静音或取消静音麦克风。

Voice Mode microphone permission prompt for MacBook Pro Microphone built-in

您可以按屏幕右下角的退出图标来结束对话。

如果您是首次开始语音聊天,系统还会要求您选择一种声音。请注意,声音选择器中的音量可能不同于语音对话期间的音量。

您可以随时在设置中更改声音,也可以在语音模式中使用右上角的自定义菜单更改。

在语音对话中,如何与 ChatGPT 分享我的视频?

订阅用户可在 iOS 和 Android 移动应用上使用视频功能。在语音聊天期间,您可以随时选择屏幕底部的摄像头按钮来分享您设备上的视频。

Image

您可以再次按此按钮,停止与 ChatGPT 分享视频。

在语音对话中,如何与 ChatGPT 分享照片或我的屏幕?

屏幕共享和图片上传仅面向订阅用户在 iOS 和 Android 移动应用上开放。您可以点击三点按钮,并在弹出菜单中选择“共享屏幕”,以便与 ChatGPT 分享图片或您的屏幕。

Voice Mode attachment menu with Share Screen, Upload Photo, and Take Photo options

选择拍照选项会打开相机,您可以立即拍摄并上传到语音对话中。选择上传照片选项后,您可以从手机中的图片里选择要在语音对话中分享给 ChatGPT 的照片。

选择共享屏幕后,会显示您手机的屏幕共享选项,让您可以将屏幕播送给 ChatGPT。

在语音对话中,如何停止与 ChatGPT 共享我的屏幕?

开始屏幕共享后,您可以再次点击屏幕共享按钮,停止与 ChatGPT 共享屏幕。

Voice Mode orb with a cast icon in the center

如果您在应用外共享屏幕,可以点击手机的系统指示器(Apple 会在屏幕顶部显示红点,Android 会在屏幕顶部显示绿色麦克风)。屏幕上会出现一个弹窗,提示您停止屏幕共享。或者,您可以返回应用,点击屏幕共享按钮或“x”按钮直接停止共享;点击“x”也会结束对话。

有多少种声音选项?

ChatGPT 提供九种逼真的输出声音可供选择,每种都有独特的语气和风格:

  • Arbor - 随和而多才多面

  • Breeze - 活泼而真诚

  • Cove - 沉着而直接

  • Ember - 自信而乐观

  • Juniper - 开放而积极

  • Maple - 愉快而坦率

  • Sol - 机敏而轻松

  • Spruce - 平静而肯定

  • Vale - 明朗而好奇

我可以进行多长时间的语音聊天(仅音频)?

对于订阅用户,您每天使用 ChatGPT 语音的时长几乎不受限制,且限制可能会变化。对于这些用户,语音会话会自动从我们最先进的语音模型 GPT-4o 开始。当您用完当天的 GPT-4o 分钟数后,仍可以使用 GPT-4o mini 在语音模式中继续聊天。

对于采用灵活定价方案的企业用户,使用 GPT-4o 的 ChatGPT 语音不受时长限制,但会消耗额度。了解有关灵活定价方案的更多信息。

对于已登录的 Free 用户,ChatGPT 语音由 GPT-4o mini 提供支持,每天限用 2 小时。限制可能会变化。

Pro 订阅用户可无限使用 GPT-4o 语音,但须遵守滥用防护规则。了解更多关于我们的 Pro 方案及相关限制的信息。

Voice Mode notice that the GPT-4o daily voice limit is reached and calls will continue with GPT-4o-mini
ChatGPT voice mode notice that the voice usage limit has been reached

我可以在语音聊天中使用视频和屏幕共享多长时间?

对于所有符合条件的方案,视频和屏幕共享功能的使用按用户设有每日限制。当您接近每日上限时,我们会发出通知。

对于订阅用户,达到 GPT-4o 语音每日使用上限后,您将回退到 GPT-4o mini;在 GPT-4o 使用上限重置前,您将无法分享新的视频或屏幕共享内容。

视频和屏幕共享功能也按每次对话设有使用限制。如果您达到单次对话上限,可以开始新的聊天继续使用视频和屏幕共享,直到达到您的使用上限。

为什么我只看到蓝色圆球语音屏幕,可以更改吗?

ChatGPT 语音可以显示在主聊天页面内、作为浮动语音圆球显示,或显示在单独的全屏语音模式 Separate Voice 中。您可以在“设置”中开启或关闭这种单独的全屏体验。在移动端,前往“设置”→“语音”→“单独模式”。在网页端,前往“设置”→“通用”→“语音”→“Separate Voice”。

在使用其他应用或锁定手机屏幕时,我可以让对话在后台继续吗?

可以。您可以在设置中开启“后台对话”,让对话在后台继续。

如果您在开启后台对话设置后开始语音对话,对话会一直继续,直到发生以下任一情况:

  • 您手动结束对话

  • 您强制关闭应用

  • 您达到每日使用上限(具体取决于您的 ChatGPT 方案)

  • 您的对话时长超过 1 小时

如果您达到每日使用上限,ChatGPT 可能会在对话结束前播放或显示一条上限提示。

当 ChatGPT 应用在后台运行且您正在共享屏幕时,屏幕共享会持续进行,直到发生上述任一情况、您关闭屏幕共享,或您锁定屏幕。

有什么建议可以避免语音对话被打断吗?

语音对话期间偶尔可能会发生打断。我们建议佩戴耳机进行语音对话。

在 iPhone 上,启用“语音突显”麦克风模式有助于避免意外打断。您可以在语音对话期间打开控制中心,选择“麦克风模式”,然后切换到“语音突显”来启用该功能。

如果仍遇到问题,我们建议关闭并重新启动应用、调高助手音量,或移到更安静的环境。

我可以与 GPTs 进行语音对话吗?

可以,GPTs 支持语音对话。GPTs 有自己的声音选项,名为 Shimmer,与使用 ChatGPT 进行语音对话时可用的九种输出声音明显不同。

部分语音模式功能会因账号和会话而异。如果您的语音会话支持上传文件或照片,请使用语音控制中的添加按钮来附加内容,无需离开语音模式。GPTs 中的图像生成、代码解释器和自定义操作在语音模式中不可用。

如何在语音聊天期间更改声音?

您可以在设置中,或通过语音模式右上角的自定义菜单更改声音。

声音按对话设置。如果您在语音模式中更改声音,系统会提示您开始新的聊天。

为什么语音转录文本有时与我进行的对话不一致?

语音对话本质上是多模态的,允许您与模型之间直接进行音频交流。因此,当这段音频被转录时,转录文本可能并不总是与原始对话完全一致。

语音对话包含字幕吗?

在 iOS 和 Android 上,您可以在语音模式中点击右上角的“cc”按钮,为模型回复启用字幕。

退出语音对话后,转录文本会添加到您当前与 ChatGPT 的文本对话中。您可以在网页版 ChatGPT 应用左侧的聊天记录中,或在 ChatGPT 移动应用左侧的菜单中,回看对话转录文本。

我一次可以同时进行多少个语音对话?

您一次只能进行一个语音聊天。

为什么语音模式或听写会检测出与我所说语言不同的语言?

有时,我们的语音输入功能可能无法准确识别您所说的语言。您可以通过语音纠正模型,让它使用您选择的语言。对于听写,您还可以在应用“设置”中指定首选语言,以提高检测准确性。

  1. 选择屏幕左上角的两条横线打开侧边栏,然后选择底部的您的姓名以打开“设置”。

  2. 在“设置”页面中,向下滚动到“语音”部分。点击“主要语言”下拉菜单以选择您的语言。

Speech settings with Main Language set to Auto-Detect

隐私与控制

你们会保留我语音聊天中的音频和视频片段多久?

在语音对话中,您语音聊天中的音频和视频片段会与聊天记录中显示的转录文本一起存储。我们会在聊天记录中提供一个视觉标识,显示哪些聊天是在高级语音模式下进行的:只需查找灰色文本以及小麦克风或摄像头图标。

Image

语音聊天中消息关联的音频和视频片段将保留 30 天。当您删除聊天时,我们也会在 30 天内删除相关音频和视频片段,除非出于安全或法律原因需要保留,或者您此前已与我们分享音频或视频片段用于训练我们的模型,且该音频或视频片段此前已与您的账号解除关联。

聊天一经删除,便无法恢复。如果您想让某个聊天不再显示在聊天记录中,但仍保留在您的账号里,应使用归档功能。与已归档聊天关联的音频和视频片段会继续保留。

请参阅这篇文章,了解内容可能如何用于训练我们的模型,以及您有哪些选择。

如果您使用的是我们的旧版标准语音模式,ChatGPT 的音频片段会先被转录,然后我们再生成回复。转录完成后,我们会删除音频片段,除非您选择分享音频片段以训练我们的模型。(注意:即使转录本身失败,音频片段也会被删除)。了解更多关于分享您的音频以训练我们的模型的信息。

你们会用语音聊天中的音频或视频片段训练模型吗?

不会,除非您选择分享语音聊天中的音频或视频片段供我们训练模型。

如果您已启用为所有人改进模型,则根据您的选择和方案,我们可能会使用您语音聊天中的转录文本和其他文件(例如上传到对话中的图片)来训练我们的模型。但除非您已将相关音频或视频片段分享给我们用于模型训练,否则我们不会用它来训练我们的模型。了解更多关于您的选择的信息。

分享音频或视频以训练我们的模型

默认情况下,我们不会使用语音聊天中的音频或视频片段(包括屏幕共享片段)来训练我们的模型。不过,Free、Plus 和 Pro 用户可以选择分享其语音聊天中的音频和视频片段,帮助我们训练模型:在“数据控制”中启用为所有人改进模型,并开启包含您的音频录音包含您的视频录制

Image

当我们邀请您分享音频和视频片段用于训练时,您也可以作出肯定答复。

如果您已启用为所有人改进模型,即使您没有分享语音聊天中的音频或视频片段,我们也可能使用您语音聊天中的转录文本和其他文件(例如上传到对话中的图片)来训练我们的模型。

谁可以分享音频和视频用于训练模型?

使用 Free、Plus 和 Pro 方案的 ChatGPT 用户可以从个人工作空间分享音频和/或视频。用户不能从 ChatGPT Business、Edu 和 Enterprise 工作空间中的语音聊天分享音频或视频。

如果我分享音频和视频用于训练模型,会发生什么?

如果您选择分享语音聊天中的音频和视频,那么从此之后,我们将使用您对话中的音频和视频来训练我们的模型。了解更多关于我们如何使用您的内容训练模型的信息。为了将您分享给我们的音频或视频片段用于训练,我们的团队可能需要对其进行审核。例如,我们可能会让团队中的人工审核员听取与点踩反馈信号相关联的音频录音,以确定 ChatGPT 可能在哪些地方误解了所说内容。

如何停止分享音频和视频?

您可以通过 ChatGPT 设置中的数据控制页面停止分享。只需停用包含您的音频录音包含您的视频录制开关,或完全关闭为所有人改进模型

如果我决定停止分享音频或视频,会发生什么?

如果您选择停止分享,新的语音聊天中的音频或视频将不再用于训练我们的模型。此前已与您的账号解除关联的音频和视频可能会继续用于训练我们的模型。在使用语音聊天中的音频或视频片段进行训练之前,我们会采取措施减少片段中的个人信息量。

如果您停止分享语音聊天中的音频或视频,我们仍可能使用这些聊天中的转录文本和其他文件(如上传的图片)来训练我们的模型,前提是您已启用为所有人改进模型。要完全退出我们的模型训练,请停用为所有人改进模型

我选择分享音频或视频用于模型训练,这项设置是否因设备而异?

您选择分享语音聊天中的音频或视频用于模型训练,此选择与您的账号绑定。如果您选择分享,该选择也会适用于您已登录的其他设备。您可以通过 ChatGPT 中的数据控制设置停止分享音频或视频。

这篇文章对你有帮助吗?