OpenAI
Esta página se tradujo automáticamente. Ver el artículo original en inglés.

Preguntas frecuentes sobre el modo de voz

Tu guía sobre los chats de voz con ChatGPT, desde configurar y usar el modo de voz hasta comprender sus capacidades y limitaciones.

Última actualización: 17 hours ago

Nota: La retención de datos de ciertos servicios puede verse afectada por desarrollos legales recientes; consulta nuestra publicación del blog para más detalles

Preguntas frecuentes generales

¿Qué son los chats de voz?

Las conversaciones de voz te permiten tener una conversación hablada con ChatGPT, lo que hace posible una interacción más conversacional y natural. Puedes hacer preguntas o mantener conversaciones por voz y recibir una respuesta hablada de ChatGPT. Las conversaciones de voz funcionan con modelos multimodales nativos y están disponibles para todos los usuarios con sesión iniciada en las apps móviles de ChatGPT y en la web de escritorio en ChatGPT.com.

Las conversaciones de voz pueden cometer errores, así que verifica la información importante. Puedes obtener más información sobre ChatGPT y la precisión aquí. El acceso a Voz y los límites de uso asociados están sujetos a cambios.

¿Cómo inicio una conversación de voz?

En el móvil

Para iniciar una conversación de voz, selecciona el ícono de Voz en la parte inferior derecha de la pantalla:

ChatGPT message bar with Voice Mode button next to the microphone icon

La voz de ChatGPT puede aparecer como una experiencia de voz dentro de la página principal del chat o como un modo separado (la pantalla de la esfera azul). La mayoría de los usuarios en iOS y Android verá la experiencia integrada de forma predeterminada, pero algunas cuentas pueden tener temporalmente solo el modo separado mientras implementamos actualizaciones. Puedes cambiar a Modo separado (o volver) en Configuración → Voz → Modo separado.

Cuando estés teniendo una conversación de voz, puedes silenciar o activar tu micrófono seleccionando el ícono del micrófono en la parte inferior izquierda de la pantalla.

Puedes finalizar la conversación presionando el ícono de salida en la parte inferior derecha de la pantalla.

Si inicias un chat de voz por primera vez, también se te pedirá que elijas una voz. Ten en cuenta que el volumen de la voz en el selector puede ser diferente del volumen durante la conversación de voz. Puedes cambiar tu voz en cualquier momento en Configuración o desde el modo de voz usando el menú de personalización en la esquina superior derecha.

Ten en cuenta que deberás otorgar permiso de micrófono a la app de ChatGPT para usar esta función.

En la web

Las conversaciones de voz están disponibles en la web de escritorio en ChatGPT.com.

Para iniciar una conversación de voz en chatgpt.com, selecciona el ícono de Voz en el lado derecho de la ventana del prompt:

ChatGPT message bar with microphone and Voice Mode wave icon

Si es la primera vez que usas la voz en tu navegador, puede que necesites otorgar a tu navegador permiso para acceder al micrófono de tu dispositivo.

Cuando estés teniendo una conversación de voz, puedes silenciar o activar tu micrófono seleccionando el ícono del micrófono en la parte inferior izquierda de la pantalla.

Voice Mode microphone permission prompt for MacBook Pro Microphone built-in

Puedes finalizar la conversación presionando el ícono de salida en la parte inferior derecha de la pantalla.

Si inicias un chat de voz por primera vez, también se te pedirá que elijas una voz. Ten en cuenta que el volumen de la voz en el selector puede ser diferente del volumen durante la conversación de voz.

Puedes cambiar tu voz en cualquier momento en Configuración o desde el modo de voz usando el menú de personalización en la esquina superior derecha.

¿Cómo comparto mi video con ChatGPT mientras tengo una conversación de voz?

El video está habilitado para suscriptores en las apps móviles de iOS y Android. Puedes compartir video desde tus dispositivos en cualquier momento durante un chat de voz seleccionando el botón de cámara en la parte inferior de la pantalla.

Image

Puedes presionar este botón nuevamente para dejar de compartir tu video con ChatGPT.

¿Cómo comparto una foto o mi pantalla con ChatGPT mientras tengo una conversación de voz?

Compartir pantalla y subir imágenes están habilitados solo para suscriptores en las apps móviles de iOS y Android. Puedes presionar el botón de tres puntos y seleccionar Compartir pantalla en el menú emergente para compartir una imagen o tu pantalla con ChatGPT.

Voice Mode attachment menu with Share Screen, Upload Photo, and Take Photo options

Elegir la opción para tomar una foto abrirá la cámara para que puedas tomarla y subirla de inmediato a tu conversación de voz. Elegir la opción para subir una foto te permitirá seleccionar entre las imágenes de tu teléfono para compartirla con ChatGPT en tu conversación de voz.

Seleccionar compartir pantalla mostrará las opciones de uso compartido de pantalla de tu teléfono, lo que te permitirá transmitir tu pantalla a ChatGPT.

¿Cómo dejo de compartir mi pantalla con ChatGPT mientras tengo una conversación de voz?

Una vez que hayas comenzado a compartir pantalla, puedes tocar nuevamente el botón de compartir pantalla para dejar de compartir tu pantalla con ChatGPT.

Voice Mode orb with a cast icon in the center

Si estás compartiendo pantalla fuera de la app, puedes tocar el indicador del sistema de tu teléfono (Apple muestra un punto rojo en la parte superior de la pantalla y Android muestra un micrófono verde en la parte superior de la pantalla). Aparecerá una ventana emergente en la pantalla indicándote que detengas el uso compartido de pantalla. Como alternativa, puedes volver a la app y detenerlo directamente tocando el botón de compartir pantalla o tocando el botón “x”, lo que también finalizará la conversación.

¿Cuántas opciones de voz hay disponibles?

Elige entre nueve voces de salida realistas para ChatGPT, cada una con su propio tono y carácter distintivos:

  • Arbor - Relajada y versátil

  • Breeze - Animada y sincera

  • Cove - Serena y directa

  • Ember - Segura y optimista

  • Juniper - Abierta y alegre

  • Maple - Jovial y franca

  • Sol - Astuta y relajada

  • Spruce - Tranquila y reconfortante

  • Vale - Brillante e inquisitiva

¿Durante cuánto tiempo puedo tener chats de voz (solo audio)?

Para los suscriptores, tu uso diario de la voz de ChatGPT es casi ilimitado cada día, y los límites pueden cambiar. Para estos usuarios, las sesiones de voz comienzan automáticamente con nuestro modelo de voz más avanzado: GPT-4o. Cuando hayas usado todos tus minutos de GPT-4o de ese día, podrás seguir chateando en modo de voz con GPT-4o mini.

Para usuarios empresariales con planes de precios flexibles, el uso de la voz de ChatGPT con GPT-4o es ilimitado sujeto al consumo de créditos. Más información sobre los planes de precios flexibles.

Para usuarios Free con sesión iniciada, el uso de la voz de ChatGPT funciona con GPT-4o mini y está sujeto a un límite de 2 horas por día. Los límites pueden cambiar.

Los suscriptores Pro tienen uso ilimitado de la voz de GPT-4o, sujeto a barreras de protección contra abuso. Más información sobre nuestro plan Pro y los límites asociados.

Voice Mode notice that the GPT-4o daily voice limit is reached and calls will continue with GPT-4o-mini
ChatGPT voice mode notice that the voice usage limit has been reached

¿Durante cuánto tiempo puedo usar video y compartir pantalla en mis chats de voz?

Por usuario, el uso de las funciones de video y compartir pantalla está limitado diariamente para todos los planes elegibles. Te avisaremos cuando te estés acercando al límite diario.

Para los suscriptores, una vez que alcances tu límite diario de uso de voz de GPT-4o, pasarás a GPT-4o mini y ya no podrás compartir contenido nuevo de video o pantalla hasta que se restablezca tu límite de uso de GPT-4o.

El uso de las funciones de video y compartir pantalla también está limitado por conversación. Si alcanzas el límite de la conversación, podrás iniciar un nuevo chat para seguir usando video y compartir pantalla hasta alcanzar tu límite de uso.

¿Por qué solo veo la pantalla de voz con la esfera azul y puedo cambiarla?

La voz de ChatGPT puede aparecer como una experiencia de voz dentro de la página principal del chat o como un modo separado (la pantalla de la esfera azul). La mayoría de los usuarios en iOS y Android verá la experiencia integrada de forma predeterminada, pero algunas cuentas pueden tener temporalmente solo el modo separado mientras implementamos actualizaciones. Puedes cambiar a Modo separado (o volver) en Configuración → Voz → Modo separado.

¿Puedo mantener una conversación en segundo plano mientras uso otras apps o con la pantalla del teléfono bloqueada?

Sí, puedes mantener una conversación en segundo plano activando “Conversaciones en segundo plano” en Configuración.

Si inicias una conversación de voz con la opción de conversaciones en segundo plano activada, tu conversación continuará hasta que ocurra una de las siguientes situaciones:

  • Finalices la conversación manualmente

  • Fuerces el cierre de la app

  • Alcances tu límite de uso diario (que varía según tu plan de ChatGPT)

  • Tu conversación supere 1 hora de duración

Mientras compartes pantalla con la app de ChatGPT en segundo plano, seguirás compartiendo pantalla hasta que ocurra alguna de las situaciones anteriores, desactives el uso compartido de pantalla o bloquees la pantalla.

¿Tienen algún consejo para evitar interrupciones en las conversaciones de voz?

Ocasionalmente, pueden producirse interrupciones durante una conversación de voz. Recomendamos tener conversaciones de voz con audífonos.

En iPhone, habilitar el modo de micrófono Aislamiento de voz puede ayudar a evitar interrupciones no intencionales. Puedes habilitar Aislamiento de voz abriendo el Panel de control mientras tienes una conversación de voz, seleccionando Modo de micrófono y cambiando a Aislamiento de voz.

Si sigues teniendo problemas, te recomendamos cerrar la app y reiniciarla, subir el volumen de tu asistente o moverte a un entorno más silencioso.

¿Puedo tener conversaciones de voz con GPTs?

Sí, las conversaciones de voz están disponibles con GPTs. Los GPTs tienen su propia opción de voz llamada Shimmer, que es claramente diferente de las nueve voces de salida disponibles para usar al tener conversaciones de voz con ChatGPT.

Ten en cuenta que el modo de voz todavía no admite herramientas como generación de imágenes, carga de archivos o el intérprete de código. Las acciones personalizadas en GPTs no están disponibles en el modo de voz.

¿Cómo cambio las voces durante un chat de voz?

Puedes cambiar tu voz en Configuración o desde el menú de personalización en la esquina superior derecha del modo de voz.

Las voces se configuran por conversación. Si cambias tu voz dentro del modo de voz, se te pedirá que inicies un chat nuevo.

¿Por qué las transcripciones de voz a veces no coinciden con la conversación que tuve?

Las conversaciones de voz son inherentemente multimodales, lo que permite un intercambio directo de audio entre tú y el modelo. Como resultado, cuando este audio se transcribe, es posible que la transcripción no siempre coincida perfectamente con la conversación original.

¿Las conversaciones de voz incluyen subtítulos?

Puedes habilitar subtítulos para las respuestas del modelo en iOS y Android tocando el botón ‘cc’ en la esquina superior derecha dentro del modo de voz.

Después de salir de una conversación de voz, la transcripción se agrega a tu conversación actual basada en texto con ChatGPT. Puedes volver a consultar la transcripción de tu conversación en tu historial de chats en el lado izquierdo de la app de ChatGPT en la web y en el menú del lado izquierdo de la app móvil de ChatGPT.

¿Cuántas conversaciones de voz puedo tener al mismo tiempo?

Solo puedes tener un chat de voz a la vez.

¿Por qué el modo de voz o el dictado detectan un idioma distinto al que estoy hablando?

A veces, el idioma que hablas puede no reflejarse con precisión en nuestra función de entrada por voz. Puedes corregir verbalmente al modelo para que hable en el idioma que prefieras. Para el dictado, también puedes especificar un idioma preferido en la Configuración de la app para una detección más precisa.

  1. Abre la barra lateral seleccionando las dos líneas en la parte superior izquierda de la pantalla y selecciona tu nombre en la parte inferior para abrir Configuración.

  2. En la página de Configuración, desplázate hacia abajo hasta la sección Voz. Haz clic en el menú desplegable "Idioma principal" para seleccionar tu idioma.

Speech settings with Main Language set to Auto-Detect

Privacidad y controles

¿Cuánto tiempo conservan los clips de audio y video de mis chats de voz?

Con las conversaciones de voz, los clips de audio y video de tus chats de voz se almacenan junto con la transcripción que aparece en tu historial de chats. Mostramos un indicador visual en el historial de chats que señala qué chats ocurrieron con el modo de voz avanzado: solo busca el texto atenuado y el pequeño micrófono o cámara.

Image

Los clips de audio y video de los mensajes en tus chats de voz se conservarán durante 30 días. Cuando elimines el chat, también eliminaremos el clip de audio y video asociado dentro de 30 días, a menos que necesitemos conservarlo por motivos de seguridad o legales, o si anteriormente compartiste tus clips de audio o video con nosotros para entrenar nuestros modelos y el clip de audio o video ya se había desvinculado de tu cuenta.

No puedes recuperar los chats una vez que los eliminas. Si quieres quitar un chat de tu historial visible pero conservarlo en tu cuenta, debes usar la función de archivo. Los clips de audio y video asociados con chats archivados continúan conservándose.

Consulta este artículo para entender cómo puede usarse el contenido para entrenar nuestros modelos y las opciones que tienes.

Si estás usando nuestro antiguo modo de voz estándar, los clips de audio de ChatGPT se transcriben antes de que generemos una respuesta. Eliminamos los clips de audio una vez que se completa la transcripción, a menos que hayas elegido compartir tus clips de audio para entrenar nuestros modelos. (Nota: Los clips de audio se eliminan incluso si falla la transcripción). Más información sobre cómo compartir tu audio para entrenar nuestros modelos.

¿Entrenan sus modelos con clips de audio o video de chats de voz?

No, a menos que elijas compartir clips de audio o video de chats de voz para que entrenemos nuestros modelos.

Si tienes activado Mejorar el modelo para todos, entonces podemos usar transcripciones y otros archivos (como imágenes subidas a la conversación) de tus chats de voz para entrenar nuestros modelos, según tus elecciones y tu plan. Pero no usaremos los clips de audio o video asociados para entrenar nuestros modelos a menos que nos los hayas compartido para el entrenamiento del modelo. Más información sobre tus opciones.

Compartir audio o video para entrenar nuestros modelos

De forma predeterminada, no entrenaremos nuestros modelos con clips de audio o video, incluidos clips de uso compartido de pantalla, de chats de voz. Pero los usuarios Free, Plus y Pro pueden elegir compartir clips de audio y video de sus chats de voz para ayudarnos a entrenar nuestros modelos al activar Mejorar el modelo para todos en Controles de datos y habilitar Incluir tus grabaciones de audio e Incluir tus grabaciones de video.

Image

También puedes responder afirmativamente cuando te invitemos a compartir clips de audio y video para entrenamiento.

Si tienes activado Mejorar el modelo para todos, podemos usar transcripciones y otros archivos (como imágenes subidas a la conversación) de tus chats de voz para entrenar nuestros modelos, incluso si no estás compartiendo clips de audio o video de tus chats de voz.

¿Quién puede compartir audio y video para entrenar modelos?

Los usuarios de ChatGPT con planes Free, Plus y Pro pueden compartir audio y/o video desde espacios de trabajo personales. Los usuarios no pueden compartir audio o video de chats de voz en espacios de trabajo de ChatGPT Business, Edu y Enterprise.

¿Qué pasa si comparto mi audio y video para entrenar modelos?

Si eliges compartir tu audio y video de chats de voz, a partir de ese momento usaremos el audio y video de tu conversación para entrenar nuestros modelos. Más información sobre cómo usamos tu contenido para entrenar nuestros modelos. Puede ser necesario que nuestro equipo revise los clips de audio o video que compartiste con nosotros para poder usarlos en el entrenamiento. Por ejemplo, alguien de nuestro equipo podría escuchar una grabación de audio asociada a una señal de comentarios negativos para identificar dónde ChatGPT pudo haber malinterpretado lo que se dijo.

¿Cómo puedo dejar de compartir audio y video?

Puedes dejar de compartirlo desde la página de controles de datos en la Configuración de ChatGPT. Solo desactiva los controles incluir tus grabaciones de audio o incluir tus grabaciones de video, o desactiva por completo Mejorar el modelo para todos.

¿Qué pasa si decido dejar de compartir mi audio o video?

Si eliges dejar de compartirlo, el audio o video de los nuevos chats de voz ya no se usará para entrenar nuestros modelos. El audio y video que previamente se haya desvinculado de tu cuenta puede seguir usándose para entrenar nuestros modelos. Antes de usar clips de audio o video de chats de voz para entrenamiento, tomamos medidas para reducir la cantidad de información personal en el clip.

Si dejas de compartir tu audio o video de tus chats de voz, aún podemos usar transcripciones y otros archivos, como imágenes subidas, de esos chats para entrenar nuestro modelo si tienes activado Mejorar el modelo para todos . Para excluirte por completo del entrenamiento de nuestros modelos, desactiva Mejorar el modelo para todos.

¿La opción de compartir audio o video para el entrenamiento del modelo es una configuración específica del dispositivo?

Tu decisión de compartir audio o video de chats de voz para entrenar modelos está vinculada a tu cuenta. Si eliges compartirlo, esa elección también se aplicará a otros dispositivos donde hayas iniciado sesión. Puedes dejar de compartir audio o video desde la configuración de Control de datos en ChatGPT.

¿Este artículo te fue útil?