Nota: la retención de datos de ciertos servicios puede verse afectada por acontecimientos legales recientes; consulta nuestra publicación del blog para obtener más detalles
Preguntas frecuentes generales
¿Qué son los chats de voz?
Las conversaciones de voz te permiten tener una conversación hablada con ChatGPT, lo que ofrece una interacción más conversacional y natural. Puedes hacer preguntas o conversar mediante entrada de voz y recibir una respuesta hablada de ChatGPT. Las conversaciones de voz funcionan con modelos multimodales nativos y están disponibles para todos los usuarios con sesión iniciada en las apps móviles de ChatGPT y en la web de escritorio en ChatGPT.com.
Las conversaciones de voz pueden cometer errores, así que verifica la información importante. Para preguntas sensibles a la fecha o la hora, Voz usa la zona horaria de tu dispositivo o navegador para entender términos como “hoy” o “mañana”. Si una respuesta parece incorrecta, revisa la zona horaria de tu dispositivo o incluye la fecha exacta, la zona horaria o la ubicación en tu pregunta. Puedes obtener más información sobre ChatGPT y la precisión aquí. El acceso a Voz y los límites de uso asociados están sujetos a cambios.
¿Cómo inicio una conversación de voz?
En dispositivos móviles
Para iniciar una conversación de voz, selecciona el ícono de Voz en la parte inferior derecha de la pantalla:
ChatGPT Voz puede aparecer como una experiencia de voz dentro de la página principal del chat o como modo separado (la pantalla del orbe azul). La mayoría de los usuarios de iOS y Android verán la experiencia integrada de forma predeterminada, pero algunas cuentas podrían tener temporalmente solo el modo separado mientras implementamos actualizaciones. Puedes cambiar al Modo separado (o volver) en Configuración → Voz → Modo separado.
Durante una conversación de voz, puedes silenciar o activar tu micrófono seleccionando el ícono de micrófono en la parte inferior izquierda de la pantalla.
Puedes finalizar la conversación presionando el ícono de salir en la parte inferior derecha de la pantalla.
Si inicias un chat de voz por primera vez, también se te pedirá que elijas una voz. Ten en cuenta que el volumen de la voz en el selector puede ser diferente del volumen durante la conversación de voz. Puedes cambiar la voz en cualquier momento en la configuración o desde el modo de voz usando el menú de personalización en la esquina superior derecha.
Ten en cuenta que deberás otorgar permiso de micrófono a la app de ChatGPT para usar esta función.
En la web
Las conversaciones de voz están disponibles en la web de escritorio en ChatGPT.com.
Para iniciar una conversación de voz en chatgpt.com, selecciona el ícono de Voz en el lado derecho de la ventana del prompt:

Si es la primera vez que usas voz en tu navegador, es posible que debas darle permiso al navegador para acceder al micrófono de tu dispositivo.
Durante una conversación de voz, puedes silenciar o activar tu micrófono seleccionando el ícono de micrófono en la parte inferior izquierda de la pantalla.
Puedes finalizar la conversación presionando el ícono de salir en la parte inferior derecha de la pantalla.
Si inicias un chat de voz por primera vez, también se te pedirá que elijas una voz. Ten en cuenta que el volumen de la voz en el selector puede ser diferente del volumen durante la conversación de voz.
Puedes cambiar la voz en cualquier momento en la configuración o desde el modo de voz usando el menú de personalización en la esquina superior derecha.
¿Cómo comparto mi video con ChatGPT durante una conversación de voz?
El video está habilitado para suscriptores en las apps móviles de iOS y Android. Puedes compartir video desde tus dispositivos en cualquier momento durante un chat de voz seleccionando el botón de cámara en la parte inferior de la pantalla.
Puedes presionar este botón de nuevo para dejar de compartir tu video con ChatGPT.
¿Cómo comparto una foto o mi pantalla con ChatGPT durante una conversación de voz?
La pantalla compartida y la carga de imágenes solo están habilitadas para suscriptores en las apps móviles de iOS y Android. Puedes presionar el botón de tres puntos y seleccionar Compartir pantalla en el menú emergente para compartir una imagen o tu pantalla con ChatGPT.
Al elegir la opción para tomar una foto, se abrirá la cámara para que puedas tomarla y subirla de inmediato a tu conversación de voz. Al elegir la opción para subir una foto, podrás seleccionar imágenes de tu teléfono para compartirlas con ChatGPT en tu conversación de voz.
Al seleccionar compartir pantalla, aparecerán las opciones de pantalla compartida de tu teléfono, lo que te permitirá transmitir tu pantalla a ChatGPT.
¿Cómo dejo de compartir mi pantalla con ChatGPT durante una conversación de voz?
Una vez que hayas iniciado la pantalla compartida, puedes tocar de nuevo el botón de pantalla compartida para dejar de compartir tu pantalla con ChatGPT.
Si compartes pantalla fuera de la app, puedes tocar el indicador del sistema de tu teléfono (Apple muestra un punto rojo en la parte superior de la pantalla y Android muestra un micrófono verde en la parte superior de la pantalla). Aparecerá una ventana emergente en la pantalla para pedirte que dejes de compartir la pantalla. Como alternativa, puedes volver a la app y dejar de compartir directamente tocando el botón de pantalla compartida o el botón “x”, lo que también finalizará la conversación.
¿Cuántas opciones de voz hay disponibles?
Elige entre nueve voces de salida realistas para ChatGPT, cada una con su propio tono y carácter distintivos:
Arbor - Tranquila y versátil
Breeze - Animada y sincera
Cove - Serena y directa
Ember - Segura y optimista
Juniper - Abierta y entusiasta
Maple - Alegre y franca
Sol - Sagaz y relajada
Spruce - Calmada y reafirmante
Vale - Brillante e inquisitiva
¿Durante cuánto tiempo puedo tener chats de voz (solo audio)?
Para los suscriptores, tu uso diario de ChatGPT Voz es casi ilimitado cada día, y los límites pueden cambiar. Para estos usuarios, las sesiones de voz comienzan automáticamente con nuestro modelo de voz más avanzado: GPT-4o. Cuando hayas usado todos tus minutos de GPT-4o de ese día, podrás seguir chateando en modo de voz con GPT-4o mini.
Para usuarios empresariales en planes de precios flexibles, el uso de ChatGPT Voz con GPT-4o es ilimitado, sujeto al consumo de créditos. Obtén más información sobre los planes de precios flexibles.
Para usuarios Free con sesión iniciada, ChatGPT Voz funciona con GPT-4o mini y está sujeto a un límite de 2 horas por día. Los límites pueden cambiar.
Los suscriptores Pro tienen uso ilimitado de voz con GPT-4o, sujeto a medidas de protección contra abusos. Obtén más información sobre nuestro plan Pro y los límites asociados.
¿Durante cuánto tiempo puedo usar video y compartir pantalla en mis chats de voz?
Por usuario, el uso de las funciones de video y pantalla compartida está limitado a diario en todos los planes elegibles. Te avisaremos cuando te estés acercando al límite diario.
Para los suscriptores, una vez que alcances tu límite de uso diario de voz con GPT-4o, pasarás a GPT-4o mini y ya no podrás compartir video nuevo ni contenido de pantalla compartida hasta que se restablezca tu límite de uso de GPT-4o.
El uso de las funciones de video y pantalla compartida también está limitado por conversación. Si alcanzas el límite de la conversación, podrás iniciar un chat nuevo para seguir usando video y pantalla compartida hasta que alcances tu límite de uso.
¿Por qué solo veo la pantalla de voz con el orbe azul y puedo cambiarla?
ChatGPT Voz puede aparecer dentro de la página principal del chat, como un orbe de voz flotante o en Voz separada, un modo de voz independiente de pantalla completa. Puedes activar o desactivar la experiencia independiente de pantalla completa en Configuración. En dispositivos móviles, ve a Configuración → Voz → Modo separado. En la web, ve a Configuración → General → Voz → Voz separada.
¿Puedo mantener una conversación en segundo plano mientras uso otras apps o con la pantalla del teléfono bloqueada?
Sí, puedes mantener una conversación en segundo plano activando “Conversaciones en segundo plano” en la configuración.
Si inicias una conversación de voz con la opción de conversaciones en segundo plano activada, la conversación continuará hasta que ocurra una de estas situaciones:
Finalizas manualmente la conversación
Fuerzas el cierre de la app
Alcanzas tu límite de uso diario (que varía según tu plan de ChatGPT)
Tu conversación supera 1 hora de duración
Si alcanzas un límite de uso diario, ChatGPT puede reproducir o mostrar un mensaje de límite antes de que termine la conversación.
Mientras compartes pantalla con la app de ChatGPT en segundo plano, seguirás compartiéndola hasta que ocurra una de las situaciones anteriores, desactives la pantalla compartida o bloquees la pantalla.
¿Tienen consejos para evitar interrupciones en las conversaciones de voz?
En ocasiones, pueden ocurrir interrupciones durante una conversación de voz. Recomendamos tener conversaciones de voz con audífonos.
En iPhone, activar el modo de micrófono Aislamiento de voz puede ayudar a evitar interrupciones involuntarias. Puedes activar Aislamiento de voz abriendo el Panel de control durante una conversación de voz, seleccionando Modo de micrófono y cambiando a Aislamiento de voz.
Si sigues teniendo problemas, recomendamos cerrar la app y reiniciarla, subir el volumen de tu asistente o moverte a un entorno más silencioso.
¿Puedo tener conversaciones de voz con GPTs?
Sí, las conversaciones de voz están disponibles con GPTs. Los GPTs tienen su propia opción de voz llamada Shimmer, claramente diferente de las nueve voces de salida disponibles para usar en conversaciones de voz con ChatGPT.
Algunas funciones del modo de voz varían según la cuenta y la sesión. Si la carga de archivos o fotos está disponible en tu sesión de voz, usa el botón de agregar en los controles de voz para adjuntar contenido sin salir del modo de voz. La generación de imágenes, el intérprete de código y las acciones personalizadas en GPTs no están disponibles en el modo de voz.
¿Cómo cambio de voz durante un chat de voz?
Puedes cambiar la voz en la configuración o desde el menú de personalización en la esquina superior derecha del modo de voz.
Las voces se configuran por conversación. Si cambias la voz dentro del modo de voz, se te pedirá que inicies un chat nuevo.
¿Por qué las transcripciones de voz a veces no coinciden con la conversación que tuve?
Las conversaciones de voz son inherentemente multimodales y permiten un intercambio directo de audio entre tú y el modelo. Por eso, cuando se transcribe este audio, es posible que la transcripción no siempre coincida perfectamente con la conversación original.
¿Las conversaciones de voz incluyen subtítulos?
Puedes activar subtítulos para las respuestas del modelo en iOS y Android tocando el botón “cc” en la esquina superior derecha dentro del modo de voz.
Después de salir de una conversación de voz, la transcripción se agrega a tu conversación actual de texto con ChatGPT. Puedes volver a consultar la transcripción de tu conversación en el historial de chat del lado izquierdo de la app web de ChatGPT y en el menú del lado izquierdo de la app móvil de ChatGPT.
¿Cuántas conversaciones de voz puedo tener al mismo tiempo?
Solo puedes tener un chat de voz a la vez.
¿Por qué el modo de voz o el dictado detectan un idioma distinto del que estoy hablando?
A veces, es posible que el idioma que hablas no se refleje con precisión en nuestra función de entrada de voz. Puedes corregir verbalmente al modelo para que hable el idioma que prefieras. Para el dictado, también puedes especificar un idioma preferido en la configuración de la app para una detección más precisa.
Abre la barra lateral seleccionando las dos líneas en la parte superior izquierda de la pantalla y selecciona tu nombre en la parte inferior para abrir Configuración.
En la página Configuración, desplázate hacia abajo hasta la sección Voz. Haz clic en el menú desplegable “Idioma principal” para seleccionar tu idioma.
Privacidad y controles
¿Durante cuánto tiempo conservan los clips de audio y video de mis chats de voz?
Con las conversaciones de voz, los clips de audio y video de tus chats de voz se almacenan junto con la transcripción que aparece en tu historial de chat. Mostramos un indicador visual en el historial de chat que señala qué chats ocurrieron con el modo de voz avanzado: solo busca el texto atenuado y el micrófono o la cámara pequeños.
Los clips de audio y video de los mensajes en tus chats de voz se conservarán durante 30 días. Cuando elimines el chat, también eliminaremos el clip de audio y video asociado en un plazo de 30 días, a menos que debamos conservarlo por motivos de seguridad o legales, o si compartiste previamente tus clips de audio o video con nosotros para entrenar nuestros modelos y el clip ya se había desvinculado de tu cuenta.
No puedes recuperar los chats una vez que los eliminas. Si quieres quitar un chat de tu historial de chat visible, pero conservarlo en tu cuenta, debes usar la función de archivo. Los clips de audio y video asociados con chats archivados se siguen conservando.
Consulta este artículo para entender cómo puede usarse el contenido para entrenar nuestros modelos y qué opciones tienes.
Si usas nuestro modo de voz estándar heredado, los clips de audio de ChatGPT se transcriben antes de que generemos una respuesta. Eliminamos los clips de audio una vez finalizada la transcripción, a menos que hayas elegido compartirlos para entrenar nuestros modelos. (Nota: los clips de audio se eliminan incluso si la transcripción falla).Obtén más información sobre compartir tu audio para entrenar nuestros modelos.
¿Entrenan sus modelos con clips de audio o video de chats de voz?
No, a menos que elijas compartir clips de audio o video de chats de voz para que entrenemos nuestros modelos.
Si tienes Mejorar el modelo para todos activado, podemos usar transcripciones y otros archivos (como imágenes subidas a la conversación) de tus chats de voz para entrenar nuestros modelos, según tus opciones y tu plan. Pero no usaremos los clips de audio o video asociados para entrenar nuestros modelos, a menos que los hayas compartido con nosotros para el entrenamiento del modelo. Obtén más información sobre tus opciones.
Compartir audio o video para entrenar nuestros modelos
De forma predeterminada, no entrenaremos nuestros modelos con clips de audio o video de chats de voz, incluidos clips de pantalla compartida. Sin embargo, los usuarios de los planes Free, Plus y Pro pueden optar por compartir clips de audio y video de sus chats de voz para ayudarnos a entrenar nuestros modelos. Para hacerlo, deben activar Mejorar el modelo para todos en Controles de datos y activar Incluir tus grabaciones de audio e Incluir tus grabaciones de video.
También puedes responder afirmativamente cuando te invitemos a compartir clips de audio y video para el entrenamiento.
Si tienes Mejorar el modelo para todos activado, podemos usar transcripciones y otros archivos (como imágenes subidas a la conversación) de tus chats de voz para entrenar nuestros modelos, incluso si no compartes clips de audio o video de tus chats de voz.
¿Quién puede compartir audio y video para entrenar modelos?
Los usuarios de ChatGPT con planes Free, Plus y Pro pueden compartir audio o video desde Espacios de trabajo personales. Los usuarios no pueden compartir audio ni video de chats de voz en Espacios de trabajo de ChatGPT Business, Edu y Enterprise.
¿Qué pasa si comparto mi audio y video para entrenar modelos?
Si decides compartir el audio y video de tus chats de voz, de ahora en adelante usaremos el audio y video de tu conversación para entrenar nuestros modelos. Obtén más información sobre cómo usamos tu contenido para entrenar nuestros modelos. Puede ser necesario que nuestro equipo revise los clips de audio o video que compartiste con nosotros para poder usarlos en el entrenamiento. Por ejemplo, es posible que una persona de nuestro equipo escuche una grabación de audio asociada con una señal de comentarios negativos para identificar dónde ChatGPT pudo haber interpretado mal lo que se dijo.
¿Cómo puedo dejar de compartir audio y video?
Puedes dejar de compartir desde la página de controles de datos en la configuración de ChatGPT. Solo desactiva los interruptores incluir tus grabaciones de audio o incluir tus grabaciones de video, o desactiva por completo Mejorar el modelo para todos.
¿Qué pasa si decido dejar de compartir mi audio o video?
Si decides dejar de compartir, el audio o video de los nuevos chats de voz ya no se usará para entrenar nuestros modelos. El audio y video que se desvinculó previamente de tu cuenta puede seguir usándose para entrenar nuestros modelos. Antes de usar clips de audio o video de chats de voz para entrenamiento, tomamos medidas para reducir la cantidad de información personal en el clip.
Si dejas de compartir el audio o video de tus chats de voz, aún podemos usar transcripciones y otros archivos, como imágenes subidas, de esos chats para entrenar nuestro modelo. si tienes Mejorar el modelo para todos activada. Para excluirte por completo del entrenamiento de nuestros modelos, desactiva Mejorar el modelo para todos.
¿Mi decisión de compartir audio o video para el entrenamiento del modelo es una configuración específica del dispositivo?
Tu decisión de compartir audio o video de chats de voz para el entrenamiento del modelo está vinculada a tu cuenta. Si decides compartir, esa decisión también se aplicará a otros dispositivos donde hayas iniciado sesión. Puedes dejar de compartir audio o video desde la configuración de Controles de datos en ChatGPT.
