Nota: la retención de datos de determinados servicios puede verse afectada por novedades legales recientes; consulta nuestra publicación del blog para obtener más detalles
Preguntas frecuentes generales
¿Qué son los chats de voz?
Las conversaciones de voz te permiten mantener una conversación hablada con ChatGPT, lo que facilita una interacción más conversacional y natural. Puedes hacer preguntas o mantener debates mediante entrada de voz y recibir una respuesta hablada de ChatGPT. Las conversaciones de voz funcionan con modelos multimodales nativos y están disponibles para todos los usuarios que hayan iniciado sesión en las apps móviles de ChatGPT y en la web de escritorio en ChatGPT.com.
Las conversaciones de voz pueden cometer errores, así que comprueba la información importante. Para preguntas sensibles a la fecha o la hora, Voz usa la zona horaria de tu dispositivo o navegador para entender términos como «hoy» o «mañana». Si una respuesta parece incorrecta, comprueba la zona horaria de tu dispositivo o incluye la fecha exacta, la zona horaria o la ubicación en tu pregunta. Puedes obtener más información sobre ChatGPT y la precisión aquí. El acceso a Voz y los límites de uso asociados están sujetos a cambios.
¿Cómo inicio una conversación de voz?
En móvil
Para iniciar una conversación de voz, selecciona el icono de Voz en la parte inferior derecha de la pantalla:
La voz de ChatGPT puede aparecer como una experiencia de voz dentro del chat principal o como un modo independiente (la pantalla del orbe azul). La mayoría de los usuarios de iOS y Android verán la experiencia integrada de forma predeterminada, pero algunas cuentas pueden tener temporalmente solo el modo independiente mientras implementamos actualizaciones. Puedes cambiar al modo independiente (o volver) en Configuración → Voz → Modo independiente.
Cuando estés manteniendo una conversación de voz, puedes silenciar o activar tu micrófono seleccionando el icono del micrófono en la parte inferior izquierda de la pantalla.
Puedes finalizar la conversación pulsando el icono de salida en la parte inferior derecha de la pantalla.
Si inicias un chat de voz por primera vez, también se te pedirá que elijas una voz. Ten en cuenta que el volumen de la voz en el selector puede ser diferente del volumen durante la conversación de voz. Puedes cambiar tu voz en cualquier momento en la configuración o desde el modo de voz usando el menú de personalización en la esquina superior derecha.
Ten en cuenta que tendrás que conceder a la app de ChatGPT permiso para acceder al micrófono para usar esta función.
En la web
Las conversaciones de voz están disponibles en la web de escritorio en ChatGPT.com.
Para iniciar una conversación de voz en chatgpt.com, selecciona el icono de Voz en el lado derecho de la ventana del prompt:

Si es la primera vez que usas la voz en tu navegador, es posible que tengas que conceder permiso al navegador para acceder al micrófono de tu dispositivo.
Cuando estés manteniendo una conversación de voz, puedes silenciar o activar tu micrófono seleccionando el icono del micrófono en la parte inferior izquierda de la pantalla.
Puedes finalizar la conversación pulsando el icono de salida en la parte inferior derecha de la pantalla.
Si inicias un chat de voz por primera vez, también se te pedirá que elijas una voz. Ten en cuenta que el volumen de la voz en el selector puede ser diferente del volumen durante la conversación de voz.
Puedes cambiar tu voz en cualquier momento en la configuración o desde el modo de voz usando el menú de personalización en la esquina superior derecha.
¿Cómo comparto mi vídeo con ChatGPT durante una conversación de voz?
El vídeo está habilitado en las apps móviles de iOS y Android para suscriptores. Puedes compartir vídeo desde tus dispositivos en cualquier momento durante un chat de voz seleccionando el botón de la cámara en la parte inferior de la pantalla.
Puedes volver a pulsar este botón para dejar de compartir tu vídeo con ChatGPT.
¿Cómo comparto una foto o mi pantalla con ChatGPT durante una conversación de voz?
La compartición de pantalla y las subidas de imágenes están habilitadas en las apps móviles de iOS y Android solo para suscriptores. Puedes pulsar el botón de los tres puntos y seleccionar Compartir pantalla en el menú emergente para compartir una imagen o tu pantalla con ChatGPT.
Si eliges la opción de hacer una foto, se abrirá tu cámara para que puedas hacerla y subirla a tu conversación de voz de inmediato. Si eliges la opción de subir una foto, podrás seleccionar entre las imágenes de tu teléfono para compartirla con ChatGPT en tu conversación de voz.
Si seleccionas compartir pantalla, aparecerán las opciones de compartición de pantalla de tu teléfono, lo que te permitirá transmitir tu pantalla a ChatGPT.
¿Cómo dejo de compartir mi pantalla con ChatGPT durante una conversación de voz?
Una vez que hayas comenzado a compartir pantalla, puedes volver a tocar el botón de compartir pantalla para dejar de compartir tu pantalla con ChatGPT.
Si estás compartiendo pantalla fuera de la app, puedes tocar el indicador del sistema de tu teléfono (Apple muestra un punto rojo en la parte superior de la pantalla y Android muestra un micrófono verde en la parte superior de la pantalla). Aparecerá una ventana emergente en la pantalla indicándote que detengas la compartición de pantalla. También puedes volver a la app y detenerla directamente tocando el botón de compartir pantalla o el botón «x», lo que también finalizará la conversación.
¿Cuántas opciones de voz hay disponibles?
Elige entre nueve voces de salida realistas para ChatGPT, cada una con su propio tono y carácter distintivos:
Arbor - Desenfadada y versátil
Breeze - Expresiva y sincera
Cove - Serena y directa
Ember - Segura y optimista
Juniper - Abierta y animada
Maple - Alegre y franca
Sol - Astuta y relajada
Spruce - Tranquila y reafirmante
Vale - Brillante e inquisitiva
¿Durante cuánto tiempo puedo tener chats de voz (solo audio)?
Para los suscriptores, el uso diario de ChatGPT Voz es casi ilimitado cada día, y los límites pueden cambiar. Para estos usuarios, las sesiones de voz empiezan automáticamente con nuestro modelo de voz más avanzado: GPT-4o. Cuando hayas usado todos tus minutos de GPT-4o de ese día, podrás seguir chateando en modo de voz con GPT-4o mini.
Para los usuarios empresariales con planes de precios flexibles, el uso de ChatGPT Voz con GPT-4o es ilimitado, sujeto al consumo de créditos. Más información sobre los planes de precios flexibles.
Para los usuarios Free que han iniciado sesión, el uso de ChatGPT Voz funciona con GPT-4o mini y está sujeto a un límite de 2 horas al día. Los límites pueden cambiar.
Los suscriptores Pro tienen uso ilimitado de la voz de GPT-4o, sujeto a medidas de protección contra abusos. Más información sobre nuestro plan Pro y los límites asociados.
¿Durante cuánto tiempo puedo usar vídeo y compartir pantalla en mis chats de voz?
Por usuario, el uso de las funciones de vídeo y de compartir pantalla está limitado diariamente en todos los planes aptos. Mostramos un aviso cuando te acercas al límite diario.
Para los suscriptores, una vez alcanzado el límite diario de uso de voz con GPT-4o, pasarás a GPT-4o mini y ya no podrás compartir nuevo contenido de vídeo o de pantalla hasta que se restablezca tu límite de uso de GPT-4o.
El uso de las funciones de vídeo y de compartir pantalla también está limitado por conversación. Si alcanzas el límite de conversación, podrás iniciar un nuevo chat para seguir usando vídeo y compartición de pantalla hasta alcanzar tu límite de uso.
¿Por qué solo veo la pantalla de voz con el orbe azul? ¿Puedo cambiarla?
ChatGPT Voz puede aparecer dentro de la página principal del chat, como un orbe de voz flotante o en Voz separada, un modo de voz independiente a pantalla completa. Puedes activar o desactivar la experiencia independiente a pantalla completa en Ajustes. En móvil, ve a Ajustes → Voz → Modo separado. En la web, ve a Ajustes → General → Voz → Voz separada.
¿Puedo mantener una conversación en segundo plano mientras estoy en otras apps o con la pantalla del teléfono bloqueada?
Sí, puedes mantener una conversación en segundo plano activando «Conversaciones en segundo plano» en los ajustes.
Si inicias una conversación de voz con el ajuste de conversaciones en segundo plano activado, la conversación continuará hasta que ocurra una de las siguientes situaciones:
Finalizas la conversación manualmente
Fuerzas el cierre de la app
Alcanzas tu límite de uso diario (que varía en función de tu plan de ChatGPT)
Tu conversación supera 1 hora de duración
Mientras compartas la pantalla con la app de ChatGPT en segundo plano, seguirás compartiéndola hasta que ocurra una de las situaciones anteriores, desactives la pantalla compartida o bloquees la pantalla.
¿Tenéis algún consejo para evitar interrupciones en las conversaciones de voz?
Ocasionalmente, pueden producirse interrupciones durante una conversación de voz. Recomendamos mantener las conversaciones de voz con auriculares.
En iPhone, activar el modo de micrófono Aislamiento de voz puede ayudar a evitar interrupciones no intencionadas. Puedes activar Aislamiento de voz abriendo tu Centro de control mientras mantienes una conversación de voz, seleccionando Modo de micrófono y cambiando a Aislamiento de voz.
Si sigues teniendo problemas, te recomendamos cerrar la app y reiniciarla, subir el volumen de tu asistente o ir a un entorno más silencioso.
¿Puedo mantener conversaciones de voz con GPTs?
Sí, las conversaciones de voz están disponibles con GPTs. Los GPTs tienen su propia opción de voz, llamada Shimmer, que es claramente diferente de las nueve voces de salida disponibles para usar al mantener conversaciones de voz con ChatGPT.
Algunas capacidades del modo de voz varían según la cuenta y la sesión. Si la subida de archivos o fotos está disponible en tu sesión de voz, usa el botón de añadir en los controles de voz para adjuntar contenido sin salir del modo de voz. La generación de imágenes, el Intérprete de código y las acciones personalizadas en GPTs no están disponibles en el modo de voz.
¿Cómo cambio de voz durante un chat de voz?
Puedes cambiar tu voz en la configuración o desde el menú de personalización en la esquina superior derecha del modo de voz.
Las voces se establecen por conversación. Si cambias tu voz dentro del modo de voz, se te pedirá que inicies un nuevo chat.
¿Por qué las transcripciones de voz a veces no coinciden con la conversación que tuve?
Las conversaciones de voz son inherentemente multimodales, lo que permite un intercambio directo de audio entre tú y el modelo. Como resultado, al transcribirse ese audio, es posible que la transcripción no siempre coincida perfectamente con la conversación original.
¿Las conversaciones de voz incluyen subtítulos?
Puedes activar subtítulos para las respuestas del modelo en iOS y Android pulsando el botón «cc» en la esquina superior derecha dentro del modo de voz.
Cuando salgas de una conversación de voz, la transcripción se añadirá a tu conversación actual basada en texto con ChatGPT. Puedes volver a consultar la transcripción de tu conversación en tu historial de chats, en el lado izquierdo de la app de ChatGPT en la web y en el menú del lado izquierdo de la app móvil de ChatGPT.
¿Cuántas conversaciones de voz puedo tener a la vez?
Solo puedes tener un chat de voz a la vez.
¿Por qué el modo de voz o el dictado detectan un idioma distinto del que estoy hablando?
A veces, el idioma que hablas puede no reflejarse con precisión en nuestra función de entrada por voz. Puedes corregir verbalmente al modelo para que hable el idioma que prefieras. En el caso del dictado, también puedes especificar un idioma preferido en la Configuración de la app para lograr una detección más precisa.
Abre la barra lateral seleccionando las dos líneas de la parte superior izquierda de la pantalla y selecciona tu nombre en la parte inferior para abrir Configuración.
En la página de Configuración, desplázate hacia abajo hasta la sección Voz. Haz clic en el desplegable «Idioma principal» para seleccionar tu idioma.
Privacidad y controles
¿Durante cuánto tiempo conserváis los clips de audio y vídeo de mis chats de voz?
Con las conversaciones de voz, los clips de audio y vídeo de tus chats de voz se almacenan junto con la transcripción que aparece en tu historial de chats. Proporcionamos un indicador visual en el historial de chats que muestra qué chats se producen con el modo de voz avanzado: basta con buscar el texto atenuado y el pequeño micrófono o la cámara.
Los clips de audio y vídeo de los mensajes de tus chats de voz se conservarán durante 30 días. Cuando elimines el chat, también eliminaremos el clip de audio y vídeo asociado en un plazo de 30 días, salvo que tengamos que conservarlo por motivos de seguridad o legales, o si anteriormente compartiste con nosotros tus clips de audio o vídeo para entrenar nuestros modelos y el clip de audio o vídeo ya se había desvinculado de tu cuenta.
No puedes recuperar los chats una vez que los eliminas. Si quieres que un chat deje de estar visible en tu historial de chats pero conservarlo en tu cuenta, debes usar la función de archivar. Los clips de audio y vídeo asociados a chats archivados se siguen conservando.
Consulta este artículo para entender cómo puede usarse el contenido para entrenar nuestros modelos y qué opciones tienes.
Si utilizas nuestro modo de voz estándar heredado, los clips de audio de ChatGPT se transcriben antes de que generemos una respuesta. Eliminamos los clips de audio una vez completada la transcripción, a menos que hayas elegido compartir tus clips de audio para entrenar nuestros modelos. (Nota: los clips de audio se eliminan aunque la propia transcripción falle).Más información sobre compartir tu audio para entrenar nuestros modelos.
¿Entrenáis vuestros modelos con clips de audio o vídeo de chats de voz?
No, salvo que decidas compartir clips de audio o vídeo de chats de voz para que entrenemos nuestros modelos.
Si tienes activada la opción Mejorar el modelo para todos, podemos usar transcripciones y otros archivos (como imágenes subidas a la conversación) de tus chats de voz para entrenar nuestros modelos, en función de tus opciones y tu plan. Pero no usaremos los clips de audio o vídeo asociados para entrenar nuestros modelos a menos que los hayas compartido con nosotros para el entrenamiento de modelos. Más información sobre tus opciones.
Compartir audio o vídeo para entrenar nuestros modelos
De forma predeterminada, no entrenaremos nuestros modelos con clips de audio o vídeo, incluidos clips de compartición de pantalla, de chats de voz. Pero los usuarios de Free, Plus y Pro pueden elegir compartir clips de audio y vídeo de sus chats de voz para ayudarnos a entrenar nuestros modelos activando Mejorar el modelo para todos en Controles de datos y activando Incluir tus grabaciones de audio y Incluir tus grabaciones de vídeo.
También puedes responder afirmativamente cuando te invitemos a compartir clips de audio y vídeo para el entrenamiento.
Si tienes Mejorar el modelo para todos activado, podremos usar transcripciones y otros archivos (como imágenes subidas a la conversación) de tus chats de voz para entrenar nuestros modelos, incluso si no compartes clips de audio o vídeo de tus chats de voz.
¿Quién puede compartir audio y vídeo para entrenar modelos?
Los usuarios de ChatGPT con planes Free, Plus y Pro pueden compartir audio y/o vídeo desde Áreas de trabajo personales. Los usuarios no pueden compartir audio ni vídeo de chats de voz en Áreas de trabajo de ChatGPT Business, Edu y Enterprise.
¿Qué ocurre si comparto mi audio y vídeo para entrenar modelos?
Si decides compartir tu audio y vídeo de los chats de voz, a partir de ese momento usaremos el audio y vídeo de tu conversación para entrenar nuestros modelos. Más información sobre cómo usamos tu contenido para entrenar nuestros modelos. Puede que nuestro equipo tenga que revisar los clips de audio o vídeo que has compartido con nosotros para poder usarlos para entrenamiento. Por ejemplo, puede que una persona de nuestro equipo escuche una grabación de audio asociada a una valoración negativa para identificar dónde ChatGPT podría haber malinterpretado lo que se dijo.
¿Cómo puedo dejar de compartir audio y vídeo?
Puedes dejar de compartirlo desde la página de controles de datos en la configuración de ChatGPT. Solo tienes que desactivar los interruptores incluir tus grabaciones de audio o incluir tus grabaciones de vídeo, o desactivar por completo Mejorar el modelo para todos.
¿Qué pasa si decido dejar de compartir mi audio o vídeo?
Si eliges dejar de compartirlo, el audio o vídeo de los nuevos chats de voz dejará de usarse para entrenar nuestros modelos. El audio y vídeo que ya se haya desvinculado de tu cuenta podrá seguir utilizándose para entrenar nuestros modelos. Antes de usar clips de audio o vídeo de chats de voz para el entrenamiento, tomamos medidas para reducir la cantidad de información personal en el clip.
Si dejas de compartir el audio o vídeo de tus chats de voz, podremos seguir usando transcripciones y otros archivos, como subidas de imágenes, de esos chats para entrenar nuestro modelo si tienes Mejorar el modelo para todos activado. Para excluirte por completo del entrenamiento de nuestros modelos, desactiva Mejorar el modelo para todos.
¿Mi elección de compartir audio o vídeo para el entrenamiento del modelo es una configuración específica del dispositivo?
Tu elección de compartir audio o vídeo de chats de voz para el entrenamiento del modelo está vinculada a tu cuenta. Si eliges compartirlo, esa elección también se aplicará a otros dispositivos en los que hayas iniciado sesión. Puedes dejar de compartir audio o vídeo desde la configuración de Controles de datos en ChatGPT.
