YouTube quiere que los vídeos doblados por inteligencia artificial parezcan aún más reales.

Después de introducir el doblaje automático mediante IA, la plataforma ha comenzado a probar una nueva función de sincronización labial inteligente. Esta función es capaz de adaptar los movimientos de la boca al audio traducido.

La tecnología, aún en fase experimental, promete reducir la barrera del idioma sin sacrificar naturalidad visual. Así, se acerca a los creadores a una audiencia global como nunca antes.

Una evolución natural del doblaje automático

La nueva función, actualmente en desarrollo, aplica un sistema de modificación a nivel de píxel sobre el rostro del hablante. Esto permite que el movimiento de los labios coincida con el audio traducido.

Según explicó Buddhika Kottahachchi, líder de producto de Auto-dubbing en YouTube, la IA analiza la estructura facial en 3D. Esto incluye labios, dientes y expresiones, para generar un resultado creíble sin afectar al resto del vídeo.

El sistema está impulsado por un modelo propio de Google, posiblemente basado en la arquitectura Veo3, su tecnología de texto a vídeo presentada este año.

Por ahora, solo es compatible con vídeos en resolución 1080p y con un número limitado de idiomas: inglés, francés, alemán, portugués y español.

Sin embargo, la compañía planea expandir el soporte a más de 20 idiomas en los próximos meses. Cubrirán todo el espectro de su actual función de doblaje automático.

YouTube no ha confirmado una fecha de lanzamiento general. No obstante, las pruebas iniciales se realizarán con un grupo reducido de creadores, siguiendo el mismo proceso que tuvo el doblaje automático.

La función podría llegar oficialmente durante 2025 si las pruebas son satisfactorias.

Más realismo… y también nuevas preguntas

Aunque el avance es impresionante, la tecnología no llega sin polémica.

Al modificar los labios del hablante, surgen preocupaciones sobre la manipulación visual de contenido. Existe la posibilidad de que los vídeos puedan ser malinterpretados o reutilizados sin permiso.

Para evitar abusos, YouTube implementará una marca invisible (tipo “fingerprint”) y una etiqueta informativa visible. Esto será similar al sistema SynthID, que identifica contenido generado o alterado por IA.

Otra incógnita es el precio. Según fuentes cercanas al proyecto, el lip-sync automático podría incluir costes adicionales. Estos costos serían para el creador o para el usuario.

La decisión final aún no está tomada. Sin embargo, la idea de monetizar esta herramienta apunta a un futuro donde la personalización del contenido multilingüe podría convertirse en un nuevo negocio dentro de la plataforma.

Curiosamente, Meta también experimenta con algo similar en Instagram y Facebook. Algunos creadores ya pueden doblar y sincronizar automáticamente sus Reels en varios idiomas, incluidos inglés, hindi, portugués y español.

Parece que la batalla por el “contenido global sin fronteras” acaba de comenzar.

Puedes seguir a HardwarePremium en FacebookTwitter (X)InstagramThreads, BlueSky o Youtube. También puedes consultar nuestro canal de Telegram para estar al día con las últimas noticias de tecnología.