La creación visual impulsada por inteligencia artificial ya no vive únicamente en servidores remotos ni depende de créditos mensuales. En paralelo a su adopción por parte de estudios creativos y agencias, empieza a consolidarse una tendencia distinta: ejecutar estos modelos directamente en el ordenador personal. NVIDIA quiere acelerar ese cambio y plantea un escenario donde la generación de imágenes y vídeo se controla, se itera y se ajusta desde casa, con el PC como núcleo del proceso creativo.

Crear imágenes y vídeo con IA, sin salir del PC

La propuesta de NVIDIA parte de una idea sencilla: llevar los flujos de trabajo creativos más exigentes al entorno local. Según la compañía, los PCs con GPU NVIDIA RTX se han convertido en la plataforma preferente para este tipo de tareas gracias a su capacidad de cómputo y a la posibilidad de ejecutar modelos sin costes asociados al uso en la nube.

Para ello, NVIDIA pone el foco en ComfyUI, una herramienta de código abierto que permite construir flujos de generación visual mediante nodos conectados. Su enfoque modular facilita tanto el acceso a modelos recientes como la personalización del proceso creativo, algo que los generadores online no suelen ofrecer.

Desde ComfyUI es posible trabajar con modelos de imagen como FLUX.2, o con propuestas orientadas a vídeo como LTX‑2, presentado recientemente para generación audiovisual controlada a partir de imágenes estáticas.

FLUX.2 y LTX-2: dos modelos, dos enfoques creativos

FLUX.2 está orientado a la generación de imágenes de alta calidad y se apoya en pesos de gran tamaño que se descargan bajo demanda desde repositorios como Hugging Face. NVIDIA recomienda versiones FP4 o FP8 según la generación de la GPU, lo que permite ajustar el consumo de memoria sin penalizar el resultado visual.

En el caso de LTX-2, el planteamiento es distinto. Se trata de un modelo pensado para transformar imágenes en secuencias de vídeo, siguiendo descripciones tipo storyboard. El usuario puede definir planos, movimientos de cámara, iluminación, ritmo y sonido, obteniendo clips coherentes directamente desde el PC.

Este modelo hace un uso intensivo de la VRAM, por lo que NVIDIA ha trabajado junto a ComfyUI en sistemas de weight streaming, capaces de desplazar parte de la carga a la memoria del sistema cuando la GPU se queda corta, aunque con impacto en los tiempos de generación.

El papel de los PC RTX en el nuevo flujo creativo

NVIDIA insiste en que ejecutar estos modelos de forma local no es solo una cuestión de rendimiento. También implica control total sobre los activos, eliminación de dependencias externas y una iteración mucho más fluida. En escenarios creativos reales, donde se prueban decenas de variantes, ese factor marca la diferencia.

Además, las optimizaciones anunciadas durante CES 2026 refuerzan este enfoque, con mejoras específicas para generación de vídeo 4K y aceleraciones adicionales en herramientas relacionadas con IA generativa.

Un ecosistema que sigue creciendo

Más allá de imagen y vídeo, NVIDIA plantea una evolución hacia flujos de trabajo más complejos, incluyendo generación guiada por escenas 3D y pipelines híbridos orientados a producción. La compañía también destaca la importancia de la comunidad, con foros y canales donde compartir workflows, resolver dudas y mostrar proyectos reales.

La lectura es clara: la IA creativa ya no es solo una demo en la nube, sino una herramienta que empieza a formar parte del escritorio.

Puedes seguir a HardwarePremium en FacebookTwitter (X)InstagramThreadsBlueSky Youtube. También puedes consultar nuestro canal de Telegram para estar al día con las últimas noticias de tecnología.

FAQ

¿Qué es ComfyUI y para qué sirve?

Es una herramienta de código abierto que permite crear flujos de generación de IA visual mediante nodos conectados.

¿Qué diferencia a FLUX.2 de otros modelos de imagen?

Está diseñado para ofrecer alta calidad visual y un control preciso del resultado, con soporte para optimización de memoria en GPUs RTX.

¿LTX-2 genera vídeo desde cero?

No exactamente. Parte de una imagen y un prompt textual para construir secuencias de vídeo coherentes.

¿Es necesario un PC muy potente?

Depende del modelo y la resolución, pero la VRAM de la GPU es un factor determinante.

¿Se puede trabajar sin conexión a Internet?

Una vez descargados los modelos, la generación se realiza completamente en local.