Mrwhosetheboss lo ha vuelto a hacer: ha puesto a prueba a los principales modelos de inteligencia artificial en una batalla directa. El resultado no solo sorprendió a sus millones de seguidores, sino que reveló un rendimiento inesperado por parte de Grok, el modelo de Elon Musk, aunque fue ChatGPT quien se llevó la victoria.

Desempeño y sorpresas en cada prueba

En el video, el youtuber enfrentó a ChatGPT (GPT-4o), Grok 3, Gemini 2.5 Pro y Perplexity Sonar Pro en situaciones reales y retadoras. Desde resolver cuántas maletas caben en el maletero de un Honda Civic hasta reconocer ingredientes inusuales en una receta de cocina, cada modelo tuvo que demostrar su capacidad para razonar, entender imágenes y manejar tareas prácticas.

Grok sorprendió al principio con respuestas precisas y directas, como identificar correctamente una jarra de setas entre otros ingredientes engañosos. Sin embargo, el modelo de OpenAI fue el más constante en tareas como traducción, matemáticas, lógica e incluso recomendaciones de productos. Perplexity fue el menos acertado, con errores frecuentes e interpretaciones poco realistas.

Resultados que muestran al ganador en Mrwhosetheboss

Tras todas las pruebas, el ranking quedó claro:

PosiciónModelo de IAPuntuación
ChatGPT (GPT-4o)29 puntos
Grok 324 puntos
Gemini 2.5 Pro22 puntos
Perplexity Sonar Pro19 puntos

Uno de los factores clave fue la capacidad de generación de vídeo, presente en ChatGPT y Gemini, lo que elevó su puntuación en creatividad multimedia. No obstante, la precisión, coherencia y habilidad para evitar errores marcaron la diferencia en el liderazgo de ChatGPT.

Con la inteligencia artificial ya integrada en asistentes, búsquedas y hasta herramientas de productividad, este tipo de comparativas ayudan a ver quién lidera la carrera en el día a día.

El vídeo completo ya está disponible en el canal de Mrwhosetheboss, y la expectación no ha bajado desde su publicación.
ChatGPT se consolida como el modelo más fiable, mientras Grok da señales claras de evolución.

Puedes seguir a HardwarePremium en FacebookTwitter (X)InstagramThreadsBlueSky Youtube. También puedes consultar nuestro canal de Telegram para estar al día con las últimas noticias de tecnología.