Mrwhosetheboss lo ha vuelto a hacer: ha puesto a prueba a los principales modelos de inteligencia artificial en una batalla directa. El resultado no solo sorprendió a sus millones de seguidores, sino que reveló un rendimiento inesperado por parte de Grok, el modelo de Elon Musk, aunque fue ChatGPT quien se llevó la victoria.
Desempeño y sorpresas en cada prueba
En el video, el youtuber enfrentó a ChatGPT (GPT-4o), Grok 3, Gemini 2.5 Pro y Perplexity Sonar Pro en situaciones reales y retadoras. Desde resolver cuántas maletas caben en el maletero de un Honda Civic hasta reconocer ingredientes inusuales en una receta de cocina, cada modelo tuvo que demostrar su capacidad para razonar, entender imágenes y manejar tareas prácticas.
Grok sorprendió al principio con respuestas precisas y directas, como identificar correctamente una jarra de setas entre otros ingredientes engañosos. Sin embargo, el modelo de OpenAI fue el más constante en tareas como traducción, matemáticas, lógica e incluso recomendaciones de productos. Perplexity fue el menos acertado, con errores frecuentes e interpretaciones poco realistas.
Resultados que muestran al ganador en Mrwhosetheboss
Tras todas las pruebas, el ranking quedó claro:
Posición | Modelo de IA | Puntuación |
---|---|---|
1º | ChatGPT (GPT-4o) | 29 puntos |
2º | Grok 3 | 24 puntos |
3º | Gemini 2.5 Pro | 22 puntos |
4º | Perplexity Sonar Pro | 19 puntos |
Uno de los factores clave fue la capacidad de generación de vídeo, presente en ChatGPT y Gemini, lo que elevó su puntuación en creatividad multimedia. No obstante, la precisión, coherencia y habilidad para evitar errores marcaron la diferencia en el liderazgo de ChatGPT.
Con la inteligencia artificial ya integrada en asistentes, búsquedas y hasta herramientas de productividad, este tipo de comparativas ayudan a ver quién lidera la carrera en el día a día.
El vídeo completo ya está disponible en el canal de Mrwhosetheboss, y la expectación no ha bajado desde su publicación.
ChatGPT se consolida como el modelo más fiable, mientras Grok da señales claras de evolución.
Puedes seguir a HardwarePremium en Facebook, Twitter (X), Instagram, Threads, BlueSky o Youtube. También puedes consultar nuestro canal de Telegram para estar al día con las últimas noticias de tecnología.