Perplexity, una de las startups de inteligencia artificial más prometedoras del momento, está en el ojo del huracán. Cloudflare ha acusado públicamente a la empresa de haber scrapeado miles de sitios web que explícitamente prohibieron este tipo de acceso. Y lo hizo, al parecer, a escondidas y a lo grande.
La polémica estalla justo cuando el debate sobre los límites éticos del entrenamiento de IA está más candente que nunca. ¿Es el fin del salvaje oeste de los datos? ¿O apenas el comienzo?
¿Qué demonios ha pasado con la IA?
Según Cloudflare, Perplexity no solo ignoró los famosos archivos robots.txt —que indican qué contenido no debe ser indexado—, sino que además escondió su identidad para evadir los bloqueos. ¿Cómo? Usando user agents falsos que simulaban ser Chrome en macOS y redes ASN alternativas.
Esta técnica no fue algo puntual. Cloudflare asegura que se repitió a diario en millones de peticiones y en decenas de miles de dominios. Gracias a una mezcla de machine learning y análisis de tráfico, el proveedor de infraestructura pudo identificar estos patrones y confirmar que venían del bot de Perplexity.
La empresa afectada, lejos de admitir culpa, ha respondido tachando el informe de “campaña de marketing”. Su portavoz incluso negó que el bot detectado les perteneciera. Pero los antecedentes no juegan a su favor: en 2024, medios como Wired ya habían acusado a Perplexity de plagio y uso indebido de contenido para entrenar su IA.
¿La competencia debería preocuparse?
Esto no va solo de legalidad. Se trata de confianza. Cloudflare ha tomado medidas drásticas: bloquear todos los bots de Perplexity y eliminarlos de su lista de rastreadores verificados. Incluso ha lanzado herramientas para que los sitios puedan cobrar a bots de IA por visita.
Con el negocio del scraping en entredicho y el ecosistema regulatorio aún sin madurar, esta acusación podría marcar un antes y un después. Las reglas del juego están cambiando… y algunos aún no se han enterado.
Puedes seguir a HardwarePremium en Facebook, Twitter (X), Instagram, Threads, BlueSky o Youtube. También puedes consultar nuestro canal de Telegram para estar al día con las últimas noticias de tecnología.