Glosario

¿Qué es la huella digital del navegador?

La huella digital del navegador es una técnica que utilizan los sitios web para identificar y rastrear a los visitantes recopilando un conjunto de atributos del navegador (User-Agent, tamaño de pantalla, fuentes, plugins, hash de canvas, firmas WebGL, etc.) y combinándolos en una firma única.

Comprende las señales que recopila la toma de huellas digitales moderna, por qué una IP nueva por sí sola no es suficiente para parecer humano y cómo mantener limpia la huella digital de tu scraper.

Explicado

El fingerprinting de navegador recopila un conjunto de atributos de su navegador y los convierte en un identificador estable. Incluso sin cookies, la combinación de User-Agent, idioma, zona horaria, resolución de pantalla, fuentes instaladas, hash de renderizado de canvas, cadena del renderer WebGL, huella digital del contexto de audio y docenas de otras señales es lo suficientemente única como para identificar un único navegador entre sesiones con una precisión sorprendente.

Las dos grandes categorías son el fingerprinting pasivo y el activo. El fingerprinting pasivo lee atributos que el navegador expone de forma implícita: User-Agent, Accept-Language, client hints sec-ch-ua. El fingerprinting activo ejecuta JavaScript que sondea el motor de renderizado del navegador, el motor de audio, la GPU y las características de temporización, y luego calcula un hash.

Para el scraping y la automatización, el fingerprinting importa porque la rotación de IPs por sí sola no es suficiente. Si rota entre 10.000 IPs residenciales pero cada solicitud lleva la misma huella digital de canvas y el mismo User-Agent predeterminado de Playwright, el destino puede correlacionar las 10.000 solicitudes con la misma instancia de scraper. Los sistemas anti-bot modernos (Cloudflare, Akamai, PerimeterX, Datadome) utilizan intensamente el fingerprinting junto con el análisis de IPs.

Cómo funciona

Cuando su navegador carga una página con código de fingerprinting, el script enumera las propiedades del navegador (UA, idioma, plugins, pantalla, zona horaria), dibuja un canvas oculto con texto y degradados específicos y luego lee los píxeles renderizados (huella digital de canvas), crea un contexto WebGL y lee las cadenas del proveedor y renderer de la GPU (huella digital WebGL), genera un tono con la API de audio y lee el espectro (huella digital de audio), y mide operaciones específicas (math.tan, deriva de performance.now) para obtener señales de hardware.

Todos esos valores se procesan en un ID de huella digital y se envían de vuelta al servidor. Dado que la combinación de incluso una docena de estos atributos es muy única, el ID resultante identifica de forma estable el navegador a través de cookies borradas, nuevas sesiones y diferentes IPs.

Tipos

Toma de huellas digitales pasiva

Lee atributos que el navegador expone implícitamente a través de cabeceras HTTP y variables globales de JavaScript: User-Agent, Accept-Language, sugerencias sec-ch-ua, tamaño de pantalla, zona horaria, idioma. Económica, funciona en todas partes.

Huella digital activa / Canvas Fingerprinting

Ejecuta JavaScript que dibuja en un canvas oculto y lee el hash de los píxeles resultantes. Las distintas combinaciones de GPU y controlador producen diferencias sutiles en el renderizado, lo que hace que las huellas de canvas sean muy estables por dispositivo.

WebGL Fingerprinting

Sondea el contexto WebGL en busca del fabricante de la GPU, la cadena de renderizado y las extensiones compatibles. Los navegadores sin interfaz gráfica y las GPU virtualizadas suelen producir firmas características.

Audio Fingerprinting

Genera una forma de onda de audio con la API AudioContext y lee el espectro de frecuencias resultante. El procesamiento de audio varía sutilmente entre sistemas operativos y controladores de audio, produciendo un hash estable por dispositivo.

TLS / Huella digital de red (JA3, JA4)

Toma la huella digital del propio protocolo de enlace TLS: lista de cifrados, extensiones, orden ALPN y valores GREASE. Identifica el cliente HTTP subyacente (curl, Python requests, Playwright, etc.) antes de que la capa de aplicación tenga siquiera la oportunidad de actuar.

Casos de uso habituales

Defensa contra bots en páginas de inicio de sesión, registro y formularios
Deduplicación de cuentas (una huella digital = un usuario)
Puntuación de fraude en flujos financieros y de compra de publicidad
Seguimiento de visitantes recurrentes sin cookies
Detección de scrapers en la capa de aplicación
Preguntas frecuentes

Preguntas frecuentes

Preguntas frecuentes sobre huella digital del navegador.

Porque los sistemas antibot toman la huella digital del navegador, no solo de la IP. Si 10.000 solicitudes provienen de 10.000 IPs distintas pero todas llevan la misma huella de canvas, el mismo TLS JA3 y el mismo User-Agent, el sistema puede correlacionarlas como un único scraper. Se necesita rotación de IP y una buena higiene de huella digital para parecer muchos usuarios distintos.