Proxy y scraping en lenguaje sencillo
Definiciones, explicaciones de funcionamiento y preguntas frecuentes sobre el vocabulario que todo desarrollador, equipo de crecimiento y scraper encuentra.
Tipos de proxy
Los diferentes tipos de proxy que puedes comprar: qué son, para quién sirven y cuál se adapta a tu trabajo.
Proxy residencial
Un proxy residencial es un servidor proxy que enruta tu tráfico de internet a través de una dirección IP asignada por un…
Proxy ISP
Un proxy ISP es un proxy residencial estático cuya dirección IP está registrada en un proveedor de servicios de Internet pero…
Proxy móvil
Un proxy móvil es un servidor proxy que enruta tu tráfico a través de una dirección IP asignada por un operador de telefonía…
Proxy de centro de datos
Un proxy de datacenter es un servidor proxy cuya dirección IP proviene de un proveedor de nube o alojamiento, en lugar de un…
Proxy rotativo
Un proxy rotativo es un servicio de proxy que asigna automáticamente una dirección IP diferente a cada solicitud (o a intervalos…
SOCKS5 Proxy
Un proxy SOCKS5 es un servidor proxy que utiliza el protocolo SOCKS5 para reenviar tráfico TCP y UDP arbitrario entre un cliente…
Proxy HTTP
Un proxy HTTP es un servidor proxy que entiende y reenvía tráfico HTTP (y, mediante el método CONNECT, también HTTPS), operando…
Cómo funcionan los proxies
La fontanería: pools de IPs, rotación, sesiones sticky y los controles de geo-targeting que expone toda pasarela de proxy.
Servidor proxy
Un servidor proxy es un sistema intermediario que se sitúa entre un cliente y un servidor de destino, reenvía las solicitudes en…
Pool de IPs
Un pool de IPs es el conjunto de direcciones IP que un proveedor de proxies puede asignar como IPs de salida para el tráfico de…
Rotación de IP
La rotación de IP es la práctica de cambiar la dirección IP de origen de las solicitudes salientes con una cadencia definida (por…
Sesión sticky
Una sesión sticky es una configuración de proxy que fija la misma IP de salida a un cliente durante una ventana definida o…
Geo-Targeting
La segmentación geográfica en los servicios de proxy es la capacidad de elegir la ubicación geográfica de tu IP de salida, por…
Anti-bot y fingerprinting
Cómo los objetivos modernos identifican y bloquean a los scrapers, y en qué se fija realmente cada capa de detección.
CAPTCHA
Un CAPTCHA (Completely Automated Public Turing test to tell Computers and Humans Apart) es un sistema de desafío-respuesta que…
Huella digital del navegador
La huella digital del navegador es una técnica que utilizan los sitios web para identificar y rastrear a los visitantes…
Huella digital TLS
Una huella TLS es un hash derivado de la estructura específica del handshake TLS de un cliente (lista de cifrados, extensiones,…
Navegador sin interfaz gráfica
Un navegador sin interfaz gráfica es un navegador web real que funciona sin interfaz de usuario, controlado de forma programática…
User Agent
Un User-Agent es una cabecera de solicitud HTTP que identifica el software cliente que realiza la solicitud, incluyendo…
Casos de uso
Los usos reales de los proxies: precios, SEO, verificación de anuncios, protección de marca y mucho más.
Web Scraping
El web scraping es la extracción automatizada de datos estructurados de sitios web mediante solicitudes HTTP, automatización de…
Scraping de SERP
El scraping de SERP es la práctica de extraer de forma programática datos de páginas de resultados de motores de búsqueda (SERP),…
Monitorización de precios
El monitoreo de precios es el seguimiento sistemático, a menudo automatizado, de los precios de productos en sitios web de la…
Verificación de anuncios
La verificación de anuncios es la práctica de auditar de forma programática dónde, cuándo y cómo aparecen realmente los anuncios…
Protección de marca
La protección de marca es la monitorización sistemática de canales en línea, como marketplaces, redes sociales, resultados de…
Normas y reglas
La fontanería de internet y el reglamento no oficial: ASNs, límites de velocidad, robots.txt y los bots que los esquivan.
ASN
Un ASN (Número de Sistema Autónomo) es un identificador único a nivel mundial asignado a un operador de red (ISP, proveedor de…
Limitación de velocidad
La limitación de velocidad es una defensa del lado del servidor que limita el número de solicitudes que un único cliente…
robots.txt
robots.txt es un archivo de texto plano en la raíz de un sitio web (por ejemplo, example.com/robots.txt) que indica a los…
Sneaker bot
Un bot de sneakers es un software automatizado diseñado para comprar zapatillas de edición limitada (u otros artículos de stock…
Ningún término del glosario coincide con tu búsqueda.
Prueba una búsqueda más corta o explora todos 26 términos.
Escala tu recopilación de datos
Empieza a recopilar datos en minutos con 205M+ IPs residenciales en 195+ países.