Proxy et scraping en termes simples
Définitions, explications de fonctionnement et FAQ pour le vocabulaire que tout développeur, équipe de croissance et scraper rencontre.
Types de proxy
Les différents types de proxy que vous pouvez acheter — ce qu'ils sont, à qui ils s'adressent et lequel convient à votre usage.
Proxy résidentiel
Un proxy résidentiel est un serveur proxy qui achemine votre trafic internet via une adresse IP attribuée par un fournisseur…
Proxy ISP
Un proxy ISP est un proxy résidentiel statique dont l'adresse IP est enregistrée auprès d'un fournisseur d'accès à Internet mais…
Proxy mobile
Un proxy mobile est un serveur proxy qui achemine votre trafic via une adresse IP attribuée par un opérateur mobile (3G, 4G ou…
Proxy Datacenter
Un proxy datacenter est un serveur proxy dont l'adresse IP provient d'un fournisseur cloud ou d'hébergement, plutôt que d'un…
Proxy rotatif
Un proxy rotatif est un service de proxy qui attribue automatiquement une adresse IP différente à chaque requête (ou à…
SOCKS5 Proxy
Un proxy SOCKS5 est un serveur proxy qui utilise le protocole SOCKS5 pour transférer du trafic TCP et UDP arbitraire entre un…
Proxy HTTP
Un proxy HTTP est un serveur proxy qui comprend et transfère le trafic HTTP (et via la méthode CONNECT, HTTPS), opérant au niveau…
Comment fonctionnent les proxies
La plomberie — pools d'IP, rotation, sessions persistantes et contrôles de géociblage que chaque passerelle proxy expose.
Serveur proxy
Un serveur proxy est un système intermédiaire qui se place entre un client et un serveur de destination, transmettant les…
Pool d'IP
Un pool d'IP est l'ensemble des adresses IP qu'un fournisseur de proxy peut attribuer comme IP de sortie pour le trafic des…
Rotation d'IP
La rotation d'IP est la pratique consistant à changer l'adresse IP source des requêtes sortantes selon une cadence définie (par…
Session persistante
Une session persistante est une configuration proxy qui fixe la même IP de sortie à un client pour une fenêtre définie ou pour la…
Geo-Targeting
Le géociblage dans les services proxy est la capacité de choisir la localisation géographique de votre IP de sortie — par pays,…
Anti-bot et empreinte numérique
Comment les cibles modernes identifient et bloquent les scrapers — et ce que chaque couche de détection examine réellement.
CAPTCHA
Un CAPTCHA (Completely Automated Public Turing test to tell Computers and Humans Apart) est un système de défi-réponse utilisé…
Browser Fingerprinting
Le browser fingerprinting est une technique utilisée par les sites web pour identifier et suivre les visiteurs en collectant un…
Empreinte TLS
Une empreinte TLS est un hachage dérivé de la structure spécifique du handshake TLS d'un client (liste de chiffrements,…
Navigateur sans interface graphique
Un navigateur headless est un vrai navigateur web fonctionnant sans interface graphique, contrôlé de manière programmatique via…
User Agent
Un User-Agent est un en-tête de requête HTTP qui identifie le logiciel client effectuant la requête — incluant généralement le…
Cas d'usage
Les usages pour lesquels les gens utilisent réellement des proxies : tarification, SEO, vérification publicitaire, protection de marque, et bien plus encore.
Web Scraping
Le web scraping est l'extraction automatisée de données structurées depuis des sites web à l'aide de requêtes HTTP, de…
Scraping SERP
Le scraping SERP est la pratique consistant à extraire de manière programmatique les données des pages de résultats de moteurs de…
Surveillance des prix
La surveillance des prix est le suivi systématique, souvent automatisé, des prix des produits sur les sites concurrents et les…
Vérification des publicités
La vérification publicitaire est la pratique consistant à auditer de manière programmatique où, quand et comment les publicités…
Protection de marque
La protection de marque est la surveillance systématique des canaux en ligne — places de marché, réseaux sociaux, résultats de…
Normes et règles
La plomberie d'Internet et le règlement non officiel — ASN, limites de débit, robots.txt, et les bots qui les contournent.
ASN
Un ASN (Autonomous System Number) est un identifiant unique mondial attribué à un opérateur réseau (ISP, hébergeur, entreprise)…
Limitation de débit
La limitation de débit est une défense côté serveur qui plafonne le nombre de requêtes qu'un seul client (identifié par IP,…
robots.txt
robots.txt est un fichier texte brut situé à la racine d'un site web (par exemple example.com/robots.txt) qui indique aux robots…
Bot pour sneakers
Un sneaker bot est un logiciel automatisé conçu pour acheter des sneakers en édition limitée (ou d'autres articles en stock…
Aucun terme du glossaire ne correspond à votre recherche.
Essayez une requête plus courte ou parcourez tout 26 termes.
Faites évoluer votre collecte de données
Commencez à collecter des données en quelques minutes avec 205M+ IP résidentielles réparties dans 195+ pays.