Wer im letzten Jahr Proxys verglichen hat, ist überall auf dieselben drei Bezeichnungen gestoßen: Residential, ISP, Datacenter. Die Labels sind so geläufig, dass die meisten Teams eine Kategorie auswählen und weitermachen. Die technischen Grundlagen dahinter sind weniger bekannt, und genau dort liegt der Ursprung der meisten Produktionsprobleme.
Dies ist ein Überblick darüber, was eine IP-Adresse tatsächlich ist, welche Informationen Zielseiten daraus auslesen und warum “Residential” eher einem Spektrum als einer binären Klassifikation entspricht.
Was eine IP-Adresse tatsächlich darstellt
Eine IP-Adresse ist eine Routing-Nummer. Sie verweist auf eine Netzwerkschnittstelle auf einem mit dem öffentlichen Internet verbundenen Rechner. Das ist die vollständige funktionale Definition.
Alles andere, die Unterscheidung zwischen Residential und Datacenter, die geografische Zuordnung, der “Ruf” der IP, sind Metadaten, die von externen Parteien hinzugefügt werden. Die IP selbst enthält nichts davon. Diese Informationen werden in Datenbanken nachgeschlagen, die aussagen: “Diese IP gehört zu Netzwerk X, das Unternehmen Y gehört, das die Datenbank als Typ Z klassifiziert hat.”
Die zwei wichtigsten Metadaten-Elemente sind:
ASN (Autonomous System Number). Jeder IP-Adressblock im Internet ist einem ASN zugeordnet. ASNs gehören Organisationen: Comcast (AS7922), Verizon (AS701), Cloudflare (AS13335), Amazon AWS (AS16509). Wenn eine Zielseite eine Anfrage erhält, schlägt ihre Anti-Bot-Schicht als erstes den ASN der Quell-IP nach und prüft, welche Art von Organisation ihn besitzt.
Geolokalisierung. Eine separate Datenbank (MaxMind GeoIP2, IP2Location, hauseigene Äquivalente) ordnet IP-Blöcke geografischen Koordinaten zu. Die Genauigkeit reicht von Länderebene (sehr zuverlässig) über Stadtebene (weitgehend zuverlässig) bis zur Straßenebene (weitgehend fiktiv). Die Seite nutzt diese Daten, um den angeblichen Standort des Besuchers zu bestimmen, die Währung für Preisanzeigen festzulegen und lokale Ergebnisse anzuzeigen.
Beide sind externe Datenbanken. Die IP weiß nicht, in welchem Land sie sich befindet. Die IP weiß nicht, wem sie gehört. Alle lesen aus denselben Anbieter-Datenbanken, und diese Anbieter sind gelegentlich nicht einer Meinung.
Die drei IP-Kategorien, technisch erklärt
Nun zu den Bezeichnungen.
Datacenter-IPs. Der ASN gehört einem Hosting-Anbieter: AWS, GCP, Azure, OVH, Digital Ocean, Hetzner. Der IP-Block ist in den wichtigsten Reputationsdatenbanken als “Hosting” eingetragen. Die Geolokalisierung verweist auf den Standort des Rechenzentrums. Diese IPs sind günstig zu beschaffen und haben nahezu keine Residential-Reputation, weshalb Zielseiten mit aktiven Abwehrmechanismen sie standardmäßig mit hohem Misstrauen behandeln.
Residential-IPs. Der ASN gehört einem Consumer-ISP: Comcast, Spectrum, Deutsche Telekom, BT, Free, NTT sowie Tausenden regionaler Anbieter. Der IP-Block ist in den Reputationsdatenbanken als “Residential” oder “Consumer” eingetragen. Die Geolokalisierung verweist auf das Haushaltsgebiet, das der ISP versorgt. Mit diesen IPs ist jahrelanges “echtes Verbraucher”-Verhalten verknüpft (jemand in diesem Haushalt streamt Netflix, surft auf Twitter, spielt Steam), sodass die Reputationsdatenbanken einen positiven Ausgangswert für sie haben.
ISP-IPs. Der ASN gehört einem Consumer-ISP, aber der tatsächliche Rechner, über den der Traffic ausgeht, steht in einem Rechenzentrum. Der ISP hat einen Teil seines Adressraums einem Colocation-Kunden zugewiesen, der den Traffic darüber leitet. Die ASN-Abfrage ergibt “Residential-ISP”. Die Reputationsdatenbanken sagen “Residential”. Der Traffic bewegt sich mit Datacenter-Geschwindigkeit. Das ist die Kategorie “ISP-Proxy”, und sie existiert genau deshalb, weil die Anti-Bot-Entscheidungen von Zielseiten auf Basis der ASN-Abfrage getroffen werden, nicht auf Basis der tatsächlichen Hosting-Realität.
Die Bezeichnungen lügen nicht. Sie entsprechen echten, beobachtbaren Unterschieden in den Ergebnissen der vorgelagerten Abfragen. Sie bilden jedoch nicht ab, “wo sich der physische Rechner befindet”, und Zielseiten prüfen das in der Regel auch nicht.
Was die Zielseite liest, Schritt für Schritt
Wenn eine Anfrage auf einer geschützten Seite eingeht, durchläuft die Anti-Bot-Schicht typischerweise diese Abfolge:
1. ASN-Abfrage. Die Quell-IP wird in einer ASN-Datenbank nachgeschlagen. Ergebnis: Name des besitzenden Netzwerks und seine Klassifikation (Residential / Hosting / Business / Mobile / Unbekannt).
2. IP-Reputationsabfrage. Die Quell-IP wird mit einer Reputationsdatenbank abgeglichen, die Signale aus dem gesamten Web aggregiert. War diese IP an Credential-Stuffing beteiligt? Kommentar-Spam? Scraping? Der Reputationswert ist IP-spezifisch und wird durch Daten von Seiten gespeist, die Signale teilen (Cloudflare betreibt den größten Pool; kleinere Anbieter beziehen Daten daraus oder kaufen sie bei Spezialisten).
3. Geolokalisierungsabfrage. Die Quell-IP wird einem Land, oft einer Stadt, zugeordnet. Die Seite nutzt dies zur Lokalisierung der Antwort (Preise, Sprache, regulatorische Hinweise, verfügbare Produkte).
4. Fingerprint-Prüfung. Diese ist unabhängig von der IP, wird aber parallel durchgeführt. Der User-Agent der Anfrage, die TLS-Handshake-Reihenfolge (JA3/JA4) und vom Browser ausgesendete Signale (Canvas, Schriftarten, WebGL) werden alle erfasst und mit bekannten Bot-Fingerprints verglichen.
5. Verhaltenshistorie. Wenn die Sitzung Kontinuität aufweist (Cookies, Fingerprint-Übereinstimmung über mehrere Anfragen), analysiert die Seite das Muster über mehrere Anfragen hinweg. Wie viele Seiten pro Minute? Wie natürlich ist der Klick-Rhythmus? Hat der Besucher gescrollt? Hat er mit der Maus gehovt?
Eine saubere Residential-IP besteht die Schritte 1, 2 und 3 problemlos. Die Seite sieht “Comcast, Residential, US-East, neutrale Reputation” und liefert die echte Seite aus. Die Fingerprint- und Verhaltensüberprüfungen finden statt, aber der Ausgangswert ist deutlich nachsichtiger als bei einer Datacenter-IP.
Eine Datacenter-IP löst sofort Misstrauen in Schritt 1 aus. Die Seite kann bereits eine degradierte Version ausliefern, blockieren oder ein CAPTCHA einblenden, bevor sie den Anfrage-Body überhaupt liest.
Eine ISP-IP sieht auf ASN-Ebene identisch mit einer Residential-IP aus und besteht Schritt 1 auf dieselbe Weise. Reputationsdatenbanken erkennen sie manchmal (einige Spezialisten stellen fest, dass “dieser IP-Block Anfragen mit sehr unmenschlichen Timing-Mustern gehostet hat”), aber die meisten klassifizieren sie weiterhin als Residential.
Warum “Residential” nicht ausreicht
Ein Residential-ASN bringt Sie durch das Eingangstor. Er garantiert nichts darüber hinaus.
Was die Seite auf einer Residential-IP noch sehen kann:
- Anfragevolumen pro IP. Eine Residential-IP, die 500 Anfragen pro Minute an die Produktseiten der Website stellt, entspricht nicht dem Bild eines “Haushaltsbesuchers”. Selbst mit einem sauberen ASN ist die Rate allein ein Signal.
- TLS-Fingerprint. Echte Browser erzeugen spezifische TLS-Cipher-Reihenfolgen, Erweiterungslisten und ALPN-Werte. Ein Scraper, der Pythons
requests-Bibliothek verwendet, erzeugt einen anderen TLS-Fingerprint, der seit Jahren katalogisiert und erkannt wird. Residential-ASN + Python-TLS = offensichtlicher Bot. - Header-Anomalien. Echte Browser senden Dutzende von Headern in einer bestimmten Reihenfolge mit bestimmten Werten. Ein fehlendes Accept-Language, ein nicht übereinstimmendes Sec-Ch-Ua, eine Reihenfolge, die nicht der tatsächlichen Ausgabe von Chrome entspricht, sind allesamt Signale.
- Verhaltenssignatur. Echte Besucher hovern, scrollen, verlassen die Seite und kehren zurück. Bots navigieren geradlinig durch Seiten. Seiten pro Sitzung, Verweildauer, das Vorhandensein oder Fehlen von Mausereignissen werden alle gemessen.
Ein Scraper, der auf einer Residential-IP läuft, ohne eines der oben genannten Punkte zu berücksichtigen, wird früher oder später klassifiziert. Die IP kauft nur Zeit, keine Unsichtbarkeit. Die Teams, die bei der dauerhaften Datenerfassung erfolgreich sind, investieren auch in den Rest des Stacks: realistische User-Agents, gehärtete Headless-Browser, vernünftige Anfrage-Rhythmen und plausible Sitzungsverläufe.
Was das für die Wahl eines Netzwerks bedeutet
Einige praktische Schlussfolgerungen:
Poolgröße ist ein Signal, nicht das einzige. Ein Pool mit 200 Millionen Residential-IPs bietet mehr Austauschmöglichkeiten, wenn einzelne IPs gesperrt werden. Das macht jede einzelne IP nicht schwerer erkennbar. Genauso wichtig ist die Fähigkeit des Netzwerks, gesperrte IPs auszutauschen, frische nachzuführen und dabei ASN- und geografische Vielfalt aufrechtzuerhalten.
Die Herkunft der IPs ist wichtiger, als Käufer meist erkennen. IPs, die durch transparente Opt-in-Vereinbarungen mit zustimmenden Nutzern bezogen werden, verhalten sich im Netzwerk eher wie echter Consumer-Traffic (weil sie es zeitweise tatsächlich sind). IPs aus weniger transparenten Quellen haben oft Verhaltens-Fingerprints, die Anti-Bot-Systeme gezielt gelernt haben zu erkennen.
Das richtige Netzwerk für eine Aufgabe ist nicht das richtige für eine andere. Eine Fan-out-Scraping-Pipeline gegen tolerante Ziele profitiert von einem riesigen Pool mit Rotation pro Anfrage. Ein langlebiger Account-Management-Workflow benötigt feste ISP-IPs mit Session-Persistenz. Ein KI-Agent, der mehrstufiges Browsing durchführt, benötigt sticky Residential-Sessions pro Durchlauf. Ein einzelnes “bestes” Netzwerk zu wählen ist der falsche Ansatz.
Die IP ist eines von vielen Signalen. Selbst eine perfekte Residential-IP kann dazu führen, dass eine Anfrage blockiert wird, wenn die Anfrage selbst roboterhaft wirkt. Umgekehrt kann eine weniger perfekte IP erfolgreich sein, wenn die umgebende Anfrage plausibel gestaltet ist. Die IP-Schicht ist notwendig, aber nicht hinreichend.
Das Fazit
Bei der Auswahl eines Residential-Proxy-Netzwerks lautet die Frage nicht “Ist es Residential” (die IPs jedes seriösen Netzwerks sind per ASN Residential). Die Fragen lauten:
- Wie bezieht das Netzwerk seine IPs?
- Wie schnell werden gesperrte IPs ausgetauscht?
- Wie geografisch und ASN-mäßig divers ist der Pool?
- Wie gut erhält das Gateway den Sitzungsstatus, wenn er benötigt wird?
- Wie sieht die Anfrage aus, wenn sie das Gateway verlässt?
Das sind beantwortbare Fragen, und die Antworten sind wichtiger als die Poolgröße in der Überschrift. Die technischen Grundlagen hinter dem Label “Residential” sind der Ort, an dem die tatsächliche Qualität liegt und das tatsächliche Produktionsverhalten bestimmt wird.