SEO in der Praxis
Expertenwissen zu den Themen Suchmaschinenoptimierung und Suchmaschinenmarketing
 
SEO Blog / ScrapeBox Proxies sammeln

ScrapeBox Proxies sammeln

Geschrieben am von Kay Molkenthin

Bei verschiedenen Aufgaben innerhalb von ScrapeBox ist es ratsam, sogenannte Proxy-Server zu verwenden, um seine Identität - genauer gesagt, seine eigentliche IP-Adresse - zu verschleiern.

Diese Maßnahme dient nicht dazu, die eigene Identität zu verbergen, sondern um den eigenen Rechner nicht in sogenannte Spam- und Blockfallen laufen zu lassen. Dazu später mehr.

Was ist ein Proxy-Server?

Ein Proxy (engl. Stellvertreter) arbeitet als Vermittler in einem Netzwerk. Er nimmt Anfragen auf der einen Seite entgegen, leitet diese unter seiner Adresse weiter an ein Ziel, empfängt die Antwort an seine Adresse und leitet die Antwort an den anfragenden Rechner zurück.

Der eigene Rechner, bzw. seine IP-Adresse, taucht beim angefragten Rechner also nie auf.

Es gibt öffentliche, als auch private Proxy-Server.

affiliate to date - DATA BECKER

Warum einen Proxy verwenden?

Bestimmte Aktionen innerhalb von ScrapeBox veranlassen den eigenen Rechner vielfach bei einer bestimmten Adresse nachzufragen. Sei es beim Harvesten von URLs, indem viele, gleichzeitige Anfragen an Google gestellt werden, als auch beim Posting-Feature von ScrapeBox.

Bekommt ein Anfrageziel mit, dass es häufig innerhalb kurzer Zeiträume von ein und der selben Adresse angefragt wird, landet die anfragende IP schnell auf einer Blacklist. Vielleicht habt ihr das bei Google schon einmal gesehen, wenn ihr bei einer Anfrage plötzlich ein Captcha eingeben müsst.

Um nun genau solche Situationen zu vermeiden, verwendet man Proxies, die man für einen selbst beim Ziel anfragen lässt. Idealerweise verwendet man für jede Anfrage einen eigenen Proxy, bzw. lässt diese aus einem Pool rotieren.

Das Problem der ScrapeBox-Proxies

ScrapeBox bietet zufällig genau solch eine Funktion an, mit der man Proxies sammeln (harvesten) kann.

Diese Funktion ist einerseits natürlich sehr nützlich, birgt aber ein nicht zu unterschätzendes Risiko: ScrapeBox verwendet eine shared Proxy-Liste, das heisst, alle ScrapeBox-User ermitteln ihre Proxies aus den selben Quellen. Man kann zwar so schnell frei verfügbare Proxies sammeln, nur tun das andere ScrapeBox-User auch und lassen ihre Aktionen mit den selben Proxies laufen.

Das heisst, es kann dabei natürlich durchaus vorkommen, dass Proxies aus der ermittelten Liste inzwischen gesperrt sind.

Wenn man diese freien Proxies verwenden möchte, empfehle ich daher dringend, vor jeder Aktion, zu der man Proxies benötigt, diese neu eremitteln zu lassen und mit einer frischen Liste zu arbeiten - der Erfolg der gesamten Aktion hängt maßgeblich von der Verfügbarkeit der Proxies ab!

Proxies mit ScrapeBox sammeln

Um mit ScrapeBox Proxies zu sammeln rufen wir die entsprechende Funktion links unten im Programm auf.

[caption id="attachment_322" align="aligncenter" width="300"]ScrapeBox Proxy-Funktion ScrapeBox Proxy-Funktion[/caption]

In dem Folgedialog wählen wir die Funktion "Harvest Proxies".

[caption id="attachment_323" align="aligncenter" width="300"]ScrapeBox Proxies sammeln ScrapeBox Proxies sammeln[/caption]

Jetzt werden die von ScrapeBox bereitgestellten Proxy-Listen angezeigt, die man an- und abwählen kann. Diese Listen sind fest vorgegeben, man kann jedoch über die Schaltfläche "Add Source" weitere Quellen hinzufügen. Die kann eine Liste aus einer Textdatei oder auch einfach eine URL sein.

[caption id="attachment_326" align="aligncenter" width="300"]ScrapeBox Proxy-Listen ScrapeBox Proxy-Listen[/caption]

Nach einem Klick auf "Start" werden die Proxy-Listen geladen und die Anzahl der jeweils pro Quelle verfügbaren Proxies angezeigt. Hierbei gilt die Regel "je mehr, umso besser". Wie wir nacher sehen werden, ist nur ein Bruchteil der Proxies für uns tatsächlich nutzbar.

[caption id="attachment_329" align="aligncenter" width="300"]ScrapeBox Ergebnisliste Proxies ScrapeBox Ergebnisliste Proxies[/caption]

Mit "OK" werden alle diese Proxies in die Bearbeitungsliste übernommen, wo diese Proxies verschiedenen Tests unterzogen werden können. In diesem Beispiel haben wir rund 4.700 Proxies in der Liste.

[caption id="attachment_330" align="aligncenter" width="300"]ScrapeBox Proxy-Bearbeitungsliste ScrapeBox Proxy-Bearbeitungsliste[/caption]

Diese Tests bestehen aus

  • Verfügbarkeit der Proxies und
  • der Antwortzeit der Anfragen (je kleiner, desto besser).

Über den Button "Test" werden diese Tests durchgeführt. Achtet hierbei auf eure Konfigurationseinstellungen, speziell die gleichzeitigen Verbindungen beim Testen der Proxies (siehe hierzu den Artikel ScrapeBox einrichten).

[caption id="attachment_331" align="aligncenter" width="300"]ScrapeBox Proxy-Tests ScrapeBox Proxy-Tests[/caption]

Wenn die Tests durchgelaufen sind erhalten wir eine Übersicht über die verfügbaren Proxies (passed) und deren Pingzeiten.

Über die Schaltfläche "CleanUp" können wir die Liste jetzt einfach bearbeiten, indem wir alle Proxies rausschmeissen, die den Test nicht bestanden haben (failed) und die eine zu hohe Pingzeit haben. Ich stelle hier maximal 2.000ms ein.

Wie man sehen kann, sind von den ursprünglich rund 4.700 Proxies knapp 150 Stück übrig geblieben. Daran sieht man gut, wie notwendig es ist, regelmäßig frische Proxies zu sammeln.

[caption id="attachment_335" align="aligncenter" width="300"]ScrapeBox Verwendbare Proxies ScrapeBox Verwendbare Proxies[/caption]

Diese bereinigte Proxy-Liste können wir jetzt abspeichern oder direkt in den Proxybereich des Hauptfensters von ScrapeBox übernehmen (Button "Export").

[caption id="attachment_336" align="aligncenter" width="300"]ScrapeBox verwendbare Proxyliste ScrapeBox verwendbare Proxyliste[/caption]

Jetzt wisst ihr, wie man Proxies mit den Bordmitteln von ScrapeBox sammelt.

Wie aber bereits oben erwähnt, haben diese Proxies einen Nachteil, nämlich den, der öffentlichen Verfügbarkeit, so dass diese ebenfalls von anderen genutzt und gegebenenfalls geblockt / blacklisted sein können.

Deshalb hier noch eine Alternative

Private Proxies

Neben den öffentlichen Proxies gibt es als Alternative noch die privaten Proxies. Diese können kostenpflichtig erworben werden und stellen durch die nicht-öffentliche Verfügbarkeit sicher, dass es sich dabei nicht um geblockte Proxies handelt. Diese Proxies sind mit einem Benutzernamen und Passwort geschützt.

Bei den kommerziellen Angeboten hat man in der Regel auch zusätzliche Features, wie Standortwahl, etc.

Update: Deutsche Anbieter findet man in diesem Segment kaum, hier ein deutscher Reseller, sehr schnelle Lieferung, Auswahl der Server-Standorte "Europa" und "USA" und sehr gute Ping-Zeiten:

30 Private Proxies (semi-dedicated) - Laufzeit 1 Monat

Tags: scrapebox, seo, suchmaschinenoptimierung, seo software, archiv



comments powered by Disqus

Suche

SEO Newsletter

Blog Kategorien

Kontakt

Kontaktieren Sie uns

Vertrauen schaffen

Geprüftes Mitglied im Händlerbund

© 2009-2015 seo-in-der-praxis.de