Das Putzlowitsch Test- und SEO-Blog

Meine technische Bilder-Hotlink Abwehrstrategie

Heiße Links

Hotlink Infografik

Martin Mißfeldt vom Tagseo-Blog hat gerade einen Artikel zum leidigen Thema Bilder-Hotlinks veröffentlicht. Dort erklärt er noch einmal recht anschaulich, was Hotlinks sind, wie sie funktionieren und wie Google damit umgeht.

Auch ich habe mich schon öfter mit dem Thema beschäftigt.

Zur technischen „Abwehr“ von Hotlinks gibt es einige Möglichkeiten, die ich im Artikel „Bilderdiebe – was ich dagegen tue“ bereits erläutert habe. Im wesentlichen habe ich das auch so beibehalten, technisch nur etwas verfeinert.

Bilder-Hotlink Abwehr

Ich fahre eine Black-List Strategie, daß heißt, Hotlinks werden nur von bestimmten Domains mit einem Ersatzbild behandelt.

So sieht der entsprechende Code z.Z. in der .htaccess-Datei aus.

# Bilderdieb
RewriteCond	%{HTTP_REFERER}	^https?://(([^\.]+?\.)?([^\.]+?\.)?[^\.]+?)/ [NC]
RewriteRule	.* - [E=DOM_REFERER:%1]
RewriteCond	%{REQUEST_FILENAME} -f
RewriteCond	%{REQUEST_URI}	!^/images/ersatzbild.png$
RewriteRule	\.(jpg|gif|png)$	-	[NC,C]
RewriteCond	%{ENV:DOM_REFERER}	\.tk$ [NC,OR]
RewriteCond	%{ENV:DOM_REFERER}	\.xyz$ [NC,OR]
RewriteCond	%{ENV:DOM_REFERER}	\.cf$ [NC,OR]
RewriteCond	%{ENV:DOM_REFERER}	mydealz\.de$ [NC,OR]
RewriteCond	%{ENV:DOM_REFERER}	example\.com
RewriteRule	.	/images/ersatzbild.png	[T=image/png,L]

Da ich in erster Linie bestimmte Domains (auch TLDs) ausschließen will, extrahiere ich zunächst den Domain-Namen aus dem Referrer und speichere ihn in einer Umgebungsvariable (Zeile 1 und 2).

Nur wenn es das Bild gibt (Zeile 3), es nicht das Ersatzbild ist (Zeile 4) und es überhaupt ein Bild ist (Zeile 5), werden die nachfolgenden Regeln abgearbeitet.

Es folgt die Liste der nicht erlaubten Domains bzw. Top-Level-Domains (TLD). Da der massive Hotlink-Spam zur Zeit vorzugsweise von .tk, .xyz und .cf TLDs kommt, stehen diese in der List. Die Domain mydealz.de habe ich nur zu Testzwecken aufgenommen. So kann ich sehen, ob meine Hotlink-Abwehr funktioniert. :-)

In der letzten Zeile wird dann das Ersatzbild ausgeliefert. Hier wird der Bildtyp auf png geändert, weil mein Ersatzbild ein PNG-Bild ist.

Der Haken an der Sache

Die Sache hat nur einen Haken. Die großen Hotlink-Farmen interessiert es nicht, was da letztendlich für Bilder auf ihren Spam-Seiten angezeigt werden. Ich vermute, daß die Seiten automatisch oder teilautomatisch aus den Bildern der Bildersuchergebnisse erstellt werde. Insofern bringt hier die „Abwehr“ per .htaccess herzlich wenig.

Aber egal, falls dann doch mal jemand auf die Spam-Seite kommt, sieht derjenige wnigstens nicht meine Bilder und es sieht mit dem Ersatzbild zumindet komisch aus. :-)

Hotlinks mit der Google Bildersuche finden

Mit einigen Abfrage-Parametern kann man mit der Google-Bildersuche Hotlinks auf Bilder finden.

Für die Bildersuche ergibt die Kombination

inurl:http://seite-a.de -site:seite-a.de

Treffer mit einem Bild von Seite A, welches nicht auf Seite A zu sehen ist. Das ist bei Hotlinks und Links der Fall.

Man kann aber auch gezielt nach Hotlinks von einer bestimmten Seite suchen:

inurl:http://seite-a.de site:seite-b.de

Damit werden Bilder von Seite A angezeigt, die von Seite B gehotlinkt bzw. gelinkt werden.

Für eine schnellere Übersicht könnte man die Ausgabe auf das alte Layout mit dem Parameter sout=1 erzwingen, zudem liefert die Abfrage in Abhängigkeit von der Sprache und den SafeSearch-Einstellungen bisweilen andere Ergebnisse.

Damit ihr euch die kompliziert Abfrage nicht per Hand zusammenbasteln müßt, habe ich ein Formular mit etwas Javascript drum herum erstellt. Damit kann die Hotlinksuche bequem erstellt werden.

Das Hotlink-Suchformular

Damit das Formular sichtbar ist und funktioniert, muß Javascript aktiviert sein.

In Domain kommt die Ursprungsseite der Bilder, falls es eine Subdomain ist, muß diese mit angegeben werden (z.B. images.seite-a.de).

Bei Weitere Seiten kommen die mit Leerzeichen getrennten Namen von Seiten rein, für die mit (●) ausschließen keine Hotlinks angezeigt werden sollen. Ist (●) einschließen ausgewählt, wird die Logik umgedreht. Es werden dann nur Hotlinks von den angegebenen Seiten angezeigt.

Die Optionen sind selbsterklärend, würde ich sagen.

Auf [Los] gehts los. Es wird ein neues Browserfenster mit der erstellten Google-Suche geöffnet. Falls das Fensteröffnen in den Browsereinstellungen nicht erlaubt ist, kann auch der links eingeblendete Link „Hotlinks finden“ angeklickt werden.

Ich will auch einen wesentlichen Nachteil der inurl:-Suche gegenüber der imagesite:-Suche nicht verschweigen. Die site:– bzw. frühere imagesite:-Abfrage beziehen sich tatsächlich auf den Domainnamen der Seite. Die inurl:-Abfrage ist da, wie der Name auch erwarten läßt, deutlich größzügiger.

Die Abfrage

inurl:http://seite-a.de

findet auch Bilder wie z.B.

http://seite-b.de/screenshot/?s=http://seite-a.de

Das ist natürlich kein Hotlink oder Link zur Ursprungsseite. Aber solche Treffer muß man dann einfach ignorieren.

Und was macht Ihr so gegen Hotlinks, wenn Ihr sie gefunden habt?

5 Kommentare »

Bilder-Hotlink-Spammer werden immer dreister

Bilder Hotlinkfarmen

Die normalen Bilder-Hotlinkfarmen mit den .xyz- und .tk-Domains binden üblicherweise 5 bis 10 Top-Bilder aus der Bildersuche auf ihren Spam-Seiten ein. Manchmal gibt es noch ein bißchen Text dazu, aber das war es dann auch schon.

Etwas anders sieht das im folgenden Beispiel aus.

Bilder-Spam Schokolade (versteckt)

Wenn man über die Google-Bildersuche auf eine Seite wie oben zu sehen kommt, wird man erstmal stutzig.

Gut, das in der Bildersuche angezeigte Bild ist dort nicht mehr zu sehen, es wurde scheinbar auf Grund von Urheberrechtsproblemen entfernt. Dann ist ja alles bestens, könnte man meinen.

Aber denkste, das Bild ist zwar für den Benutzer nicht sichtbar, aber trotzdem noch vorhanden (war es schon immer). Der Google-Bot „sieht“ es auch und Google schickt deshalb die Suchenden zu dieser Hotlink-Spam-Seite, und nicht zur eigentlichen Seite mit dem Bild.

Und es ist nicht nur ein Bild, es sind deren 300, die auf den Seite pro Suchbegriff verhotlinkt werden. Damit der Nutzer sie nicht sieht, sonder nur diesen „Foto auf Antrag des Inhabers der Urheberrechte entfernt“-Blödsinn, befinden sich alle Bilder in einem großen div-Element, das per css mit position:absolut und top:-999999px „unsichtbar“ gemacht wurden.

Nimmt man die css-Positionierung weg, sieht das Ganze so aus:

Bilder-Spam Schokolade

Wobei der Screenshot nur die ersten Bilder zeigt, der „Pearl Crescent Page Saver“ stürzt beim Speichern der ganzen Seite ab. Auch „Full Page Screen Capture“ in Chrome scheitert an der riesiegen Seite mit den vielen Bildern.

Google DMCA-Beschwerdestelle ausgetrickst

Es gibt nicht viele Möglichkeiten, gegen diesen massiv zugenommenen Bilder-Hotlink-Spam vorzugehen.

Man kann bei Google einen Spam-Report erstellen, der aber praktisch gar nicht bewirkt. Man kann die Seiten im Google-Webmasterforum verpetzen und falls Sven das mitbekommt, werden solche Seiten eventuell manuell aus dem Index entfernt.

Oder man reicht eine DMCA-Beschwerde bei Google ein. Dort muß man das Bild beschreiben, eine URL für eine autorisierte Verwendung des Bildes und die URL mit der Urheberrechtsverletzung angeben.

Ich weiß jetzt nicht genau, wie die eingereichten Daten bewertet werden, aber wenn da eine Mensch sitzt und sich die URLs ansieht, wird er den Antrag vermutlich ablehnen, weil er das Bild auf der urheberrechtsverletzenden Seite nicht finden kann.

Erschwerend kommt hinzu, daß die Bearbeitung 10 Tage bis 2 Wochen dauert und bis dahin die Spammer schon längst auf eine neue Domain umgezogen sind. :-(

Dabei wäre die Lösung so einfach.
Google muß einfach aufhören, derartige Hotlinkseiten so gut zu ranken. Der Ranking-Algorithmus der Google-Bildersuche ist zur Zeit krank, schwer krank, würde ich sagen. Ob es noch Hoffnung auf Genesung gibt, ist fraglich.

Weitere Artikel mit Bezug zu diesem:
10 Kommentare »

CMOS (BIOS) Batterie wechseln, Intel Desktop Board DB65AL

PC CMOS-Batterie (BIOS-Batterie)

Normalerweise halten CMOS-Batterien, die die BIOS-Einstellungen auf Mainboards auch bei Stromabschaltung am Leben erhalten, recht lange. Ich mußte bei den PCs, die ich bisher hatte, noch keine dieser BIOS-Batterien wechseln.

Wenn man aber einen Rechner nur gelegentlich nutzt und ihn zudem per Verteiler mit Schalter richtig vom Stromnetz trennt, dann ist die Batterie möglicherweise schon nach ca. 3 Jahren verbraucht. Durch das netzseitige Abschalten wird die Standby-Spannung nicht mehr erzeugt und so muß die BIOS-Batterie die längste Zeit die Versorgung der Einstellungen übernehmen.

Kürzlich stand ein CMOS-Batteriewechsel bei einem Rechner an und da ich ihn auf Grund der räumlichen Entfernung nicht selbst ausführen konnte, habe ich ein kurzes Anleitungs-Video erstellt:

Gewitter Nacht Berlin Köpenick 15 08 2023

Beim Intel Desktop Board DB65AL befindet sich der Batteriehalter nicht wie bei vielen Boards unten oder zwischen den Erweiterungs-Steckplätzen (siehe Bild), sondern oben rechts neben den Speichermodulen. Außerdem ist es keine liegender, sondern ein stehender Batteriehalter.

Benötigte Batterie: CR 2032

Vorher: PC ausschalten und vom Netz trennen

So gehts:
Den oberen Rand der Halterung vorsichtig nach oben/hinten drücken, bis die Batterie zur Seite herausklappt. Nun die Batterie entnehmen und die neue Batterie unten in den Halter einsetzen, so das die Seite mit der Beschriftung nach rechts zeigt. Die CR-2032 oben in die Halterung drücken. Fertig! :-)

Ein Kommentar »

Mit der Google-Bildersuche Schuhe verkaufen – so gehts

Gewinner in der Bildersuche

Im Bidox 53/2015 gibt es einen überraschenden Gewinner.

Bidox-Gewinner KW 53/2015

Noch vor den üblichen .tk-Hotlink-Farmen steht diesmal eine ganz normale DE-Website ganz oben. Das „Aachener Kolloquium Fahrzeug- und Motorentechnik“ hat quasi aus dem Nichts einen Bidox von gut 37 Punkten und damit Platz 42 erreicht. Nicht schlecht, aber irgendwie verdächtig.

Schaut man sich die Suchbegriffe an, für die die Website in der Bildersuche rankt, wird man stutzig: air jordan, jordans, new balance, nike air force, nike air max, nike roshe run, schuhe nike, …

Verkauft das „Aachener Kolloquium“ etwa auch Schuhe?

Nein, die Seite wurde gehackt, wie so einige andere auch. Wenn man in der Bildersuche z.B. nach air max sucht, findet man auch Seiten wie „Engler Umzüge“ und die „Belchen Seilbahn“.

Der Klick auf eines der Bilder-Suchergebnisse führt dann entsprechend per Weiterleitung zu einer Schuhverkaufsseite.

Google-Suche: Aachener Kolloquium (gehackt)

In der normalen Suche warnt Google sogar, daß die Seite möglicherweise gehackt wurde. Diese Warnung wird in der Bildersuche allerdings nicht angezeigt.

Bilder-Hotlinks nutzen

Gehackte Seiten sind natürlich ärgerlich aber der Grund, warum das überhaupt in der Form gemacht wird und so gut funktioniert, ist der Hotlink-Bug im Ranking-Algorithmus der Google-Bildersuche.

Es ist ganz einfach. Man nehme die ersten 10 oder 15 Top-Bilder aus der Google-Bildersuche zu den gewünschten Suchbegriffen, erstelle ein paar Seiten, auf denen diese Bilder per Hotlink eingebunden werden und schon nach wenigen Stunden hat man gaaaanz viele Besucher auf seinen Seiten.

Den Traffic kann man nun per AdSense monetarisieren oder eben auch auf die eigentlichen Verkaufsseiten umleiten.

Der Erfolg ist praktisch garantiert.

Weitere Artikel mit Bezug zu diesem:
Keine Kommentare »

Veränderungen in der Google-Bildersuche – Jahresrückblick 2015

Veränderungen in der Google-Bildersuche

Seit ein paar Tagen kann man hier die Veränderungen in der Google-Bildersuche für die letzten 30 Tage beobachten. Die Veränderungen werden aus den Bilder-Beobachter-Daten (BiBeo) berechnet und beziehen sich nur auf die Bildersuche bei google.de.

Da heute der 1. Dezember ist, Zeit also für einen Jahresrückblick, habe ich mal die Veränderungen über das Jahr monatsweise zusammengestellt:

Bis ungefähr Mitte Juni bewegen sich die Änderungen auf einem eher niedrigen Niveau (unter 100). Einzige Ausnahme ist der 11. Februar mit einen Wert knapp über 150.

Am 17. Juni gibt es einen Anstieg auf über 250, am Tag danach sogar auf über 350. Seitdem liegt das Veränderungsniveau durchschnittlich auf einem höheren Level.

Die Änderung von Mitte Juni war mir als Sommer-Update bereits damals aufgefallen. Was ich da noch nicht erkannt hatte, ist das insgesamt deutlich dynamischere Ranking in der Bildersuche.

„Messen“ statt Schätzen, das Bilder-Beobachter-Wetter

Größerer Ranking-Updates gab es dann erst wieder im November. Diese wären mir auch nicht aufgefallen, hätte nicht Martin Mißfeldt bei Google+ danach gefragt. Nach dem stichprobenartigen Überfliegen der BiBeo-Daten hatte ich zwar das Update vom 4. November, aber nicht das vom 25. erkannt. Das war der Grund, den Bilder-Beobachter-Wetterbericht (BBW) zu berechnen.

Mit dem BBW kann man nur zwar recht gut erkennen, daß es ein Ranking-Update gab, allerdings nicht, was genau verändert wurde. Dazu müßte man sich die Gewinner-/Verlierer-Daten im Detail ansehen und versuchen, Gemeinsamkeiten herauszuarbeiten.

Verlierer der Woche

Im Bidox ist mir diese Woche neben den Bilder-Hotlink-Farmen Vebidoo als großer Verlierer aufgefallen.

bidox: vebidoo.de KW 48/2015

Vebidoo hatte längere Zeit die Bilder unter einem Layer versteckt. Möglicherweise erkennt Google nun solche Tricks und ignoriert einfach derartig eingebundene Bilder. Mittlerweile sind diese Layer bei Vebidoo verschwunden. Mal sehen, ob sich das Ranking erholt.

Nichts genaues weiß man nicht

Was nun genau die Ranking-Änderungen bewirkt hat, läßt sich nicht wirklich sagen. Das bleibt wie so vieles im Bereich der Suchmaschinen nur Spekulation.

Vielleicht hat ja von Euch noch jemand ein paar diesbezügliche Ideen. Falls ja, immer her damit, schreibt es in die Kommentare. :-)

Keine Kommentare »