Das Putzlowitsch Test- und SEO-Blog
Stichwort: Hotlink

Direkte Bild-Aufrufe auf Seite weiterleiten – so gehts

Das Problem

In den letzten Tagen ist die Aufregung ob der neuen Google-Bildersuche recht groß und viele versuchen, einen Ausweg aus den sinkenden Besucherzahlen zu finden.

In der neuen Bildersuche werden die Bilder direkt in Original-Auflösung auf der Ergebnisseite geladen. Der Nutzer hat also wenig Anlaß, die Ursprungsseite zu besuchen.

Google-Bildersuche: Links zu Seite/Bilder

Immerhin gibt es vier Links (grün), die den Benutzer auf die Ursprungsseite mit dem Bild führen. Dazu kommt ein Link direkt zum Bild [Bild ansehen] und indirekt die Möglichkeit, per Rechtsklick und „Grafik anzeigen“ nur das Bild aufzurufen.

Der direkte Link zum Bild bringt allerdings keine Besucher auf die Seite. Daher gibt es die Idee, den direkten Aufruf eines Bildes aus der Bildersuche auf eine Seite mit dem Bild umzuleiten.

Achtung!
Lest bitte vorher die Hinweise von Google zu „Bilder-Cloaking“ und überlegt Euch, ob Ihr das Riskio eingehen wollt.

So gehts

Um zu erkennen, ob jemand von der Bildersuche kommt, kann man den Referrer auswerten. Vereinfacht gesagt, könnte man folgende Regel formulieren:

„Ist die Referrer-Domain google.* und die angeforderte Datei ein Bild (jpeg,png,…), dann leite den Nutzer auf eine Seite mit dem Bild um.“

In der .htaccess könnte das so aussehen:

<IfModule mod_rewrite.c>
RewriteEngine On
RewriteBase /

RewriteCond	%{REQUEST_FILENAME} -f
RewriteCond	%{HTTP_REFERER}	^http(s)?://(www\.)?google [NC]
RewriteRule	\.(jpg|png|gif)$	/redirect.php	[L]
</IfModule>

Zunächst wird Rewrite eingeschaltet und die Basis festgelgt.
Dann wird geprüft, ob es die angeforderte Datei überhaupt gibt und ob der Referrer Google ist. Falls ja und die Datei ein Bild ist, wird das PHP-Skript zur Weiterleitung aufgerufen.

So weit, so gut, nur gibt es noch einige Probleme zu lösen.

Leider wird der Referrer auch gesendet, wenn das Bild als Bild auf der Google-Seite geladen wird. Da soll natürlich keine Weiterleitung erfolgen, weil das im Kontext eines Bilder zu einem Fehler führt. Kann man also unterscheiden, ob das Bild geladen wird oder ein Link auf das Bild aufgerufen wird? Ja, mann kann. Zumindest meistens.

Außerdem wird ein bereits geladenes Bild vom Browser im Cache vorgehalten, was zu unvorhergesehenen Ergebnissen bei der Weiterleitung führen kann. Kann man das verhindern? Ja, man kann.

Meine Problemlösungen

Als technische Basis setze ich einen Apache-Server mit den aktiven Modulen mod_rewrite, mod_headers und mod_setenvif voraus. Wobei das Modul mod_setenvif nicht zwingend erforderlich ist, es macht die Sache aber übersichtlicher:

<IFModule mod_headers.c>
Header	set	 Cache-Control "no-cache, no-store, must-revalidate"	env=NO_CACHE
Header	unset	 Expires	env=NO_CACHE
Header	unset	 Last-Modified	env=NO_CACHE
Header	unset	 ETag	env=NO_CACHE
</IfModule>

<IfModule mod_setenvif.c>
SetEnvIf Accept "text/html"	REQ_HTML=1
SetEnvIf Referer "^https?://(([^\.]+?\.)?([^\.]+?\.)?[^\.]+?)/"	DOM_REFERER=$1
</IfModule>

<IfModule mod_rewrite.c>
RewriteEngine On
RewriteBase /bilder

RewriteCond	%{REQUEST_FILENAME} -f
RewriteRule	\.(jpg|gif|png)$	-	[NC,C]

RewriteCond	%{ENV:DOM_REFERER}	google\.de$ [NC,OR]
RewriteCond	%{ENV:DOM_REFERER}	google\.at$ [NC,OR]
RewriteCond	%{ENV:DOM_REFERER}	google\.ch$ [NC,OR]
RewriteCond	%{ENV:DOM_REFERER}	example\.com
RewriteRule	.*	-	[E=DO_RDR:1,E=NO_CACHE:1]

RewriteCond	%{ENV:REQ_HTML} 1
RewriteCond	%{ENV:DO_RDR} 1
RewriteRule	([^-]+)-([0-9]+)\.(jpg|gif|png)$	/bild-$1-$2.html	[R=302,L]
</IfModule>

Zur Unterscheidung von Bildaufruf (img src=…) und Link verwende ich den Wert von „Accept“ im HTTP-Request-Header. Nach meiner Beobachtung enthält dieses Header-Feld bei Bild-Aufrufen nicht den Typ „text/html“, beim Aufruf von Links, auch zu Bildern, aber schon. Wenn also „text/html“ im Accept-Header zu finden ist, dürfte es sich um den Link zum Bild und nicht um das Laden des Bildes in der Google-Ansicht handeln.

<IfModule mod_setenvif.c>
SetEnvIf Accept "text/html"	REQ_HTML=1
SetEnvIf Referer "^https?://(([^\.]+?\.)?([^\.]+?\.)?[^\.]+?)/"	DOM_REFERER=$1
</IfModule>

Den Accept-Header werte ich in einer SetEnvIf Anweisung aus und setze eine entsprechende Variable, die ich später in den Rewrite-Regeln auswerten kann. Zudem extrahiere ich in dem Block den Domain-Namen aus dem Referer, da ich diesen auch in anderen Rewrite-Regeln benötige.

RewriteCond	%{REQUEST_FILENAME} -f
RewriteRule	\.(jpg|gif|png)$	-	[NC,C]

Mit den Rewrite-Regeln prüfe ich zunächst die Existenz der Datei und über die Datei-Erweiterung, ob ein Bild aufgerufen wird. Falls nicht, wir der zweite Block der Rewrite-Regeln gar nicht erst ausgeführt.

RewriteCond	%{ENV:DOM_REFERER}	google\.de$ [NC,OR]
RewriteCond	%{ENV:DOM_REFERER}	google\.at$ [NC,OR]
RewriteCond	%{ENV:DOM_REFERER}	google\.ch$ [NC,OR]
RewriteCond	%{ENV:DOM_REFERER}	example\.com
RewriteRule	.*	-	[E=DO_RDR:1,E=NO_CACHE:1]

Im zweiten Block wird eine Liste von Referrer-Domains abgearbeitet, für die die Weiterleitung erfolgen soll. In dem Fall sind es die drei Google-Domains, von denen die meisten meiner Besucher kommen (exemple.com ist nur ein Platzhalter). Die Abfrage nach dem Referer kann man natürlich auch anders gestalten. Das hängt halt davon ab, was man damit erreichen will. Hier setze ich mir wieder ein Flag (DO_RDR), das ich später für die Weiterleitung auswerte.

<IFModule mod_headers.c>
Header	set	 Cache-Control "no-cache, no-store, must-revalidate"	env=NO_CACHE
Header	unset	 Expires	env=NO_CACHE
Header	unset	 Last-Modified	env=NO_CACHE
Header	unset	 ETag	env=NO_CACHE
</IfModule>

Außerdem setze ich einen Wert (NO_CACHE), mit dem am Ende geprüft wird, ob das Caching deaktiviert werden soll. Der Block mod_headers steht zwar am Anfang, der Webserver führt diese Anweisungen aber erst ganz zum Schluß aus, kurz bevor die Antwort an den Client gesendet wir. Damit wird das Caching des von Google direkt geladenen Bildes verhinert.

RewriteCond	%{ENV:REQ_HTML} 1
RewriteCond	%{ENV:DO_RDR} 1
RewriteRule	([^-]+)-([0-9]+)\.(jpg|gif|png)$	/bild-$1-$2.html	[R=302,L]

Im dritten Rewrite-Block erfolgt dann die Weiterleitung, falls es sich um einen Link-Request (REQ_HTML) handelt und eine Weiterleitung überhaupt ausgeführt werden soll (DO_RDR).

Wohin weiterleiten?

Ein weiteres Problem kann die eigentliche Weiterleitung sein. Wohin soll die Reise gehen?

Im Beispiel ist das relativ einfach. Die Bilder liegen in einem Unterverzeichnis /bilder/ und der Dateinamen besteht aus Bezeichnung und laufender Nummer. Die Zielseiten mit den Bildern bestehen auch aus Bezeichnung und laufender Nummer. Damit läßt sich schon in der .htaccess Datei die Weiterleitungsregel unmittelbar formulieren.

/bilder/tomaten-7.jpg -> /bild-tomaten-7.html
/bilder/banane-23.jpg -> /bild-banane-23.html
...

Schön, wenn man so eine klare Struktur für seine Bilder hat. Ich habe die leider nicht. :-)

RewriteCond	%{ENV:REQ_HTML} 1
RewriteCond	%{ENV:DO_RDR} 1
RewriteRule	.*	/rdr.php	[L]

Also muß die Weiterleitung z.B. von einem PHP-Skript erledigt werden, in dem man dann praktisch beliebige Weiterleitunsziele adressieren kann.

In WordPress gibt es für die über die Mediathek hochgeladenen Bilder jeweils eine Attachment-Seite. Nun könnte man sich die Informationen zum Weiterleitungsziel aus der WP-Datenbank holen. Aus Performance-Gründen habe ich da einen etwas anderen Weg gewählt.

Für WordPress, wie z.B. hier bei schnurpsel.de, sieht das rdr.php-Skript so aus:

<?php
define( 'THISPATH', dirname(__FILE__) . '/' );
@include( THISPATH.'redir.php' );

function set_404() {
	header( "HTTP/1.0 404 Not Found", true, 404 );
	echo <<<EOT
<!DOCTYPE html>
<html>
<head><title>404 Not Found</title></head>
<body>
<h1>Not Found</h1>
<p>The requested URL was not found on this server.</p>
</body></html>
EOT;
	exit;
}

function set_header( $ctype ) {
	@header( "Content-type: $ctype" );
	@header( 'Cache-Control: no-cache' );
	@header( 'Cache-Control: max-age=0', false ); 
	@header( 'Expires:'.gmdate('D, d M Y H:i:s', 0 ).' GMT' );
}

function redirect( $url, $status = 302 ) {
	@header( 'Cache-Control: no-cache, no-store, must-revalidate' );
	@header( "Location: $url", true, $status );
	exit();
}

$img_uri = urldecode( $_SERVER['REQUEST_URI'] );
$redir_url = $redir_b[$img_uri];

if( !$redir_url && @preg_match( '~(.+?)-(1600|1200)\.(jpg|png|gif)$~', $img_uri, $treffer ) ) {
	$redir_url = $redir_b[$treffer[1].'.'.$treffer[3]];
}

if( $redir_url )
	redirect( $redir_url );
else {
	$img_file = THISPATH.$img_uri;
	$img_size = @getimagesize( $img_file );
	if( $img_size ) {
		set_header( $img_size['mime'] );
		@readfile( $img_file );
		exit;
	}
}
set_404();
?>

Download: rdr.zip

In meinem rdr-Skript includiere ich eine weitere PHP-Datei (redir.php), die nur ein Array mit den Weiterleitungszielen für die Bilder enthält. Falls kein Weiterleitungsziel gefunden wird, gebe ich einfach das Bild selbst aus.

Die redir.php PHP-Datei lasse ich mir von einem Skript durch WordPress erstellen:

<?php
define( 'THISPATH', dirname(__FILE__) . '/' );
define( 'WP_USE_THEMES', false );
define( 'USE_ATTACHMENT_URL', true );

@include( THISPATH.'redir.php' );

require('./wp-blog-header.php');

echo '<pre>';

$args = array( 'post_type' => 'attachment', 'posts_per_page' => -1, 'post_mime_type' => 'image', 'post_parent' => null ); 
$attachments = get_posts( $args );
if ( $attachments ) {
	foreach ( $attachments as $post ) {
		$attachment_url = wp_get_attachment_url( $post->ID );
		$attachment_uri = @parse_url( $attachment_url, PHP_URL_PATH );
		if( USE_ATTACHMENT_URL )
			$page = get_attachment_link( $post->ID );
		else
			$page = get_permalink( $post->post_parent );
		if( $page && $attachment_uri && !$redir_b[$attachment_uri] ) {
			if( strpos( $page, 'attachment_id' ) === false ) {
				$redir_b[$attachment_uri] = $page;
				echo "+ $attachment_uri -> $page\r\n";
			}
			else
				echo "- $attachment_uri -> $page\r\n";
		}
		else
			echo "* $attachment_uri -> $page\r\n";
	}
}

$export_data = "<?php\r\n\$redir_b = ";
$export_data .= var_export( $redir_b, true );
$export_data .= ";\r\n\r\n?>";
file_put_contents( THISPATH.'new_redir.php', $export_data );
echo '</pre>';
?>

Download: get-redir.zip

Mit der Konstante ‚USE_ATTACHMENT_URL‘ wird festgelegt, ob die Weiterleitung auf die Attachment-Seite (true) oder zur Artikel-Seite mit dem Bild (false) erfolgen soll.

Zum Anfang wird die bestehende ‚redir.php‘ geladen. Es werden dann nur Einträge hinzugefügt, die es noch nicht gibt.

Außerdem prüfe ich, ob es die Attachment-Seite wirklich gibt, denn für Bilder ohne Eltern-Seite bzw. Bilder in nicht veröffentlichten Artikeln wird kein Permalink zurückgeliefert, sonder nur die URL mit dem ‚attachment_id‘-Parameter.

Am Ende wird eine neue Datei ’new_redir.php‘ geschrieben, mit der man dann die alte ‚redir.php‘ ersetzen kann.

Folgende Dateien sind an der Methode beteiligt:
/rdr.php
/redir.php
/wp-content/uploads/.htaccess

In der .htaccess-Datei muß die RewriteBase entsprechend angepaßt werden:

RewriteBase /wp-content/upload

Für meine Putzlowitscher Zeitung enthält das Array etwas mehr als 2000 Einträge. Das ergibt eine Dateigröße von ca. 350k. Wer deutlich mehr Bilder in WP verwaltet, muß sich ggf. etwas anderes einfallen lasse.

So ein Array hat aber den Vorteil, daß ich darin auch beliebige, andere Weiterleitungsziele definieren kann.

Noch ein paar Tips und Hinweise

Falls sich alle Eure Bilder in einem Unterverzechnis befinden, bei WordPress z.B. /wp-content/uploads/, dann packt die .htaccess-Datei genau dort rein. Für alle anderen, normalen Seitenaufrufe wird sie dann gar nicht erst abgearbeitet.

Was irgendwie möglich ist, sollte schon in der .htaccess-Datei erledigt werden. Der Aufruf eines Skriptes, eventuell sogar mit Datenbankabfragen, kostet mehr Server-Leistung und verschlechtert die Performance.

Ihr könnt sogar unterscheiden, ob jemand den Button [Bild ansehen] angeklickt oder per Rechtsklick das Bild aufgerufen hat. Beim Rechtsklick wird ggf. vom Browser als Referer die komplette Google-Such-URL übermittelt. Das kann man zur Unterscheidung auswerten, z.B. ob der Parameter tbm=isch im Referer enthalten ist.

Das Speichern mit Rechtsklick auf das Original-Bild in der Bildersuche funktioniert nicht. Es wird die HTML-Seite des Weiterleitungs-Ziels gespeichert. :-)

Ich habe bisher nur mit wenigen Browsern getestet. Bei denen hat es aber funktionert, wie es soll.

Ich übernehme keine Haftung für Schäden, die möglicherweise durch die Umsetzung der hier vorgestellten Methoden entstehen.

12 Kommentare »

Google Bildersuche Wochenrückblick 2016/21

Die Bidox-Aufsteiger der Woche

Bidox-Gewinner 21. KW 2016

Der letzte Google Bildersuche Wochenrückblick liegt schon ein paar Wochen zurück. Das liegt einfach daran, daß in dieser Zeit nicht wirklich etwas Gravierendes in der Bildersuche passiert ist. In der letzten Woche gab es aber doch ein paar wesentliche Änderungen, die einen ersten Schritt von Google gegen den massiven Spam mit Bilder-Hotlink-Farmen darstellen.

Das Ende der Hotlink-Farmen?

Seit einigen Monaten habe ich eine Hotlink-Erkennung am Laufen, die für etwas mehr als 20 Keywords stündlich die Top-100 der Bildersuche untersucht und Hotlinkfarmen aufspürt. Im April sah das Ergebnis z.B. noch so aus:

Hotlink-Farmen am 18.04.2016

Besonders Websites mit den TLDs .tk, .xyx, und .top waren bei den Hotlink-Spammern sehr beliebt. Die tauchten dann auch regelmäßig bei den Wochengewinnern im Bidox auf [1, 2]. Wie dreist die Spammer teilweise dabei vorgehene, hatte ich hier beschrieben.

Seit Mitte letzter Woche hat sich das Bild verändert. In meinem Hotlink-Finder (HLF) tauchen diese Seiten nicht mehr auf und auch im Bidox sind sie nicht bei den Wochengewinnern zu finden (siehe oben).

Hotlink-Farmen am 30.05.2016

Neben den stündlich aktualisierten Daten aus dem Hotlink-Finder habe ich die Hotlink-Erkennung zusätzlich über die täglich für den BiBeo erhobenen Daten laufen lassen. Auch hier werden mir seit einigen Tagen keine klassischen Hotlink-Seiten mehr abgezeigt.

Außerdem habe ich zu Testzwecken selbst mal ein paar .tk-Domains registriert und mit Bilder-Hotlink-Seiten versehen. Diese habe ich in der Google-Search-Console angemeldet um zu sehen, was mit ihnen passiert. Eine manuelle Maßnahme hat es bisher nicht gegeben, allerdings sind die Klicks seit dem 24. Mai deutlich zurückgegangen.

Klicks für die .tk Testseite

Waren es bisher so zwischen 50 und 100 Klicks am Tag, sind es jetzt nur noch 1 bis 2. Den größten „Erfolg“ für die Spamseite gab es übrigens am Muttertag (8. Mai 2016) mit gut 5000 Klicks. :-)

Die üblichen Verdächtigen (.tk, .xyz, .top …) habe also scheinbar mit Hotlink-Farmen keinen Erfolg mehr in der Bildersuche. Aber…

Umstieg auf Free-Hoster und Subdomains

Wie man im Bidox und auch im HLF sieht, feiert dafür nun eine andere Domain große Erfolge. Die Domain hol.es gehört zum Free-Hoster Hostinger, unter der man als Kunde beliebige Subdomains anlegen kann. Das wird nun von den Hotlinkern neuerdings genutzt, um dem Hotlink-Update zu entkommen. Die Subdomains und Websites, die man dort findet, sehen praktisch genau so aus, wie die bisher unter den TLDs .tk und .xyz zu findenden Hotlink-Farmen.

Insofern wundert es mich ein wenig, daß diese Websites nicht vom Google-Hotlink-Update erkannt werden.

Gehackte Seiten mit Hotlinks weiter ein Problem

Der Gewinner der Woche ist mal wieder eine gehackte Seite, über die der Nutzer zu dubiosen Webshops für Schuhe umgeleitet wird (ich berichtetet). Die Website „Festungsflimmern“ ist dafür nur ein Beispiel. Es tummeln sich viel mehr gehackte Seiten bei der Suche nach Nike- oder Adidas-Schuhen in der Google-Bildersuche:

Google Bildersuche: adidas schuhe

Und wenn jetzt wer sagt, daß ja wohl kaum jemand zum Schuhkauf über die Google-Bildersuche geht, dann mag das durchaus sein. Aber auch die Bilderbox in der normalen Google-Suche ist natürlich Spam-verseucht und da werden sicher so einige Schuhsuchende mal auf ein Bild klicken.

Googlesuche: adidas schuhe (Bilderbox)

Leider scheint das Hotlink-Update nicht für gehackte Seiten zu greifen. Aber vielleicht gibt es ja noch ein Update zum Update und alles wird gut.

Bildkopien weiter ein Problem

Die Nummer 3 bei den Wochengewinnern (science-all.com) ist keine Hotlinkfarm, sondern eine Bildkopie-Farm. Unter dem Deckmantel der Traumdeutung und dem Titel „Science for all“ werden dort zu vielen Suchbegriffen die Top-Bilder aus der Bildersuche auf die eigenen Seiten kopiert. Auch dazu hatte ich bereits etwas geschrieben.

Nachdem die Seite in den letzten Woche etwas schwächelte, feiert sie nun wieder fröhlich Erfolg:

Bidox 21/2016: science-all.com

Das dürfte unter anderem daran liegen, daß die Hotlinker aus den Rankings verschwunden sind und nun die Bild-Kopierer deren Plätze in der Bildersuche einnehmen.

Überhaupt werden wohl die Bildkopie-Farmen in nächster Zeit zunehmen. Die technische Umsetzung ist zwar etwas aufwändiger, aber das Konzept insgesamt zukunftssicherer, denn Kopien werden natürlich nicht als Hotlinks erkannt, weil es keine sind. Zudem ist die Einordnung von Bildkopien als Spam oder Nicht-Spam schwieriger, weil der Ursprung der Bilder nicht nachvollziehbar ist.

Für mich ist ein Verdachtsmoment immer der plötzlich hohe Bidox-Wert praktisch aus dem Nichts, aber ob Gooolge auch etwas derartiges erkennen, auswerten und vor allem bewerten kann und will, ist fraglich. Einfach ist es zumindest nicht.

Die Bidox-Verlierer der Woche

Bidox-Verlierer 21. KW 2016

Wo Gewinner sind, gibt es auch Verlierer. Dabei hat es letzte Woche gleich fünf Seiten mit Bildkopien erwischt.

Bildkopien findet man üblicherweise bei Wallpaper-Sites, die nach eigenem bekunden kostenlose und natürlich frei Bilder als Hintergrundbilder zum Download anbieten (1fotonin.com, esciencelog.com, lemerg.com).

Beliebt sind kopierte Bilder auch bei Promi-Seiten (artcreationforever.com) und eine Traumdeutungs-Seite (weknowyourdreamz.com) hat es auch erlegt. Wobei ich hier davon ausgehe, das diese Seiten „Opfer“ von manuellen Maßnahmen wurden.

Die Hotlink-Farm einebinsenweisheit.com mit einem etwas anderen Konzept (Affiliate-Seite), die Besucher über die Bildersuche gezogen hat, dürfte direkt vom Hotlink-Update betroffen sein.

Zwei gehackte Seiten (stover-rennen.de, autogrund.de) gehören auch zu den Verlierern, aber warum die Süddeutschen starke Verluste in der Bildersuche hat, kann ich nicht sagen. Die haben praktisch die Hälft ihrer Sichtbarkeit in der Bildersuche eingebüßt. Was da wohl passiert ist?

Bidox 2016/12: sueddeutsche.de

Google Bildersuche Wochenrückblick 2016/21

Den klassische Hotlink-Farmen wurde wohl der Todesstoß versetzt, wobei das Update aus welchen Gründen auch immer, nicht für alle Seiten zu wirken scheint. Gehackten Seiten mit Bilder-Hotlinks sind weiterhin ein großes Problem. Auch ist mit der Zunahme von Bildkopie-Farmen zu rechnen. Ob und wann Google das dann in den Griff bekommt, wird man sehen.

Und hier noch der Blick auf das Bildersuche-Wetter :-)

Bewegung in der Bildersuche 2016/05/29

0 Kommentare »

Google Bildersuche Wochenrückblick 2016/13

Herzlichen Glückwunsch

Google-Bildersuche: birthday (04.04.2016)

So sieht das Ergebnis der Google-Bildersuche nach birthday im Moment aus. Stolze sieben der ersten acht Bilder sind von Hotlink-Farmen verspammt worden.

Gut zu erkennen ist, daß sich der der Trend der letzten Woche fortgesetzt hat. Die .tk-Domains sind bei den Spammern out, .win und .xyz-Domains sind in. Eine Frage, die mich schon länger beschäftigt: Wofür steht dieses .win eigentlich?

Ich hatte da immer win -> Windows im Hinterkopf, aber laut .win-Registrar geht es um Spiele, vorzugsweise Online-Games und das win steht für gewinnen.

Insofern bekommt die Sache durch Hotlink-Spamseiten eine weitere Bedeutung, die weniger mit Spielen, sondern vielmehr mit den finanziellen Gewinnen zu tun hat, die diese Websites wohl einstreichen dürften.

Die .tk-Domains gibt es zwar für lau, aber auch .win, .xyz und weitere, neue TLDs kann man für weniger als einen Dollar z.B. bei Namecheap registrieren. Mit dem im Preis enthaltenen WhoisGuard bleibt man selbst unerkannt im Hinteregrund, ideal für jede Art von Spam-Aktivität.

Irgendwie hatte ich gehofft und es sah zwischenzeitlich fast so aus, daß Google den Bilder-Hotlink-Spam etwas besser in den Griff bekommen würde. Zur Zeit sieht es aber eher nicht danach aus und so muß ich weiter meine täglichen Spam-Reports verschicken.

Update des Keyword-Sets im bidox

Google-Trends am 4. April 2016 – DE, 12 Monate, Bildersuche

Da ein neues Quartal begonnen hat, wurde das Keywordset für den Bilder-Domain-Index Bidox angepaßt. Das Keywordset wird aus den als CSV-Datei pro Kategorie verfügbaren beliebtesten Suchanfragen bei Google-Trends für die Bildersuche in Deutschland der letzten 12 Monate erstellt.

In den letzten Quartalen hatte sich die Anzahl der Keywords im Bereich von 4000 bis 6000 bewegt. Mit dem jüngsten Update ist die Anzahl auf über 11000 gestiegen.

Der Bidox-Wert wird zwar auf die Anzahl der Keywords normiert, so daß die Werte zu denen der vorhergehenden Wochen auch nach der Anapssung vergleichbar bleiben. Es könne aber doch anpassungsbedingte Verschiebungen auftreten.

bidox KW 13/2016: zimbio.com und listal.com

Im aktuellen Bidox zählen zwei Seiten (zimbio.com und listal.com) zu den Gewinnern, die mit vielen Bildern von prominenten Personen Ranken. Mit dem Update des Keyword-Sets sind scheinbar viele Namen von Promis hinzu gekommen. Nach dem ersten Überfliegen der neuen Keywords sind mir auch einige Suchbegriffe zu militärische Dingen wie Flugzeuge (f 16, f 22, f 35, f-16, f-22, f-35, f14, f15, f150 raptor, f18, f22 raptor) aufgefallen.

So etwas führt zu einer veränderten, inhaltlichen Gewichtung und damit zu größeren Rankingverschiebungen im Bidox.

Mehr Bewegung

Bewegung in der Bildersuche 2016/04/03

Am Wochenende gab es etwas mehr Bewegung in der Bildersuche als im Verlauf der eher ruhigen Woche von Montag bis Donnerstag. Allerdings läßt sich nicht wirklich sagen, was der Grund dafür sein könnte. Dazu wäre eine tiefergehende Untersuchung der Ranking-Veränderungen notwendig. Hat jemand von Euch etwas bei den Bilderzugriffen und Besuchern über die Bildersuche bemerkt?

Google Bildersuche Wochenrückblick 2016/13

Die klassischen Hotlink-Farmen sind weiter gut im Rennen, besonder die Billig-Domains .xyz und .win sind sehr beliebt und funktionieren immer noch bestens. Gehackten Seiten sind weiterhin ein Problem, auch wenn ich das oben nicht extra erwähnt habe. Es hat sich daran ja nichts beändert.

Die aktuellen Bidox-Werte sind mit einer gewissen Vorsicht zu betrachten, da sich das Keyword-Set erheblich verändert hat.

0 Kommentare »

Google Bildersuche Wochenrückblick 2016/12

Die Bidox-Aufsteiger der Woche

bidox Gewinner KW 12/2016

Der Google Bildersuche Wochenrückblick 2016/11 fehlt, weil ich im Osterurlaub war. In der letzten Woche haben wieder einige, klassische Hotlink-Farmen ordentlich zugeschlagen und die gehackten Seiten teilweise deutlich hinter sich gelassen.

Wie schnelllebig das Geschäft mit den Bilder-Hotlinks ist sieht man daran, daß Spitzenreiter bilder.press schon nicht mehr existiert (vom Provider gesperrt). Der Einstieg von 0 auf über 100 Bidox-Punkte ist allerdings respektabel gewesen, in den letzten Wochen schafften es die Hotlinker meist nur auf 25 bis 30 Punkte.

Aber selbst wenn eine Hotlink-Farm nur für kurze Zeit überlebt, stehen schon die nächsten in den Startlöchern. „Nachfolger“ von bilder.press sind z.B. bilder2016.win und bday1.win:

Im nächsten Bidox werden die beiden Websites aber nicht mehr auftauchen, denn die Ranking-Daten werden am Samstag und Sonntag erfaßt. Bestenfalls wird man die Nachfolger von den Nachfolgern sehen.

Ostern – ein lukratives Geschäft auch für Hotlinker

Ostern Hotlink-Websites 2016

Die Liste zeigt eine Auswahl von Hotlink-Farmen, die sich teilweise ganz auf Ostern spezialisiert haben. Deshalb tauchen sie auch nicht im Bidox bei den Gewinnern auf. Im Bidox findet man nur vier Keywords mit direktem Bezug zu Ostern (frohe ostern, osterhase, ostern, ostern 2015).

Google-Bildersuche: osterhase KW 12/2016

Die Website ostern.xyz/ostern3.xyz hat zwar 5 Rankings in der Top-10, kommt aber insgesamt nur auf 1,7 Bidox-Punkte und rangiert damit „unter ferner liefen“. Ungeachtet dessen ist so ein ereignisoptimiertes Ranking gut und gerne für 10000 bis 20000 Klicks oder mehr am Tag gut, was über die Werbung Tageseinnahmen von einigen hundert Euro ermöglichen dürfte.

Was gab es sonst noch in der Bildersuche?

Auch ein paar gehackte Seiten mit nachgeschalteten Schuh-Shops sind wieder bei den Gewinnern (knueppelknifte.de) und Verlierern (arminia-stuttgart.de, maxflair.de) der Woche dabei. Und die Bildkopierer wie science-all.com steigen weiter auf:

Bidox KW 12/2016: science-all.com

Die Website hatte ich vor zwei Wochen bereits erwähnt. Hier werden Bildkopien unter dem Deckmantel „Traumdeutung“ verwendet. Da Kopien von gut rankenden Bildern genau wie Hotlinks die Bilder in der Bildersuche „übernehmen“ kommt der weitere Aufstieg nicht überraschend.

Google Bildersuche Wochenrückblick 2016/12

Die klassischen Hotlink-Farmen haben wieder zugelegt, Ostern ist ein gutes Geschäft für Hotlinker, Bildkopierer gewinnen dazu und die gehackten Seiten sind weiterhin ein Problem.

Bis auf einen stärkeren Ausschlag am 26. März war es insgesamt aber eher ruhig in der Google-Bildersuche.

Bewegung in der Bildersuche 2016/03/28

0 Kommentare »

Google Bildersuche Wochenrückblick 2016/10

Die Bidox-Aufsteiger der Woche

bidox Gewinner KW 10/2016

Wie in der vorigen Woche ist der Gewinner im Bidox leider eine gehackte Website, der viele Seiten mit viele verhotlinkten Bildern zum Thema Schuhe untergeschoben wurden. Betroffen ist diesmal arminia-stuttgart.de, wobei ich hier zunächst an einen Sportverein dachte. Es handelt sich aber um die Seite der „Stuttgarter Burschenschaft Arminia“.

Klickt man auf ein Suchergebnis, z.B. für „air max“, landet man aber nicht bei der Burschenschaft, sondern per Weiterleitung auf einer Shop-Seite. Ich habe mir die Seite mal angesehen:

Shoes we buy – Xmas-Special

Gut, wir haben zwar Mitte März, aber ein Xmas-Special mit 80% Rabatt sollte man sich nicht entgehen lassen. Hmmm, oder ist das bereits für das kommende Weihnachtsfest gedacht? Aber dann sollte es nicht schon bald enden. Egal, Rabatt ist Rabatt.

Prima ist auch der weltweite, kostenlose Versand in alle Länder. Die Versandkosten nach Deutschland können ja ganz schön hoch sein, besonders aus …, tja, woher kommt die Ware eigentlich? Ist aber auch egal, aus welchem Land der Shop versendet, denn es kostet ja nix.

Auch sehr schön, ich kann im Shop Deutsch und viele andere Sprachen auswählen. Na gut, die Texte sind zwar manchmal etwas komisch formuliert, aber man kann verstehen, was gemeint ist, zumindest fast immer.

Shoes we buy – ganz sicher

Daß der Shop wirklich gut sein muß, sieht man am Ende der Seite. Alle wichtigen Zahlungsmethoden werden angeboten und außerdem ist alles selbstverständlich vollkommen sicher, wie die Siegel von „PayPal Verfied“, „McAfee Secure“, „Trustwave“ und „VeriSign Trusted“ beweisen. Etwas seltsam ist nur, das der Bestell-Prozeß unverschlüsselt läuft. Aber das wird schon seine Richtigkeit haben, die Siegel zeigen es ja.

Shoes we buy – Western-Union Rabatt

Der Knüller ist aber, daß es nochmal 5% bis 10% Rabatt gibt, wenn ich über „Western Union“ bezahle. Mit dem Xmas-Rabatt und ohne Versandkosten bekomme ich die Schuhe praktisch geschenkt. :-)

Noch mehr Bilder-Spam mit gehackten Seiten

Schaut man sich die Suchergebnisse für ein paar dieser Suchanfragen (z.B. roshe run damen) an, fallen wieder weitere Domains auf, die normlaerweise keine Nikes und Pumas verkaufen:

Google-Bildersuche: roshe run damen

Die Seite gitarre-hersbruck.de hatte ich bereits letzte Woche erwähnt. Neu sind nun bunteshaus-freiberg.de und schwarzachtalseen.de und es gibt bestimmt noch mehr. Bei diesen Seiten wird man auf andere Shops weitergeleitet.

Bei einem, der sich einen höchstoffiziellen Anstrich gibt, sieht der Anfang der FAQ so aus:

nikeonlinech.com – FAQ

Mal abgesehen vom durch die automatische Übersetzung holprigen Deutsch ist es schon seltsam, daß als erste die Frage beantwortet wird, ob der Shop legitim bzw. legal ist. Welcher richtig Onlineshop würde so etwas in die FAQ schreiben?

Weniger klassische Hotlink-Farmen

Auch diese Woche hält sich der klassische Hotlink-Spam in Grenzen. Nur zwei .xyz-Domains zählen im Bidox zu den Gewinnern der Woche. Dazu kommt noch techimageslive.com und ganz neu dabei ist die Top-Level-Domain .press mit der Seite deu.press. Allerdings sind die bereits auf die neue Domain 874.press umgezogen.

Auf Platz 7 bei den Aufsteigern findet man waterige.com, konkret mit der Subdomain schnappchen.waterige.com, die auch mit Hotlinks arbeiten:

waterige.com – Hotlinks

Allerdings sind die Bilder nicht auf der Landingpage zu sehen. Dort werden zwar auch Bilder angezeigt, das sind aber alles amazon-Produktbilder mit den entsprechenden Partner-Links zur Monetarisierung. Ich habe die Bilder aus der Google-Bildersuche auch nicht im Quelltext der Seite gefunden. Scheinbar wird dort mit Cloaking gearbeitet, daß heißt, dem Google-Bot wird etwas anderes gezeigt, als dem Nutzer.

Mehr Bild-Kopierer

Vorige Woche hatte ich schon etwas über die „Traumdeutungs-Seiten“ geschrieben, die Biler nicht hotlinken, sondern kopieren. Nach Verlusten in KW 09/2016 gehört weknowyourdreamz.com aktuell wieder zu den Gewinnern. Es sind aber noch zwei weitere Seiten hinzugekommen, die weknowyourdreamz.com sehr ähnlich sehen.

Bei science-all.com vermutet man erstmal nichts Böses, Wissenschaft klingt seriös. Aber auch hier findet man eine Hotlink-Seite nach dem Modell der Traumdeuter:

science-all.com – Traumdeutung und Bilderspam

Eine weitere Seite mit dem selben Geschäftmodell ist artcreationforever.com, zwar keine Traumdeutung, aber mit Promis kann man auch gut Traffic aus der Bildersuche ziehen:

artcreationforever.com – Dakota Fanning Biography

Gut zu erkennen ist der grundsätzlich gleiche Aufbau wie auch bei weknowyourdreamz.com:
Werbeblock, 4 Bilder, Werbeblock, 4 Bilder, Text

Wenig überraschend liegen all drei Domains beim selben Webhoster, haben die selbe IP-Adresse und sind unter dem selben Namen einer Person in Rußland registriert.

Da wird wohl in nächster Zeit noch so einiges auf uns zukommen.

Google Bildersuche Wochenrückblick 2016/10

Weniger klassische Hotlink-Farmen, dafür mehr Bildkopierer gab es in der letzten Woche in der Google-Bildersuche. Die gehackten Seiten sind weiterhin ein großes Problem.

Insgesamt war es aber eher ruhig, gewissermaßen alles im grünen Bereich:

Bewegung in der Bildersuche 2016/03/13

Und ja, Verlierer gab es auch, aber da habe ich jetzt keinen Bock mehr, etwas dazu zu schreiben. :-)

0 Kommentare »

Google Bildersuche Wochenrückblick 2016/09

Die Bidox-Aufsteiger der Woche

bidox Gewinner KW 09/2016

Was sofort auffällt, es gibt nur eine der üblichen .tk/.xyz-Spam-Domains bei den Wochengewinnern. Da es stramm auf Ostern zugeht, waren Domains wie easter2016.tk zu erwarten gewesen. Bis Ostern wird die Website nicht überleben, würde ich sagen. Aber es gibt ja noch viele andere freie .tk-Domains.

Der Aufsteiger der Woche ist allerdings gera-ident.de, ein mittelständisches Unternehmen auf dem Gebiet von Identifikationsprodukten und –lösungen (passive HF- und UHF-RFID).

Bidox 2016/09: gera-ident.de

Von 0 auf gut 22 Bidox-Punkte, das ist ein steiler Aufstieg, der aber bei mir die Alarmglocken klingeln läßt. Und tatsächlich haben sie es nicht mit ihren eigenen Bildern so weit gebracht.

Die Website wurde gehackt, die untergeschobenen Seiten verlinken viele Bilder zu Suchbegriffen wie air jordan, jordans, new balance, nike air force, nike air max, nike roshe run, schuhe nike, … und ranken damit in der Bildersuche. Klickt man auf eines der Suchergebnisse, wird man zu einem Verkaufsseite weitergeleitet.

Bidox 2016/09: gera-ident.de (Rankings Platz 1)

Bilderspam auf gehackten Seiten

Neu ist das Problem nicht, bereis 2011 und Anfang des Jahres hatte ich darüber berichtet. Wobei die gehackten Websites 2011 vorzugsweise zur Verbreitung von Schadsoftware genutzt wurden.

Gut, daß Seiten gehackt werden, ist erstmal nicht das Problem von Google. Würde Google in der Bildersuche aber nicht immer noch die Hotlink-Sites so gut ranken, würde das Konzept der Hacker/Spammer nicht aufgehen und an Attrakrivität verlieren.

Schaut man sich die Suchergebnisse zu den Schuh-Keywords an, tauchen auch weitere Domains auf (z.B. feuerwehr-todtnau.de, zentralmoschee-koeln.de, gitarre-hersbruck.de), auf deren Seiten wohl eigentlich keine Nikes verkauft werden sollen.

Seltsam finde ich auch pferdeversicherungen-kagel.de und australien-spezi.de, obwohl es dort keine Hotlinks sind. Die Bilder liegen auf der selben Domain, wie die Seiten. Wurde hier die komplette Domain „übernommen“ oder sind es expired Domains, die jetzt anders genutzt werden? Gegen letzteres sprechen die DENIC-Einträge der Domaininhaber, die erstmal unverdächtig aussehen.

Aufsteiger fotocommunity.de

Bidox 2016/09: fotocommunity.de

Wie man sieht, ist die Fotocommunity kein wirklicher Aufsteiger. Es wurden nur die Verluste der vorletzten Woche zumindest zum Teil ausgeglichen. Was ganau passiert war, kann ich nicht sagen. Vielleicht gab es ein technisches Prolem.

Die Bidox-Absteiger der Woche

bidox Verlierer KW 09/2016

Wo Gewinner sind, gibt es auch Verlierer. So haben drei der .xyz-Spam-Seiten alle Rankings (also 100%) verloren. Gut so.

Auf den Plätzen 4 bis 6 folgen drei gehackte Seiten mit den schon oben erwähnten Schuh-Bildern. Für diese Seiten gibt es noch ein paar Rankings. Immerhin hat rekers-beton.de soger zwei eigene Bilder zum Suchbegriff terrassenplatten in der Bildersuche (Platz 21 und 62), die auch weiterhin bestehenn bleiben dürften.

Bidox 2016/09: belchen-seilbahn.de

Erschreckend ist, wie lange sich belchen-seilbahn.de mit den gehackten Seiten in der Bildersuche gehalten hat, ganz 10 Wochen. Ich hatte sie schon in meinem Artikel von Anfang des Jahres erwähnt.

Google zeigt diese Seiten in der normalen Suche als „möglicherweise gehackt“ an. Bekommt man darüber ein Meldung in den Webmaster-Tools? Nur wenn die Seiten gar nicht bei den WMT angemeldet sind…

Sollte ich dann besser die Seitenbetreiber informieren, wenn ich solche gehackten Seiten entdecke?

Absteiger weknowyourdreamz.com

Auf den ersten Blick sieht die Seite unverdächtig aus. Aber sie hat schon eine Vorgeschichte, denn es ist die Reinkarnation von weknowyourdreams.com, nun mit z an Stelle von s am Ende.

Bidox 2016/09: weknowyourdreamz.com

Nachdem die Vorgänger-Seite in der 2. KW 2016 ganz abgestürzt war, wurde alles flux mit einer neuen Domain wieder aufgebaut und die Rankings kamen schnell zurück.

Die Website ist zwar keine klassische Hotlink-Farm, sondern speichert die geklauten Bilder selber. Aber ob gehotlinkt oder kopiert, das macht beim Ranking in der Google-Bildersuche praktisch keinen Unterschied. Es funktioniert beides immer noch bestens.

Website weknowyourdreamz.com – Bilder und Werbung

Das ganze ist als Traumdeutung getarnt und damit man auch noch Promis unterbringen kann, gibt es auch noch eine Rubrik „Horoskop“. Daß es aber eigentlich um die Bilder geht, sieht man auf der Beispielseite ganz gut. Erstmal kommen die Bilder und die Werbung „above the fold“ und dann der Rest. Es werden pro Keyword ca. 50 Bilder eingebunden und auf mehrere Unterseiten verteilt.

Der nächste in der Liste, dreamatico.com, hat ein ähnliches Konzept. Es geht zwar noch etwas mehr um die Texte, die Bilder stehen nicht so im Vordergrung und kommen erst nach dem Text. Aber auch hier sind die zusammengesammelten Bilder ein wichter Faktor, um Besucher auf die Seiten zu locken.

Google Bildersuche Wochenrückblick 2016/09

Es sieht so aus, als hätte Google das Problem der großen Hotlink-Farmen mit .tk und .xyz Domains etwas besser im Griff. Oder die Betreiber haben einfach keine Lust mehr, mit den Seiten ständig auf neue Domains umzuziehen. :-)

Ein großes Problem sind weiterhin gehackte Seiten, die über die Bildersuche Besucher anlocken und dann auf dubiose Verkaufsseiten weiterleiten.

Schwer als Spam zu erkennen sind Seiten mit kopierten Bildern, die unter dem Deckmantel seriöser Inhalte (Traumdeutung, Horoskop) ihr Unwesen treiben.

Mal sehen, was sich nächste Woche, nach der SEP-Campixx, so getan hat…

1 Kommentar »

Bilder-Hotlink-Spammer werden immer dreister

Bilder Hotlinkfarmen

Die normalen Bilder-Hotlinkfarmen mit den .xyz- und .tk-Domains binden üblicherweise 5 bis 10 Top-Bilder aus der Bildersuche auf ihren Spam-Seiten ein. Manchmal gibt es noch ein bißchen Text dazu, aber das war es dann auch schon.

Etwas anders sieht das im folgenden Beispiel aus.

Bilder-Spam Schokolade (versteckt)

Wenn man über die Google-Bildersuche auf eine Seite wie oben zu sehen kommt, wird man erstmal stutzig.

Gut, das in der Bildersuche angezeigte Bild ist dort nicht mehr zu sehen, es wurde scheinbar auf Grund von Urheberrechtsproblemen entfernt. Dann ist ja alles bestens, könnte man meinen.

Aber denkste, das Bild ist zwar für den Benutzer nicht sichtbar, aber trotzdem noch vorhanden (war es schon immer). Der Google-Bot „sieht“ es auch und Google schickt deshalb die Suchenden zu dieser Hotlink-Spam-Seite, und nicht zur eigentlichen Seite mit dem Bild.

Und es ist nicht nur ein Bild, es sind deren 300, die auf den Seite pro Suchbegriff verhotlinkt werden. Damit der Nutzer sie nicht sieht, sonder nur diesen „Foto auf Antrag des Inhabers der Urheberrechte entfernt“-Blödsinn, befinden sich alle Bilder in einem großen div-Element, das per css mit position:absolut und top:-999999px „unsichtbar“ gemacht wurden.

Nimmt man die css-Positionierung weg, sieht das Ganze so aus:

Bilder-Spam Schokolade

Wobei der Screenshot nur die ersten Bilder zeigt, der „Pearl Crescent Page Saver“ stürzt beim Speichern der ganzen Seite ab. Auch „Full Page Screen Capture“ in Chrome scheitert an der riesiegen Seite mit den vielen Bildern.

Google DMCA-Beschwerdestelle ausgetrickst

Es gibt nicht viele Möglichkeiten, gegen diesen massiv zugenommenen Bilder-Hotlink-Spam vorzugehen.

Man kann bei Google einen Spam-Report erstellen, der aber praktisch gar nicht bewirkt. Man kann die Seiten im Google-Webmasterforum verpetzen und falls Sven das mitbekommt, werden solche Seiten eventuell manuell aus dem Index entfernt.

Oder man reicht eine DMCA-Beschwerde bei Google ein. Dort muß man das Bild beschreiben, eine URL für eine autorisierte Verwendung des Bildes und die URL mit der Urheberrechtsverletzung angeben.

Ich weiß jetzt nicht genau, wie die eingereichten Daten bewertet werden, aber wenn da eine Mensch sitzt und sich die URLs ansieht, wird er den Antrag vermutlich ablehnen, weil er das Bild auf der urheberrechtsverletzenden Seite nicht finden kann.

Erschwerend kommt hinzu, daß die Bearbeitung 10 Tage bis 2 Wochen dauert und bis dahin die Spammer schon längst auf eine neue Domain umgezogen sind. :-(

Dabei wäre die Lösung so einfach.
Google muß einfach aufhören, derartige Hotlinkseiten so gut zu ranken. Der Ranking-Algorithmus der Google-Bildersuche ist zur Zeit krank, schwer krank, würde ich sagen. Ob es noch Hoffnung auf Genesung gibt, ist fraglich.

10 Kommentare »