Das Putzlowitsch Test- und SEO-Blog

Neue Qualität bei Kommentar-Spam oder alter Hut?

Alter HutVielleicht ist es ja auch ein alter Hut, ich bin zumindest erst vorhin drauf gestoßen. Und das kam so.

Ich habe nach längerer Zeit mal wieder die Google-Webmastertools aufgerufen um zu sehen, was ich denn so für eingehende Links auf meine Putzlowitsch-Seite habe. Der erste Blick zeigte nicht viel Neues, auf den zweiten Blick habe ich aber eine Seite entdeckt, die mir völlig unbekannt ist. Neugierig bin ich dem Link gefolgt und wurde zu einem alten Bekannten, dem TagSeoBlog und dort auf die Startseite weitergeleitet.

Hier habe ich dann den aktuellen Artikel „Aktuelle Meldungen aus der Blogosphäre“ mit zu dem Zeitpunkt drei Kommentaren gelesen. Ein Kommentar von Mirco (seo2feel) geht am Ende auf das Problem topsy.com (Spam oder nicht?) ein und verweist auf einen eigenen Beitrag „Topsy die neue Spamschleuder„. Und genau dort ist mir in den Kommentaren etwas aufgefallen.

Kommentar-Recycling

Beim Lesen der Kommentare wurde ich bei Kommentar Nr. 7 stutzig. Den hatte ich doch schon mal gelesen, also flux nach oben gescrollt und siehe da, da war er schon mal als Nr. 2. Allerdings nicht wirklich, denn sowohl Kommentator als auch Link unterscheiden sich, und der Kommentartext selbst auch. Allerdings nur in der Anordnung der Wörter, die Wörter selbst sind dieselben:
Kommentar Recycling
Neben der Umstellung des Satzbaus gibt es noch zwei kleinere Abweichungen. Aus einzigste wird einzigster und aus Stadtportale wird Stadtportal. Aber warum sollte man einen Kommentartext wiederverwerten?

Aus meiner Sicht gibt es nur einen Grund, man will inhaltsbasierte Spamabwehr-Ansätze wie Akismet oder einfache Stopwortlisten austricksen. Die Idee ist einfach, man sucht sich einen Kommentar, der bereits genehmigt wurde (klar, sonst wäre er ja nicht zu sehen) und verwendet genau die Wörter für den eigenen „Kommentar“. Damit es nicht zu offensichltich ist, gruppiert man die Wörter etwas um. Da das am Inhalt aber nichts ändert, ist die Wahrscheinlichkeit in eine inhaltsorientiert Spamabwehr zu laufen, sehr gering. Und schon hat man einen Link von einer themenrelevanten Seite platziert.

Oder doch nicht?

Vielleicht sehe ich ja auch zu schwarz, ist gar nichts dran und es war nur der etwas hilflose Versuch eines der deutschen Sprache nicht mächtigen, in einem deutschsprachigen Blog einen Kommentar zu hinterlassen. Die Idee als solche finde ich aber schon nicht schlecht, also das mit dem Kommentar-Recycling für Spamkommentare :-)

5 Kommentare »

Achtung! Spamschutz!

Achtung! Der Inhalt der nachfolgenden Seite wird erst nach Eingabe der Spamschutz-Überprüfung zugänglich!

Spamschutz

Kleiner Hinweis noch, es sind 4 Ziffern (in Worten: vier).

Kannst Du nichts erkennen? Einfach warten, nach ein paar Sekunden wird ein neuer Code eigeblendet.
Immer noch nicht? Na dann rate ich zu einem Besuch beim Augenarzt! :-)

Solche Sachen bekommt man auf manchen Seiten vorgesetzt. In dem Fall war es eine Flirt-Seite, natürlich alles 100% kostenlos und völlig unverbindlich.

Hier noch die Auflösung des Zahlenrätsels. Ich habe einfach den Gammawert etwas hochgedreht.

Keine Kommentare »

Eingehende Links von /map.html

Eingehende Links sind ja was feines. Da hat also jemand anderes die Seite verlinkt, vielleicht weil sie ihm besonders gut gefällt, er sie irgendwie nützlich findet oder warum auch immer. Manche Seiten veröffentlichen sogar Statistiken mit diesen eingehenden Links, inklusive des Links als Link, womit er dann ein ausgehender Link wird, der wiederum einen eingehenden Link aus Sicht der verlinkenden Seite darstellt. Wie wichtig Links sind, ist ja nicht erst seit Google bekannt.

Woher weiß man nun aber, woher die Links kommen? Man kann es unter anderem in der Webserver-Logdatei sehen, dort wird der soganannte Referer möglicherweise mit gespeichert und das ist genau die Information um zu erkennen, wie der Besucher auf die Seite gelangt ist. Wenn er z.B. über eine Suche von Google gekommen ist, kann man sogar herausfinden, wonach der Benutzer bei Google gesucht hatte.

Der Referer wird normalerweise vom Web-Browser des Nutzers an den Webserver beim Aufruf einer Seite im sogenannten HTTP-Request mitgeschickt, kann aber ebenso fehlen oder sonst irgendwie verändert sein. Er kann auch auf irgendeine beliebige andere Webseite verweisen, auf der überhaupt kein Link zur eigenen Seite existiert. Genau das machen sich Spammer zunutze, man spricht dann von „Referer-Spam“, eine Technik, die es schon seit einiger Zeit gibt.

In letzter Zeit habe ich hier häufiger eingehende Links von Seiten, die als /map.html erscheinen. Immer von irgendwelchen .com-Hosts mit so interessanten Namen wie facsimile-prints, trollcollective oder yachting-swap, in den letzten 30 Tagen ungefähr 20 unterschiedliche Seiten mit jeweils vier bis sieben Aufrufen.
Auf den Seiten selbst findet man dann lange Listen mit Links, die alle nach pharmazeutischen Produkten klingen, so Sachen wie adipex, didrex, medrol, prozac und xanax. Diese Links sind aber wiederum nur Weiterleitungen auf andere Seiten die allerdings meist nicht funktionieren. Also weiß ich nicht, wo man dann wirklich landet, interessiert mich aber auch nicht. Es ist halt Spam, Referer-Spam.

Falls also jemand vermehrt eingehenden Links von *.com/map.html hat, nicht zu früh freuen, es wir mit hoher Wahrscheinlichkeit Spam sein.

Weitere Artikel mit Bezug zu diesem:
Keine Kommentare »