<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Schnurpsel &#187; Spam</title>
	<atom:link href="http://schnurpsel.de/nacht/spam/feed/" rel="self" type="application/rss+xml" />
	<link>http://schnurpsel.de</link>
	<description>Das Putzlowitsch Testblog für alles mögliche</description>
	<lastBuildDate>Sun, 05 Sep 2010 17:40:26 +0000</lastBuildDate>
	<generator>http://wordpress.org/?v=Vista 7</generator>
	<language>de</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
			<item>
		<title>Auch Spam-Bots sind nur Menschen</title>
		<link>http://schnurpsel.de/auch-spam-bots-sind-nur-menschen-679/</link>
		<comments>http://schnurpsel.de/auch-spam-bots-sind-nur-menschen-679/#comments</comments>
		<pubDate>Fri, 03 Sep 2010 15:43:46 +0000</pubDate>
		<dc:creator>Schnurpselchen</dc:creator>
				<category><![CDATA[Internet]]></category>
		<category><![CDATA[Programmierung]]></category>
		<category><![CDATA[Konfiguration]]></category>
		<category><![CDATA[Spam]]></category>
		<category><![CDATA[Text]]></category>

		<guid isPermaLink="false">http://schnurpsel.de/auch-spam-bots-sind-nur-menschen-679/</guid>
		<description><![CDATA[
Menschen machen Fehler. Aber nicht nur Menschen, oft sind auch Technik und Programme nicht fehlerfrei. Was aber nicht verwundert, denn die sind in aller Regel von Menschen gemacht.
Ich kann mich ja immer wieder über den Spammer-Dialog auf dem TagSEOBlog köstlich amüsieren. Ich denke mal, Martin hat das gleich passend für den letzten und den aktuellen Webmaster-Friday konzipiert und so gewissermaßen zwei Fliegen mit einer <a href='http://schnurpsel.de/auch-spam-bots-sind-nur-menschen-679/' class='more-link'>...&#187;</a>]]></description>
			<content:encoded><![CDATA[<p><a class='imagelink' href='http://schnurpsel.de/wp-content/uploads/2010/09/ich-war-es-nicht.jpg'><img src='http://schnurpsel.de/wp-content/uploads/2010/09/ich-war-es-nicht.jpg' alt='Ich war es nicht' title='Ich war es nicht' /></a></p>
<p>Menschen machen Fehler. Aber nicht nur Menschen, oft sind auch Technik und Programme nicht fehlerfrei. Was aber nicht verwundert, denn die sind in aller Regel von Menschen gemacht.</p>
<p>Ich kann mich ja immer wieder über <a href="http://www.tagseoblog.de/kommentarspammer-unter-sich">den Spammer-Dialog</a> auf dem TagSEOBlog köstlich amüsieren. Ich denke mal, Martin hat das gleich passend für <a href="http://www.webmasterfriday.de/blog/sind-die-boesen-fuers-bloggen-die-besten">den letzten</a> und den <a href="http://www.webmasterfriday.de/blog/humor-im-blog">aktuellen Webmaster-Friday</a> konzipiert und so gewissermaßen zwei Fliegen mit einer Klappe geschlagen. :-)</p>
<p>Viele der Spamtexte kannte ich auch schon, aber in der Dialog-Bearbeitung erreichen sie eine ganz neue Qualität. Heute nun hat es aber jemand übertrieben und mir gleich eine Liste mit 64 dieser <a href='http://schnurpsel.de/wp-content/uploads/2010/09/kommentar-spam-texte.txt'>Spam-Texte</a> als &#8220;Kommentar&#8221; zukommen lassen.</p>
<p>Ich denke mal, daß das keine Absicht war, denn irgendwie ist das schon ein bißchen unglaubwürdig, so ein Kommentar mit 64 praktisch nichtssagenden Sätzen. Außerdem sind die Paragraph-Zeichen am Anfang jeder Zeile für einen richtigen Kommentar doch eher ungewöhnlich.</p>
<p>Hier hat entweder der Spambot versagt, der vermutlich nur immer jeweils einen Satz zufällig pro Kommentar auswählen soll, oder der Nutzer hat keine Ahnung, wie das funktioniert und irgendwas falsch eingestellt. Oder aber das ist ein Scherz und jemand hat mir seine gesammelten Spam-Texte zukommen lassen, warum auch immer.</p>
<p>Ich denke aber, es war ein Fehler. Menschen machen nun mal Fehler.</p>
<p><small style='color:gray;'>Das ist kein Beitrag zum Webmasterfreitag, auch wenn ich dorthin verlinke.</small></p>
]]></content:encoded>
			<wfw:commentRss>http://schnurpsel.de/auch-spam-bots-sind-nur-menschen-679/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Gravatar-Profile und Spam</title>
		<link>http://schnurpsel.de/gravatar-profile-und-spam-640/</link>
		<comments>http://schnurpsel.de/gravatar-profile-und-spam-640/#comments</comments>
		<pubDate>Tue, 17 Aug 2010 18:08:26 +0000</pubDate>
		<dc:creator>Schnurpselchen</dc:creator>
				<category><![CDATA[Internet]]></category>
		<category><![CDATA[Gravatar]]></category>
		<category><![CDATA[Spam]]></category>

		<guid isPermaLink="false">http://schnurpsel.de/gravatar-profile-und-spam-640/</guid>
		<description><![CDATA[Hat eigentlich jemand mitbekommen, daß man bei Gravatar nicht nur die kleinen Bildchen (Avatar) speichert, sondern ein Profilseite erstellen kann? Ich hatte es wohl irgendwann mal gelesen, der Sache aber keine weiter Bedeutung beigemessen. Heute nun ist der erste Referer-Spam bei mir aufgetaucht.
Weiter unten gibt es dann gaaanz viel themenrelevanten Text. Gut, die Links sind zwar &#8220;nofollow&#8221; , aber es reicht ja, wenn mal <a href='http://schnurpsel.de/gravatar-profile-und-spam-640/' class='more-link'>...&#187;</a>]]></description>
			<content:encoded><![CDATA[<p><a class='imagelink' href='http://schnurpsel.de/wp-content/uploads/2010/08/gravatar-profil-zs.png'><img src='http://schnurpsel.de/wp-content/uploads/2010/08/gravatar-profil-zs-160x137.png' alt='Gravatar-Profil' title='Gravatar-Profil' class='leftimg' /></a>Hat eigentlich jemand mitbekommen, daß man bei Gravatar nicht nur die kleinen Bildchen (Avatar) speichert, sondern ein Profilseite erstellen kann? Ich hatte es wohl irgendwann mal gelesen, der Sache aber keine weiter Bedeutung beigemessen. Heute nun ist der erste <a href='http://schnurpsel.de/referertrick-referer-spam-mit-system-421/' title='Referertrick &#8211; Referer-Spam mit System'>Referer-Spam</a> bei mir aufgetaucht.</p>
<p>Weiter unten gibt es dann gaaanz viel <a class='imagelink' href='http://schnurpsel.de/wp-content/uploads/2010/08/gravatar-profil-zs-text.png'>themenrelevanten Text</a>. Gut, die Links sind zwar &#8220;nofollow&#8221; , aber es reicht ja, wenn mal ein paar User draufklicken.</p>
]]></content:encoded>
			<wfw:commentRss>http://schnurpsel.de/gravatar-profile-und-spam-640/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Zellenradschleusen und Denkmalimmobilien</title>
		<link>http://schnurpsel.de/zellenradschleusen-und-denkmalimmobilien-518/</link>
		<comments>http://schnurpsel.de/zellenradschleusen-und-denkmalimmobilien-518/#comments</comments>
		<pubDate>Mon, 28 Jun 2010 13:29:44 +0000</pubDate>
		<dc:creator>Schnurpselchen</dc:creator>
				<category><![CDATA[Blog]]></category>
		<category><![CDATA[Internet]]></category>
		<category><![CDATA[Spam]]></category>
		<category><![CDATA[Werbung]]></category>

		<guid isPermaLink="false">http://schnurpsel.de/zellenradschleusen-und-denkmalimmobilien-518/</guid>
		<description><![CDATA[Irgendwie läßt mich das Thema Spamkommentare im Moment nicht los. Mancher Spam hat ja zumindest ein gewisses Niveau und ist halbwegs kreativ verfaßt.
Ich habe mal nachgesehen, was es bisher so für Keyword-Namen bei den Kommentaren auf Putzlowitsch und Schnurpsel gab. Hier eine Auswahl:

SMS Chat
Geschenkidee
Sicherheitsschuhe
Kultur in Berlin
Gerd Sparen
Lisa Tuniken
Flüge Australien
Babymode
Poker Shirt
Webdesigner
Exchange Hosting
Tresor
Schmuck
Moderatoren Agentur
Schüttguttechnik
Zellenradschleusen
Denkmalimmobilien
Shop4iphones

Manche nennen einfach kurz und prägnant worum es geht, wie Schmuck, Tresor, Babymode <a href='http://schnurpsel.de/zellenradschleusen-und-denkmalimmobilien-518/' class='more-link'>...&#187;</a>]]></description>
			<content:encoded><![CDATA[<p><a class='imagelink' href='http://schnurpsel.de/wp-content/uploads/2009/07/niveau-creme.png'><img src='http://schnurpsel.de/wp-content/uploads/2009/07/niveau-creme-160x160.png' alt='Niveau-Creme' title='Niveau-Creme' class='rightimg' /></a>Irgendwie läßt mich <a href='http://schnurpsel.de/vuvuzela-gehoerschutz-roberta-geht-um-516/' title='Vuvuzela Gehörschutz &#8211; Roberta geht um'>das Thema Spamkommentare</a> im Moment nicht los. Mancher Spam hat ja zumindest ein gewisses Niveau und ist halbwegs kreativ verfaßt.</p>
<p>Ich habe mal nachgesehen, was es bisher so für Keyword-Namen bei den Kommentaren auf Putzlowitsch und Schnurpsel gab. Hier eine Auswahl:</p>
<ul>
<li>SMS Chat</li>
<li>Geschenkidee</li>
<li>Sicherheitsschuhe</li>
<li>Kultur in Berlin</li>
<li>Gerd Sparen</li>
<li>Lisa Tuniken</li>
<li>Flüge Australien</li>
<li>Babymode</li>
<li>Poker Shirt</li>
<li>Webdesigner</li>
<li>Exchange Hosting</li>
<li>Tresor</li>
<li>Schmuck</li>
<li>Moderatoren Agentur</li>
<li>Schüttguttechnik</li>
<li>Zellenradschleusen</li>
<li>Denkmalimmobilien</li>
<li>Shop4iphones</li>
</ul>
<p>Manche nennen einfach kurz und prägnant worum es geht, wie Schmuck, Tresor, Babymode oder auch in zwei Worten wie Exchange Hosting, Flüge Australien und Moderatoren Agentur.</p>
<p>Eine andere Gruppe kombiniert das Schlüsselwort mit einem gängigen Vornamen, so z.B. <em>Gerd Sparen</em> oder <em>Lisa Tuniken</em>. Gut, ich will jetzt nicht ausschließen, daß es diese Namen tatsächlich gibt. Wenn man dem Link folgt wird dann klar, daß das aber schon ein sehr großer Zufall wäre, wenn der Betreiber einer Seite &#8220;ratgeber-geld-sparen&#8221; Gerd Sparen oder die &#8220;fashionexpertin&#8221; Lisa Tuniken heißt.</p>
<p>Bei Shop4Iphones z.B. aus der dritten Gruppe ist der Name identisch mit dem Hostnamen der verlinkten Website.</p>
<p><a class='imagelink' href='http://schnurpsel.de/wp-content/uploads/2010/06/fluegelradzaehler.png'><img src='http://schnurpsel.de/wp-content/uploads/2010/06/fluegelradzaehler-120x160.png' alt='Flügelradzähler' title='Flügelradzähler' class='leftimg' /></a>Am meisten angetan haben es mir aber die Zellenradschleusen und die Schüttguttechnik. Das sind zumindest eher selten anzutreffende Kommentatoren-Spam-Namen und insofern ewtas Besonderes. Andererseits wurde dabei wieder die Erinnerung an meinen ursprünglichen Lehrberuf &#8220;BMSR-Techniker&#8221; wach, den solche bzw.ähnliche technische Gerätschaften spielten in meiner Berufsausbildung auch eine Rolle.</p>
<p>Die Zellenradschleuse erinnert mich doch sehr stark an ein Meßgerät zur volumetrischen Durchflußmessung, dem Flügelradzähler. Das Bild stammt aus dem Lehrbuch für die Berufsausbildung &#8220;Betriebsmeßtechnik&#8221; von Gerhard Fischer. Herr Fischer war übrigens nicht etwa Fischer, sondern Oberlehrer und Diplom-Gewerbelehrer.</p>
]]></content:encoded>
			<wfw:commentRss>http://schnurpsel.de/zellenradschleusen-und-denkmalimmobilien-518/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Vuvuzela Gehörschutz &#8211; Roberta geht um</title>
		<link>http://schnurpsel.de/vuvuzela-gehoerschutz-roberta-geht-um-516/</link>
		<comments>http://schnurpsel.de/vuvuzela-gehoerschutz-roberta-geht-um-516/#comments</comments>
		<pubDate>Mon, 28 Jun 2010 09:44:39 +0000</pubDate>
		<dc:creator>Schnurpselchen</dc:creator>
				<category><![CDATA[Blog]]></category>
		<category><![CDATA[Geld verdienen]]></category>
		<category><![CDATA[Internet]]></category>
		<category><![CDATA[Spam]]></category>
		<category><![CDATA[Vuvuzela]]></category>
		<category><![CDATA[Werbung]]></category>

		<guid isPermaLink="false">http://schnurpsel.de/vuvuzela-gehoerschutz-roberta-geht-um-516/</guid>
		<description><![CDATA[Es paßt irgendwie so schön zum aktuellen Webmaster-Friday Thema &#8220;Kommentar-Spam und Trackback-Spam&#8220;. Und nein, ich habe den Webmasterfriday mit diesem Artikel nicht getrackbackt (oder trackgebackt?), weil ich ihn schlicht für nicht wirklich relavant halte. Es ist halt nur ein Beispiel für aktuellen Kommentarspam.
Heute hat Roberta bei Putzlowitsch einen Kommentar zur Vuvuzela hinterlassen. Der Link führte ursprünglich zum &#8220;Gehörschutz-Versand&#8221;, eigentlich für mich eine klare Sache, <a href='http://schnurpsel.de/vuvuzela-gehoerschutz-roberta-geht-um-516/' class='more-link'>...&#187;</a>]]></description>
			<content:encoded><![CDATA[<p><a class='imagelink' href='http://schnurpsel.de/wp-content/uploads/2010/06/vuvuzela.jpg'><img src='http://schnurpsel.de/wp-content/uploads/2010/06/vuvuzela-160x120.jpg' alt='Vuvuzela' title='Vuvuzela' class='leftimg' /></a>Es paßt irgendwie so schön zum aktuellen Webmaster-Friday Thema &#8220;<a href="http://www.webmasterfriday.de/blog/kommentar-spam-und-trackback-spam">Kommentar-Spam und Trackback-Spam</a>&#8220;. Und nein, ich habe den Webmasterfriday mit diesem Artikel nicht getrackbackt (oder trackgebackt?), weil ich ihn schlicht für nicht wirklich relavant halte. Es ist halt nur ein Beispiel für aktuellen Kommentarspam.</p>
<p>Heute hat Roberta bei Putzlowitsch einen <a href="http://putzlowitsch.de/2010/06/24/vuvuzela-musikalisch/#comment-2390">Kommentar zur Vuvuzela</a> hinterlassen. Der Link führte ursprünglich zum &#8220;Gehörschutz-Versand&#8221;, eigentlich für mich eine klare Sache, daß es sich um Kommentar-Spam handelt. Wenn es nicht so offensichtlich ist oder manchmal einfach aus Neugier suche ich bei Google, wo bereits weitere derartige Kommentare auftauchen. Dir gute Roberta ist schon etwas länger aktiv und hat bereits einige Kommentare auf anderen Blogs hinterlassen. Ein paar Beispiele:</p>
<blockquote style='font-size:0.85em'><p>&#8220;Die Vuvuzelas kann ich gar nicht leiden. So ein unangenehmes Geräusch habe ich nie gehört.&#8221;<br />
&#8220;wow! beeindruckendes video, ist echt interessant zum anschauen.&#8221;<br />
&#8220;Endlich eine Lösung des Problems! Ich hoffe. dass es wirklich wirkt&#8221;<br />
&#8220;Wegen der Vuvuzelas warte ich auf das Ende der WM voller Ungeduld.&#8221;<br />
&#8220;Wie könnte das erlaubt bleiben, das ist einfach dumm. Die Hörschaden sind also nicht von so großer Bedeutung.&#8221;<br />
&#8220;kann man die vuvuzelas einfach verbieten?&#8221;<br />
&#8220;Manche Leute haben Glück, ich aber muss das Geräusch ständig zu hause hören, Lucky man&#8221;<br />
&#8220;Der Fußball gefällt mir nicht mehr, das ist das Resultat&#8221;<br />
&#8220;140 Dezibel?! WOW! Das will ich mir gar nicht vorstellen.&#8221;<br />
&#8220;Das ist das unerträglichste Geräusch der Welt. Gott sei Dank, dass ich dort nicht bin.&#8221;
</p></blockquote>
<p>Die Kommentare gehen schon mehr oder weniger auf den Artikel ein. Und immerhin nutzt die Aktion thematisch aktuelles Geschehen (Vuvuzela), eigentlich eine gar nicht mal schlechte Herangehensweise. Letzendlich muß jeder aber selber entscheiden, wie er mit solchen Kommentaren umgeht. Technische Spamabwehr dürfte wohl bei dieser Art von Spam-Kommentaren ohnehin versagen. Wo die Kommentare nicht moderiert werden, erscheinen sie dann direkt und bleiben vermutlich auch unbemerkt.</p>
<p>Aber andererseits, was solls? Es ist nun auch kein Weltuntergang, wenn da jemand ein paar Links bekommt, die zudem möglicherweise nur &#8220;nofollow&#8221; sind. Man kann das auch mal locker sehen, wenn es denn nicht Überhand nimmt. Trööööööt! :-)</p>
]]></content:encoded>
			<wfw:commentRss>http://schnurpsel.de/vuvuzela-gehoerschutz-roberta-geht-um-516/feed/</wfw:commentRss>
		<slash:comments>3</slash:comments>
		</item>
		<item>
		<title>Fremde Inhalte + automatische Backlinks = Erfolg?</title>
		<link>http://schnurpsel.de/fremde-inhalte-automatische-backlinks-erfolg-511/</link>
		<comments>http://schnurpsel.de/fremde-inhalte-automatische-backlinks-erfolg-511/#comments</comments>
		<pubDate>Sat, 19 Jun 2010 15:47:13 +0000</pubDate>
		<dc:creator>Schnurpselchen</dc:creator>
				<category><![CDATA[Geld verdienen]]></category>
		<category><![CDATA[Internet]]></category>
		<category><![CDATA[Blog]]></category>
		<category><![CDATA[Geld]]></category>
		<category><![CDATA[Spam]]></category>

		<guid isPermaLink="false">http://schnurpsel.de/fremde-inhalte-automatische-backlinks-erfolg-511/</guid>
		<description><![CDATA[In der Reihe &#8220;Geld verdienen im Internet&#8221; stelle ich heute eine weitere Möglichkeit anhand eines praktischen Beispiels vor. Ging es kürzlich noch um das Geldverdienen mit Bildern, kommen heute Texte zum Zuge. Texte sind ja das AundO für erfolgreiche Suchmaschinenoptimierung, gute Texte machen sich bezahlt.
Aufmerksam darauf geworden bin ich Anfang Juni durch ein Pingback hier bei Schnurpsel. Da ich Kommentare und Track-/Pingbacks moderiere, schau <a href='http://schnurpsel.de/fremde-inhalte-automatische-backlinks-erfolg-511/' class='more-link'>...&#187;</a>]]></description>
			<content:encoded><![CDATA[<p>In der Reihe &#8220;Geld verdienen im Internet&#8221; stelle ich heute eine weitere Möglichkeit anhand eines praktischen Beispiels vor. Ging es kürzlich noch um das <a href='http://schnurpsel.de/mit-der-bildersuche-geld-verdienen-so-einfach-ist-das-358/' title='Mit der Bildersuche Geld verdienen, so einfach ist das'>Geldverdienen mit Bildern</a>, kommen heute Texte zum Zuge. Texte sind ja das AundO für erfolgreiche Suchmaschinenoptimierung, gute Texte machen sich bezahlt.</p>
<p>Aufmerksam darauf geworden bin ich Anfang Juni durch ein Pingback hier bei Schnurpsel. Da ich Kommentare und Track-/Pingbacks moderiere, schau ich vor dem Freischalten nach, wo diese herkommen. Es handelte sich um diesen &#8220;Beitrag&#8221; zur Datenrettung (datenrettung.24h-tiрр.de). Gestern und heute kamen dann noch MPU, Katzen und Schufa hinzu. Ein wenig anders kommt Kreide, Sand und lange Strände daher. Ist auch ein anderer Betreiber, aber praktisch das selbe Prinzip.</p>
<h3>Technik</h3>
<p>Man benötigt ein Webhostingpaket oder einen Server im Internet. Hier wird zunächst Wordpress (MU oder 3.0)  installiert. Dann richtet man ein paar interessante Stichwörter als (virtuelle) Subdomains ein. Es funktioniert natürlich auch ohne Subdomains.</p>
<h3>Texte</h3>
<p>Nun benötigt man ein Plugin, mit dem man fremde Inhalte als Artikel in Wordpress einlesen und speichern kann. Damit hat man schon mal ohne großen Aufwand Text, das wichtigste Futter für die Suchmaschinen. Bei den Beispielen oben werden die Inhalte vorzugsweise von <a href="http://de.answers.yahoo.com/">Yahoo-Answers</a>, dem Frage- und Antwortenportal von Yahoo abgegriffen. Man kann dort einfach die Feeds zur Stichwortsuche auslesen.</p>
<p>Das mit Yahoo-Answers hat zudem den Vorteil, daß man die Antworten direkt als Kommentare zu den Fragen einlesen kann. Damit wird das Blog-Feeling verstärkt.</p>
<h3>Links</h3>
<p>Neben dem Textfutter sind für Suchmaschinen natürlich auch Backlinks wichtig. Das Linkbuilding erfolgt hier auch automatisch über Pingbacks aus Blogs. Dazu werden mit einem Plugin über die Google-Blogsuche oder ähnliche Blogquellen passende Blogartikel zu aus dem Text extrahierten Stichwörtern gesucht. Diese werden dann als &#8220;Related Blogs&#8221; direkt in den Artikel eingefügte.</p>
<p>Beim Speichern des &#8220;Artikels&#8221; versendet Wordpress nun brav an jede dieser Seiten ein Pingback. Spamabwehr-Plugins wie Trackback-Check und Ähnliche greifen hier natürlich nicht, weil der Link auf die Zielseite bei der pingenden Seite ja tatsächlich vorhanden ist.</p>
<h3>Werbung</h3>
<p>Nun hat man schon mal Inhalte und Backlinks, was fehlt ist nun noch die Werbung. Hier kommt idealerweise kontextsensitive Werbung wie AdSense zum Einsatz. Fertig ist die Laube, der Rest läuft weitestgehend automatisch.</p>
<h3>Geld</h3>
<p>Ob das nun tatsächlich funktioniert und den Rubel rollen läßt, kann ich nicht beurteilen. So wie oben beschrieben, ist es zumindest aus meiner Sicht angelegt. Technische gesehen ist das keine große Sache, aber Technik allein ist nicht alles. Aus SEO-Sicht kann ich das sowieso nicht beurteilen.</p>
<p>Na mal sehen, ob dieses Modell eine weitere Verbereitung findet. Ein paar andere Seiten/Domains gibt es zumindest noch, z.B. Kredite und Baufinanzierung. :-) </p>
]]></content:encoded>
			<wfw:commentRss>http://schnurpsel.de/fremde-inhalte-automatische-backlinks-erfolg-511/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>Spam-Bot Wetter, die Bots testen Kommentare</title>
		<link>http://schnurpsel.de/spam-bot-wetter-die-bots-testen-kommentare-439/</link>
		<comments>http://schnurpsel.de/spam-bot-wetter-die-bots-testen-kommentare-439/#comments</comments>
		<pubDate>Wed, 07 Apr 2010 16:24:48 +0000</pubDate>
		<dc:creator>Schnurpselchen</dc:creator>
				<category><![CDATA[Internet]]></category>
		<category><![CDATA[Wordpress]]></category>
		<category><![CDATA[Bot]]></category>
		<category><![CDATA[Kommentar]]></category>
		<category><![CDATA[Spam]]></category>

		<guid isPermaLink="false">http://schnurpsel.de/spam-bot-wetter-die-bots-testen-kommentare-439/</guid>
		<description><![CDATA[Heute scheint gutes Spam-Wetter zu sein, die Spambots sind unterwegs und testen die Kommentar-Formulare, im Moment drüben bei Putzlowitsch.
Das Muster ist immer gleich:

xyz.amazonaws.com  /2007/01/09/spam-spammiger-am-spammigsten
xyz.amazonaws.com  /2007/01/09/spam-spammiger-am-spammigsten/
xyz.amazonaws.com  /wp-comments-post.php
xyz.casema.nl      /wp-comments-post.php
xyz.slicehost.net  /wp-comments-post.php

Erst kommt so ein Hansel vorbei und ruft eine Seite mit der falschen URL (ohne abschließendem Slash) auf. Dann wird er auf die richtige URL weitergeleitet und versucht <a href='http://schnurpsel.de/spam-bot-wetter-die-bots-testen-kommentare-439/' class='more-link'>...&#187;</a>]]></description>
			<content:encoded><![CDATA[<p>Heute scheint gutes Spam-Wetter zu sein, die Spambots sind unterwegs und testen die Kommentar-Formulare, im Moment drüben bei Putzlowitsch.<br />
Das Muster ist immer gleich:</p>
<pre>
xyz.amazonaws.com  /2007/01/09/spam-spammiger-am-spammigsten
xyz.amazonaws.com  /2007/01/09/spam-spammiger-am-spammigsten/
xyz.amazonaws.com  /wp-comments-post.php
xyz.casema.nl      /wp-comments-post.php
xyz.slicehost.net  /wp-comments-post.php
</pre>
<p>Erst kommt so ein Hansel vorbei und ruft eine Seite mit der falschen URL (ohne abschließendem Slash) auf. Dann wird er auf die richtige URL weitergeleitet und versucht einen &#8220;Kommentar&#8221; abzusetzen. Gleich danach kommen noch zwei Spam-Bot-Kollegen und versuchen dasselbe. Als User-Agent steht immer &#8220;Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1)&#8221; drin.</p>
<p>Inhaltlich habe die nicht wirklich was zu bieten, es scheint eher nur ein Test zu sein, ob die Kommentare entgegengenommen werden und wie Links eingefügt werden können. So in etwa sehen die Kommentare aus:</p>
<pre>EBuBBk
&lt;a href=\&quot;http://swdjxdiycbec.com/\&quot;&gt;swdjxdiycbec&lt;/a&gt;,
[url=http://ndnoaqhxujvg.com/]ndnoaqhxujvg[/url],
[link=http://krperquplewf.com/]krperquplewf[/link], 

http://keejyaqvdysc.com/</pre>
<p>Angefangen hat es kurz nach 9 Uhr. Bisher sind gut 300 Spam-Versuche aufgeschlagen, also etwa 100 Zugriffe des obigen Verhaltensmusters. Nur gut, daß dieser Spam-Quark schon an der Türe abgewiesen wird und erst gar nicht in die Spam- oder Moderationsliste von Wordpress gelangt.</p>
<p>Ich befürchte, die Bots geben erst Ruhe, wenn sie alle ca. 750 Artikel bei Putzlowitsch abgegrast haben. Und dann komme sie womöglich noch hierher zu Schnurpsel. Hoffentlich merken die bald mal, daß sie dort wie auch hier keine Chance haben, ihren Spam loszuwerden.</p>
]]></content:encoded>
			<wfw:commentRss>http://schnurpsel.de/spam-bot-wetter-die-bots-testen-kommentare-439/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Referertrick &#8211; Referer-Spam mit System</title>
		<link>http://schnurpsel.de/referertrick-referer-spam-mit-system-421/</link>
		<comments>http://schnurpsel.de/referertrick-referer-spam-mit-system-421/#comments</comments>
		<pubDate>Thu, 25 Mar 2010 19:04:12 +0000</pubDate>
		<dc:creator>Schnurpselchen</dc:creator>
				<category><![CDATA[Geld verdienen]]></category>
		<category><![CDATA[Internet]]></category>
		<category><![CDATA[Referer]]></category>
		<category><![CDATA[Spam]]></category>
		<category><![CDATA[Statistik]]></category>

		<guid isPermaLink="false">http://schnurpsel.de/referertrick-referer-spam-mit-system-421/</guid>
		<description><![CDATA[Referer-Spam ist ja nichts Neues, dazu habe ich schon vor einiger Zeit etwas geschrieben.
Gefälschter Referer -> Spam
Der Referer wird normalerweise beim Aufruf einer Seite vom Web-Browser des Benutzers an den Webserver im sogenannten HTTP-Request mitgeschickt, kann aber ebenso fehlen oder sonst irgendwie verändert sein. Da diese Information beliebig gesetzt werden kann, ist nicht gewährleistet, das sie auch stimmt. Genau solche &#8220;gefälschten&#8221; Referer machen sich <a href='http://schnurpsel.de/referertrick-referer-spam-mit-system-421/' class='more-link'>...&#187;</a>]]></description>
			<content:encoded><![CDATA[<p><a href='http://schnurpsel.de/eingehende-links-von-maphtml-73/' title='Eingehende Links von /map.html'>Referer-Spam</a> ist ja nichts Neues, dazu habe ich schon vor einiger Zeit <a href="http://putzlowitsch.de/2008/01/06/eingehende-links/">etwas geschrieben</a>.</p>
<h3>Gefälschter Referer -> Spam</h3>
<p>Der Referer wird normalerweise beim Aufruf einer Seite vom Web-Browser des Benutzers an den Webserver im sogenannten HTTP-Request mitgeschickt, kann aber ebenso fehlen oder sonst irgendwie verändert sein. Da diese Information beliebig gesetzt werden kann, ist nicht gewährleistet, das sie auch stimmt. Genau solche &#8220;gefälschten&#8221; Referer machen sich Spammer zu Nutze und setzen den Refefer auf eine Seite, von der gar kein Link auf die aufgerufene Seite zeigt.</p>
<h3>Spamziel -> Neugierige Webmaster und öffentliche Statistik</h3>
<p>Was hat ein Spammer nun von so einem auf eine &#8220;beworbene&#8221; Seite zeigenden, falschen Referer? Zwei Aspekte spielen dafür eine wichtige Rolle.</p>
<p>Zum einen die Neugier des Webmasters, der gerne wissen möchte, wer denn da und warum auf die eigene Seite verlinkt. Damit hat die bespammte Seite schonmal einen Besucher mehr. Ich gebe zu, ich gucke da auch manchmal nach, woher die Links kommen :-)</p>
<p>Zum anderen gibt es Webseiten, die ihre <a href="http://www.google.de/search?q=chCounter%3A+Hauptseite">Zugriffsstatistik öffentlich einsehbar</a> auf einer Seite bereitstellen. Meist gibt es da auch einen Bereich mit der Herkunft der Besucher, als der <a href="http://www.google.de/search?&#038;q=chCounter%3A+Referrer-Statistiken">referenzierenden Webseite</a>, die dann <a href="http://www.google.de/search?q=chCounter+inurl%3Alatest%3Dreferrers">oft sagar als Link</a> ausgegeben werden. Über die Bedeutung von Links im allgemeinen und für das Suchmaschinen-Ranking im besonderen brauche ich wohl keine großen Worte verlieren.</p>
<h3>Referer-Spam mit System</h3>
<p>Seit ein paar Tagen, konkret seit dem 18. März, befinden sich in meinen Log-Dateien Referer von der Seite referertrick.com (seit kurzem auch mit .de).<br />
Die Zugriffe kommen bisher von den drei IP-Adressen 87.118.82.66, 87.118.82.104 und 87.118.116.23. Ich habe noch etwas &#8220;zurückgeblättert&#8221; und festgestellt, daß es bereits im Dezember 2009 ein paar Zugriffe von einem Bot namens &#8220;SourceSpider/2.1&#8243; über die IP 87.118.82.66 gab. Im Januar wurde vermutlich eine Testlauf gestartet, da tauchte dieser Server mit &#8220;Kunden-Referer&#8221; auf.  </p>
<p>Auf der referertrick-Webseite heißt es ganz unverblümt:</p>
<blockquote><p>Wir senden HTTP-Pakete an alle Webseiten des Internets. Dabei wird Ihre Webseite als Referer aufgelistet.<br />
Die Inhaber dieser vielen (teilweise Millionen) anderen Webseiten glauben daher, dass Sie auf diese Webseite verlinken würden, und besuchen Ihre Webseite aus Neugierde.<br />
Jeder Besucher ist ein potentieller Kunde, ganz zu schweigen von der Suchmaschinen-Optimierung durch die vielen Statistik-Links!</p></blockquote>
<h3>Geld verdienen im Internet</h3>
<p>Das Ganze klingt natürlich erstmal nach einer cleveren Geschäftsidee. Ich halte es allerdings für eine weitere Art von Spam, die irgendwann nur nervig ist.</p>
<p>Irgendwie paßt das auch ganz gut zum aktuellen Thema des Webmasterfridays &#8220;<a href="http://www.webmasterfriday.de/blog/was-ist-die-richtige-linkbuilding-strategie">Was ist die richtige Linkbuilding-Strategie?</a>&#8221; :-)<br />
Allerdings denke ich, daß dieser Art gekauftes &#8220;Linkbuilding&#8221; über gefakte Referer auf Statistikseiten keine gut Strategie ist.</p>
<h3>Google-Analytics und externe Statistik nicht betroffen</h3>
<p>Wenn sich nun jemand wundert, daß bei ihm noch keine Referertricks angekommen sind, liegt es vielleicht daran, das die Statistik nicht über die Serverlogdatei funktioniert oder direkt auf dem Server läuft. Technisch bedingt sind keine Statistik-Tools betroffen, die extern per Javascript oder &#8220;Zählerpixel&#8221; eingebunden werden. Der Referertrick-Bot führt, davon gehe ich einfach mal aus, schließlich kein Javascript aus oder lädt per IMG-Tag eingebundene Grafiken nach. Somit sehen Statistik-Tools wie Google-Analytics, WordPress.com Stats oder auch Piwick diese falschen Referer erst gar nicht.</p>
]]></content:encoded>
			<wfw:commentRss>http://schnurpsel.de/referertrick-referer-spam-mit-system-421/feed/</wfw:commentRss>
		<slash:comments>7</slash:comments>
		</item>
		<item>
		<title>Die schnurpsel.de Vor- und Frühgeschichte</title>
		<link>http://schnurpsel.de/die-schnurpsel-de-vor-und-fruehgeschichte-304/</link>
		<comments>http://schnurpsel.de/die-schnurpsel-de-vor-und-fruehgeschichte-304/#comments</comments>
		<pubDate>Wed, 06 Jan 2010 21:48:05 +0000</pubDate>
		<dc:creator>Schnurpselchen</dc:creator>
				<category><![CDATA[Internet]]></category>
		<category><![CDATA[Bewertung]]></category>
		<category><![CDATA[Blog]]></category>
		<category><![CDATA[Geschichte]]></category>
		<category><![CDATA[Schnurpsel]]></category>
		<category><![CDATA[Spam]]></category>

		<guid isPermaLink="false">http://schnurpsel.de/die-schnurpsel-de-vor-und-fruehgeschichte-304/</guid>
		<description><![CDATA[Spam?
Spam oder nicht, das ist hier die Frage, und wenn ja, wozu ist es gut:
Betreff: [сugе.org] Aufnahme-Benachrichtigung: schnurpsel.de
Sehr geehrte Damen und Herren, 
aufgrund der neuen Rechtslage in Europa haben wir die Pflicht Sie darüber zu informieren, dass die o.g. Website im Bewertungs-Index von сugе.org gelistet ist. сugе [kjudsch] ist ein freier Service für die Bewertung der Service-Qualität und Zuverlässigkeit von Websites durch die Kunden <a href='http://schnurpsel.de/die-schnurpsel-de-vor-und-fruehgeschichte-304/' class='more-link'>...&#187;</a>]]></description>
			<content:encoded><![CDATA[<h3>Spam?</h3>
<p>Spam oder nicht, das ist hier die Frage, und wenn ja, wozu ist es gut:</p>
<blockquote><p><strong>Betreff:</strong> [сugе.org] Aufnahme-Benachrichtigung: schnurpsel.de</p>
<p>Sehr geehrte Damen und Herren, </p>
<p>aufgrund der neuen Rechtslage in Europa haben wir die Pflicht Sie darüber zu informieren, dass die o.g. Website im Bewertungs-Index von сugе.org gelistet ist. сugе [kjudsch] ist ein freier Service für die Bewertung der Service-Qualität und Zuverlässigkeit von Websites durch die Kunden der Site selbst.<br />
&#8230;</p></blockquote>
<p>Dann kommt mehr oder weniger uninteressanter Text gefolgt von diesem wichtigen Hinwies:</p>
<blockquote><p>*** Wichtige Hinweise: *** </p>
<p>Insbesondere Deutsche Website-Betreiber möchten wir darauf hinweisen, dass es sich bei dieser Benachrichtigung nicht um sog. Spam handelt. Sie erhalten diese E-Mail als vermuteter Inhaber der o.g. Website, weil ein Website-Betreiber nach neuer Europäischer Rechtslage das Recht hat, von dem Listing in einem Bewertungsdienst zu erfahren und sich ggfs. gegen ungerechtfertigte Bewertungen zu wehren.
</p></blockquote>
<p>Ich empfinde den eindringlichen Hinweis, daß es sich nicht um Spam handelt, schon fast wieder als Indiz dafür, daß es doch Spam ist. Und was für eine neue europäische Rechtslage ist gemeint?</p>
<p>Na egal, ich war dann doch neugierig (das ist vermutlich der Zweck) und habe mir meine Bewertung dort angesehen. Es gibt tatsächlich eine Bewertung die, nun ja, eher mittelprächtig ausfällt. Obwohl ich eine durchschnittliche Lieferzeit von einem Tag und vier Stunden gar nicht mal schlecht finde.</p>
<p>Das Problem ist nur, ich liefere überhaupt nichts, schon gar keine Erze, Mineralien und Substitute. Die gemachten Angaben wie Firmenname, Kategorie &#8220;Internationales Business&#8221; und Internationaler Handel Import Export stimmen ünerhaupt nicht mit meiner Schnurpsel-Seite überein. Die Firma Linox GmbH gibt es allerdings wirklich und auf die paßt auch die Beschreibung, nur die Webseite ist falsch. Man findet die Firma, oh großes Wunder, unter <a href="http://www.linox-gmbh.de">www.linox-gmbh.de</a>.</p>
<h3>Schnurpsel von früher?</h3>
<p>Was wäre nun aber, wenn es schnurpsel.de vielleicht schon vor meiner Zeit mit ganz anderen Inhalten gegeben hat? Ausschließen kann man das nicht, denn ich habe die Domain erst im Juni 2007 registriert und mein <a href='http://schnurpsel.de/hallo-welt-1/' title='Hallo Welt!'>erster Artikel</a> erschien am 06.06.07. Also habe ich mal bei <a href="http://web.archive.org/web/*/http://schnurpsel.de/">archive.org</a> nachgesehen, dort kann man die Internetgeschichte bis 1996 zurückverfolgen.</p>
<p>Und siehe da, schnurpsel.de gab es bereits von März 2001 bis zum Februar 2005. Leider kann man keine Inhalte mehr sehen, da die Domain damals nur per Frameset auf eine private Homepage bei berlinweb.de weiterleitete. Diese gehörte wohl einem gewissen ComiXxx aka Thomas Antelmann. Es war aber bestimmt keine Handelsfirma für Erze und Metalle.</p>
<h3>Fazit</h3>
<p>So hat mich eine (vermutliche) Spam-E-Mail zumindest dazu gebracht, mal in die Vergangenheit meiner Domain abzutauchen, von der ich vorher nicht vermutet hätte, das es sie überhaupt gibt.</p>
]]></content:encoded>
			<wfw:commentRss>http://schnurpsel.de/die-schnurpsel-de-vor-und-fruehgeschichte-304/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Studenten-Spam, eine neue Masche?</title>
		<link>http://schnurpsel.de/studenten-spam-eine-neue-masche-289/</link>
		<comments>http://schnurpsel.de/studenten-spam-eine-neue-masche-289/#comments</comments>
		<pubDate>Thu, 17 Dec 2009 14:03:38 +0000</pubDate>
		<dc:creator>Schnurpselchen</dc:creator>
				<category><![CDATA[Blog]]></category>
		<category><![CDATA[Internet]]></category>
		<category><![CDATA[Spam]]></category>

		<guid isPermaLink="false">http://schnurpsel.de/studenten-spam-eine-neue-masche-289/</guid>
		<description><![CDATA[Beim ersten Kommentar hier war es mir gar nicht aufgefallen. Die Seite, die der Kommentator als Homepage angegeben hat, sieht erstmal unverfänglich aus. Zumal sie auf einen Uni-Account bei der TU-Dresden verweist. Stutzig wurde ich bei einem weiteren Kommantar auf Putzlowitsch, hier lag die Homepage bei der HTW-Berlin. Verblüffend ähnlich war aus meiner Sicht der Aufbau der beiden Seiten. Es gibt jeweils eine Homepage <a href='http://schnurpsel.de/studenten-spam-eine-neue-masche-289/' class='more-link'>...&#187;</a>]]></description>
			<content:encoded><![CDATA[<p>Beim ersten <a href='http://schnurpsel.de/wordpress-bei-strato/vorbereitung-installation/#comment-587' title='Kommentar zu: Vorbereitung Installation'>Kommentar hier</a> war es mir gar nicht aufgefallen. Die Seite, die der Kommentator als Homepage angegeben hat, sieht erstmal unverfänglich aus. Zumal sie auf einen Uni-Account bei der <a href="http://tu-dresden.de/">TU-Dresden</a> verweist. Stutzig wurde ich bei einem <a href="http://putzlowitsch.de/2007/08/02/werbezappelecken/#comment-2194">weiteren Kommantar</a> auf Putzlowitsch, hier lag die Homepage bei der HTW-Berlin. Verblüffend ähnlich war aus meiner Sicht der Aufbau der beiden Seiten. Es gibt jeweils eine Homepage und dann eine weitere Seite &#8220;1. Story&#8221; bzw. &#8220;Story Nr.1&#8243;. Zufall?</p>
<p>Bei beiden Seiten ist das &#8220;Design&#8221; eher etwas altbacken, technisch mit Tabellen realisiert. Das wundert mich besonders bei Christoph, der ja vorgibt, im vierten  Studienjahr Informatik zu studieren. Abderrahim hingegen studiert schon im fünften Studienjahr im Fach &#8220;Techik&#8221;, richtig, nur Technik. Komisch auch, daß Christoph als E-Mail-Adresse Christian@ verwendet. Aber egal, das ist alles vielleicht nur Zufall.</p>
<p>Wenn man sich nun die Seiten von Christoph und Abderrahim ansieht, fallen weitere Gemeinsamkeiten auf. Beide berichten über Stromanbieter und verlinken auf Stromsuche. Beide schreiben über Gutscheine und Coupons und verlinken auf Gutscheindorado. Und jetzt kommts, beide Kommentare wurden von derselben IP-Adresse abgesetzt, Anbieter ist Kabel-Deutschland (dynip.superkabel.de). Aber auch das ist möglicherweise alles nur Zufall :-)</p>
<p>Was mich eher interessieren würde, wie die Seiten bei den Unis dort hinkommen. Werden für ein paar Euro Studenten gekauft, die dann Ihren Uni-Zugang dafür hergeben. Oder wurden die Accounts geknackt oder gibt es sonst eine Lücke, die es ermöglicht, auf Uni-Servern Seiten abzulegen?</p>
<p>Na mal sehen, ob und wie das weitergeht&#8230;</p>
]]></content:encoded>
			<wfw:commentRss>http://schnurpsel.de/studenten-spam-eine-neue-masche-289/feed/</wfw:commentRss>
		<slash:comments>6</slash:comments>
		</item>
		<item>
		<title>Mehr Bilderdiebe</title>
		<link>http://schnurpsel.de/mehr-bilderdiebe-286/</link>
		<comments>http://schnurpsel.de/mehr-bilderdiebe-286/#comments</comments>
		<pubDate>Wed, 16 Dec 2009 15:17:45 +0000</pubDate>
		<dc:creator>Schnurpselchen</dc:creator>
				<category><![CDATA[Bildersuche]]></category>
		<category><![CDATA[Blog]]></category>
		<category><![CDATA[Internet]]></category>
		<category><![CDATA[Bilder]]></category>
		<category><![CDATA[Spam]]></category>

		<guid isPermaLink="false">http://schnurpsel.de/mehr-bilderdiebe-286/</guid>
		<description><![CDATA[Eigentlich sind es nicht wirklich mehr Bilderdiebe geworden, der bekannte Bilderdieb taucht nur mit einem anderen Gesicht, sprich weiteren Subdomains auf. Nach meinem Äpfelbild ist nun auch mein Fenchel dort zu finden, der Fenchel von einem gewissen Kochbuch (Stichwort: Brötchen) übrigens auch. Die haben mittlerweile auch ein Ersatzbild eingebaut.
So muß ich nun nicht nur freeimages-de aussperren, sondern auch noch images-de. Oder doch gleich bloggum <a href='http://schnurpsel.de/mehr-bilderdiebe-286/' class='more-link'>...&#187;</a>]]></description>
			<content:encoded><![CDATA[<p><a class='imagelink' href='http://schnurpsel.de/wp-content/uploads/2009/12/bilder-dieb-am-pranger.jpg'><img src='http://schnurpsel.de/wp-content/uploads/2009/12/bilder-dieb-am-pranger-120x160.jpg' alt='Bilderdieb am Pranger' title='Bilderdieb am Pranger' class='rightimg' /></a>Eigentlich sind es nicht wirklich mehr Bilderdiebe geworden, der bekannte Bilderdieb taucht nur mit einem anderen Gesicht, sprich weiteren Subdomains auf. Nach meinem Äpfelbild ist nun auch mein Fenchel dort zu finden, der Fenchel von einem gewissen Kochbuch (Stichwort: Brötchen) übrigens auch. Die haben mittlerweile auch ein Ersatzbild eingebaut.</p>
<p>So muß ich nun nicht nur freeimages-de aussperren, sondern auch noch images-de. Oder doch gleich bloggum insgesamt? Ich weiß nicht&#8230;</p>
<p>Mit Dieben ist man früher nicht zimperlich gewesen. Die wurden kurzerhand an den Pranger gestellt und hatten da nichts zu lachen. Gut, die moderne Form des digitalen Prangers gibt es ja auch und das kann manchmal noch schlimmere Folgen haben.</p>
]]></content:encoded>
			<wfw:commentRss>http://schnurpsel.de/mehr-bilderdiebe-286/feed/</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
		<item>
		<title>Spam-Kommentare, die beliebtesten Artikel</title>
		<link>http://schnurpsel.de/spam-kommentare-die-beliebtesten-artikel-282/</link>
		<comments>http://schnurpsel.de/spam-kommentare-die-beliebtesten-artikel-282/#comments</comments>
		<pubDate>Mon, 07 Dec 2009 22:44:40 +0000</pubDate>
		<dc:creator>Schnurpselchen</dc:creator>
				<category><![CDATA[Blog]]></category>
		<category><![CDATA[Internet]]></category>
		<category><![CDATA[Wordpress]]></category>
		<category><![CDATA[Google]]></category>
		<category><![CDATA[Kommentar]]></category>
		<category><![CDATA[Pagerank]]></category>
		<category><![CDATA[Spam]]></category>
		<category><![CDATA[Statistik]]></category>

		<guid isPermaLink="false">http://schnurpsel.de/spam-kommentare-die-beliebtesten-artikel-282/</guid>
		<description><![CDATA[Viel Kommentarspam kommt hier ja nicht an. In den Monaten September, Oktober und November waren es insgesamt etwa 600 Versuche, automatisch einen spammigen Kommentar bei einem Artikel oder einer Seite zu hinterlassen. Diese Versuche werden allerdings gleich an der Türe abgebügelt, kommen gar nicht erst bis zur Datenbank und müssen deshalb auch nicht moderiert oder gelöscht werden.
Was mich schon immer interessiert, nach welchen Gesichtspunkten <a href='http://schnurpsel.de/spam-kommentare-die-beliebtesten-artikel-282/' class='more-link'>...&#187;</a>]]></description>
			<content:encoded><![CDATA[<p>Viel Kommentarspam kommt hier ja nicht an. In den Monaten September, Oktober und November waren es insgesamt etwa 600 Versuche, automatisch einen spammigen Kommentar bei einem Artikel oder einer Seite zu hinterlassen. Diese Versuche werden allerdings gleich an der Türe abgebügelt, kommen gar nicht erst bis zur Datenbank und müssen deshalb auch nicht moderiert oder gelöscht werden.</p>
<p>Was mich schon immer interessiert, nach welchen Gesichtspunkten wählen die Spambots Ihre Zielseiten aus. Gibt es irgendein System oder wird einfach zufällig gestreut? Ich habe dashalb alle Spamversuche aus den drei oben genannten Monaten aufsummiert und eine kleine Tabelle erstellt:</p>
<table class='statistik-tab' style='width:99%;'>
<tr>
<th>Nr</th>
<th>Artikel/Seite</th>
<th>Spam</th>
<th>PR</th>
<th>Kom</th>
</tr>
<tr class='line-0'>
<td>1</td>
<td class='text'><a href='http://schnurpsel.de/wordpress-plugins/123-moderate-comment-notification/' title='123 Moderate Comment Notification'>123 Moderate Comment Notification</a></td>
<td>21,3%</td>
<td>3</td>
<td>3</td>
</tr>
<tr class='line-1'>
<td>2</td>
<td class='text'><a href='http://schnurpsel.de/es-geht-doch-kontaktformular-mit-post-und-permalinks-71/' title='Es geht doch, Kontaktformular mit POST und Permalinks'>Es geht doch, Kontaktformular mit POST und Permalinks</a></td>
<td>17,1%</td>
<td>1</td>
<td>3</td>
</tr>
<tr class='line-0'>
<td>3</td>
<td class='text'><a href='http://schnurpsel.de/wordpress-und-die-suboptimale-mysql-optimierung-5051-74/' title='Wordpress und die suboptimale MySQL-Optimierung (5.0.51)'>Wordpress und die suboptimale MySQL-Optimierung (5.0.51)</a></td>
<td>14,7%</td>
<td>2</td>
<td>42</td>
</tr>
<tr class='line-1'>
<td>4</td>
<td class='text'><a href='http://schnurpsel.de/wordpress-plugins/123-metablog/' title='Privat: 123 MetaBlog'>Privat: 123 MetaBlog</a></td>
<td>11,9%</td>
<td>2</td>
<td>2</td>
</tr>
<tr class='line-0'>
<td>5</td>
<td class='text'><a href='http://schnurpsel.de/wordpress-23-anonym-up-to-date-bleiben-59/' title='Wordpress 2.3 &#8211; Anonym up-to-date bleiben'>Wordpress 2.3 &#8211; Anonym up-to-date bleiben</a></td>
<td>5,9%</td>
<td>2</td>
<td>14</td>
</tr>
<tr class='line-1'>
<td>6</td>
<td class='text'><a href='http://schnurpsel.de/wordpress-23-problem-ohne-www-bei-strato-65/' title='Wordpress 2.3 &#8211; Problem ohne www bei Strato'>Wordpress 2.3 &#8211; Problem ohne www bei Strato</a></td>
<td>5,2%</td>
<td>2</td>
<td>82</td>
</tr>
</table>
<p>Ich habe nur die Seiten und Artikel berücksichtigt, die 5% oder mehr am Spamaufkommen ausmachen. In der Spalte <em>PR</em> steht der aktuelle Google-Pagerank und in der Spalte <em>Kom</em> die Anzahl der abgegebenen und freigeschalteten  Kommentare.</p>
<p>Alle Seiten oder Artikel sind schon mindestens ein Jahr alt. Der Artikel &#8220;<a href='http://schnurpsel.de/wordpress-27-wartungsmodus-ohne-plugin-139/' title='Wordpress 2.7 &#8211; Wartungsmodus ohne Plugin'>Wordpress 2.7 &#8211; Wartungsmodus ohne Plugin</a>&#8221; mit dem höchsten Pagerank (4) gehört mit 0,8% nicht zu den Favoriten der Spambots, allerdings immerhin zwei der Seiten mit den meisten Kommentaren.</p>
<p>Was kann man nun daraus schließen? Nichts, würde ich sagen :-)<br />
Es gibt wohl kein offensichtliches Muster, nachdem sich die Spambots die Artikel aussuchen, zumindest kann ich keins erkennen.</p>
<p>Interessant fand ich allerdings die Tatsache, daß zwar selten, aber ab und zu doch Kommentarspam fast in Echtzeit auftauchte, nur wenige Stunden nach Veröffentlichung eines Artikels. Rekord war dabei mal eine knappe halbe Stunde. Schon erstaunlich.</p>
]]></content:encoded>
			<wfw:commentRss>http://schnurpsel.de/spam-kommentare-die-beliebtesten-artikel-282/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Bilderdiebe &#8211; was ich dagegen tue</title>
		<link>http://schnurpsel.de/bilderdiebe-was-ich-dagegen-tue-279/</link>
		<comments>http://schnurpsel.de/bilderdiebe-was-ich-dagegen-tue-279/#comments</comments>
		<pubDate>Sat, 05 Dec 2009 23:23:18 +0000</pubDate>
		<dc:creator>Schnurpselchen</dc:creator>
				<category><![CDATA[Bildersuche]]></category>
		<category><![CDATA[Blog]]></category>
		<category><![CDATA[Internet]]></category>
		<category><![CDATA[Bilder]]></category>
		<category><![CDATA[Hut]]></category>
		<category><![CDATA[Konfiguration]]></category>
		<category><![CDATA[Rewrite]]></category>
		<category><![CDATA[Spam]]></category>

		<guid isPermaLink="false">http://schnurpsel.de/bilderdiebe-was-ich-dagegen-tue-279/</guid>
		<description><![CDATA[Gut, das Thema des aktuellen Webmasterfridays ist zwar mit &#8220;Was tun bei Urheberrechtsverstößen?&#8221; deutlich weiter gefaßt, als das es dabei nur um Bilder und Fotos ginge.
Der &#8220;Aufhänger&#8221; war aber wohl der Bilderklau beim TagSeoBlog und so will ich mich hier auch nur auf dieses Problem beziehen.
Von Bilderdieben und Raubkopierern
Im richtigen Leben ist das alles klar und weitestgehend eindeutig definiert. Geht jemand in eine Gemäldegalerie, <a href='http://schnurpsel.de/bilderdiebe-was-ich-dagegen-tue-279/' class='more-link'>...&#187;</a>]]></description>
			<content:encoded><![CDATA[<p><a class='imagelink' href='http://schnurpsel.de/wp-content/uploads/2009/10/alter-hut.jpg'><img src='http://schnurpsel.de/wp-content/uploads/2009/10/alter-hut-160x120.jpg' alt='Alter Hut' title='Alter Hut' class='leftimg' /></a>Gut, das Thema des aktuellen Webmasterfridays ist zwar mit &#8220;<a href="http://www.webmasterfriday.de/blog/was-tun-bei-urheberrechtsverstoessen">Was tun bei Urheberrechtsverstößen?</a>&#8221; deutlich weiter gefaßt, als das es dabei nur um Bilder und Fotos ginge.</p>
<p>Der &#8220;Aufhänger&#8221; war aber wohl der <a href="http://www.tagseoblog.de/krimineller-fall-von-bilderklau-black-hat-bilder-seo-pur">Bilderklau beim TagSeoBlog</a> und so will ich mich hier auch nur auf dieses Problem beziehen.</p>
<h3>Von Bilderdieben und Raubkopierern</h3>
<p>Im richtigen Leben ist das alles klar und weitestgehend eindeutig definiert. Geht jemand in eine Gemäldegalerie, hängt dort heimlich ein Bild ab und nimmt es mit nach Hause, so ist das Diebstahl und derjenige ein Bilderdieb. Tut er so etwas zudem unter Anwendung von Gewalt oder Androhung von Gefahr für Leib oder Leben von Personen, so ist das Raub. Was nun genau ein Raubkopierer macht, ist mir allerdings nicht klar. Ich könnte mir aber vorstellen, daß das jemand ist, der z.B. eine bestimmte Ablauf eines bekannt gewordenen Raubes nachahmt, mithin also den Raub in der Vorgehensweise kopiert :-)</p>
<p>Beiden Delikten, Diebstahl und Raub, ist gemeinsam, daß es sich um die Wegnahme einer fremden beweglichen Sache handelt. Deshalb wird ein Diebstahl meist auch recht schnell bemerkt, denn der entwendete Gegenstand, z.B. das Gemälde, ist ja nicht mehr da.</p>
<h3>Bildkopien und Hotlinking</h3>
<p>In der digitalen Welt sieht das nun etwas anders aus, auch wenn hier unzutreffenderweise die Begriffe aus dem richtigen Leben verwendet werden. Denn normalerweise wird ein Bild ja nicht &#8220;entwendet&#8221;, so daß es plötzlich beim Besitzer fehlt, sondern nur eine Kopie angefertigt und an anderer Stelle verwendet (Bildkopie). Das führ auch dazu, daß die unrechtmäßige Verwendung eines Bildes erst sehr spät oder auch gar nicht bemerkt wird. Oft kommt so etwas nur eher zufällig ans Tageslicht.</p>
<p>Besonders im Internet wird oft noch nicht mal eine Kopie eines Bildes angefertigt, sondern das Bild einfach direkt von der fremden Seite eingebunden (Hotlink). Dadurch wird nicht nur das Bild möglicherweise unberechtigt verwendet, sondern auch noch der Server des &#8220;Bestohlenen&#8221; belastet und ein zusätzliches Datenaufkommen erzeugt. Andererseits sind diese Hotlinks recht schnell zu erkennen, wenn man sich als Webmaster ab und zu die Serverlogfiles daraufhin ansieht.</p>
<h3>Urheberrecht</h3>
<p><a class='imagelink' href='http://schnurpsel.de/wp-content/uploads/2009/12/uhrheber.jpg'><img src='http://schnurpsel.de/wp-content/uploads/2009/12/uhrheber-160x102.jpg' alt='Uhrheber' title='Uhrheber' class='rightimg' /></a>Die oben genannten Bildkopien bzw. das Hotlinking sind also kein Diebstahl oder gar Raub, sondern Verletzungen des Urheberrechtes.</p>
<p>Die wichtigsten Punkte im Urheberecht sind wohl Veröffentlichungs-, Verwertungs- und Folgerechte die es dem Schöpfer eines Werkes erlauben, allein darüber zu bestimmt, ob, wann, wo und in welcher Form sein Werk der Öffentlichkeit zugänglich gemacht und wie es im weiteren verwertet, verbreitet und vervielfältigt wird.</p>
<h3>Meine Bilder</h3>
<p>Im Allgemeinen habe ich nichts dagegen, wenn meine hier oder bei Putzlowitsch veröffentlichten Bilder von Dritten verwendet werden. Sei es nun in Communities, Foren oder anderen Blogs. Auch mit Hotlinks habe ich im Zeitalter von &#8220;unbegrenztem&#8221; Traffic keine Probleme, ganz im Gegenteil, bin ich doch darüber schon auf die eine oder andere <a href="http://putzlowitsch.de/2007/03/20/drummer-baby-bel/">interessante Seite</a> gestoßen.</p>
<p>Wenn nun aber meine Bilder dreist auf irgendwelchen Spam-Seiten landen oder in einem mir sonst wie nicht genehmen Kontext (z.B. rechtsradikale Foren) erscheinen, dann habe ich schon etwas dagegen. Da es bisher meist nur Hotlinks waren (bei Kopien habe ich es möglicherweise nur noch nicht bemerkt), gehe ich dagegen mit einer technischen Maßnahme vor.</p>
<h3>Bilder-Hotlink unterbinden</h3>
<p>Normalerweise sendet der Webbrowser eines Nutzers beim Aufruf einer Seite oder eines Bildes die Information mit, woher der Aufruf kommt. Bei einem Link ist das die verlinkende Seite oder bei einem sichtbaren Bild eben die Seite, auf der das Bild angezeigt wird. Diese Information, den so genannten REFERER kann der Webserver auswerten und gegebenenfalls bestimmte Aktionen ausführen. Das Ganze läuft über das Servermodul <em>mod_rewrite</em> und wird über die Datei <em>.htaccess</em> konfiguriert. Damit kann man dem Webserver z.B. sagen, daß wenn die Seite <em>xyz</em> aufgerufen wurde, er doch stattdessen bitte die Seite <em>abc</em> ausliefern oder einen Fehlercode zurückgeben soll.</p>
<p>Die einfachste und zugleich radikalste Variante, dem Hotlinking zu begegnen, ist folgender Dreizeiler:</p>
<pre>
RewriteCond %{HTTP_REFERER} !^$
RewriteCond %{HTTP_REFERER} !^http://(www.)?schnurpsel.de/.*$ [NC]
RewriteRule \.(gif|jpe?g|png)$ - [F,L]</pre>
<p>So oder ähnlich findet man das auf vielen Webseiten als Empfehlung, wie man sich gegen das Hotlinking schützen kann. Die Strategie ist hierbei, allen die Zugriffe auf Bilder zu verbieten (3. Zeile), und nur Zugriffe von der eigenen Seite zuzulassen (2. Zeile). Die 1. Zeile nimmt etwas Radikalität wieder raus, denn auch wenn der Referer leer, also nicht bekannt ist, woher der Aufruf kam, werden die Bilder angezeigt. Ohne Zeile eins würde man z.B. alle Suchmaschinen-Bots aussperren und auch die User, deren Browser den Referer unterdrückt.</p>
<p>Unberechtigte Zugriffe werden hier vom Webserver mit dem Fehlercode &#8220;<a href="http://www.w3.org/Protocols/rfc2616/rfc2616-sec10.html#sec10.4.4">403 Forbidden</a>&#8221; quittiert, der Browser zeigt dann für ein Bild nur den Alternativtext (falls vorhanden) und eventuell ein Fehlersymbol an. Die Antwort ist klar und deutlich, der Zugriff ist verboten und wird verweigert.</p>
<h3>Meine Hotlink-Strategie</h3>
<p>Ich bin da nicht ganz so konsequent sondern fahre eine andere Strategie. Ich erlaube prinzipiell allen den Zugriff und schließe nur unerwünschte Seiten aus. Ich will ja nicht die vielen netten User von Jappy, Schnappy und Zappy daran hindern, sich gegenseitig ihre &#8220;Gästebücher&#8221; mit Bildern vollzukippen :-)</p>
<p>Bei mir sieht die Hotlinkabwehr deswegen etwas komplizierter aus:</p>
<pre>RewriteCond	%{REQUEST_FILENAME} -f
RewriteCond	%{REQUEST_URI}	!^/images/1x5120.gif$
RewriteRule	\.(jpg|gif|png)$	-	[NC,C]
RewriteCond	%{HTTP_REFERER}	hotlink\.schnurpsel\.de [NC,OR]
RewriteCond	%{HTTP_REFERER}	bilderdieb\.schnurpsel\.de [NC,OR]
RewriteCond	%{HTTP_REFERER}	xxxx-yyyy\.zz
RewriteRule	.	/images/1x5120.gif	[T=image/gif,L]</pre>
<p>In der 1. Zeile wird geprüft, ob die angeforderte Datei überhaupt existiert. Falls nicht, soll nicht die Hotlink-Abwehr greifen, sondern die normale Fehlerbehandlung ablaufen.</p>
<p>Da ich nicht einfach den Statuscode 403 zurückliefern will, sondern ein Ersatzbild, wird in der 2. Zeile geprüft, ob nicht gerade das Ersatzbild angefordert wird. Dann darf die Hotlink-Abwehr nicht erneut anspringen, sonst gäbe es eine prima Endlosschleife.</p>
<p>Die 3. Zeile selektiert nur die Zugriffe, die ein Bild mit einer der angegebenen Datei-Erweiterungen betreffen, hier also jpg-, gif- und png-Bilder. Die Liste kann natürlich beliebig erweitert werden. Dabei kann man ein klein wenig optimieren, in dem man den Bildtyp nach der Reihenfolge ihrer Häufigkeit angibt. Da bei mir die meisten Bilder vom Typ jpg sind, brauchen die restlichen Einträge dann nicht mehr überprüft werden.</p>
<p>Mit den Zeilen 1 bis 3 werden Vorbedingungen geprüft und nur wenn die angeforderte Datei existiert, nicht das Ersatzbild ist und dem richtigen Dateityp entspricht, wird der Rest abgearbeitet.</p>
<p>Die Zeilen 4, 5 &#8230; n-1 enthalten die eigentlichen Bedingungen, wann ein Hotlink als böse einzuordnen ist. Hier wird auf den oben schon angesprochenen Referer Bezug genommen und jede Seite eingetragen, von der Hotlinks unerwünscht sind. Auch hier kann man etwas optimieren, indem man die häufigsten Seiten an den Anfang der Liste stellt. Man kann hier aber auch andere Bedingungen einsetzen, z.B. IP-Adressen. Eine ausführliche Beschreibung zum Apache-Rewrite-Modul findet man <a href="http://httpd.apache.org/docs/1.3/mod/mod_rewrite.html">hier</a>.</p>
<p>Die letzte Zeile n gibt dann nur noch das Ersatzbild aus, bei mir ein transparentes GIF-Bild mit einem Pixel Breite aber über 5000 Bildpunkten Höhe. Zu sehen ist es nicht, aber es reißt die Seite an der Stelle weit auseinander, ja nach dem, wie das Bild auf der Hotlinkseite eingebunden ist. Außerdem liefere ich, egal was für ein Bildtyp angefordert wird, immer das Gif-Bild aus. Deshalb wird noch der richtige Content-Type (image/gif) gesetzt.</p>
<h3>So sieht es aus</h3>
<p>Zur Demonstration habe ich mal zwei böse und eine gute Sub-Domain erstellt, damit man sehen kann, wie sich das Ersatzbild auswirkt.<br />
Die gute Seite:<br />
<a href="http://der-alte-hut.schnurpsel.de/">Der alte Hut</a><br />
Die bösen Seiten:<br />
<a href="http://bilderdieb.schnurpsel.de/">Bilderdieb</a><br />
<a href="http://hotlink.schnurpsel.de/">Hotlink</a><br />
Hinweis zu den bösen Seiten: Wenn man sich zuerst die gute Seite angesehen hat, dann wird auf einer der bösen Seiten möglicherweise trotzdem der Hut und nicht das Ersatzbild angezeigt. Das liegt am Caching durch den Browser. Man muß dann nochmal das Neuladen der Seite erzwingen, beim Firefox z.B. mit Shift+Reload-Button oder Strg+F5.</p>
<p>Vorerst reicht mir meine Hotlink-Abwehr per Ersatzbild für böse Seiten, die Seiten und Abrufe sind allerdings auch recht überschaubar. Problematisch wird es, wenn die Liste mit den Seiten gar zu lang wird, denn die muß der arme Webserver immer von oben bis unten abarbeiten. Das könnte sich dann mit schlechten Antwortzeiten und höherer Serverlast bemerkbar machen.</p>
<p><strong>Nachtrag:</strong> Ich habe es nicht extra erwähnt, aber damit die Regeln überhaupt abgearbeitet werden, muß normalerweise die Rewrite-Engine eingeschaltet werden. Zudem sollte man prüfen, ob das Modul mod_rewrite überhaupt zur Verfügung steht. So sieht dann meine Variante komplett aus:</p>
<pre>&lt;IfModule mod_rewrite.c&gt;
RewriteEngine On
RewriteCond %{REQUEST_FILENAME} -f
RewriteCond %{REQUEST_URI} !/bilder/bild-foto/die-besten-bilder-der-welt.jpg$
RewriteRule \.(jpg|gif|png)$ - [NC,C]
RewriteCond %{HTTP_REFERER} bilderr\.com [NC,OR]
RewriteCond %{HTTP_REFERER} pictures-images\.com [NC,OR]
RewriteCond %{HTTP_REFERER} freeimages-de\.bloggum\.com [NC,OR]
RewriteCond %{HTTP_REFERER} zaggla\.com [NC]
RewriteRule . /bilder/bild-foto/die-besten-bilder-der-welt.jpg [T=image/jpg,L]
&lt;/IfModule&gt;</pre>
<p>Dieser Block sollte noch vor allen anderen  Rewrite-Blöcken stehen, also auch vor den Wordpress-Permalink-Eintrag.</p>
]]></content:encoded>
			<wfw:commentRss>http://schnurpsel.de/bilderdiebe-was-ich-dagegen-tue-279/feed/</wfw:commentRss>
		<slash:comments>14</slash:comments>
		</item>
		<item>
		<title>Komischer Spam und der HTTP-Statuscode</title>
		<link>http://schnurpsel.de/komischer-spam-und-der-http-statuscode-251/</link>
		<comments>http://schnurpsel.de/komischer-spam-und-der-http-statuscode-251/#comments</comments>
		<pubDate>Sat, 31 Oct 2009 18:44:00 +0000</pubDate>
		<dc:creator>Schnurpselchen</dc:creator>
				<category><![CDATA[Internet]]></category>
		<category><![CDATA[HTTP]]></category>
		<category><![CDATA[Spam]]></category>
		<category><![CDATA[Statuscode]]></category>

		<guid isPermaLink="false">http://schnurpsel.de/komischer-spam-und-der-http-statuscode-251/</guid>
		<description><![CDATA[
Komischer Link
Hin und wieder schaue ich mal in die Google-Webmastertools, wie es so um meine Seiten bestellt ist. Neben allerlei anderen, nützlichen Sachen gibt es auch eine Übersicht, welche Probleme es möglicherweise beim Abfragen der Seiten durch den Google-Bot in letzter Zeit gab. Und diese Übersicht zeigt mir im Moment dieses hier an.
Gut, die Fehler 1,2 und 4 sind klar, die kann ich nachvollziehen, <a href='http://schnurpsel.de/komischer-spam-und-der-http-statuscode-251/' class='more-link'>...&#187;</a>]]></description>
			<content:encoded><![CDATA[<p><img src='http://schnurpsel.de/images/crawling-fehler-webmastertools.png' alt='Crawling-Fehler Google-Webmastertools' title='Crawling-Fehler Google-Webmastertools' /></p>
<h3>Komischer Link</h3>
<p>Hin und wieder schaue ich mal in die Google-Webmastertools, wie es so um meine Seiten bestellt ist. Neben allerlei anderen, nützlichen Sachen gibt es auch eine Übersicht, welche Probleme es möglicherweise beim Abfragen der Seiten durch den Google-Bot in letzter Zeit gab. Und diese Übersicht zeigt mir im Moment <a href='http://schnurpsel.de/images/crawling-fehler-spam.png' title='Crawling-Fehler Spam'>dieses hier</a> an.</p>
<p>Gut, die Fehler 1,2 und 4 sind klar, die kann ich nachvollziehen, aber was bitte ist Fehler 3?</p>
<p>/warning_this_is_english_domain_to_solve_this_problem_submit_site_in_atoall.com.html</p>
<p>Wenn ich irgend sowas Seltsames finde, suche ich erstmal bei Google, was das denn bedeuten könnte. Das <a href="http://schnurpsel.de/images/google-wm-spam-url.png">Ergebnis</a> hat mich dann doch überrascht. Diese komische, nichtexistierende Seite gibt es auf einigen Tausend Domains. Wenn man die <a href="http://www.google.de/search?q=warning_this_is_english_domain_to_solve_this_problem_submit_site_in_atoall.com.html&#038;meta=lr%3Dlang_de">Suche nur auf deutsche Seiten</a> beschränkt, findet man sogar prominente Seiten wie www.ard.de oder www.wetter.de.</p>
<p>Aber wieso nimmt Google diese vermutlich nicht wirklich existierenden Seiten in den Index auf, die offensichtlich Ergebnis einer, wie auch immer gearteten Spamaktion sind?</p>
<h3> HTTP-Statuscode</h3>
<p>Hier kommt nun der HTTP-Statuscode ins Spiel, denn was im Fehlerfall dem Nutzer angezeigt wird, ist das eine. Viel wichtiger ist aber, mit welchem Antwortcode die Seite ihr Ergebnis zurückliefert. Bei einem &#8220;normalen&#8221; Fehler, wie z.B. einer nichtexistierenden Seite, sollte das der Code <strong>404 Not Found</strong> sein. <a href='http://schnurpsel.de/410-gone-der-seo-technische-supergau-169/' title='410 Gone &#8211; der SEO-technische Supergau'>Zu den Statuscodes</a> hatte ich bereits vor einiger Zeit etwas geschrieben. Was machen aber alle die Seiten, die man in der Google-Suche zu der seltsamen URL findet. Sie geben einfach den Code <strong>200 Ok</strong> zurück, damit geht der Google-Bot davon aus, daß die Seite existiert, und nimmt sie in den Index auf.</p>
<p>Manche Seiten zeigen zumindest dem Nutzer an, daß ein Fehler aufgetreten ist. Die zwei oben genannten Beispiele tun aber so, als sei alles in Ordnung und präsentieren dem Nutzer die Startseite. Das finde ich ohnehin immer ein Unding, weil der Nutzer überhaupt nicht mitbekommt, das etwas nicht stimmt. Gut, man muß nun den User auch nicht unbedingt mit einer spartanischen Fehlermeldung wie hier auf schnurpsel.de erschrecken, aber so zu tun, als sei nichts passiert, ist auch nicht der richtige Weg. Wenigstens sollte man den Statuscode 404 ausliefern, den sieht der Nutzer ja nicht.</p>
<h3>Meine Deutung</h3>
<p>Ich würde diese Sache mal als Webmaster-Spam verbuchen, denn die Treffer in der Google-Suche findet man nur mit der vollständigen URL. Hätte der &#8220;Spamerfinder&#8221; es auf Google-Treffer abgesehen, hätte er die einzelnen Wörter mit Bindestrichen und nicht mit Unterstrichen trennen müssen.</p>
<p>Aber Webmaster, die sich entweder mit den Google-Webmaster-Tools oder einfach mit den Errorlogs des Webservers die Fehler hin und wieder ansehen, stoßen auf diese URL. Eventuell ist ja der eine oder andere Neugierig, zumal der gelesene URL-Text irgendwie nach einer Systemmeldeung klingt, und besucht die Seite am Ende der URL. Naja, und was er da dann findet&#8230;</p>
<p><strong>Nachtrag</strong> (2.11.):<br />
Der Sachverhalt mit den komischen URLs ist schon jemandem <a href="http://www.cix-blog.de/Suchmaschinen-Spam-im-Google-Index-787-2009.html">10 Tage vor mir</a> aufgefallen, wie ich <a href="http://www.cix-blog.de/Werbung-mit-Google-Index-790-2009.html">hierrüber</a> entdeckt habe. Ähmmm, stand ja auch schon im ersten Kommentar. Ich sollte die Kommentare mal ernst nehmen :-)</p>
<p>Beste Grüße nach Görlitz :-)</p>
]]></content:encoded>
			<wfw:commentRss>http://schnurpsel.de/komischer-spam-und-der-http-statuscode-251/feed/</wfw:commentRss>
		<slash:comments>4</slash:comments>
		</item>
		<item>
		<title>Neue Qualität bei Kommentar-Spam oder alter Hut?</title>
		<link>http://schnurpsel.de/neue-qualitaet-bei-kommentar-spam-oder-alter-hut-223/</link>
		<comments>http://schnurpsel.de/neue-qualitaet-bei-kommentar-spam-oder-alter-hut-223/#comments</comments>
		<pubDate>Wed, 21 Oct 2009 09:58:03 +0000</pubDate>
		<dc:creator>Schnurpselchen</dc:creator>
				<category><![CDATA[Blog]]></category>
		<category><![CDATA[Kommentar]]></category>
		<category><![CDATA[SEO]]></category>
		<category><![CDATA[Spam]]></category>

		<guid isPermaLink="false">http://schnurpsel.de/neue-qualitaet-bei-kommentar-spam-oder-alter-hut-223/</guid>
		<description><![CDATA[Vielleicht ist es ja auch ein alter Hut, ich bin zumindest erst vorhin drauf gestoßen. Und das kam so.
Ich habe nach längerer Zeit mal wieder die Google-Webmastertools aufgerufen um zu sehen, was ich denn so für eingehende Links auf meine Putzlowitsch-Seite habe. Der erste Blick zeigte nicht viel Neues, auf den zweiten Blick habe ich aber eine Seite entdeckt, die mir völlig unbekannt ist. <a href='http://schnurpsel.de/neue-qualitaet-bei-kommentar-spam-oder-alter-hut-223/' class='more-link'>...&#187;</a>]]></description>
			<content:encoded><![CDATA[<p><a class='imagelink' href='http://schnurpsel.de/wp-content/uploads/2009/10/alter-hut.jpg'><img src='http://schnurpsel.de/wp-content/uploads/2009/10/alter-hut-160x120.jpg' alt='Alter Hut' title='Alter Hut' class='leftimg' /></a>Vielleicht ist es ja auch ein <a class='imagelink' href='http://schnurpsel.de/wp-content/uploads/2009/10/alter-hut-1600.jpg'>alter Hut</a>, ich bin zumindest erst vorhin drauf gestoßen. Und das kam so.</p>
<p>Ich habe nach längerer Zeit mal wieder die Google-Webmastertools aufgerufen um zu sehen, was ich denn so für eingehende Links auf meine <a href="http://putzlowitsch.de">Putzlowitsch-Seite</a> habe. Der erste Blick zeigte nicht viel Neues, auf den zweiten Blick habe ich aber eine Seite entdeckt, die mir völlig unbekannt ist. Neugierig bin ich dem Link gefolgt und wurde zu einem alten Bekannten, dem <a href="http://www.tagseoblog.de/">TagSeoBlog</a> und dort auf die Startseite weitergeleitet.</p>
<p>Hier habe ich dann den aktuellen Artikel &#8220;<a href="http://www.tagseoblog.de/aktuelle-news-aus-der-blogosphaere">Aktuelle Meldungen aus der Blogosphäre</a>&#8221; mit zu dem Zeitpunkt drei Kommentaren gelesen. Ein Kommentar von <a href="http://seo2feel.de/">Mirco (seo2feel)</a> geht am Ende auf das Problem topsy.com (Spam oder nicht?) ein und verweist auf einen eigenen Beitrag &#8220;<a href="http://seo2feel.de/2009/09/topsy-die-neue-spamschleuder/">Topsy die neue Spamschleuder</a>&#8220;. Und genau dort ist mir in den Kommentaren etwas aufgefallen.</p>
<h3>Kommentar-Recycling</h3>
<p>Beim Lesen der Kommentare wurde ich bei Kommentar Nr. 7 stutzig. Den hatte ich doch schon mal gelesen, also flux nach oben gescrollt und siehe da, da war er schon mal als Nr. 2. Allerdings nicht wirklich, denn sowohl Kommentator als auch Link unterscheiden sich, und der Kommentartext selbst auch. Allerdings nur in der Anordnung der Wörter, die Wörter selbst sind dieselben:<br />
<a class='imagelink' href='http://schnurpsel.de/wp-content/uploads/2009/10/kommentar-recycling-500.png'><img src='http://schnurpsel.de/wp-content/uploads/2009/10/kommentar-recycling-500.png' alt='Kommentar Recycling' title='Kommentar Recycling' class='leftimg' /></a><br />
Neben der Umstellung des Satzbaus gibt es noch zwei kleinere Abweichungen. Aus einzigste wird einzigster und aus Stadtportale wird Stadtportal. Aber warum sollte man einen Kommentartext wiederverwerten?</p>
<p>Aus meiner Sicht gibt es nur einen Grund, man will inhaltsbasierte Spamabwehr-Ansätze wie <a href="http://akismet.com/">Akismet</a> oder einfache Stopwortlisten austricksen. Die Idee ist einfach, man sucht sich einen Kommentar, der bereits genehmigt wurde (klar, sonst wäre er ja nicht zu sehen) und verwendet genau die Wörter für den eigenen &#8220;Kommentar&#8221;. Damit es nicht zu offensichltich ist, gruppiert man die Wörter etwas um. Da das am Inhalt aber nichts ändert, ist die Wahrscheinlichkeit in eine inhaltsorientiert Spamabwehr zu laufen, sehr gering. Und schon hat man einen Link von einer themenrelevanten Seite platziert.</p>
<h3>Oder doch nicht?</h3>
<p>Vielleicht sehe ich ja auch zu schwarz, ist gar nichts dran und es war nur der etwas hilflose Versuch eines der deutschen Sprache nicht mächtigen, in einem deutschsprachigen Blog einen Kommentar zu hinterlassen. Die Idee als solche finde ich aber schon nicht schlecht, also das mit dem Kommentar-Recycling für Spamkommentare :-)</p>
]]></content:encoded>
			<wfw:commentRss>http://schnurpsel.de/neue-qualitaet-bei-kommentar-spam-oder-alter-hut-223/feed/</wfw:commentRss>
		<slash:comments>5</slash:comments>
		</item>
		<item>
		<title>Achtung! Spamschutz!</title>
		<link>http://schnurpsel.de/achtung-spamschutz-216/</link>
		<comments>http://schnurpsel.de/achtung-spamschutz-216/#comments</comments>
		<pubDate>Thu, 08 Oct 2009 12:09:08 +0000</pubDate>
		<dc:creator>Schnurpselchen</dc:creator>
				<category><![CDATA[Internet]]></category>
		<category><![CDATA[Sicherheit]]></category>
		<category><![CDATA[Spam]]></category>

		<guid isPermaLink="false">http://schnurpsel.de/achtung-spamschutz-216/</guid>
		<description><![CDATA[Achtung! Der Inhalt der nachfolgenden Seite wird erst nach Eingabe der Spamschutz-Überprüfung zugänglich!

Kleiner Hinweis noch, es sind 4 Ziffern (in Worten: vier).
Kannst Du nichts erkennen? Einfach warten, nach ein paar Sekunden wird ein neuer Code eigeblendet.
Immer noch nicht? Na dann rate ich zu einem Besuch beim Augenarzt! :-)
Solche Sachen bekommt man auf manchen Seiten vorgesetzt. In dem Fall war es eine Flirt-Seite, natürlich alles <a href='http://schnurpsel.de/achtung-spamschutz-216/' class='more-link'>...&#187;</a>]]></description>
			<content:encoded><![CDATA[<p>Achtung! Der Inhalt der nachfolgenden Seite wird erst nach Eingabe der Spamschutz-Überprüfung zugänglich!</p>
<p><img src='http://schnurpsel.de/wp-content/uploads/2009/10/spamschutz.gif' alt='Spamschutz' title='Spamschutz' /></p>
<p>Kleiner Hinweis noch, es sind <strong>4 Ziffern</strong> (in Worten: vier).</p>
<p>Kannst Du nichts erkennen? Einfach warten, nach ein paar Sekunden wird ein neuer Code eigeblendet.<br />
Immer noch nicht? Na dann rate ich zu einem Besuch beim Augenarzt! :-)</p>
<p>Solche Sachen bekommt man auf manchen Seiten vorgesetzt. In dem Fall war es eine Flirt-Seite, natürlich alles 100% kostenlos und völlig unverbindlich.</p>
<p>Hier noch die <a class='imagelink' href='http://schnurpsel.de/wp-content/uploads/2009/10/spamschutz-aufloesung.gif'>Auflösung des Zahlenrätsels</a>. Ich habe einfach den Gammawert etwas hochgedreht.</p>
]]></content:encoded>
			<wfw:commentRss>http://schnurpsel.de/achtung-spamschutz-216/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Eingehende Links von /map.html</title>
		<link>http://schnurpsel.de/eingehende-links-von-maphtml-73/</link>
		<comments>http://schnurpsel.de/eingehende-links-von-maphtml-73/#comments</comments>
		<pubDate>Sun, 06 Jan 2008 21:32:00 +0000</pubDate>
		<dc:creator>Schnurpselchen</dc:creator>
				<category><![CDATA[Allgemein]]></category>
		<category><![CDATA[Internet]]></category>
		<category><![CDATA[HTTP]]></category>
		<category><![CDATA[Link]]></category>
		<category><![CDATA[Referer]]></category>
		<category><![CDATA[Spam]]></category>

		<guid isPermaLink="false">http://schnurpsel.de/eingehende-links-von-maphtml-73/</guid>
		<description><![CDATA[Eingehende Links sind ja was feines. Da hat also jemand anderes die Seite verlinkt, vielleicht weil sie ihm besonders gut gefällt, er sie irgendwie nützlich findet oder warum auch immer. Manche Seiten veröffentlichen sogar Statistiken mit diesen eingehenden Links, inklusive des Links als Link, womit er dann ein ausgehender Link wird, der wiederum einen eingehenden Link aus Sicht der verlinkenden Seite darstellt. Wie wichtig <a href='http://schnurpsel.de/eingehende-links-von-maphtml-73/' class='more-link'>...&#187;</a>]]></description>
			<content:encoded><![CDATA[<p>Eingehende Links sind ja was feines. Da hat also jemand anderes die Seite verlinkt, vielleicht weil sie ihm besonders gut gefällt, er sie irgendwie nützlich findet oder warum auch immer. Manche Seiten veröffentlichen sogar Statistiken mit diesen eingehenden Links, inklusive des Links als Link, womit er dann ein ausgehender Link wird, der wiederum einen eingehenden Link aus Sicht der verlinkenden Seite darstellt. Wie wichtig Links sind, ist ja nicht erst seit Google bekannt.</p>
<p>Woher weiß man nun aber, woher die Links kommen? Man kann es unter anderem in der Webserver-Logdatei sehen, dort wird der soganannte Referer möglicherweise mit gespeichert und das ist genau die Information um zu erkennen, wie der Besucher auf die Seite gelangt ist. Wenn er z.B. über eine Suche von Google gekommen ist, kann man sogar herausfinden, wonach der Benutzer bei Google gesucht hatte.</p>
<p>Der Referer wird normalerweise vom Web-Browser des Nutzers an den Webserver beim Aufruf einer Seite im sogenannten HTTP-Request mitgeschickt, kann aber ebenso fehlen oder sonst irgendwie verändert sein. Er kann auch auf irgendeine beliebige andere Webseite verweisen, auf der überhaupt kein Link zur eigenen Seite existiert. Genau das machen sich Spammer zunutze, man spricht dann von &#8220;Referer-Spam&#8221;, eine Technik, die es schon seit einiger Zeit gibt.</p>
<p>In letzter Zeit habe ich hier häufiger eingehende Links von Seiten, die als /map.html erscheinen. Immer von irgendwelchen .com-Hosts mit so interessanten Namen wie facsimile-prints, trollcollective oder yachting-swap, in den letzten 30 Tagen ungefähr 20 unterschiedliche Seiten mit jeweils vier bis sieben Aufrufen.<br />
Auf den Seiten selbst findet man dann lange Listen mit Links, die alle nach pharmazeutischen Produkten klingen, so Sachen wie adipex, didrex, medrol, prozac und xanax. Diese Links sind aber wiederum nur Weiterleitungen auf andere Seiten die allerdings meist nicht funktionieren. Also weiß ich nicht, wo man dann wirklich landet, interessiert mich aber auch nicht. Es ist halt Spam, Referer-Spam.</p>
<p>Falls also jemand vermehrt eingehenden Links von *.com/map.html hat, nicht zu früh freuen, es wir mit hoher Wahrscheinlichkeit Spam sein.</p>
]]></content:encoded>
			<wfw:commentRss>http://schnurpsel.de/eingehende-links-von-maphtml-73/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>
