Das Putzlowitsch Test- und SEO-Blog

Komischer Spam und der HTTP-Statuscode

Crawling-Fehler Google-Webmastertools

Komischer Link

Hin und wieder schaue ich mal in die Google-Webmastertools, wie es so um meine Seiten bestellt ist. Neben allerlei anderen, nützlichen Sachen gibt es auch eine Übersicht, welche Probleme es möglicherweise beim Abfragen der Seiten durch den Google-Bot in letzter Zeit gab. Und diese Übersicht zeigt mir im Moment dieses hier an.

Gut, die Fehler 1,2 und 4 sind klar, die kann ich nachvollziehen, aber was bitte ist Fehler 3?

/warning_this_is_english_domain_to_solve_this_problem_submit_site_in_atoall.com.html

Wenn ich irgend sowas Seltsames finde, suche ich erstmal bei Google, was das denn bedeuten könnte. Das Ergebnis hat mich dann doch überrascht. Diese komische, nichtexistierende Seite gibt es auf einigen Tausend Domains. Wenn man die Suche nur auf deutsche Seiten beschränkt, findet man sogar prominente Seiten wie www.ard.de oder www.wetter.de.

Aber wieso nimmt Google diese vermutlich nicht wirklich existierenden Seiten in den Index auf, die offensichtlich Ergebnis einer, wie auch immer gearteten Spamaktion sind?

HTTP-Statuscode

Hier kommt nun der HTTP-Statuscode ins Spiel, denn was im Fehlerfall dem Nutzer angezeigt wird, ist das eine. Viel wichtiger ist aber, mit welchem Antwortcode die Seite ihr Ergebnis zurückliefert. Bei einem „normalen“ Fehler, wie z.B. einer nichtexistierenden Seite, sollte das der Code 404 Not Found sein. Zu den Statuscodes hatte ich bereits vor einiger Zeit etwas geschrieben. Was machen aber alle die Seiten, die man in der Google-Suche zu der seltsamen URL findet. Sie geben einfach den Code 200 Ok zurück, damit geht der Google-Bot davon aus, daß die Seite existiert, und nimmt sie in den Index auf.

Manche Seiten zeigen zumindest dem Nutzer an, daß ein Fehler aufgetreten ist. Die zwei oben genannten Beispiele tun aber so, als sei alles in Ordnung und präsentieren dem Nutzer die Startseite. Das finde ich ohnehin immer ein Unding, weil der Nutzer überhaupt nicht mitbekommt, das etwas nicht stimmt. Gut, man muß nun den User auch nicht unbedingt mit einer spartanischen Fehlermeldung wie hier auf schnurpsel.de erschrecken, aber so zu tun, als sei nichts passiert, ist auch nicht der richtige Weg. Wenigstens sollte man den Statuscode 404 ausliefern, den sieht der Nutzer ja nicht.

Meine Deutung

Ich würde diese Sache mal als Webmaster-Spam verbuchen, denn die Treffer in der Google-Suche findet man nur mit der vollständigen URL. Hätte der „Spamerfinder“ es auf Google-Treffer abgesehen, hätte er die einzelnen Wörter mit Bindestrichen und nicht mit Unterstrichen trennen müssen.

Aber Webmaster, die sich entweder mit den Google-Webmaster-Tools oder einfach mit den Errorlogs des Webservers die Fehler hin und wieder ansehen, stoßen auf diese URL. Eventuell ist ja der eine oder andere Neugierig, zumal der gelesene URL-Text irgendwie nach einer Systemmeldeung klingt, und besucht die Seite am Ende der URL. Naja, und was er da dann findet…

Nachtrag (2.11.):
Der Sachverhalt mit den komischen URLs ist schon jemandem 10 Tage vor mir aufgefallen, wie ich hierrüber entdeckt habe. Ähmmm, stand ja auch schon im ersten Kommentar. Ich sollte die Kommentare mal ernst nehmen :-)

Beste Grüße nach Görlitz :-)

Weitere Artikel mit Bezug zu diesem:
4 Kommentare »

PageRank Update Oktober 2009

Pagerank Update Oktober 2009Von vielen erwartet, von manchen bereits totgesagt, ist es nun doch gekommen. Ein Update des sichtbaren Google-Pageranks erfolgte in den letzten Stunden. Ich hatte es ja bereits vorausgesagt, nun hat es allerdings doch etwas länger auf sich warten lassen, als ich angenommen hatte :-)

Was hat es gebracht? Zumindest für meine Seiten, die ich so im Überblick habe, gab es kaum Veränderungen. Aufsteiger ist bei mir mein Putzlowitsch-Twitter-Account, der von PR0 auf PR3 gestiegen ist. Naja, was ich nun davon habe, weiß ich ehrlich gesagt auch nicht.

Ein Gewinner ist auch der Webmaster-Friday, der nun immerhin zwei Pagerank-Pünktchen verzeichnen kann. Dazu wird Martin sicher noch etwas schreiben, denke ich. Zumindest „lohnt“ es sich nun noch mehr, am Webmaster-Freitag teilzunehmen :-)
Das aktuelle Freitags-Thema „Bilder erstellen für Blog-Artikel“ spricht mich auch direkt an, da ich meine Stärke und Kompetenz durchaus im Bereich Bilder und Blogs (WordPress) sehe.

Apropos Bilder, etwas Sorge bereitet mir nun allerdings die Tatsache, das hier von Schnurpsel keine seit Anfang Oktober veröffentlichten Bilder im Google-Bilderindex auftauchen. Sie werden zwar vom Bilderbot erfaßt, erscheinen aber z.B. nicht in meiner Seiten-Übersicht. Andererseits gab es sowas schon einmal im April dieses Jahres. Ich hoffe, daß sich das bald wieder einränken wird.

Weitere Artikel mit Bezug zu diesem:
3 Kommentare »

Noch zwei Interessenten für Strato

Nachdem sich Strato-Eigentümer Freenet bereits vom DSL-Geschäft getrennt hat, möchte man auch die Webhosting-Sparte los werden. Nur noch zwei Bieter sind im Rennen, die Interesse an Strato haben, die Deutsche Telekom und United Internet. United Internet hat bereits mit 1&1 einen direkten Strato-Konkurrenten im Hostingbereich am Markt.

Auch wenn ich mich hier bei Schnurpsel technisch und inhaltlich mehr und mehr von Strato entferne, habe ich immer noch die leise Hoffnung, daß sich vielleicht mit einem Besitzerwechsel bezüglich des Strato-Shared-Webhostings performancemäßig alles zum Guten wendet. Zumindest für größere PHP-Projekte wie WordPress oder Joomla kann man im Moment von Strato nur abraten.

Weitere Artikel mit Bezug zu diesem:
Keine Kommentare »

Mit Google ähnliche Bilder suchen

Google - Ähnliche Bilder suchenGanz neu ist sie nicht, seit einiger Zeit gibt es im Google-Labor diese spezielle Suchfunktion bereits. Da nannte sie sich „Similar Images“ und hat nun scheinbar den Sprung aus dem Labor in die Weiten des Internets geschafft.

Heute ist mir nämlich zum ersten Mal bei der normalen Bildersuche dieser Link „Ähnliche Bilder suchen“ unter manchen Bildern aufgefallen. Die Suche nach ähnlichen Bildern steht nun also auch den „normlen“ Nutzern zur Verfügung.

Interessante Ergebnisse hatte ich ja früher schon im Labor gesehen, mein Auberginen-Bild ist vielen Schuhen ähnlich :-)

Nachtrag:
Falls jetzt bei dem einen oder anderen die Links nicht angezeigt werden oder die Suche nach ähnlichen Bildern nicht funktioniert, dann einfach öfter mal den „Neu Laden“-Button des Browsers drücken. Bei neuen Funktionen kann es etwas dauern, bis alle Google-Server entsprechend geupdated sind und die Funktionen konstant zur Verfügung stehen.

Außerdem scheinen Schuhe eine große Ähnlichkeit auch mit anderem Gemüse zu haben, nicht nur Auberginen, sondern auch Champignons.

Nachtrag 2:
Bei Golem hat man es auch bemerkt :-)

Nachtrag 3 (29.10.):
Bei wem jetzt die Links „Ähnliche Bilder suchen“ immer noch nicht da sind, der hat vermutlich Javascript deaktiviert. Ohne Javascript bekommt man die Links für die Suche nach den ähnlichen Bildern nicht zu sehen.

Ein Kommentar »

In der Bing-Bildersuche angekommen

Bing-Bildersuche - RadieschenNa immerhin sind ein paar meiner Bilder in der Bing-Bildersuche auf Seite 1 angekommen. Obwohl, Seiten im klassischen Sinne gibt es da ja nicht, dann müßte man wohl besser sagen, in der ersten Ansicht.

Vorzugsweise sind das Bilder, die auch schon bei der Google-Bildersuche weit vorn zu finden sind. Sachen wie Tomaten, Gurke, Erdbeere oder Radieschen sind dabei, haben es teilweise sogar auf den ersten Platz geschafft.

Gut, in den letzten sieben Tagen waren es grad mal ingesamt knapp 30 Treffer (Google in dieser Zeit ca. 12000), aber Bing ist ja noch relativ jung und noch nicht soooo bekannt, wie Google.

Immerhin hab ich bei Bing noch nicht gesehen, das ein Hotlink-Bild oder eine Kopie meiner Bilder dort auftaucht. Mal sehen, ob das so bleibt…

Weitere Artikel mit Bezug zu diesem:
Keine Kommentare »