Warum folgt Google URLs, die gar keine Links sind?

404 Not found

Google Webmastertools - Crawl Error 404

In den Google-Webmastertools sehe ich mir hin und wieder unter „Diagnostics – Crawl Errors“ an, welche Probleme und Fehler der Googlebot beim Crawlen meiner Seiten gefunden hat. In letzter Zeit sind da für putzlowitsch.de einige „404 Not found“-Fehler dazu gekommen.

Nun wollte ich wissen, wer denn da mit falschen URLs auf meine Seiten verlinkt. Ganz neu ist das für mich nicht. So etwas passiert z.B., wenn jemand nur die verkürzte Darstellung eines Links und nicht die URL selbst von einer anderen Webseite kopiert und dann als Link verwendet.

Unter „Linked from“ habe ich mir also ein paar dieser „Bösewichte“ angesehen und war überrascht, das ich die von Google beanstandeten URLs dort gar nicht finden konnte. Zumindest sind sie auf den Seiten nicht als Link vorhanden, wohl aber als einfacher Text. Hier ein paar Beispiele als Screenshot:

Google auf Abwegen

Bei allen diesen Seiten ist der Linktext korrekt verlink (1) oder es ist gar kein Link vorhanden (2, 3 und 4). Die Sichbare URL ist für die Darstellung verkürzt. Genau diesen nur als Text vorhandenen, verkürzten URLs geht Google wie einem normalen Link nach und produziert somit selbst die 404er Fehler.

Ein weiteres Beispiel kommt von schnurpsel.de, die letzten beiden URLs in obigen Screenshot. In einem Artikel hatte ich etwas zum Google-URL-Redirector geschrieben und prompt versucht Google meinen symbolischen Beispielen zu folgen. Die dort auch nur als Text vorhandenen „URLs“ sind und waren nie verlinkt.

Link oder nicht Link

Meiner Meinung nach geht Google hier zu weit. Ich kann ja verstehen, daß Google möglichst alle Informationen erfassen will und allen Links folgt, aber ein Text ist nun mal kein Link, auch wenn er wie eine URL aussieht. Google tut sich damit selbst keinen Gefallen, denn es werden Ressourcen verschwendet und zudem wird die Anzeige in den Webmastertools mit wertlosen Informationen zugemüllt.

Ich finde diesen Diagnostic-Bereich in den Google-WMT ja wirklich gut und nützlich, hilft er mir doch dabei, mögliche Fehlerquellen auf meiner Website aufzuspüren. Wenn nun aber jede Menge Pseudo-Fehler angezeigt werden, geht die Übersicht verloren und ich übersehe vielleicht die echten Fehler.

Einfluß auf das Ranking?

Da es nicht nur fehlerhafte, weil verkürzte Text-URLs gibt, sondern vermutlich auf viele korrekte Links, stellt sich natürlich die Frage, ob sich das rankingtechnisch auswirkt. Kann über eine nur als Text notierte URL PageRank weitergegeben werden? Verwendet Google diese Texte nur als Link-Quelle für den Crawler? Wie wirken sich die vielen Fehler durch die Pseudo-Links auf die „verlinkte“ Seite aus?

Viele Fragen, auf die ich keine Antwort weiß.

Stichwörter: , , , , , ,

Reaktionen zu “Warum folgt Google URLs, die gar keine Links sind?” (6)

  1. Hm sehr spannend.
    Du könntest mal testen, ob du auf diese Weise eine Seite in den Index bekommst.

    Beim Local-SEO sind die Brand-Mentions ja auch ein Faktor. Allerdings kann ich mir nicht vorstellen, dass das Ranking dadurch beeinflusst wird, sonst hätte man ja keine Kontrolle mehr über User generated Content (nofollow kann man ja nicht verwenden…)

    Grüße
    Pascal

  2. Es gehört IMHO zu einem realistischen Bild einer guten Seite dazu, dass der URL auch mal ohne Link erwähnt wird…

  3. Aber Google könnte wenigstens die URLs ignorieren, die mit drei Punkten enden oder die drei Punkte irgendwo mitten drin haben. Solche URLs gibt es doch nicht wiklich und die URL-Verkürzung für die Darstellung ist ja auch durchaus üblich.

  4. Dieses Phänomen beobachte ich auch seit längerer Zeit. Wenn mich die Ansammlung der „Fehler“ gar zu sehr stört, leite ich die Seiten in der .htaccess auf die richtige URL einfach um.
    Manchmal findet G. übrigens auch Seiten- und Verzeichniskombinationen, die es gar nicht gibt… auch hier kann eine Weiterleitung sicher nicht schaden.

  5. viellеiсht handelt es sich ja nur um einen test? Ich denke, dass google wahrscheinlich bald selber merken wird, dass da viel käse produziert wird. so wie ich den verein kenne, werden die sich dann was neues einfallen lassen (z.B. wie du, schnurpselchen schon sagtest, die urls mit 3 Punkten ignorieren) oder werden den Test beenden und das ding einstampfen.

    Mich würde daher interessieren, wie deine diagnostic in einer woche aussieht. obs da immer noch die glеiсhen probleme gibt.

  6. Hey!

    Gutes Thema, komme von Radio4Seo hier rüber.

    Diese Links habe ich schon ewig drinnen bei meinen Seiten. Teilweise sind es aber auch reports vom Jahre schnee und die Links gibt es schlicht weg auch nicht mehr.

    Auswirkungen soll diese keine haben, aber ich trau dem nicht. Ist wirklich ärgerlich wenn man seine Seite schön haben möchte und dann kommt der BOOH Mann mit den Error Seiten.

Einen Kommentar schreiben




 Hier kein Häkchen setzen
 Ich bin kein Spambot

Hinweis: Kommentare von bisher unbekannten Schreibern (Name und eMail) oder mit mehr als einem Link werden moderiert.