Das Putzlowitsch Test- und SEO-Blog

Ausfall der KubaSeoTräume-Statistik und Top-100

Kubaseoträume-Statistik Fehler

So ähnlich sah heute für ca. 1½ Stunden die Kubaseoträume-Top-10 aus und auch die Top 100 zeigte keine Daten an. Was war passiert?

Ich hatte nach einem kurzen E-Mail-Wechsel mit dem Veranstalter des SEO-Wettbewerbs das Keyword für die Abfragen der offiziellen Schreibweise KubaSeoTräume angepaßt. Ich hatte bis dahin das Suchwort in Kleinschreibung verwendet. Es hatte sich aber gezeigt, daß Google abweichende Ergebnisse je nach Schreibweise ausgibt.

Die Erstellung der Statistik und Top-Liste erfolgt in drei Schritten. Im Schritt Eins werden die Google-Ergebnisse abgefragt und im originalen HTML-Seitenformat als Rohdaten abgespeichert. Im zweiten Schritt werden die Ergebnisseiten eingelesen, ausgewertet (Parsing) und die Daten in einer Datenbank abgelegt. Der letzte Schritt ist dann das Generieren der Ausgabedaten, also der Diagramme (mit Image-Map) und der Top-Listen.

Nun hatte ich zwar die Schreibweise für KubaSeoTräume in der Konfiguration für Phase 1 (Google-Abfrage) und Phase 2 (Datenbank) angepaßt, nicht aber für Phase 3 (Ausgabe). So waren zwar alle Daten korrekt erfaßt, ausgewertet und gespeichert worden, konnten aber nicht ausgegeben werden.

Ich mußte einfach die Ausgabe der Daten mit der richtigen Konfiguration für KubaSeoTräume erneut anstoßen und alles war wieder im Lot. Kleine Änderungen mit großen Auswirkungen, nun ja. :-)

3 Kommentare »

Bildersuche wieder im grünen Bereich

Google-Suchanfragen im grünen BereichNach nunmehr etwa einem Monat hat sich seit dem Fehler bei putzlowitsch.de alles weitestgehend normalisiert.

Die in den Google-Webmastertools angezeiten Suchzahlen liegen nach den roten Zahlen vom Januar wieder überwiegend im grünen Bereich. Aber das häng eher mit dem Rückgang der Suchzahlen zum Jahreswechsel und dem Anstieg am Jahresanfang zusammen, der so praktisch jedes Jahr zu beobachten ist.

Anzahl Bilder im Index

Wie sich das Aussperren des Google-Bots konkret ausgewirkt hat, ist ganz gut an der Anzahl der putzlowitsch-Bilder im Index zu sehen:

Google-Bildersuche: Anzahl Bilder mit Site-Abfrage im Index

Von einem Tag auf den anderen waren ca. 200 Bilder aus dem Index verschwunden (Einbruch der roten Linie zw. 6. und 13. 1.), das sind bei damals etwa 700 Bildern schon fast ein Drittel. Bis die Bilder wieder zurück im Index waren, hat es wesentlich länger gedauert, als nur ein paar Tage, es waren ungefähr drei Wochen. Nach etwa drei Wochen waren auch wieder die vielen HTTP-403-Fehler in den Webmastertools verschwunden. Aber so richtig war es auch da noch nicht überstanden.

Aprikosen und Kirschen wieder da

Nicht nur in der Site-Abfrage waren 200 Bilder verwschwunden, sondern logischerweise auch in der normalen Bildersuche zu den entsprechenden Suchwörtern. Vor ein paar Tagen sind nun auch die letzten verlorenen Bilder wieder zu finden:

Google-Bildersuche: Aprikosen - Top-10-Diagramm

Die letzten Rückkehrer waren die Aprikosen und Kirschen. Einige Bilder waren ganz verschwunden, andere waren durch Kopien auf anderen Seiten oder Hotlinks ersetzt worden. Einge Bilder mußten nach der Rückkehr auch eine Abwertung hinnehmen, die sie bid heute noch nicht wieder ausgleichen konnten.

Insgesamt ist aber erstmal wieder alles weitestgehend normalisiert.

Nie den Google-Bot aussperren

Ich kann nur jedem raten, niemals den Google-Bot für längere Zeit auszusperren. :-)

Selbst wenn das nur Stunden oder ein zwei Tage sind, die negativen Auswirkungen ziehen sich möglicherweise über Wochen und Monate hin.

Keine Kommentare »

1&1 WebAnalytics – Suchbegriffe nur böhmische Dörfer?

1&1-Webanalytics

Ich bin ja so ein bißchen Statistik-Fan. Mich interessiert schon, wer z.B. mit welchen Suchbegriffen von einer Suchmaschine auf meine Seite gekommen ist. Für die Statistik habe ich mir ein paar PHP-Skripte geschrieben, die zwar nicht sonderlich komfortabel sind aber zumindest zuverlässig funktionieren und mir alles anzeigen, was ich wissen will.

Mein Webhoster 1&1 hat auch eine Statistik im Kundenmenü zu bieten. Diese hieß früher mal schlicht „WebStatistik“. Ich habe sie aber kaum bis gar nicht verwendet. Neuerdings nennt sie sich nun „1&1 WebAnalytics“, was irgendwie professioneller klingt (erinnert an Google-Analytics) und so habe ich mir das Teil mal angesehen.

Kurven, Torten und Karten

1&1-Webanalytics: Herkunft

Ich bin mir zwar nicht sicher, wie die alte Statistik aussah, aber da gab es meiner Erinnerung nach noch keine Kurven- und Tortendiagramme. Das sieht zumindest nett aus, bringt aber kaum einen Informationszuwachs.

Bei der Herkunft der Besucher werden 76% direkte Zugriffe, 19% über verweisende Domains und 6% über Suchmachinen angezeigt. In der Liste der verweisenden Seiten (auf den Bild nicht zu sehen) gibt es allerdings nur 10 sichtbare Einträge. Allein sechs davon sind Google (.de, .at, .ch, .com, /imgres, /search, /url), ein Eintrag ist die T-Online-Suche und nur zwei zeigen Nicht-Suchmaschinen-Domains. Der eigentlich interessante Rest ist anonym unter „Andere“ zusammengefaßt.

Da liefert mir meine Statistik aus den Logfiles umfangreichere und bessere Daten. Wo ich allerdings nicht mithalten kann, das ist die Aufschlüsselung der Besucher nach Regionen:
1&1-Webanalytics: Geographie

Die Regionen sind nach den zwei ersten Stellen der Postleitzahl segmentiert. Es ist zwar interessant zu sehen, daß die übergroße Mehrheit der Besucher aus den Regionen Leipzig, Köln und Heilbronn kam, aber wirklich etwas damit anfangen kann ich nicht.

Suchbegriffe

1&1-Webanalytics: SuchbegriffeAuf der WebAnalytics-Seite „Herkunft“ findet man auch eine Liste mit Suchbegriffen (immerhin 50 Einträge). Was dort angezeigt wird, hat mich erstmal verblüfft. Ganz oben steht das Suchwort del mit über 1100 Besuchern (fast 30%).

Bei del fällt mir als erstes „delete“ ein, so wie es auf englischen Tastaturen steht. Ctrl-Alt-Del war z.B. der „Affengriff“ zum Warmstart des Rechners.

Auf keiner meiner Seiten bei 1&1 habe ich aber darüber etwas geschrieben, auch nicht über die „Deutsche Eishockey Liga“. Selbst wenn ich etwas zu del geschrieben hätte, würde ich bei etwa 2,4 Milliarden Google-Treffern kaum irgendwo auftauchen, so daß sich auch nur ein Besucher von Google auf meine Seite verirrt.

Auch das zweite Suchwort in der Liste hmische ist ungewöhnlich, beim dritten Listeneintrag semmelkn ging mir aber ein Licht auf. Die 1&1-Statistik hat Probleme mit Umlauten. Denn semmelkn sind eindeutig Semmelknödel, da habe ich tatsächlich einiges an Besuchern.

Plötztlich ergibt auch del einen Sinn, denn das ist der Rest vom Knödel oder Semmelknödel. Die Statistik trennt einfach die Suchwörter bei Umlauten in Teile auf, als wären das Leer- oder sonstige Trennzeichen. Auch hmische läßt sich mit diesem Hintergrundwissen einfach entschlüsseln, es ist der zweite Teil von böhmische (Semmelknödel) und entsprechend geht mische aus bömische hervor. Das ist zwar falsch geschrieben, wurde nach meiner Statistik aber immerhin 35 mal in Kombination mit anderen Wörtern gesucht.

Neben dem Umlautfehler hat die Suchwortstatitsik von 1&1 noch einen Nachteil. Sie behandelt Suchwörter immer einzeln und nicht die gesamte Suchphrase, die aus mehreren Wörtern bestehen kann. Aus meiner Sicht ist die Statistik in diesem Bereich weitestgehend unbrauchbar.

Wörter raten

Ein paar interessante Wortzerlegungen kann ich meinen Lesern als kleines Rätsel auf den Weg geben:

  • rlitz
  • bchen
  • gem
  • sest
  • hsport
  • rfel
  • grie

Was wurde dabei wirklich gesucht? Viel Spaß beim raten. :-)

4 Kommentare »

Abgewertet, ersetzt und rausgeschmissen

Nun gab es von Google die Quittung für den Ausfall der Putzlowitscher Zeitung am 5. Januar 2011. In den Webmastertools werden mir derzeit gut 1200 Fehler mit dem Statuscode 403 (Forbidden) angezeigt:

Googlebot Crawl-Errors: PZ am 9.1.2011

Ein Umzug mit Verzug

Am 5. Januar war der Google-Bot zuletzt gegen 1.30 Uhr bei putzlowitsch.de zu finden. Dann erfolgte seitens des Webhosters der Umzug auf einen neuen Server und somit bekamen alle dort gehosteten Seiten eine neue IP-Adresse. Für die dort registrierten Seiten war das auch kein Problem, nach kurzer Zeit waren die DNS-Server aktualisiert und Besucher und Suchmaschinenbots bekamen die Seiten wieder normal zu sehen.

Einige Seiten, die bei anderen Anbietern liegen, werden aber per DNS-A-Record auf den Webspace beim umgezogenen Server umgeleitet und da stimmte die IP-Adresse dann nicht mehr, weil diese Einträge nicht automatisch aktualisiert werden.

Gegen 7 Uhr hatte ich das bemerkt und zunächst den Eintrag für meine wichtigste Seite, die „Putzlowitscher Zeitung“, angepaßt. Im Laufe des Vormittags hatte sich dann auch fast alles wieder eingerenkt, die normalen Besucher und z.B. der Yahoo-Bot (gegen 8.30 Uhr) und der Bing-Bot (gegen 9.30 Uhr) kamen wieder auf die Seite.

Nur der Googlebot ließ sich nicht blicken. Erst am 6. Januar hat er gegen 2.30 Uhr wieder die Putzlowitsch-Seite besucht. Ungünstigerweise ist er außerdem noch in meine Bot-Falle getappt, denn auch die robots.txt war für ihn mehr als 24 Stunden nicht abrufbar. Somit gab es aus Sicht des Google-Bots keinerlei Zugriffsbeschränkungen.

Abgewertet, ersetzt und rausgeschmissen

Google-Bildersuche: KartoffelSeit gestern verabschieden sich so langsam auch einige meiner Seiten, besonders Bilder, aus den Google-Suchergebnissen.

Dabei kann man drei unterschiedliche Ergebnisse sehen. Im einfachsten Fall werden die Bilder zunächst nur um ein paar Plätze im Ranking abgewertet. Je nach Position hat das auch die Verschiebung auf eine hintere Trefferseite zur Folge. Vermutlich ist das aber nur ein Zwischenschritt zum zweiten und dritten Fall.

Falls es eine identische Kopie oder das Bild in einer weiteren Version auf einer anderen Webseite gibt, wird nun die Kopie angezeigt, aber an einer schlechteren Trefferposition. So ist das z.B. bei der Kartoffel der Fall (siehe Screenshot). Mein Kartoffelbild lag in den letzten Wochen recht konstant auf Platz vier, die Kopie wurde nun an Position 8 einsortiert. Interessanterweise wird bei der Suche nach „Ähnlichen Bilder“ aber weiterhin meine Kartoffel angezeigt.

Im schlimmsten Fall sind Bilder ganz aus den Suchergebnissen verschwunden. So ist es z.B. den Kartoffeln, der Karotte und der Möhre ergangen.

Positiv denken

Etwas Gutes hat die Sache natürlich. So kann man mal sehen was passiert, wenn plötzlich gut rankende Bilder gesperrt werden und wo es eventuell noch andere Kopien der Bilder gibt. Der Witz ist, daß ich genau so etwas gerade als kleines Experiment in Angriff nehmen wollte, allerdings nicht in dieser Breite mit so vielen Bildern. :-)

Leider ist auch mein Bilder-SERPs-Überwachungstool noch nicht ganz fertig, so daß ich nun ständig „manuell“ nachgucken muß, was mit den Bildern passiert. Ich bin auch mal gespannt, wann sich alles wieder normalisiert. Dann könnte ich ja nochmal mit meinem eigentlichen Experiment durchstarten.

Keine Kommentare »

Auch Google hat mal Fehler

Google - Weitere Ergebnisse mit Fehler

Ich kann mich nicht daran erinnern, wann Google schon mal eine Fehlermeldung angezeigt hat, weil es Probleme mit dem Server gab (bei Twitter z.B. kommt das ja ständig vor :-).

Insofern hat mich die lapidare Meldung

„Fehler: Der Server konnte Ihre Anforderung nicht ausführen. Versuchen Sie es in 30 Sekunden noch einmal.“

schon etwas überrascht. Allerdings ist sie nach nunmehr gefühlten 30 Stunden immer noch da. Naja, aber wirklich problematisch ist das nicht. Gibt es halt keine weiteren Ergebnisse, macht auch nichts.

Weitere Artikel mit Bezug zu diesem:
Ein Kommentar »