Das Putzlowitsch Test- und SEO-Blog

1&1 WebAnalytics – Suchbegriffe nur böhmische Dörfer?

1&1-Webanalytics

Ich bin ja so ein bißchen Statistik-Fan. Mich interessiert schon, wer z.B. mit welchen Suchbegriffen von einer Suchmaschine auf meine Seite gekommen ist. Für die Statistik habe ich mir ein paar PHP-Skripte geschrieben, die zwar nicht sonderlich komfortabel sind aber zumindest zuverlässig funktionieren und mir alles anzeigen, was ich wissen will.

Mein Webhoster 1&1 hat auch eine Statistik im Kundenmenü zu bieten. Diese hieß früher mal schlicht „WebStatistik“. Ich habe sie aber kaum bis gar nicht verwendet. Neuerdings nennt sie sich nun „1&1 WebAnalytics“, was irgendwie professioneller klingt (erinnert an Google-Analytics) und so habe ich mir das Teil mal angesehen.

Kurven, Torten und Karten

1&1-Webanalytics: Herkunft

Ich bin mir zwar nicht sicher, wie die alte Statistik aussah, aber da gab es meiner Erinnerung nach noch keine Kurven- und Tortendiagramme. Das sieht zumindest nett aus, bringt aber kaum einen Informationszuwachs.

Bei der Herkunft der Besucher werden 76% direkte Zugriffe, 19% über verweisende Domains und 6% über Suchmachinen angezeigt. In der Liste der verweisenden Seiten (auf den Bild nicht zu sehen) gibt es allerdings nur 10 sichtbare Einträge. Allein sechs davon sind Google (.de, .at, .ch, .com, /imgres, /search, /url), ein Eintrag ist die T-Online-Suche und nur zwei zeigen Nicht-Suchmaschinen-Domains. Der eigentlich interessante Rest ist anonym unter „Andere“ zusammengefaßt.

Da liefert mir meine Statistik aus den Logfiles umfangreichere und bessere Daten. Wo ich allerdings nicht mithalten kann, das ist die Aufschlüsselung der Besucher nach Regionen:
1&1-Webanalytics: Geographie

Die Regionen sind nach den zwei ersten Stellen der Postleitzahl segmentiert. Es ist zwar interessant zu sehen, daß die übergroße Mehrheit der Besucher aus den Regionen Leipzig, Köln und Heilbronn kam, aber wirklich etwas damit anfangen kann ich nicht.

Suchbegriffe

1&1-Webanalytics: SuchbegriffeAuf der WebAnalytics-Seite „Herkunft“ findet man auch eine Liste mit Suchbegriffen (immerhin 50 Einträge). Was dort angezeigt wird, hat mich erstmal verblüfft. Ganz oben steht das Suchwort del mit über 1100 Besuchern (fast 30%).

Bei del fällt mir als erstes „delete“ ein, so wie es auf englischen Tastaturen steht. Ctrl-Alt-Del war z.B. der „Affengriff“ zum Warmstart des Rechners.

Auf keiner meiner Seiten bei 1&1 habe ich aber darüber etwas geschrieben, auch nicht über die „Deutsche Eishockey Liga“. Selbst wenn ich etwas zu del geschrieben hätte, würde ich bei etwa 2,4 Milliarden Google-Treffern kaum irgendwo auftauchen, so daß sich auch nur ein Besucher von Google auf meine Seite verirrt.

Auch das zweite Suchwort in der Liste hmische ist ungewöhnlich, beim dritten Listeneintrag semmelkn ging mir aber ein Licht auf. Die 1&1-Statistik hat Probleme mit Umlauten. Denn semmelkn sind eindeutig Semmelknödel, da habe ich tatsächlich einiges an Besuchern.

Plötztlich ergibt auch del einen Sinn, denn das ist der Rest vom Knödel oder Semmelknödel. Die Statistik trennt einfach die Suchwörter bei Umlauten in Teile auf, als wären das Leer- oder sonstige Trennzeichen. Auch hmische läßt sich mit diesem Hintergrundwissen einfach entschlüsseln, es ist der zweite Teil von böhmische (Semmelknödel) und entsprechend geht mische aus bömische hervor. Das ist zwar falsch geschrieben, wurde nach meiner Statistik aber immerhin 35 mal in Kombination mit anderen Wörtern gesucht.

Neben dem Umlautfehler hat die Suchwortstatitsik von 1&1 noch einen Nachteil. Sie behandelt Suchwörter immer einzeln und nicht die gesamte Suchphrase, die aus mehreren Wörtern bestehen kann. Aus meiner Sicht ist die Statistik in diesem Bereich weitestgehend unbrauchbar.

Wörter raten

Ein paar interessante Wortzerlegungen kann ich meinen Lesern als kleines Rätsel auf den Weg geben:

  • rlitz
  • bchen
  • gem
  • sest
  • hsport
  • rfel
  • grie

Was wurde dabei wirklich gesucht? Viel Spaß beim raten. :-)

4 Kommentare »

Essen in der Bildersuche – Weihnachtsessen?

Google-Bildersuche: Essen zu Weihnachten

Daß es jahreszeitlich bedingte Häufungen von bestimmten Suchanfragen gibt, habe ich kürzlich schon für Kerzen, Advent und Osterhase aufgezeigt. Da ist die Sache klar und für mich auch nachvollziehbar. Aber warum wird zu Weihnachten verstärkt nach Bildern von Essen gesucht?

Ich meine hier nicht die Stadt Essen im Ruhrgebiet, sonder Essen als Speise, Mahlzeit und Nahrung.

Normalerweise bewegt sich die Essenskurve (rot) im Wochenrhythmus wie z.B. auch die Katze (hellgrau) auf und ab. Zum Vergleich habe ich noch den Advent (hellrosa) im obigen Diagramm eingeblendet, da gab es einen starken Anstieg der Besucherzahlen Ende November und Anfang Dezember, dem Beginn der Adventszeit.

Vom 20. bis 22. und dann besonders am 23. und 24. Dezember schnellten die Bildersucherzahlen für Essen gegen den eigentlich abwärts gerichteten Weihnachts- bzw. Wochenendtrend nach oben.

Gut, in der Weihnachtszeit spielt das Essen eine durchaus wichtige Rolle, aber warum werden Bilder vom Essen gesucht?

Ich habe nur eine Idee. Da hat jemand noch kein Geschenk und will ein Essen verschenken. Dafür muß dann noch schnelle ein Gutschein angefertigt werden und da macht sich ein Bild von etwas zu Essen ganz gut drauf. Also schnell die Google-Bildersuche angeworfen und ein Essen-Bild rausgepickt. :-)

Na dann, frohe Weihnachten und guten Appetit. :-)

Keine Kommentare »

Spam-Kommentare im dritten Quartal 2010

Spam-Kommentar

Kürzlich hatte Martin im TagSEOBlog seinen 5000sten Kommentar vermeldet. Was mir dabei aufgefallen war, die aktuelle Kommentar-Id lag da ungefähr bei 18000. Das bedeutet, daß etwa 13000, also 70% der Kommentare dort Spam-Kommentare sind. Die Statistik weist es bei ihm auch aus, Akismet hat 13044 Kommantare als Spam eingestuft.

Da ich Akismet hier im Blog nicht verwende, habe ich mal nach der höchsten Kommentar-ID gesehen und diese in Relation zu den genehmigten Kommentaren gesetzt. Die ID steht derzeit bei 1064, genehmigte Kommentare habe ich hier 956, das sind also (1064-956)/1064 = 0,10 mithin also nur 10% Kommantarspam.

Das ist aber nur die halbe Wahrheit, denn durch ein selbstgeschriebenes Plugin schaffen es viele Spam-Versuche gar nicht erst in die WordPress-Datenbank und bekommen somit auch keine Kommentar-Nummer. Für die letzten drei Monate Juli, August und September (3. Quartal 2010) habe mal die Logfiles auf die Spamversuche hin untersucht und bin auf etwa 700 derartige Einträge gestoßen. Im selben Zeitraum gab es ungefähr 160 genehmigte Kommentare und dazu 30 Kommentare die ich von Hand als Spam eingestuft habe. Das ergibt nun 730/890 = 0.82 also etwa 80% Spam.

Nebenbei hab ich auch gleich die beliebtesten Artikel der Kommentar-Spammer ermittelt:

Nr Artikel/Seite Spam PR Kom
1 WordPress 2.3 – Anonym up-to-date bleiben 14,1% 2 14
2 Letzter Beitrag als Startseite 12,0% 2 33
3 Mit WordPress per E-Mail bloggen 11,5% 1 43
4 WordPress und die suboptimale MySQL-Optimierung (5.0.51) 8,5% 2 42
5 Die Verbindestrichung 7,7% 0
6 WordPress 2.7 – Wartungsmodus ohne Plugin 6,1% 3 3
7 123 Moderate Comment Notification 6,0% 3 4

Ich habe nur die Seiten und Artikel berücksichtigt, die 5% oder mehr am Spamaufkommen ausmachen. In der Spalte PR steht der aktuelle Google-Pagerank und in der Spalte Kom die Anzahl der abgegebenen und freigeschalteten Kommentare.

Meine derzeit PR-stärksten Seiten (PR 4) werden gar nicht („WordPress ab 2.1 – Optionen für die Startseite„) oder nur mittelmäßig („WordPress für statische Seiten optimieren„) Ziel vom Spam-Kommentaren. Am PR der Seite kann es alos nicht liegen, wonach die Spammer die Artikel auswählen. Ist aber auch egal.

Erfreulich ist vielmehr, daß bei mir gute 95% Spam gar nicht erst in WordPress landen und ich diese einfach links liegen lassen kann. Ein bißchen Beachtung bekommen sie dann bestenfalls für die statistische Auswertung. :-)

Keine Kommentare »

lastactionseo – Germany’s Next Super-SEO 2010

lastactionseoNach iPhone4Spiel und reVierphone bleibt kaum Zeit zum Luftholen, der nächste SEO-Wettbewerb läuft bereits seit fast einer Woche. Ich habe diesmal den Anfang verpaßt, was aber nicht weiter tragisch ist, denn der „lastactionseo – Germany’s Next Super-SEO 2010“ Wettbewerb läuft noch bis zum 10. November 2010.

Etwas von Nachteil ist das Fehlen der ersten Tage in meiner lastactionseo-Top-10 bei hbgf.de, aber diese werden nach fast sieben Wochen ohnehin aus dem Blickfeld verschwunden sein. Ich beobachte auch wieder die Bilder und schicke diesmal einen alten Hut ins Rennen. Mein angestaubtes Siemens S-10D paßt hier nicht so richtig dazu, das kommt erst wieder beim nächsten iPhone-Wettbewerb zum Einsatz.

lastactionseo Top-100

Wenn ich die Daten schon mal habe (für die Top-10 bei hbgf), kann ich natürlich auch die Top-100 für lastactionseo bereitstellen. Diese wird jeweils um 0, 6, 12 und 18 Uhr aktualisiert. Die kleinen Kästchen in eckigen Klammern sind die anklickbaren Links zu den jeweiligen Seiten. Die Farben sind die Linkfarben, grün – noch nicht besuchte Seite, grau – bereits besuchte Seite und orange – Überfahren mit der Maus (hover).

Wie bei den bisherigen SEO-Wettbewerben steht für mich nicht so sehr der Gewinn des ausgelobten Preises im Vordergrund. Vielmehr ist ee interessant zu beobachten, wer mit welcher Taktik erfolgreich ist. Ich bin gespannt, was z.B. mit den Videos oder Google-Groups zu bewegen sein wird, die beim reVierPhone ja ganz orderntlich punkten konnten.

Weitere Artikel mit Bezug zu diesem:
7 Kommentare »

Bilder aus Google Universal-Search verschwunden?

Bilder Universal-Search in der Statistik

Ich bin ja ein Anhänger der Logfile-Statistik. Alle für mich interessanten Informationen, wie z.B. die Suchtreffer, kann ich mir daraus halbwegs zuverlässig und ungefiltert extrahieren. Seit es Bilder auch in den normalen Suchergebnissen gibt (Universal-Search), lasse ich mir die darüber kommenden Besucher getrennt von denen über die Bildersuche kommenden anzeigen. Die Besucherzahlen kann ich mir auch in einer grafischen Darstellung ansehen:

Google-Universal-Search Bilder - Wochenübersicht

Anfang 2009 nahm die Sache so langsam Fahrt auf, zu besten Zeiten im Jahr 2010 kamen bis zu 200 Besucher täglich über die Bilder in der Universal-Search zu putzlowitsch.de (darauf beziehen sich die Daten). Ende Mai/Anfang Juni gibt es plötzlich einen starken Einbruch der sich im Tages-Chart für den 3. Juni lokalisieren läßt. Danach kommt nur noch etwas Rauchen bis nach dem 15. Juli schließlich überhaupt nichts mehr zu sehen ist.

Bilder verschwunden oder fehlerhafte Statistik?

Meine erste Befürchtung, aus irgendeinem Grund würden meine Bilder nicht mehr in der Universalsuche angezeigt werden, bestätigte sich erfreulicherwiese nicht. Aber wenn die Bilder wie bisher angezeigt werden, müßten doch auch mal ein paar Sucher draufklicken und in der Statistik landen. Da kann doch der Fehler nur in der Auswertung liegen.

Und richtig, neurdings liefert Google leider ein paar wichtige Parameter im Referer nicht mehr aus, mit denen sich zuvor die Treffer für Bilder aus der Universal-Search von denen aus der normalen Bildersuche unterscheiden ließen. Man konnte früher sogar die Ranking-Position des Bildes auf der Trefferseite auslesen. Alles das ist nun nicht mehr da. Schade!

Kleine Reparaturen

Zumindest habe ich eine Möglichkeit gefunden, die Universal-Treffer zu erkennen, aber die Positionsermittlung ist wohl endgültig verloren. Da werde ich wohl doch mal mein Google-Bildersuche-Tool in Angriff nehmen müssen, um den Überblick zu behalten. Ich kann ja schlecht Hunderte von Suchanfragen manuelle überprüfen, so viel Zeit habe ich dann doch nicht. :-)

Keine Kommentare »