Statistik « Schnurpsel

Google Bildersuche und das iPhone4Spiel – ein Rückblick

15.08.2010 19:22 von schnurpselchen in Bildersuche, Internet

Gestern war das Ende des iPhone4Spiel zwei Wochen her, heute endet die Aufzeichnung der Suchergebnisseiten bei hbgf.de. Auch wenn die Bildersuche nicht Gegenstand des Wettbewerbs war, richte ich immer ein besonderen Blick auf die Bilder. Hier kann man gerade bei neuen Suchbegriffen so mancherlei interessante Beobachtung machen.

Die Bildersuche durchläuft mehrere Phasen, die ich nachfolgend etwas näher beleuchten will.

Phase 1 – alte Bilder zum neuen Keyword

Meist findet Google spätestens 24 Stunden, nachdem ein neues Keyword in die freie Wildbahn entlassen wurde, die ersten Bilder. Das sind immer alte Bilder, die bereits länger im Bilderindex vorhanden sind und nun irgendwo im Kontext des neuen Suchwortes auftauchen.

Das erste Bild zum iPhone4Spiel gab es am 17. Juni bei der „Messung“ um 4 Uhr, es war das Twitterprofilbild von @frasermillar, fragt mich aber nicht, warum. Am Nachmittag des selben Tages waren es bereits 37 Bilder.

Wie man im Diagramm oben sieht, verschwinden diese Bilder der ersten Stunden dann recht schnell auf den hinteren Plätzen. In der Phase 1 kommen praktisch täglich neue Altbilder hinzu.

Phase 2 – neue Bilder aus den Google-News

Wo die Phase 1 nicht wirklich etwas Neues bietet, stellt Phase 2 doch ein Novum dar. Erstmals am 19 Juni tauchen echte neue Bilder in der Bildersuche auf. Die beiden Bilder in der unteren Reihe

„Gewinne ein iPhone 4! … Start: 16.06.2010…“

können eigentlich keine alten Bilder sein, denn sie nehmen auf das iPhone4Spiel Bezug, das ja erst am 16. Juni gestartet wurde.

Eine Latenzzeit von gerade mal 3 Tagen wäre schon eine kleine Sensation, benötigten Bilder doch selbst zu Googles besten Zeiten mindestens eine Woche bis in den Bilderindex. Ich hatte das zwar wahrgenommen, aber gedacht, das der Veranstalter die Bilder vielleicht doch schon eher irgendwo ins Internet gestellt hätte oder so.

Richtig offensichtlich wurde es dann am 23. Juni, als Bilder auftauchten, die ein nicht vorhersehbares Ereignis aufgriffen und insofern wirklich neu sein mußten. „Interaktiv.net gegen tagSeoBlog“ erschien über die diverse Presseportale in Google-News und somit war klar, das Google Bilder von Newsseiten fast in Echtzeit in den Bilderindex aufnimmt. Auch die schon am 19. Juni auftauchenden Bilder kamen über Google-News in den Index.

Am 25. Juni rutschen die Presseportal-Bilder um bis zu 30 Plätze nach hinten, so daß sie fast mehrheitlich nur noch jenseits der Position 30 oder 40 und damit auf der Trefferseite zwei bzw. drei zu finden sind. Meine Vermutung war nun, daß sie halt genau wie die News-Meldungen nach einer gewissen Zeit nicht mehr interessant sind und deshalb abgewertet werde. Wen interessieren schon Nachrichten oder Bilder von gestern. :-)

Nun hab ich mir mal die Suchergebnisseiten vom 24. und vom 25. Juni angesehen:

Im Bild links vom 24. Juni werden bei den Ergebnissen noch Google-News eingeblendet, am 25. Juni (Bild rechts) gibt es keine News mehr. Am 25. Juni wurden dann auch die zu den News gehörenden Bilder bei der Bildersuche auf die Trefferseite 2 bzw. 3 durchgereicht (siehe Diagramm oben).

Phase 3 – neue Bilder zum neuen Keyword

Bis dann die ersten wirklich neuen Bilde auftauchen, passiert eigentlich nicht mehr viel. Es gibt schon noch Bewegung im Bilder-Ranking, bestimmte alte Bilder setzen sich an Positionen fest und dann kommen eventuelle noch alte Bilder im neuen Gewand daher.

Richtig was los ist dann aber erst wieder mit wirklich neuen Bildern. Das Diagramm oben zeigt die Top 10 am iPhone4Spiel-Stichtag 31. Juli um 16 Uhr. Bereits zwei Tage vorher, am 29. Juli 2010 beginnt das lange erwartete Google-Bilderupdate und damit fallen praktisch alle Altbilder von den ersten Plätzen nach hinten zurück.

Die erste Suchergebnisseite wird nun von neuen Bildern dominiert. Dabei ranken Bilder von Seiten besonders gut, die auch bei der normalen Suche weit vorn liegen und auch ein paar von den News-Bildern tauchen nun regulär wieder auf.

Fazit

Bei einem SEO-Wettbewerb mit einem neuen, bisher nicht bei Google zu findenden Schlüsselwort, kann man den „Lebenszyklus“ der Bildersuche sehr schön verfolgen. Eine wirklich interessante Entdeckung für mich war, daß Goolge Bilder aus den Google-News tagesaktuelle in den Bilderindex aufnimmt. Das war mir bis dahin nicht aufgefallen, obwohl es vermutlich schon eine etwas längere Zeit so ist und auch Sinn ergibt. Es paßt zur Google-Echzeit-Strategie.

Ich freue nich nun schon auf den nächsten SEO-Wettbewerb, dann kann man bestimmte Beobachtungen noch einmal verfizieren und vielleicht weitere interessante Erkenntnisse zur Bildersuche gewinnen. Es muß ja nicht immer der Gewinn des ausgesetzten Preises sein. :-)

Ein Kommentar »

1 Million iPhone4Spiel-Seiten, ein voller Erfolg?

23.07.2010 17:50 von schnurpselchen in Internet

Hoch- und Abrechnung

Gut, ich habe da etwas übertrieben. Es sind noch keine Millionen iPhone4Spiel-Seiten, Google „spricht“ von ungefähr 925 Tausend Treffern. Aber auch Google übertreibt mit den 925000 Ergebnissen maßlos, wie man schnell merkt, wenn man sich mal in den SERPs bis zum Ende durchklickt.

Da ist bereits auf „Seite 36 von 353 Ergebnissen“ das Ende der Fahnenstange erreicht. Gut, da steht ja noch der bekannte Hinweis:

Um Ihnen nur die treffendsten Ergebnisse anzuzeigen, wurden einige Einträge ausgelassen, die den 353 bereits angezeigten Treffern sehr ähnlich sind.

Aber auch mit filter=0 kommt man nur bis zur Seite 59, mithin sind es also etwa 600 Treffer, die Google tatsächlich präsentiert.

Nun frage ich mich, nicht zum ersten Mal, wie Google auf solche utopisch hohen Zahlen kommt. Selbst wenn es nicht nur 600, sondern sagen wir mal 9000 Seiten sind, wäre das immer noch ein Mißverhältnis von 1:100.

Vermutlich wird die ungefähre Ergebniszahl irgendwie hochgerechnet, aber wirklich brauchbar ist diese Rechnung nicht. Man stelle sich vor, bei der nächsten Bundestagswahl gibt es erste Hochrechnungen für die FDP von 50% und tatsächlich sind es dann aber nur 0,5%. :-)

Erfolg und Mißerfolg

Ob der „SEO-Wettbewerb“ zum iPhone4Spiel nun ein Erfolg oder Mißerfolg ist, mag ich nicht beurteilen. Die Frage ist ja immer auch, woran wird Erfolg gemessen und wer hat etwas davon.

Für mich gibt das iPhone4Spiel immerhin etwas Schreibstoff her, ich habe mal wieder an den Ranking-Charts gearbeitet (und einen Fehler bemerkt) und ein paar Beobachtungen machen können. Insofern ist das iPhone4Spiel für mich ganz persönlich sowas wie ein kleiner Erfolg.

Weitere Artikel mit Bezug zu diesem:

Seopardenforelle ungefähr 25 Ergebnisse

Keine Kommentare »

iPhone4Spiel-Diagramm mit Lücke

19.07.2010 17:27 von schnurpselchen in Bildersuche, Internet, PHP, Programmierung

Mut zur Lücke, könnte man sagen, aber das war so nicht beabsichtigt. Vielleicht hat es ja einer der vielen Beobachter beim iPhone4Spiel-Diagramm schon bemerkt. Seit etwa einer Woche stimmt da was nicht. Es gibt seit dem 13. Juli eine datentechnische Lücke für Plätze großer als 10 bei der normalen Suche bzw. größer Platz 20 bei der Bildersuche. Da ist gewissermaßen ein Daten-Sommerloch entstanden.

Solche „Aussetzer“ können zwar auch entstehen, wenn sich die Platzierung jenseits der 100 befindet, denn dort endet die Darstellung des Diagramms (nicht aber die Datenerfassung), aber eine so auffällige Lücke erschien mir doch verdächtig. Es ist recht unwahrscheinlich, wenn auch nicht ausgeschlossen, daß z.B. geld-im-internet mit seinem iPhone4Spiel-Beitrag der in letzter Zeit immer in den Top-20 war, plötzlich auf Plätze über 100 abfällt.

Was war passiert? Ich hole mir die Daten dirket aus den SERPs, parse also die HTML-Seite und extrahiere die Links und Positionen. Zudem habe ich eine Next-Page-Erkennung eingebaut um festzustellen, ob es von der aktuellen Seite aus gesehen jeweils noch eine weitere Ergebnisseite gibt. Genau diese Erkennung hatte versagt und nach der ersten Seite das Einlesen abgebrochen.

Ich habe die Funktion nun etwas robuster ausgelegt und hoffe, daß sie in Zukunft die weiteren Ergebnisseiten zuverlässig erkennt. Verlassen kann ich mich darauf aber leider nicht, also muß ich immer die Daten nach Auffälligkeiten im Auge behalten.

Weitere Artikel mit Bezug zu diesem:

1 Million iPhone4Spiel-Seiten, ein voller Erfolg?

Ein Kommentar »

Referertrick – Referer-Spam mit System

25.03.2010 20:04 von schnurpselchen in Geld verdienen, Internet

Referer-Spam ist ja nichts Neues, dazu habe ich schon vor einiger Zeit etwas geschrieben.

Gefälschter Referer -> Spam

Der Referer wird normalerweise beim Aufruf einer Seite vom Web-Browser des Benutzers an den Webserver im sogenannten HTTP-Request mitgeschickt, kann aber ebenso fehlen oder sonst irgendwie verändert sein. Da diese Information beliebig gesetzt werden kann, ist nicht gewährleistet, das sie auch stimmt. Genau solche „gefälschten“ Referer machen sich Spammer zu Nutze und setzen den Refefer auf eine Seite, von der gar kein Link auf die aufgerufene Seite zeigt.

Spamziel -> Neugierige Webmaster und öffentliche Statistik

Was hat ein Spammer nun von so einem auf eine „beworbene“ Seite zeigenden, falschen Referer? Zwei Aspekte spielen dafür eine wichtige Rolle.

Zum einen die Neugier des Webmasters, der gerne wissen möchte, wer denn da und warum auf die eigene Seite verlinkt. Damit hat die bespammte Seite schonmal einen Besucher mehr. Ich gebe zu, ich gucke da auch manchmal nach, woher die Links kommen :-)

Zum anderen gibt es Webseiten, die ihre Zugriffsstatistik öffentlich einsehbar auf einer Seite bereitstellen. Meist gibt es da auch einen Bereich mit der Herkunft der Besucher, als der referenzierenden Webseite, die dann oft sagar als Link ausgegeben werden. Über die Bedeutung von Links im allgemeinen und für das Suchmaschinen-Ranking im besonderen brauche ich wohl keine großen Worte verlieren.

Referer-Spam mit System

Seit ein paar Tagen, konkret seit dem 18. März, befinden sich in meinen Log-Dateien Referer von der Seite referertrick.com (seit kurzem auch mit .de).
Die Zugriffe kommen bisher von den drei IP-Adressen 87.118.82.66, 87.118.82.104 und 87.118.116.23. Ich habe noch etwas „zurückgeblättert“ und festgestellt, daß es bereits im Dezember 2009 ein paar Zugriffe von einem Bot namens „SourceSpider/2.1“ über die IP 87.118.82.66 gab. Im Januar wurde vermutlich eine Testlauf gestartet, da tauchte dieser Server mit „Kunden-Referer“ auf.

Auf der referertrick-Webseite heißt es ganz unverblümt:

Wir senden HTTP-Pakete an alle Webseiten des Internets. Dabei wird Ihre Webseite als Referer aufgelistet.
Die Inhaber dieser vielen (teilweise Millionen) anderen Webseiten glauben daher, dass Sie auf diese Webseite verlinken würden, und besuchen Ihre Webseite aus Neugierde.
Jeder Besucher ist ein potentieller Kunde, ganz zu schweigen von der Suchmaschinen-Optimierung durch die vielen Statistik-Links!

Geld verdienen im Internet

Das Ganze klingt natürlich erstmal nach einer cleveren Geschäftsidee. Ich halte es allerdings für eine weitere Art von Spam, die irgendwann nur nervig ist.

Irgendwie paßt das auch ganz gut zum aktuellen Thema des Webmasterfridays „Was ist die richtige Linkbuilding-Strategie?“ :-)
Allerdings denke ich, daß dieser Art gekauftes „Linkbuilding“ über gefakte Referer auf Statistikseiten keine gut Strategie ist.

Google-Analytics und externe Statistik nicht betroffen

Wenn sich nun jemand wundert, daß bei ihm noch keine Referertricks angekommen sind, liegt es vielleicht daran, das die Statistik nicht über die Serverlogdatei funktioniert oder direkt auf dem Server läuft. Technisch bedingt sind keine Statistik-Tools betroffen, die extern per Javascript oder „Zählerpixel“ eingebunden werden. Der Referertrick-Bot führt, davon gehe ich einfach mal aus, schließlich kein Javascript aus oder lädt per IMG-Tag eingebundene Grafiken nach. Somit sehen Statistik-Tools wie Google-Analytics, WordPress.com Stats oder auch Piwick diese falschen Referer erst gar nicht.

Weitere Artikel mit Bezug zu diesem:

8 Kommentare »

Der Februar 2010 in Zahlen

02.03.2010 17:43 von schnurpselchen in Blog, Internet

Den letzten Monatsrückblick gab es im Januar 2010. Wenn man nicht so recht weiß, was man sonst schreiben soll, stürzt man sich halt auf die Statistik :-). Die Werte sind alle aus der Serverlogdatei ermittelt worden.

Die Kennzahlen vom Februar 2010

Webzugriffe: 141450 von 12946 IP-Adressen (10,93 Req/IP)
Seitenzugriffe: 5659 (ca. 202/Tag)
Besucher: 3411 (ca. 122/Tag)
Einnahmen: 0,00 EUR (keine)

Was ich unter Web- bzw. Seitenzugriffen verstehe, habe ich bereits im letzten Monat erklärt. Neu sind die Besucher, hier verwende ich eine Kombination aus anonymisierter IP-Adresse und User-Agent, um Besucher zu unterscheiden.

Aus den Seitenzugriffen und der Besucherzahl ergibt sich der Seiten/Besucher-Quotient, hier liegt der Wert bei 1,66 Seiten je Besucher. Oder anders gesagt, durchschnittlich nur etwas mehr als jeder dritte Besucher guckt sich mehr als eine Seite an. Die globale Absprungrate liegt bei ungefähr 61 Prozent.

Die Einnahmen betrugen im Februar 0 Euro und 0 Cent, kein Wunder, habe ich doch den Google-Adsense-Block wie angekündigt wieder entfernt.

Am häufigsten aufgerufene Seiten

Die am häufigsten aufgerufene Seite ist die Startseite mit 432 Zugriffen (etwa 7,6 %). Es folgen diese Seiten:

WordPress bei Strato (414 → 7,3 %)
WordPress beim 1&1 Webhosting (1&1 Homepage) (357 → 6,3 %)
WordPress 2.3 – Problem ohne www bei Strato (325 → 5,7 %)
WordPress Permalinks (290 → 5,1 %)
Warum WordPress bei Strato so langsam ist (272 → 4,8 %)
SpeedPlus – Strato macht PHP-Anwendungen schneller (236 → 4,2 %)
Mit WordPress per E-Mail bloggen (217 → 3,8 %)
Strato wird vernünfig, mod_rewrite funktioniert (185 → 3,3 %)
Home/Startseite im WordPress-Menü (176 → 3,1 %)
Google-Bildersuche mit neuem imagesite-Parameter (168 → 3,0 %)

Die Artikel passen logischerweise recht gut zu den häufigsten Suchwörtern wie wordpress, strato, permalinks, mod_rewrite, 1und1 u.Ä. Eine kleine Ausnahme stellt der Artikel auf Platz 10 dar, hier kamen die Besucher kaum über eine Suchmaschine, sondern über Twitter und andere, referenzierende Seiten.

Blog-Statistik

Zum Schluß noch schnell die Blog-Statistik. Hier bei Schnurpsel gibt es derzeit 16 Seiten sowie 137 Artikel in 12 Kategorien und mit 156 Stichworten. Dazu kommen 684 genehmigte Kommentare, Trackbacks und Pingbacks.

Weitere Artikel mit Bezug zu diesem:

Ein Kommentar »