Das Putzlowitsch Test- und SEO-Blog

Bananen und Orange – ein Bilder-Experiment

bild-1 bild-2 bild-3 bild-4 bild-5 bild-6 bild-7 bild-8 bild-9

Der Versuchsaufbau

Ende Januar habe ich, inspiriert vom Mohakenox-Versuch, ein kleines Experiment mit Bananen und einer Orange gestartet. Oder besser gesagt, mit dem Foto von Bananen und einer Orange. Ich habe das Bild in unterschiedlichen Größen (in Pixel) sowie JPEG-Komprimierungsraten und damit Dateigrößen gespeichert. Ich wollte sehen, welche Bilder Google für die Bildersuche bevorzugen würde.

Die Bilder

Bananen und Orangen - Bilderübersicht
Das Bild im Format 800×600 gibt es sechsmal, dabei variiert die Dateigröße von etwa 10k (Bild 1) bis 100k (Bild 6). Die Bilder 7 bis 9 haben auch eine Dateigröße von ungefähr 100k, aber andere Abmessungen. Neben den „gängigen“ Formaten 1024×768 (Bild 7) und 640×480 (Bild 8) habe ich auch noch ein krummes Format 637×477 (Bild 9) dazu genommen.

Phase 1 – Der Googlebot-Image kommt

Der Artikel mit den Bildern wurde am 26.01.2010 17:04 Uhr veröffentlicht. Der Googlebot hat erstmals am 01.02.2010 um 21:09 Uhr ein Bild eingelesen, das Bild Nr. 4. Die Bilder wurden bisher insgesamt 51 mal vom Bot abgefragt, im einzelnen:

Bild Pixel Größe Anzahl erstmalig zuletzt
1 800×600 10k 6 10.03.2010 09.07.2010
2 800×600 20k 7 11.02.2010 24.06.2010
3 800×600 30k 5 29.03.2010 11.06.2010
4 800×600 50k 6 01.02.2010 10.06.2010
5 800×600 70k 5 12.02.2010 12.06.2010
6 800×600 100k 5 03.02.2010 23.06.2010
7 1024×768 100k 6 22.03.2010 27.06.2010
8 640×480 100k 5 09.02.2010 19.07.2010
9 637×477 100k 6 06.02.2010 27.06.2010

Die letzten Bilder wurden erst nach etwa einem Monat erfaßt. Da Schnurpsel keine ausgesprochene Bilderseite ist, dauert es wohl auch länger als z.B. bei Putzlowitsch, wo Bilder meist schon nach 24 Stunden, spätestens aber drei Tagen abgefragt werden. Je größer und „bilderlastiger“ eine Website ist, um so schneller und häufiger kommt der Googlebot-Image vorbei.

Phase 2 – Die Bilder in den Suchergebnissen

Bis Anfang Januar 2010 war die Google-Bildersuche sehr schnell. Bereits nach zwei Wochen tauchten neue Bilder in den SERPs auf. Ich war wohl für „Burger mit Pommes“ grad noch so in die schnelle Phase reingerutscht, danach ging es zumindest bergab.

Das erste „Bananen und Orange“-Bild tauchte am 12. April in den Suchergebnissen auf, allerdings erst, nachdem ich etwas nachgeholfen hatte (dazu später mehr). Besser gesagt waren es zwei Bilder, Bild 2 (800×600, 20k) landete für die Suche nach Bananen und Orange auf dem ersten Platz, Bild 5 (800×600, 70k) belegte direkt dahinter Platz 2.

Bananen und Orange im Mai 2010

Bis zum 8. Mai blieben die Bilder fast unverändert auf Platz 1 und 2 liegen, wurden dann am 9. Mai von Bild 3 (800×600, 30k) und Bild 1 (800×600, 10k) abgelöst. Zwischendurch wurden diese noch kurzzeitig durch die Bilder 6 (800×800, 100k) und 8 (640×480, 100k) ersetzt, bis die Bilder schließlich am 27. Mai wieder ganz verschwanden. Für die Keyphrase Bananen und Orange haben es also 6 von 9 Bildern in die SERPs geschafft.

Zwei weitere Bilder tauchten zumindest bei der imagesite-Abfrage für schnurpsel.de auf, Bild 4 (800×600, 50k) und Bild 7 (1024×768, 100k). Vom Bild 9 (637×477, 100k) fehlt bisher jede Spur in den Bilder-SERPs.

Phase 3 – Hin und weg

Die Phase 3 war so gar nicht geplant, ergab sich aber aus der Tatsache, daß die Bilder zunächst überhaupt nicht auftauchen wollten. Anfang April wurde ich schon etwas unruhig, weil die Bilder nach nunmehr gut zwei Monaten nicht in den Suchergebnissen angekommen waren. Nun wollte ich es „erzwingen“ und holte den Artikel „Bananen und Orange“ wieder auf die Startseite.

Tatsächlich tauchten die ersten Bilder einige Tage später, eben am 12. April, in den SERPs auf. War das jetzt nur Zufall gewesen oder ließ sich die Sache reproduzieren? Ende Mai habe ich den Artikel von der Startseite entfernt und zwei bis drei Tage später (am 27. Mai) waren die Bilder verschwunden. Auch nur Zufall? Nein! Ich kann die Bilder gewissermaßen suchergebnismäßig ein- und ausschalten.

Ich habe dann noch zweimal hin- und hergeschaltet, die Bilder sind nun seit dem 18 Juli wieder in den SERPs. Allerdings haben sie etwas Boden verloren. Sie liegen derzeit auf Platz 10 und 11, Bild 1 ist immer dabei, das zweite Bild wechselt zwischen Bild 3 und 6. Zudem wechselt auch die Position zwischendurch immer wieder mal von 10 und 11 auf 3 und 4, es ist also derzeit Bewegung drin.

Phase 4 – Die Auswertung

Aus meiner Sicht lassen sich nur drei Schlüsse ziehen, und diese nicht mal sicher.

  1. Bilder mit krummen Abmessungen (637×477) haben wenig Chancen, man sollte für Bilder gängige Standardformate wie 640×480, 800×600, 1024×768 usw. verwenden.
  2. Bilder auf der Starseite haben ein höheres Gewicht, aber das ist nichts wirklich Neues.
  3. Zu viele Bilder und zu wenig Text, der zudem praktisch nur aus den Schlüsselwörtern besteht, werden als Spam abgestraft. Auf der Artikel-Einzelseite kommt die Schlüsselphrase Bananen und Orange inkl. alt- und title-Attributen fast 40-mal vor, aber kaum anderer Text. Das ist dann wohl doch etwas viel.

Die zunächst naheliegende Vermutung, das Google möglicherweise das Bildformat 800×600 bevorzugen könnte, läßt sich durch den mangelhaften Versuchsaufbau nicht belegen. Da 6 von 9 Bilder dieses Format haben, ist allein statistisch gesehen die Chance für ein 800x600er Bild in die SERPs zu kommen deutlich höher, als für eines der anderen Bilder.

Fazit

Das Experiment hat auf Grund mangelhafter Planung und Durchführung keine brauchbaren Erkenntnisse bezüglich des Versuchsziels gebracht. Allerdings ist die Ein- und Ausschaltmöglichkeit für Bilder in den SERPs ein recht lustiger Nebeneffekt. Naja, und ich habe hier mal wieder Stoff für einen längeren, halbwegs „wissenschaftlich“ aussehende Artikel. :-)

Nachtrag: Die nächste Abschaltung erfolgt am 31. Juli. Gut möglich, daß dann die Bilder aber durch diesen Artikel hier über Wasser gehalten werde und nicht von der Bildfläche verschwinden. Man wird sehen…

Nachtrag 28. Juli
Bananen und Orange - krummHätte ich ja auch vorher schon mal nachsehen können. Wenn man bei Google explizit nach Bananen und Orange mit der Bildgröße 637×477 sucht, wird dann das „krumme“ Bild 9 angezeigt. Es ist also im Index, dürfte aber normal kaum in Erscheinung treten. Wer sucht schon nach einem Bild mit der exakten Größe 637 Pixel mal 477 Pixel?

Weitere Artikel mit Bezug zu diesem:
9 Kommentare »

Nach den Sternen greifen – Ziele von Schnurpsel

Nach den Sternen greifen

Mein ursprüngliches Ziel mit diesem Schurpsel-Blog hier ist schnell benannt. Ich konnte das ewige Rumgenörgel im WordPress-Deutschland-Forum bezüglich WordPress und Starto nicht mehr hören (lesen). Also habe ich ein Hostingpaket bei Strato bestellt um selbst zu sehen, was an den ganzen Kritiken dran ist.

Probleme und Lösungen

Ja, die meisten Kritikpunkte am Stratohosting des Sommers 2007 waren durchaus berechtigt. Das für die Permalinks notwendige mod_rewrite war nicht verfügbar, der PHP-Speicher mit 8MB recht knapp bemessen, durch eine fehlerhafte Server-Konfiguration wurden Endlosschleifen produziert und die gesamte Performance der Webseiten war nicht gerade berauschend.

Im Großen und Ganzen habe ich mein Ziel erreicht. Durch Plugins, Konfigurationseinstellungen und Hacks habe ich WordPress auch beim Strato-Webhosting zufriedenstellen zum Laufen bekommen, auch mit Permalinks und ohne Endlosschleife. Eigentlich wäre das der Zeitpunkt gewesen, die Blogaktivitäten hier bei schnurpsel.de einzustellen.

Aber wie das so ist, es tauchen neue Probleme auf und auch so ganz allgemein ist ein Zweitblog zum Testen und Probieren ganz praktisch.

Kurzfristige Nahziele

Wenn SEO-Wettbewerbe laufen, wie aktuell das iPhone4Spiel, dann möchte ich mit meinem Schnurpsel-Test-und-Probierblog natürlich so weit wie möglich nach vorne kommen, am besten auf Platz 1. Allerdings investiere ich nicht wirklich viel in solche Aktionen. Ich registriere keine Keyword-Domain, befülle nicht 100 Blogs mit automatischen Texten und kippe auch nicht täglich „Pressemeldungen“ in News-Portalen ab. Insofern habe ich da auch kaum eine Chance, aber es gibt doch immer wieder Interessantes zu beobachten. Ich freue mich auch immer über nofollow-Links als Dankeschön oder Quellenangabe.

Außerdem will ich immer der Erste mit einer Meldung sein, wenn es wichtige Neuerungen bei Google und dort speziell bei der Bildersuche gibt. Manchmal schaffe ich das sogar, wie beim geheimen imagesite-Paramter. :-)

Langfristige Fernziele

Ich will auch in Zukunft den leidgeplagten WordPress-bei-Strato (1&1, Host-Europe, All-Inkl) Nutzern mit Rat und Tat zur Seite stehen. Dazu muß ich natürlich mit den relevanten Suchbegriffen bei Google gefunden werden. Als kann das Fernziel nur lauten. Platz 1 bei Google. :-)

4 Kommentare »

WordPress mit Permalinks – den Webserver entlasten

Wie WordPress Permalinks verarbeitet

Durch Permalinks bekommen Artikel und Seiten lesbare URLs und auch Struktur. Alle Artikel in der Kategorie ‚Wordpess‘ können mit schnurpsel.de/themen/wordpress/ aufgerufen werden, das Monatsarchiv für Juli 2010 mit schnurpsel.de/date/2010/07/.

Auf dem Webserver existiert aber kein Verzeichnis /themen/wordpress/ oder /date/2010/07/. Damit die Seiten trotzdem aufgerufen werden können, erstellt WordPress eine einfache Regel für das Rewrite-Modul des Apache-Webservers:

RewriteCond %{REQUEST_FILENAME} !-f
RewriteCond %{REQUEST_FILENAME} !-d
RewriteRule . /index.php [L]

Diese drei Zeilen führen dazu, das alles, was nicht tatsächlich als Datei oder Verzeichnis auf dem Server existiert, einfach an die index.php von WordPress durchgereicht wird. WordPress kümmert sich nun darum, ob es z.B. eine Kategorie „WordPress“ gibt, stellt die Liste mit den passenden Artikeln zusammen und gibt sie aus.

Was es alles nicht gibt

Im Moment sind wohl mal wieder ein paar Bots oder Skriptkiddies unterwegs, die einfach versuchen, irgendwelche php-Skripte aufzurufen, um mögliche Sicherheitslücken ausnutzen zu können. Das sieht dann etwa so aus:

/scripts/setup.php
/pma/scripts/setup.php
/phpMyAdmin/scripts/setup.php
/phpmyadmin/scripts/setup.php
/myadmin/scripts/setup.php

Solche Dateien gibt es hier allerdings nicht. Auch andere Sachen können zu fehlerhaften Aufrufen führen, z.B. Standard-Icons wie favicon.ico oder apple-touch-icon.png, die manche Browser einfach aufrufen oder durch Nutzer aus der Bildersuche falsch kopierte BILd-URLs.

Durch die für die Permalinks notwendigen mod_rewrite-Regeln werden alle dies Aufrufe nun an WordPress weitergeleitet. WordPress wird geladen, stellt eine Datenbankverbingung her, klappert die internene Rewriteregeln ab um schließlich nur festzustellen, daß es mit dem Aufruf nichts anfangen kann. Dann gibt WordPress schließlich auch nur eine Fehlerseite aus, die möglicherweise auch noch aufwändig gestaltet ist und unnötig viel Daten als Antwort zurücküberträgt.

WordPress und den Webserver entlasten

Damit nun nicht WordPress wegen jeder Kleinigkeit behelligt werden, kann man eine spezielle Regel der WordPress-Regel vorschalten, die einfach gegebenfalls die Abarbeitung der Rewrite-Regeln beendet:

<IfModule mod_rewrite.c>
RewriteEngine On
RewriteCond %{REQUEST_FILENAME} !-f
RewriteRule \.[^\.]+$ - [L]
</IfModule>

Die Idee dabei ist, daß alle Permalink-URLs normalerweise keine Dateierweiterung wie .html, .jpg oder .php haben. Falls nun eine Datei nicht existiert (RewriteCond) und diese Datei mit einem Punkt und mindestens einem weiteren Zeichen endet, wird die Abarbeitung der Regeln an dieser Stelle beendet (RewriteRule). Diese Zeilen müssen vor den WordPress-Regeln stehen.

WordPress bekommt diese Aufrufe nicht mehr zu sehen, der Fehler wird einfach vom Webserver behandelt. Hier kommt dann auch eine konfigurierte und vorhanden benutzerdefinierte Fehlerseite zu Anwendung.

Ich weiß, es gibt auch Blogger, die aus welchen Gründen auch immer, die Permalinks mit einem abschließenden .html konfiguriert haben. Aber auch das ist kein Problem, es muß nur eine Zeile hinzugefügt werden, welche die Regel für die Endung .html (oder eine andere) ungültig macht:

<IfModule mod_rewrite.c>
RewriteEngine On
RewriteCond %{REQUEST_FILENAME} !-f
RewriteCond %{REQUEST_URI}	!\.html$
RewriteRule \.[^\.]+$ - [L]
</IfModule>

Optimierte Version

Mann kann die zusätzlichen Bedingungen auch direkt in die WordPress-Rules einfügen. Nachteil hierbei ist aber, daß sie bei Änderungen an den Permalinkeinstellungen verloren gehen, weil WordPress den Block zwischen # BEGIN WordPress und # END WordPress neu schreibt:

# BEGIN WordPress
<IfModule mod_rewrite.c>
RewriteEngine On
RewriteBase /
RewriteRule ^index\.php$ - [L]
RewriteCond %{REQUEST_FILENAME} !-f
RewriteCond %{REQUEST_FILENAME} !-d
RewriteCond %{REQUEST_URI}	!\.[^\.]+$
RewriteRule . /index.php [L]
</IfModule>
# END WordPress

Die Version mit Endung .html:

# BEGIN WordPress
<IfModule mod_rewrite.c>
RewriteEngine On
RewriteBase /
RewriteRule ^index\.php$ - [L]
RewriteCond %{REQUEST_FILENAME} !-f
RewriteCond %{REQUEST_FILENAME} !-d
RewriteCond %{REQUEST_URI}	!\.[^\.]+$ [OR]
RewriteCond %{REQUEST_URI}	\.html$
RewriteRule . /index.php [L]
</IfModule>
# END WordPress

Plugin-Version

Angeregt durch die Kommentare von Ralf habe ich nun eine Plugin-Version fertig gestellt.

Download: 123 Rewrite Error 0.10

Das Plugin schreibt die Regeln beim Aktivieren, Deaktivieren und bei Änderungen an der Permalinkstruktur wie bei der Optimierten Version beschrieben automtisch mit den WordPress-RewriteRules in die .htaccess. Dabei wird auch gleich berücksichtigt, ob in der Permalinkstruktur eine Erweiterung wie .html angegeben wurde.

Fazit

Wieviel Serverlast oder Traffic durch diese Maßnahme eingespart wird, kann ich nicht sagen. Das hängt sicher auch vom Nutzungsprofil und der Konfiguration der Website ab. Aber warum sollte man solch eine einfache Möglichkeiten auslassen, um WordPress und dem Webserver das Leben ein bißchen leichter zu machen.

8 Kommentare »

1&1 Webhosting – Fehlerseite 404 mit Sedo-Werbung

Error 404 Fehlerseite - 1&1 Werbung mit Sedoparking

1&1 blendet Werbung auf Kundenseiten ein

Da diskutiere ich grad im WordPress-Forum darüber, ob WordPress bei 1&1 denn auch selbst eine .htaccess-Datei erstellt und plötzlich bekomme ich beim rumprobieren eine mir bisher unbekannte Fehlerseite angezeigt. Unter der großen in 1&1-Blau gehaltenen Fehlermeldung gibt es ein Suchfeld und eine Liste mit Links zu unterschiedlichen Seiten. Diese führen per Weiterleitung über sedoparking.com zu googleads.g.doubleclick.net (den Link habe ich im Bild hinzugefügt). Also irgendwie bezahlte Werbung, die ich ganz bestimmt nicht bei mir geschaltet habe.

Hier erdreistet sich 1&1 einfach Werbung zu schalten, der ich so ganz bestimmt nicht zugestimmt habe. Als ich vor etwa 9 Jahren mein Webhosting-Paket, damals noch bei Puretec bestellt habe, hatte ich mich extra für die zwar teurere, dafür aber werbebannerfreie Version entschieden. Und nun sowas.

Bei anderen auch

Ich weiß nun ehrlich gesagt nicht, wie lange das schon so ist, habe aber mal gesucht und einen Foren-Thread bei mediengestalter.info gefunden (hier wurde auch berichtet). Ich hatte zwar schon begonnen, benutzerdefinierte Fehlerseiten zu bauen, dort im Forum steht aber die einfachere „Lösung“. Man kann den ganzen Kram abschalten, muß man aber erstmal drauf kommen:

1&1 Domain-Parking

Das findet man im 1&1-Control-Center bei Domains unter der Domainliste rechts unten. Dort steht:

Domain-Parking
Ist Ihre Homepage noch nicht fertig? Bieten Sie Ihren Besuchern beim Aufruf Ihrer Domain vorgefertigte Inhalte statt „Baustellenseiten“ an.

Irgendwer hat dann auch noch eine Stelle in den 1&1-Webhosting AGB gefunden, die sich wie folgt liest:

3.4
Solange der Kunde selbst zu einer Domain noch keine Inhalte bereitstellt, ist 1&1 berechtigt, eigene Inhalte wie Werbung für 1&1 oder Dritte einzublenden.

Gut, das Baustellenschild kenn ich auch, aber das hat ja wohl nichts mit einer Fehlerseite zu tun. Ich habe seit Jahren auf meinen Domains Inhalte hinterlegt und nur weil ein Hansel versehentlich eine falsche URL eingibt, wird plötzlich Werbung eingeblendet, die ich nicht will. Wohlgemerkt bei einer Fehlerseite, nicht bei einer neuen und noch ungenutzten Domain. Das ist meiner Meinung nach auch nicht durch Punkt 3.4 der AGB gedeckt.

Überhaupt, wenn auf meiner Domain Werbung zu finden ist, handle ich denn nun plötzlich im geschäftlichen Verkehr und muß eventuell mit wettbewerbs- oder markenrechtlichem Ungemach rechnen? Neeee, so geht das nicht!

Abschalten

Ich kann nur jedem Raten, die Sedo-Parking-Werbung im Control-Center abzuschalten. Man hat selbst nichts davon und bekommt möglicherweise sogar noch Ärger.

Weitere Artikel mit Bezug zu diesem:
13 Kommentare »

1 Million iPhone4Spiel-Seiten, ein voller Erfolg?

iPhone4Spiel - 925000 Treffer

Hoch- und Abrechnung

Gut, ich habe da etwas übertrieben. Es sind noch keine Millionen iPhone4Spiel-Seiten, Google „spricht“ von ungefähr 925 Tausend Treffern. Aber auch Google übertreibt mit den 925000 Ergebnissen maßlos, wie man schnell merkt, wenn man sich mal in den SERPs bis zum Ende durchklickt.

Da ist bereits auf „Seite 36 von 353 Ergebnissen“ das Ende der Fahnenstange erreicht. Gut, da steht ja noch der bekannte Hinweis:

Um Ihnen nur die treffendsten Ergebnisse anzuzeigen, wurden einige Einträge ausgelassen, die den 353 bereits angezeigten Treffern sehr ähnlich sind.

Aber auch mit filter=0 kommt man nur bis zur Seite 59, mithin sind es also etwa 600 Treffer, die Google tatsächlich präsentiert.

Nun frage ich mich, nicht zum ersten Mal, wie Google auf solche utopisch hohen Zahlen kommt. Selbst wenn es nicht nur 600, sondern sagen wir mal 9000 Seiten sind, wäre das immer noch ein Mißverhältnis von 1:100.

Vermutlich wird die ungefähre Ergebniszahl irgendwie hochgerechnet, aber wirklich brauchbar ist diese Rechnung nicht. Man stelle sich vor, bei der nächsten Bundestagswahl gibt es erste Hochrechnungen für die FDP von 50% und tatsächlich sind es dann aber nur 0,5%. :-)

Erfolg und Mißerfolg

Ob der „SEO-Wettbewerb“ zum iPhone4Spiel nun ein Erfolg oder Mißerfolg ist, mag ich nicht beurteilen. Die Frage ist ja immer auch, woran wird Erfolg gemessen und wer hat etwas davon.

Für mich gibt das iPhone4Spiel immerhin etwas Schreibstoff her, ich habe mal wieder an den Ranking-Charts gearbeitet (und einen Fehler bemerkt) und ein paar Beobachtungen machen können. Insofern ist das iPhone4Spiel für mich ganz persönlich sowas wie ein kleiner Erfolg.

Weitere Artikel mit Bezug zu diesem:
Keine Kommentare »