Das Putzlowitsch Test- und SEO-Blog

WordPress mit Permalinks – den Webserver entlasten

Wie WordPress Permalinks verarbeitet

Durch Permalinks bekommen Artikel und Seiten lesbare URLs und auch Struktur. Alle Artikel in der Kategorie ‚Wordpess‘ können mit schnurpsel.de/themen/wordpress/ aufgerufen werden, das Monatsarchiv für Juli 2010 mit schnurpsel.de/date/2010/07/.

Auf dem Webserver existiert aber kein Verzeichnis /themen/wordpress/ oder /date/2010/07/. Damit die Seiten trotzdem aufgerufen werden können, erstellt WordPress eine einfache Regel für das Rewrite-Modul des Apache-Webservers:

RewriteCond %{REQUEST_FILENAME} !-f
RewriteCond %{REQUEST_FILENAME} !-d
RewriteRule . /index.php [L]

Diese drei Zeilen führen dazu, das alles, was nicht tatsächlich als Datei oder Verzeichnis auf dem Server existiert, einfach an die index.php von WordPress durchgereicht wird. WordPress kümmert sich nun darum, ob es z.B. eine Kategorie „WordPress“ gibt, stellt die Liste mit den passenden Artikeln zusammen und gibt sie aus.

Was es alles nicht gibt

Im Moment sind wohl mal wieder ein paar Bots oder Skriptkiddies unterwegs, die einfach versuchen, irgendwelche php-Skripte aufzurufen, um mögliche Sicherheitslücken ausnutzen zu können. Das sieht dann etwa so aus:

/scripts/setup.php
/pma/scripts/setup.php
/phpMyAdmin/scripts/setup.php
/phpmyadmin/scripts/setup.php
/myadmin/scripts/setup.php

Solche Dateien gibt es hier allerdings nicht. Auch andere Sachen können zu fehlerhaften Aufrufen führen, z.B. Standard-Icons wie favicon.ico oder apple-touch-icon.png, die manche Browser einfach aufrufen oder durch Nutzer aus der Bildersuche falsch kopierte BILd-URLs.

Durch die für die Permalinks notwendigen mod_rewrite-Regeln werden alle dies Aufrufe nun an WordPress weitergeleitet. WordPress wird geladen, stellt eine Datenbankverbingung her, klappert die internene Rewriteregeln ab um schließlich nur festzustellen, daß es mit dem Aufruf nichts anfangen kann. Dann gibt WordPress schließlich auch nur eine Fehlerseite aus, die möglicherweise auch noch aufwändig gestaltet ist und unnötig viel Daten als Antwort zurücküberträgt.

WordPress und den Webserver entlasten

Damit nun nicht WordPress wegen jeder Kleinigkeit behelligt werden, kann man eine spezielle Regel der WordPress-Regel vorschalten, die einfach gegebenfalls die Abarbeitung der Rewrite-Regeln beendet:

<IfModule mod_rewrite.c>
RewriteEngine On
RewriteCond %{REQUEST_FILENAME} !-f
RewriteRule \.[^\.]+$ - [L]
</IfModule>

Die Idee dabei ist, daß alle Permalink-URLs normalerweise keine Dateierweiterung wie .html, .jpg oder .php haben. Falls nun eine Datei nicht existiert (RewriteCond) und diese Datei mit einem Punkt und mindestens einem weiteren Zeichen endet, wird die Abarbeitung der Regeln an dieser Stelle beendet (RewriteRule). Diese Zeilen müssen vor den WordPress-Regeln stehen.

WordPress bekommt diese Aufrufe nicht mehr zu sehen, der Fehler wird einfach vom Webserver behandelt. Hier kommt dann auch eine konfigurierte und vorhanden benutzerdefinierte Fehlerseite zu Anwendung.

Ich weiß, es gibt auch Blogger, die aus welchen Gründen auch immer, die Permalinks mit einem abschließenden .html konfiguriert haben. Aber auch das ist kein Problem, es muß nur eine Zeile hinzugefügt werden, welche die Regel für die Endung .html (oder eine andere) ungültig macht:

<IfModule mod_rewrite.c>
RewriteEngine On
RewriteCond %{REQUEST_FILENAME} !-f
RewriteCond %{REQUEST_URI}	!\.html$
RewriteRule \.[^\.]+$ - [L]
</IfModule>

Optimierte Version

Mann kann die zusätzlichen Bedingungen auch direkt in die WordPress-Rules einfügen. Nachteil hierbei ist aber, daß sie bei Änderungen an den Permalinkeinstellungen verloren gehen, weil WordPress den Block zwischen # BEGIN WordPress und # END WordPress neu schreibt:

# BEGIN WordPress
<IfModule mod_rewrite.c>
RewriteEngine On
RewriteBase /
RewriteRule ^index\.php$ - [L]
RewriteCond %{REQUEST_FILENAME} !-f
RewriteCond %{REQUEST_FILENAME} !-d
RewriteCond %{REQUEST_URI}	!\.[^\.]+$
RewriteRule . /index.php [L]
</IfModule>
# END WordPress

Die Version mit Endung .html:

# BEGIN WordPress
<IfModule mod_rewrite.c>
RewriteEngine On
RewriteBase /
RewriteRule ^index\.php$ - [L]
RewriteCond %{REQUEST_FILENAME} !-f
RewriteCond %{REQUEST_FILENAME} !-d
RewriteCond %{REQUEST_URI}	!\.[^\.]+$ [OR]
RewriteCond %{REQUEST_URI}	\.html$
RewriteRule . /index.php [L]
</IfModule>
# END WordPress

Plugin-Version

Angeregt durch die Kommentare von Ralf habe ich nun eine Plugin-Version fertig gestellt.

Download: 123 Rewrite Error 0.10

Das Plugin schreibt die Regeln beim Aktivieren, Deaktivieren und bei Änderungen an der Permalinkstruktur wie bei der Optimierten Version beschrieben automtisch mit den WordPress-RewriteRules in die .htaccess. Dabei wird auch gleich berücksichtigt, ob in der Permalinkstruktur eine Erweiterung wie .html angegeben wurde.

Fazit

Wieviel Serverlast oder Traffic durch diese Maßnahme eingespart wird, kann ich nicht sagen. Das hängt sicher auch vom Nutzungsprofil und der Konfiguration der Website ab. Aber warum sollte man solch eine einfache Möglichkeiten auslassen, um WordPress und dem Webserver das Leben ein bißchen leichter zu machen.

8 Kommentare »

1&1 Webhosting – Fehlerseite 404 mit Sedo-Werbung

Error 404 – 1&1 Werbung mit Sedoparking

1&1 blendet Werbung auf Kundenseiten ein

Da diskutiere ich grad im WordPress-Forum darüber, ob WordPress bei 1&1 denn auch selbst eine .htaccess-Datei erstellt und plötzlich bekomme ich beim rumprobieren eine mir bisher unbekannte Fehlerseite angezeigt. Unter der großen in 1&1-Blau gehaltenen Fehlermeldung gibt es ein Suchfeld und eine Liste mit Links zu unterschiedlichen Seiten. Diese führen per Weiterleitung über sedoparking.com zu googleads.g.doubleclick.net (den Link habe ich im Bild hinzugefügt). Also irgendwie bezahlte Werbung, die ich ganz bestimmt nicht bei mir geschaltet habe.

Hier erdreistet sich 1&1 einfach Werbung zu schalten, der ich so ganz bestimmt nicht zugestimmt habe. Als ich vor etwa 9 Jahren mein Webhosting-Paket, damals noch bei Puretec bestellt habe, hatte ich mich extra für die zwar teurere, dafür aber werbebannerfreie Version entschieden. Und nun sowas.

Bei anderen auch

Ich weiß nun ehrlich gesagt nicht, wie lange das schon so ist, habe aber mal gesucht und einen Foren-Thread bei mediengestalter.info gefunden (hier wurde auch berichtet). Ich hatte zwar schon begonnen, benutzerdefinierte Fehlerseiten zu bauen, dort im Forum steht aber die einfachere „Lösung“. Man kann den ganzen Kram abschalten, muß man aber erstmal drauf kommen:

1&1 Domain-Parking

Das findet man im 1&1-Control-Center bei Domains unter der Domainliste rechts unten. Dort steht:

Domain-Parking
Ist Ihre Homepage noch nicht fertig? Bieten Sie Ihren Besuchern beim Aufruf Ihrer Domain vorgefertigte Inhalte statt „Baustellenseiten“ an.

Irgendwer hat dann auch noch eine Stelle in den 1&1-Webhosting AGB gefunden, die sich wie folgt liest:

3.4
Solange der Kunde selbst zu einer Domain noch keine Inhalte bereitstellt, ist 1&1 berechtigt, eigene Inhalte wie Werbung für 1&1 oder Dritte einzublenden.

Gut, das Baustellenschild kenn ich auch, aber das hat ja wohl nichts mit einer Fehlerseite zu tun. Ich habe seit Jahren auf meinen Domains Inhalte hinterlegt und nur weil ein Hansel versehentlich eine falsche URL eingibt, wird plötzlich Werbung eingeblendet, die ich nicht will. Wohlgemerkt bei einer Fehlerseite, nicht bei einer neuen und noch ungenutzten Domain. Das ist meiner Meinung nach auch nicht durch Punkt 3.4 der AGB gedeckt.

Überhaupt, wenn auf meiner Domain Werbung zu finden ist, handle ich denn nun plötzlich im geschäftlichen Verkehr und muß eventuell mit wettbewerbs- oder markenrechtlichem Ungemach rechnen? Neeee, so geht das nicht!

Abschalten

Ich kann nur jedem Raten, die Sedo-Parking-Werbung im Control-Center abzuschalten. Man hat selbst nichts davon und bekommt möglicherweise sogar noch Ärger.

Weitere Artikel mit Bezug zu diesem:
13 Kommentare »

1 Million iPhone4Spiel-Seiten, ein voller Erfolg?

iPhone4Spiel - 925000 Treffer

Hoch- und Abrechnung

Gut, ich habe da etwas übertrieben. Es sind noch keine Millionen iPhone4Spiel-Seiten, Google „spricht“ von ungefähr 925 Tausend Treffern. Aber auch Google übertreibt mit den 925000 Ergebnissen maßlos, wie man schnell merkt, wenn man sich mal in den SERPs bis zum Ende durchklickt.

Da ist bereits auf „Seite 36 von 353 Ergebnissen“ das Ende der Fahnenstange erreicht. Gut, da steht ja noch der bekannte Hinweis:

Um Ihnen nur die treffendsten Ergebnisse anzuzeigen, wurden einige Einträge ausgelassen, die den 353 bereits angezeigten Treffern sehr ähnlich sind.

Aber auch mit filter=0 kommt man nur bis zur Seite 59, mithin sind es also etwa 600 Treffer, die Google tatsächlich präsentiert.

Nun frage ich mich, nicht zum ersten Mal, wie Google auf solche utopisch hohen Zahlen kommt. Selbst wenn es nicht nur 600, sondern sagen wir mal 9000 Seiten sind, wäre das immer noch ein Mißverhältnis von 1:100.

Vermutlich wird die ungefähre Ergebniszahl irgendwie hochgerechnet, aber wirklich brauchbar ist diese Rechnung nicht. Man stelle sich vor, bei der nächsten Bundestagswahl gibt es erste Hochrechnungen für die FDP von 50% und tatsächlich sind es dann aber nur 0,5%. :-)

Erfolg und Mißerfolg

Ob der „SEO-Wettbewerb“ zum iPhone4Spiel nun ein Erfolg oder Mißerfolg ist, mag ich nicht beurteilen. Die Frage ist ja immer auch, woran wird Erfolg gemessen und wer hat etwas davon.

Für mich gibt das iPhone4Spiel immerhin etwas Schreibstoff her, ich habe mal wieder an den Ranking-Charts gearbeitet (und einen Fehler bemerkt) und ein paar Beobachtungen machen können. Insofern ist das iPhone4Spiel für mich ganz persönlich sowas wie ein kleiner Erfolg.

Weitere Artikel mit Bezug zu diesem:
Keine Kommentare »

Neue Google Bildersuche nicht nur schlecht

Das nicht alle nur das Schlechte an der neugestalteten Google-Bildersuche sehen, war nicht anders zu erwarten. Hier mal ein paar positive Stimmen aus Twitter:

„Wir finden Googles neue Bildersuche echt gelungen! Toll!!!“ (reproscan)
„Die neue Bilder-Suche von Google fetzt ja voll. :P“ (Maybach)
„Google hat die Bildersuche schöner gemacht…“ (rjoerges)
„… cooler Ansatz, macht auf jeden Fall mehr Spaß“ (visu)
„Woow…die neue Google Bilder suche ist cool. Sehr schick!“ (thedrayman)
„mir gefällt die neue #google bildersuche“ (mcnesium)

Klar, das ist natürlich immer alles sehr subjektiv und viele Neuerungen benötigen eine längere Eingewöhungsphase. Man hängt nun mal oft an den altebekannten Sachen.

Wordpress 2.6Wenn ich da z.B. noch an den Wechsel bei Wordpess vom horizontalen Menü oben zum vertikalen Menü links denke.
Was ging damals für ein Aufschrei durch die WordPress-Nutzerschaft, wie man denn nur sowas machen könne. Heute will wohl keiner mehr das alte „Design“ zurückhaben.

Ich hoffe mal, daß Google bei der Bildersuche noch nachbessert und zumindest ein paar Darstellungsoptionen anbietet. Eventuell kann man sich auch mit einem älteren Browser oder deaktiviertem Javascript behelfen, um noch eine Weile die alte Ansicht zu bekommen.

3 Kommentare »

Google-Bildersuche in neuem Gewand

Google-Bildersuche neu

In den Google– bzw. Bilderfachblogs und News-Portalen ist es bereits zu lesen, bei der Google-Bildersuche gibt es einige, tiefgreifende Veränderungen. Am augenfälligsten ist eine neu Präsentation der Ergebnisbilder. Früher wurden kleine Vorschaubilder mit weiteren Informationen zum Bild wie Abmessungen (Pixel), Dateigröße und URL des Bildes in einer „starren“ Tabelle gezeigt.

Jetzt ist das Vorschaubild größer und die Anordnung wird entsprechend den Bildformaten optimiert. Es kann also schon mal passieren, das in einer Zeile 5, 6 oder 7 Bilder stehen.

Keine inhaltliche Optimierung

Im Unterschied zum Googlewatchblog kann ich aber keine inhaltliche Gruppierug nach Ähnlichkeit oder Form erkennen. Die Bilder-Rankings haben sich nicht verändert, die Reihenfolge der Bilder ist im Vergleich mit der alten Bildersuche gleich geblieben. Die wichtigen Zusatzinformationen zu einem Bild werden nun beim Überfahren des Bildes mit der Maus angezeigt.

Einen wesentlichen Nachteil hat aber die Darstellungsoptmierung der Übersichtsseite. Falls notwendig, werden die Vorsschaubilder links und rechts bzw. oben und unten abgeschnitten. Das ist z.B. beim „Befreiphone“ (VolksPhone, iPhone4Spiel) oben unter der Gurke zu erkennen. Wenn nun jemand nach einem solchen Bild sucht und sieht, daß da beim Handy die Antenne abgeschnitten ist, wird er es vielleicht links liegen lassen.

Noch zwei weitere Bilder wurden bschnitten, wie hier zu sehen ist:
Google-Bildersuche neu (Animation)

Bilder mit einem ungünstigen Breiten-Höhen-Verhältnis dürften es in Zukunft schwer haben. Am besten, man verwendet Standardformate wie 640×480, 800×600, 1024×786, 1600×1200 usw.

Ein alter Hut?

Alter HutWirklich neu ist diese Darstellung der Bilder-Suchergebnisse nicht. Bei Bing gibt es das schon eine Weile und auch bei Google gab es Anfang 2007 erste Versuche in der Richtung. Damals wurden aber nur ein paar Informationen weggelassen und auch erst durch Überfahren mit der Maus sichtbar. Die Sache war aber nur von kurzer Dauer und ich war damals sehr erleichtert darüber. Ich befürchte aber, diesmal gibt es kein Zurück mehr.

Ausblick – Google Suche demnächst in neuem Layout

Konsequenterweise wird auch die normale Suche demnächst eine Umgestaltung erfahren und könnte zukünfig so aussehen:
Google-Suche neu

Nachtrag 17:20 Uhr
Die Zielseite, also wenn man auf ein Bildersuchergebnis klickt, sieht nun so aus:
Google Bildersuche neu - Zielseite

Technisch gesehen handelt es sich nun nicht mehr um eine Tabelle, sondern um div-Container, bei denen die Zielseite per iframe eingebunden wird. Die Framebreaker, mit denen man das iFrame verlassen kann um auf die richtige Zielseite weiterzuleiten, funktionieren auch weiterhin, wie ein erster Test zeigte.

Besonders auffällig ist das über die abgedunkelte Zielseite gelegte Originalbild. Ein Klick auf den Schließ-Button in der rechten oberen Ecke oder den abgedunkelte Bereich führt dann letztendlich zur Seite, auf der das Bild zu finden ist.

Ein Kommentar »