Das Putzlowitsch Test- und SEO-Blog

SEO-Tipps und SEO-Tricks und überhaupt

Nach längerer Zeit will ich mal wieder beim Webmaster-Freitag mitmachen, das Thema der Woche lautet „Sollte man SEO-Tipps sharen?„.

Die Sicht der Dinge

Man muß bei diesem Thema mehrere Aspekte unterscheiden. Einerseits die Perspektive, also sieht man es aus der Sicht des SEOs, der als Sender die Tipps veröffentlicht oder aus Sicht eines Webseitenbetreibers bzw. SEO-Konkurrenten, der als Empfänger von den Tipps profitiert.

Aus meiner Perspektive als Webseitenbetreiber kann ich es nur begrüßen, wenn SEOs ihr Wissen mit dem gemeinen Volk teilen. Andererseits ist natürlich für einen gewerbsmäßigen SEO sein Wissen auch Betriebskapital und da kann ich es schon nachvollziehen, wenn er nur wenig oder gar nichts davon preisgibt.

Andererseits ist auch zwischen Tipps und Tricks zu unterscheiden, obwohl hier die Trennlinie nicht ganz klar gezogen werden kann und die Übergänge in der Betrachtunsgweise des Herangehens gleitend sind.

SEO-Tipps

Im Duden findet man zum Stichwort „Tipp“ folgendes:

nützlicher Hinweis, guter Rat, der jemandem bei etwas hilft

Genau das ist ein Tipp, ein nützlicher Hinweis, nicht mehr und nicht weniger. Meist kann man diese Tipps unter SEO-Basiswissen einsortieren. Wenn nun jemand sagt, das ist ja alles nichts Neues und man kann das überall finden dann sage ich, bestimmte Sachen kann man einfach nicht oft genug wiederholen. Bezogen z.B. auf Bilder im Web kann ich folgendes empfehlen, auch wenn das schon alles ein alter Hut ist :-)
Alter Hut

  • Datei dem Bildinhalt entsprechend benennen
  • Sinnvolle Alt- und Titeltexte verwenden
  • Geeignete Bildgrößen verwenden
  • Passendes Formate nach Bildtyp auswählen

Das sind aber alles Sachen, die vordergründig gar nichts mit SEO zu tun haben, sondern mit Benutzerfreundlichkeit und Web-Standards bzw. damit, wie man seine Daten organisiert und sich dadurch das Leben leichter macht.

Die Bilddatei mit dem alten Hut nenne ich einfach deshalb alter-hut.jpg, damit ich bei den vielen Bildern selbst den Überblick behalte. Denn bei Dateinamen wie DSCF2783.JPG oder IMG_1966.JPG müßte ich erst jedesmal alle Bilder durchsehen, um das Gesuchte zu finden.

Wenn nun zufälligerweise auch die Suchmaschinen die oben genannten Punkte gut bewerten, ist das zwar schön, hat aber nichts mit SEO zu tun. Wer aber so grundlegende Dinge nicht berücksichtigt und z.B. die Bilder der 12 Megapixelkamera in höchster Auflösung mit mehreren Megabyte Dateigröße in seine Webseite einbindet, wird halt nicht nur die Leser vergraulen, sondern auch die Suchmaschinen vercrawlen.

SEO-Tricks

Auch zum „Trick“ hält der Duden eine schöne Kurzbeschreibung bereit:

listig ausgedachtes, geschicktes Vorgehen; Kunstgriff; Kniff; List

Das trifft es ganz gut, denn Kniff, List und vielleicht sogar Täuschung passen aus meiner Sicht wie die Faust aufs Auge, es muß aber nicht unbedingt so negativ gesehen werde. Ein SEO-Trick ist also alles, was über die oben beispielhaft für Bilder genannten Tipps hinausgeht und nicht wirklich der Benutzerfreundlichkeit, sondern vielmehr fast nur der Suchmaschine dient.

Besonders bei SEO-Wettbewerben wird gerne mal in die Trickkiste gegriffen. Deshalb sind diese Wettbewerbe auch gut geeignet, solche manchmal ganz billigen Tricks kennenzulernen. Eine Sache war mir damals (2005) bei der „Hommingberger Gepardenforelle“ aufgefallen. Da dieser Wettbewerb eine relative größe Popularität erlangte, haben da auch viele kleine Webseiten einfach nur aus Spaß an der Freude mitgemacht.

Nicht lange ließen damals Linktauschangebote auf sich warten, auch ich hatte einige E-Mails bekommen. Der gemeine Websitebetreiber hatte bestimmt schon davon gehört, das viele Links nicht nur gut für Besucher sonder auch für die Platzierung bei den Suchmaschinen sind (und darauf kam es beim Wettbewerb ja an). Das Motto war einfach „Verlinkt uns und wir verlinken euch“. Nur ist ein Link, wie ihn der Besucher auf der Seite sieht, nicht unbedingt auch etwas für die Suchmaschine wert, z.B. wenn er per Javascript eingebunden ist und der Suchmaschinen-Bot den Link überhaupt nicht sieht. Die Bots sind, auch heute noch, weitestgehend Javascript-blind.

Mit Tricks sollte man also eher vorsichtig sein, sowohl beim Veröffentlichen als auch bei der Nutzung. Oft basieren Tricks nur auf Unzulänglichkeiten, Schwachstellen oder Fehlern und können durchaus auch mal nach hinten losgehen. Genau dann, wenn eben jene Unzulänglichkeiten, Schwachstellen oder Fehler beseitigt werden.

Mein SEO-Tipp für heute

Zum Schluß kann ich mir einen kleinen SEO-Tipp nicht verkneifen. Es ist eine Buchempfehlung für ein Buch, das ich zwar selber gar nicht besitze oder kenne, das aber bestimmt eine feine Sache ist, zumindest wenn man sich für SEO interessiert: „SEO“ von Christoph Tannert

Und nein, ich habe das Buch nicht entdeckt, weil ich bei Amazon nach SEO gesucht habe. Es steht hier bei mir im kleinen Buchladen um die Ecke im Schaufenster.

Weitere Artikel mit Bezug zu diesem:
5 Kommentare »

Studenten-Spam, eine neue Masche?

Beim ersten Kommentar hier war es mir gar nicht aufgefallen. Die Seite, die der Kommentator als Homepage angegeben hat, sieht erstmal unverfänglich aus. Zumal sie auf einen Uni-Account bei der TU-Dresden verweist. Stutzig wurde ich bei einem weiteren Kommantar auf Putzlowitsch, hier lag die Homepage bei der HTW-Berlin. Verblüffend ähnlich war aus meiner Sicht der Aufbau der beiden Seiten. Es gibt jeweils eine Homepage und dann eine weitere Seite „1. Story“ bzw. „Story Nr.1“. Zufall?

Bei beiden Seiten ist das „Design“ eher etwas altbacken, technisch mit Tabellen realisiert. Das wundert mich besonders bei Christoph, der ja vorgibt, im vierten Studienjahr Informatik zu studieren. Abderrahim hingegen studiert schon im fünften Studienjahr im Fach „Techik“, richtig, nur Technik. Komisch auch, daß Christoph als E-Mail-Adresse Christian@ verwendet. Aber egal, das ist alles vielleicht nur Zufall.

Wenn man sich nun die Seiten von Christoph und Abderrahim ansieht, fallen weitere Gemeinsamkeiten auf. Beide berichten über Stromanbieter und verlinken auf Stromsuche. Beide schreiben über Gutscheine und Coupons und verlinken auf Gutscheindorado. Und jetzt kommts, beide Kommentare wurden von derselben IP-Adresse abgesetzt, Anbieter ist Kabel-Deutschland (dynip.superkabel.de). Aber auch das ist möglicherweise alles nur Zufall :-)

Was mich eher interessieren würde, wie die Seiten bei den Unis dort hinkommen. Werden für ein paar Euro Studenten gekauft, die dann Ihren Uni-Zugang dafür hergeben. Oder wurden die Accounts geknackt oder gibt es sonst eine Lücke, die es ermöglicht, auf Uni-Servern Seiten abzulegen?

Na mal sehen, ob und wie das weitergeht…

6 Kommentare »

Mehr Bilderdiebe

Bilderdieb am PrangerEigentlich sind es nicht wirklich mehr Bilderdiebe geworden, der bekannte Bilderdieb taucht nur mit einem anderen Gesicht, sprich weiteren Subdomains auf. Nach meinem Äpfelbild ist nun auch mein Fenchel dort zu finden, der Fenchel von einem gewissen Kochbuch (Stichwort: Brötchen) übrigens auch. Die haben mittlerweile auch ein Ersatzbild eingebaut.

So muß ich nun nicht nur freeimages-de aussperren, sondern auch noch images-de. Oder doch gleich bloggum insgesamt? Ich weiß nicht…

Mit Dieben ist man früher nicht zimperlich gewesen. Die wurden kurzerhand an den Pranger gestellt und hatten da nichts zu lachen. Gut, die moderne Form des digitalen Prangers gibt es ja auch und das kann manchmal noch schlimmere Folgen haben.

Weitere Artikel mit Bezug zu diesem:
2 Kommentare »

Strato PowerPlus mit SpeedPlus – Fehler bei der Remote-Adresse (REMOTE_ADDR)

Nachtrag am 22.01.2010:

Seit heute scheint das weiter unten geschilderte Problem mit der Remote-Adresse nicht mehr zu bestehen. Die Einträge in der .htaccess-Datei oder sonstige Eingriffe sind daher möglicherweise nicht mehr erforderlich.
Bei mir ist das Problem verschwunden, aber offensichtlich noch nicht generell.

Nachtrag am 01.03.2011:

Nach aktuellen Informationen ist das Problem wohl nun doch endgültig behoben worden. Die Einträge in der .htaccess-Datei oder sonstige Eingriffe sind daher nicht mehr erforderlich.

Seit Anfang Dezember 2009 bin ich mit meiner Schnurpsel-Seite wieder zurück zu Strato umgezogen. Ganz weg war ich ja nicht, ich hatte nur den Hostnamen bei einem anderen Anbieter aufgeschaltet. Aber seit es nun SpeedPlus bei Strato gibt, bin ich nun doch wieder zurückgekehrt.

Die Geschwindigkeit ist wirklich gut. Antwortzeiten von ungefähr 0,5 Sekunden gegenüber 3 bis 4 Sekunden vorher sind für ein PHP-Schwergewicht wie WordPress eine merkliche Verbesserung. Zudem wurde auch gleich das ohne-www-Problem beseitigt, in der Umgebungsvariable HTTP_HOST steht nun der tatsächlich im HTTP-Request angegebene host drin.

Die Remote-IP-Adresse (REMOTE_ADDR)

Neben allerlei anderen interessanten Informationen wird bei jedem Webseitenaufruf auch die IP-Adresse des Aufrufers in einer Umgebungsvariablen vermerkt. Auf diese kann z.B. mit Skriptsprachen wie PHP oder Perl als Variable „REMOTE_ADDR“ zugegriffen werden. Diese Remote-Adresse ist z.B. für statistische Auswertungen interessant oder kann beim Aussperren unerwünschter Zugriffe (Spam-Bots) helfen.

Allerdings zählt diese IP-Adresse ja nach Auffassung und Auslegung der Gesetze zu den personenbezogenen Daten und dürften dann eigentlich nicht gespeichert werden. Bei Strato werden die IP-Adressen in den den Kunden zur Verfügung gestellten Serverlogdateien in anonymisierter Form gespeichert. Auch die im Kundenmenü anzeigbare Webseiten-Statistik greift auf diese Daten zurück.
So können die Zugriffe zwar unterschieden aber nicht einem konkreten Anschluß zugeordnet werden

Mehr Geschwindigkeit mit SpeedPlus

Wenn ich die Grafik zu SpeedPlus bei Strato richtig deute, werden die Zugriffe nicht mehr direkt auf die Webserver geroutet, sondern von einem Loadbalancing-Cluster lastabhängig verteilt.
Diese Verteilung funktioniert vermutlich ähnlich wie bei einem nicht-transparenten Proxy, denn für den Webserver sieht es so aus, als würde der Strato-interne Server die Seite anfordern. Genau deshalb steht in der Remoteadresse nicht mehr die IP-Adresse des Aufrufers drin, sondern eine 81.169.145.xxx drin.

Komischerweise tritt der Effekt aber nicht bei allen Domains auf, nur die Hälfte meiner Domains (inkl. Subdomains) bei Strato ist davon betroffen.

Die richtige Remoteadresse ermitteln und setzen

Ich wäre ja nicht Schnurpsel, hätte ich nicht bereits eine Lösung für das Problem parat :-)
Die richtige IP-Adresse findet man im Request-Header-Feld X-Forwarded-For, daß heißt der Strato-Server trägt hier die Adresse ein, von der er die Anforderung erhalten hat.

In Skriptsprachen wie PHP oder Perl steht diese Variable als „HTTP_X_FORWARDED_FOR“ zur Verfügung. Hier könnte man sich die Remote-Adresse also einfach möglichst am Anfang (bei WP z.B. in der wp-config.php) der Abarbeitung in die REMOTE_ADDR eintragen, z.B. so:

if( isset( $_SERVER['HTTP_X_FORWARDED_FOR'] ) ) {
  $ip_addr = @trim( @end( @explode( ",", $_SERVER['HTTP_X_FORWARDED_FOR'] ) ) );
  if( '' != $ip_addr )
    $_SERVER['REMOTE_ADDR'] =  $ip_addr;
}

Hier kommen zwei wichtige Aspekte zum Tragen, denn in „X-Forwarded-For“ können mehrere durch Komma getrennte IP-Adressen stehen, sofern unterwegs mehrere Proxies durchlaufen wurden. Außerdem soll die Adresse nicht überschrieben werden, falls kein X-Forwarded-For-Feld existiert oder aus anderem Grund nicht ermittelt werden kann.

Für Perl könnte das etwa so aussehen:

if( $ENV{'HTTP_X_FORWARDED_FOR'} ne "" )
{
  my @ip_list = split(/,/, $ENV{'HTTP_X_FORWARDED_FOR'});
  $ENV{'REMOTE_ADDR'} = $ip_list[-1]; 
}

Nachteil ist hierbei natürlich, daß man alle Webapplikationen, die irgendwie die REMOTE_ADDR verwenden, entsprechend anpassen muß. Es geht aber auch noch einfacher und allgemeiner.

Umgebungsvariablen mit mod_setenvif setzen

Das Apache-Modul mod_rewrite kennen bestimmt viele WordPress-Nutzer, manch einer kennt vielleicht sogar mod_alias, aber vermutlich nur wenige haben schon mal etwas vom Modul mod_setenvif gehört. Es kommt auch ganz bescheiden und unspektakulär mit nur vier Anweiungen daher.

Mit dem Modul mod_setenvif hat man die Möglichkeit, Umgebungsvariablen abhängig von Request-Feldern zu setzen. Genau das brauchen wir hier. Wir haben das Request-Feld X-Forwarded-For und wollen abhängig davon die Umgebungsvariable REMOTE_ADDR setzen. Das Problem läßt sich mit ein bißchen Regular-Expression in einer Zeile in der .htacces erschlagen:

SetEnvIf X-Forwarded-For "(.+,)? *(.+)$" REMOTE_ADDR=$2

Optimalerweise steht diese Zeile ganz am Anfang einer .htaccess im Wurzelverzeichnis des Webpaketes. Dann wirkt sei auch auf alle Domains oder Subdomains, die ihr sichtbares Wurzelverzeichnis in einem Unterverzeichnis des Webspace haben.

Das schöne an diesem kleinen Eingriff ist, daß er auch auf das Serverlogfile und die Webstatistik wirkt. Im Logfile stehen nun wieder zwar anonymisierte, aber unterscheidbare Zugriffe und die Webstatistik zeigt nicht mehr 10000 Zugriffe von nur 5 Adressen an.

Ende gut, alles gut?

Mit ein bißchen Handarbeit kann man wieder mal einen Strato-Konfigurationsfehler ausbügeln. Andereseits ist die SpeedPlus-Plattform noch recht neu, da können solche Fehler schon mal auftreten. Ich habe das Problem auch bereits vor 10 Tagen an den Strato-Support gemeldet, warte aber immer noch auf die Antwort zu meinem Ticket. Scheint etwas komplizierter zu sein. Bis zur Strato-Problemlösung kann mein kleiner „Trick“ zumindest über die Zeit helfen.

7 Kommentare »

Spam-Kommentare, die beliebtesten Artikel

Viel Kommentarspam kommt hier ja nicht an. In den Monaten September, Oktober und November waren es insgesamt etwa 600 Versuche, automatisch einen spammigen Kommentar bei einem Artikel oder einer Seite zu hinterlassen. Diese Versuche werden allerdings gleich an der Türe abgebügelt, kommen gar nicht erst bis zur Datenbank und müssen deshalb auch nicht moderiert oder gelöscht werden.

Was mich schon immer interessiert, nach welchen Gesichtspunkten wählen die Spambots Ihre Zielseiten aus. Gibt es irgendein System oder wird einfach zufällig gestreut? Ich habe dashalb alle Spamversuche aus den drei oben genannten Monaten aufsummiert und eine kleine Tabelle erstellt:

Nr Artikel/Seite Spam PR Kom
1 123 Moderate Comment Notification 21,3% 3 3
2 Es geht doch, Kontaktformular mit POST und Permalinks 17,1% 1 3
3 WordPress und die suboptimale MySQL-Optimierung (5.0.51) 14,7% 2 42
4 Privat: 123 MetaBlog 11,9% 2 2
5 WordPress 2.3 – Anonym up-to-date bleiben 5,9% 2 14
6 WordPress 2.3 – Problem ohne www bei Strato 5,2% 2 82

Ich habe nur die Seiten und Artikel berücksichtigt, die 5% oder mehr am Spamaufkommen ausmachen. In der Spalte PR steht der aktuelle Google-Pagerank und in der Spalte Kom die Anzahl der abgegebenen und freigeschalteten Kommentare.

Alle Seiten oder Artikel sind schon mindestens ein Jahr alt. Der Artikel „WordPress 2.7 – Wartungsmodus ohne Plugin“ mit dem höchsten Pagerank (4) gehört mit 0,8% nicht zu den Favoriten der Spambots, allerdings immerhin zwei der Seiten mit den meisten Kommentaren.

Was kann man nun daraus schließen? Nichts, würde ich sagen :-)
Es gibt wohl kein offensichtliches Muster, nachdem sich die Spambots die Artikel aussuchen, zumindest kann ich keins erkennen.

Interessant fand ich allerdings die Tatsache, daß zwar selten, aber ab und zu doch Kommentarspam fast in Echtzeit auftauchte, nur wenige Stunden nach Veröffentlichung eines Artikels. Rekord war dabei mal eine knappe halbe Stunde. Schon erstaunlich.

Keine Kommentare »