Das Putzlowitsch Test- und SEO-Blog

Groß- und Kleinschreibung in der Google-Bildersuche

Google Bildersuche: Erdbeeren Groß- KleinschreibungBisher dachte ich immer, die Groß- und Kleinschreibung würde bei der Googlesuche keine Rolle spielen. Bei der Bildersuche hat sie zwar auch keinen Einfluß auf das eigentliche Suchergebnis, was die angezeigten Bilder anbelangt. Es wirkt sich aber möglicherweise auf die dem Bild zugeordnete Seite aus.

Mein Erdbeeren-Bild existiert noch als (mindestens) eine identische Kopie auf einer anderen Seite. Irgendwann war mir aufgefallen, das nicht mehr mein Erdbeeren-Bild, sondern die Seite mit der Kopie in der Bildersuche verlinkt wurde. Seit ein paar Wochen war dann wieder mein Bild in der Bildersuche aufgetaucht, seit ein paar Tagen wird nun wieder auf die Kopie verlinkt.

Heute nun ist mir zufällig aufgefallen, daß zwar bei der Suche nach erdbeere (Kleinschreibung) die Kopie angezeigt wird, bei Erdbeeren in richtiger Großschreibung (schließlich ist Erdbeeren ein Substantiv) jedoch mein Bild. Allerdings habe ich keine Ahnung, warum das so ist. Denn sowohl bei mir als auch auf der Kopieseite wird „Erdbeeren“ korrekt groß geschrieben.

Komische Sache, vielleicht ist aber alles nur Zufall, denn bei anderen Bildern konnte ich diesen Effekt noch nicht beobachten.

Nachtrag (12.01. 08:00 Uhr)
Es war wohl doch nur Zufall, gestern abend war bei beiden Schreibweisen mein Bilder gelistet, heute ist es wieder die Kopie. Schade. :-)
Nachtrag (12.01. 12:20 Uhr)
Verblüffend, im Monent ist es grad wieder so, wie oben beschrieben, also Kleinschreibung die Kopie, Großschreibung ich. Zudem wechselt beim Aktualisieren manchmal das Google-Logo zwischen „Google“ und „Google bilder“.

Keine Kommentare »

Die schnurpsel.de Vor- und Frühgeschichte

Spam?

Spam oder nicht, das ist hier die Frage, und wenn ja, wozu ist es gut:

Betreff: [сugе.org] Aufnahme-Benachrichtigung: schnurpsel.de

Sehr geehrte Damen und Herren,

aufgrund der neuen Rechtslage in Europa haben wir die Pflicht Sie darüber zu informieren, dass die o.g. Website im Bewertungs-Index von сugе.org gelistet ist. сugе [kjudsch] ist ein freier Service für die Bewertung der Service-Qualität und Zuverlässigkeit von Websites durch die Kunden der Site selbst.

Dann kommt mehr oder weniger uninteressanter Text gefolgt von diesem wichtigen Hinwies:

*** Wichtige Hinweise: ***

Insbesondere Deutsche Website-Betreiber möchten wir darauf hinweisen, dass es sich bei dieser Benachrichtigung nicht um sog. Spam handelt. Sie erhalten diese E-Mail als vermuteter Inhaber der o.g. Website, weil ein Website-Betreiber nach neuer Europäischer Rechtslage das Recht hat, von dem Listing in einem Bewertungsdienst zu erfahren und sich ggfs. gegen ungerechtfertigte Bewertungen zu wehren.

Ich empfinde den eindringlichen Hinweis, daß es sich nicht um Spam handelt, schon fast wieder als Indiz dafür, daß es doch Spam ist. Und was für eine neue europäische Rechtslage ist gemeint?

Na egal, ich war dann doch neugierig (das ist vermutlich der Zweck) und habe mir meine Bewertung dort angesehen. Es gibt tatsächlich eine Bewertung die, nun ja, eher mittelprächtig ausfällt. Obwohl ich eine durchschnittliche Lieferzeit von einem Tag und vier Stunden gar nicht mal schlecht finde.

Das Problem ist nur, ich liefere überhaupt nichts, schon gar keine Erze, Mineralien und Substitute. Die gemachten Angaben wie Firmenname, Kategorie „Internationales Business“ und Internationaler Handel Import Export stimmen ünerhaupt nicht mit meiner Schnurpsel-Seite überein. Die Firma Linox GmbH gibt es allerdings wirklich und auf die paßt auch die Beschreibung, nur die Webseite ist falsch. Man findet die Firma, oh großes Wunder, unter www.linox-gmbh.de.

Schnurpsel von früher?

Was wäre nun aber, wenn es schnurpsel.de vielleicht schon vor meiner Zeit mit ganz anderen Inhalten gegeben hat? Ausschließen kann man das nicht, denn ich habe die Domain erst im Juni 2007 registriert und mein erster Artikel erschien am 06.06.07. Also habe ich mal bei archive.org nachgesehen, dort kann man die Internetgeschichte bis 1996 zurückverfolgen.

Und siehe da, schnurpsel.de gab es bereits von März 2001 bis zum Februar 2005. Leider kann man keine Inhalte mehr sehen, da die Domain damals nur per Frameset auf eine private Homepage bei berlinweb.de weiterleitete. Diese gehörte wohl einem gewissen ComiXxx aka Thomas Antelmann. Es war aber bestimmt keine Handelsfirma für Erze und Metalle.

Fazit

So hat mich eine (vermutliche) Spam-E-Mail zumindest dazu gebracht, mal in die Vergangenheit meiner Domain abzutauchen, von der ich vorher nicht vermutet hätte, das es sie überhaupt gibt.

Keine Kommentare »

Studenten-Spam, eine neue Masche?

Beim ersten Kommentar hier war es mir gar nicht aufgefallen. Die Seite, die der Kommentator als Homepage angegeben hat, sieht erstmal unverfänglich aus. Zumal sie auf einen Uni-Account bei der TU-Dresden verweist. Stutzig wurde ich bei einem weiteren Kommantar auf Putzlowitsch, hier lag die Homepage bei der HTW-Berlin. Verblüffend ähnlich war aus meiner Sicht der Aufbau der beiden Seiten. Es gibt jeweils eine Homepage und dann eine weitere Seite „1. Story“ bzw. „Story Nr.1“. Zufall?

Bei beiden Seiten ist das „Design“ eher etwas altbacken, technisch mit Tabellen realisiert. Das wundert mich besonders bei Christoph, der ja vorgibt, im vierten Studienjahr Informatik zu studieren. Abderrahim hingegen studiert schon im fünften Studienjahr im Fach „Techik“, richtig, nur Technik. Komisch auch, daß Christoph als E-Mail-Adresse Christian@ verwendet. Aber egal, das ist alles vielleicht nur Zufall.

Wenn man sich nun die Seiten von Christoph und Abderrahim ansieht, fallen weitere Gemeinsamkeiten auf. Beide berichten über Stromanbieter und verlinken auf Stromsuche. Beide schreiben über Gutscheine und Coupons und verlinken auf Gutscheindorado. Und jetzt kommts, beide Kommentare wurden von derselben IP-Adresse abgesetzt, Anbieter ist Kabel-Deutschland (dynip.superkabel.de). Aber auch das ist möglicherweise alles nur Zufall :-)

Was mich eher interessieren würde, wie die Seiten bei den Unis dort hinkommen. Werden für ein paar Euro Studenten gekauft, die dann Ihren Uni-Zugang dafür hergeben. Oder wurden die Accounts geknackt oder gibt es sonst eine Lücke, die es ermöglicht, auf Uni-Servern Seiten abzulegen?

Na mal sehen, ob und wie das weitergeht…

6 Kommentare »

Mehr Bilderdiebe

Bilderdieb am PrangerEigentlich sind es nicht wirklich mehr Bilderdiebe geworden, der bekannte Bilderdieb taucht nur mit einem anderen Gesicht, sprich weiteren Subdomains auf. Nach meinem Äpfelbild ist nun auch mein Fenchel dort zu finden, der Fenchel von einem gewissen Kochbuch (Stichwort: Brötchen) übrigens auch. Die haben mittlerweile auch ein Ersatzbild eingebaut.

So muß ich nun nicht nur freeimages-de aussperren, sondern auch noch images-de. Oder doch gleich bloggum insgesamt? Ich weiß nicht…

Mit Dieben ist man früher nicht zimperlich gewesen. Die wurden kurzerhand an den Pranger gestellt und hatten da nichts zu lachen. Gut, die moderne Form des digitalen Prangers gibt es ja auch und das kann manchmal noch schlimmere Folgen haben.

Weitere Artikel mit Bezug zu diesem:
2 Kommentare »

Strato PowerPlus mit SpeedPlus – Fehler bei der Remote-Adresse (REMOTE_ADDR)

Nachtrag am 22.01.2010:

Seit heute scheint das weiter unten geschilderte Problem mit der Remote-Adresse nicht mehr zu bestehen. Die Einträge in der .htaccess-Datei oder sonstige Eingriffe sind daher möglicherweise nicht mehr erforderlich.
Bei mir ist das Problem verschwunden, aber offensichtlich noch nicht generell.

Nachtrag am 01.03.2011:

Nach aktuellen Informationen ist das Problem wohl nun doch endgültig behoben worden. Die Einträge in der .htaccess-Datei oder sonstige Eingriffe sind daher nicht mehr erforderlich.

Seit Anfang Dezember 2009 bin ich mit meiner Schnurpsel-Seite wieder zurück zu Strato umgezogen. Ganz weg war ich ja nicht, ich hatte nur den Hostnamen bei einem anderen Anbieter aufgeschaltet. Aber seit es nun SpeedPlus bei Strato gibt, bin ich nun doch wieder zurückgekehrt.

Die Geschwindigkeit ist wirklich gut. Antwortzeiten von ungefähr 0,5 Sekunden gegenüber 3 bis 4 Sekunden vorher sind für ein PHP-Schwergewicht wie WordPress eine merkliche Verbesserung. Zudem wurde auch gleich das ohne-www-Problem beseitigt, in der Umgebungsvariable HTTP_HOST steht nun der tatsächlich im HTTP-Request angegebene host drin.

Die Remote-IP-Adresse (REMOTE_ADDR)

Neben allerlei anderen interessanten Informationen wird bei jedem Webseitenaufruf auch die IP-Adresse des Aufrufers in einer Umgebungsvariablen vermerkt. Auf diese kann z.B. mit Skriptsprachen wie PHP oder Perl als Variable „REMOTE_ADDR“ zugegriffen werden. Diese Remote-Adresse ist z.B. für statistische Auswertungen interessant oder kann beim Aussperren unerwünschter Zugriffe (Spam-Bots) helfen.

Allerdings zählt diese IP-Adresse ja nach Auffassung und Auslegung der Gesetze zu den personenbezogenen Daten und dürften dann eigentlich nicht gespeichert werden. Bei Strato werden die IP-Adressen in den den Kunden zur Verfügung gestellten Serverlogdateien in anonymisierter Form gespeichert. Auch die im Kundenmenü anzeigbare Webseiten-Statistik greift auf diese Daten zurück.
So können die Zugriffe zwar unterschieden aber nicht einem konkreten Anschluß zugeordnet werden

Mehr Geschwindigkeit mit SpeedPlus

Wenn ich die Grafik zu SpeedPlus bei Strato richtig deute, werden die Zugriffe nicht mehr direkt auf die Webserver geroutet, sondern von einem Loadbalancing-Cluster lastabhängig verteilt.
Diese Verteilung funktioniert vermutlich ähnlich wie bei einem nicht-transparenten Proxy, denn für den Webserver sieht es so aus, als würde der Strato-interne Server die Seite anfordern. Genau deshalb steht in der Remoteadresse nicht mehr die IP-Adresse des Aufrufers drin, sondern eine 81.169.145.xxx drin.

Komischerweise tritt der Effekt aber nicht bei allen Domains auf, nur die Hälfte meiner Domains (inkl. Subdomains) bei Strato ist davon betroffen.

Die richtige Remoteadresse ermitteln und setzen

Ich wäre ja nicht Schnurpsel, hätte ich nicht bereits eine Lösung für das Problem parat :-)
Die richtige IP-Adresse findet man im Request-Header-Feld X-Forwarded-For, daß heißt der Strato-Server trägt hier die Adresse ein, von der er die Anforderung erhalten hat.

In Skriptsprachen wie PHP oder Perl steht diese Variable als „HTTP_X_FORWARDED_FOR“ zur Verfügung. Hier könnte man sich die Remote-Adresse also einfach möglichst am Anfang (bei WP z.B. in der wp-config.php) der Abarbeitung in die REMOTE_ADDR eintragen, z.B. so:

if( isset( $_SERVER['HTTP_X_FORWARDED_FOR'] ) ) {
  $ip_addr = @trim( @end( @explode( ",", $_SERVER['HTTP_X_FORWARDED_FOR'] ) ) );
  if( '' != $ip_addr )
    $_SERVER['REMOTE_ADDR'] =  $ip_addr;
}

Hier kommen zwei wichtige Aspekte zum Tragen, denn in „X-Forwarded-For“ können mehrere durch Komma getrennte IP-Adressen stehen, sofern unterwegs mehrere Proxies durchlaufen wurden. Außerdem soll die Adresse nicht überschrieben werden, falls kein X-Forwarded-For-Feld existiert oder aus anderem Grund nicht ermittelt werden kann.

Für Perl könnte das etwa so aussehen:

if( $ENV{'HTTP_X_FORWARDED_FOR'} ne "" )
{
  my @ip_list = split(/,/, $ENV{'HTTP_X_FORWARDED_FOR'});
  $ENV{'REMOTE_ADDR'} = $ip_list[-1]; 
}

Nachteil ist hierbei natürlich, daß man alle Webapplikationen, die irgendwie die REMOTE_ADDR verwenden, entsprechend anpassen muß. Es geht aber auch noch einfacher und allgemeiner.

Umgebungsvariablen mit mod_setenvif setzen

Das Apache-Modul mod_rewrite kennen bestimmt viele WordPress-Nutzer, manch einer kennt vielleicht sogar mod_alias, aber vermutlich nur wenige haben schon mal etwas vom Modul mod_setenvif gehört. Es kommt auch ganz bescheiden und unspektakulär mit nur vier Anweiungen daher.

Mit dem Modul mod_setenvif hat man die Möglichkeit, Umgebungsvariablen abhängig von Request-Feldern zu setzen. Genau das brauchen wir hier. Wir haben das Request-Feld X-Forwarded-For und wollen abhängig davon die Umgebungsvariable REMOTE_ADDR setzen. Das Problem läßt sich mit ein bißchen Regular-Expression in einer Zeile in der .htacces erschlagen:

SetEnvIf X-Forwarded-For "(.+,)? *(.+)$" REMOTE_ADDR=$2

Optimalerweise steht diese Zeile ganz am Anfang einer .htaccess im Wurzelverzeichnis des Webpaketes. Dann wirkt sei auch auf alle Domains oder Subdomains, die ihr sichtbares Wurzelverzeichnis in einem Unterverzeichnis des Webspace haben.

Das schöne an diesem kleinen Eingriff ist, daß er auch auf das Serverlogfile und die Webstatistik wirkt. Im Logfile stehen nun wieder zwar anonymisierte, aber unterscheidbare Zugriffe und die Webstatistik zeigt nicht mehr 10000 Zugriffe von nur 5 Adressen an.

Ende gut, alles gut?

Mit ein bißchen Handarbeit kann man wieder mal einen Strato-Konfigurationsfehler ausbügeln. Andereseits ist die SpeedPlus-Plattform noch recht neu, da können solche Fehler schon mal auftreten. Ich habe das Problem auch bereits vor 10 Tagen an den Strato-Support gemeldet, warte aber immer noch auf die Antwort zu meinem Ticket. Scheint etwas komplizierter zu sein. Bis zur Strato-Problemlösung kann mein kleiner „Trick“ zumindest über die Zeit helfen.

7 Kommentare »