Das Putzlowitsch Test- und SEO-Blog

Ausfall der KubaSeoTräume-Statistik und Top-100

Kubaseoträume-Statistik Fehler

So ähnlich sah heute für ca. 1½ Stunden die Kubaseoträume-Top-10 aus und auch die Top 100 zeigte keine Daten an. Was war passiert?

Ich hatte nach einem kurzen E-Mail-Wechsel mit dem Veranstalter des SEO-Wettbewerbs das Keyword für die Abfragen der offiziellen Schreibweise KubaSeoTräume angepaßt. Ich hatte bis dahin das Suchwort in Kleinschreibung verwendet. Es hatte sich aber gezeigt, daß Google abweichende Ergebnisse je nach Schreibweise ausgibt.

Die Erstellung der Statistik und Top-Liste erfolgt in drei Schritten. Im Schritt Eins werden die Google-Ergebnisse abgefragt und im originalen HTML-Seitenformat als Rohdaten abgespeichert. Im zweiten Schritt werden die Ergebnisseiten eingelesen, ausgewertet (Parsing) und die Daten in einer Datenbank abgelegt. Der letzte Schritt ist dann das Generieren der Ausgabedaten, also der Diagramme (mit Image-Map) und der Top-Listen.

Nun hatte ich zwar die Schreibweise für KubaSeoTräume in der Konfiguration für Phase 1 (Google-Abfrage) und Phase 2 (Datenbank) angepaßt, nicht aber für Phase 3 (Ausgabe). So waren zwar alle Daten korrekt erfaßt, ausgewertet und gespeichert worden, konnten aber nicht ausgegeben werden.

Ich mußte einfach die Ausgabe der Daten mit der richtigen Konfiguration für KubaSeoTräume erneut anstoßen und alles war wieder im Lot. Kleine Änderungen mit großen Auswirkungen, nun ja. :-)

3 Kommentare »

Werbung im STRATO-Kundenmenü, (k)ein Sicherheitsrisiko

Strato-Kundenmenü mit WerbungAn Werbung auf Internetseiten habe ich mich nun schon langsam gewöhnt. Einen großen Teil davon sehe ich allerdings gar nicht, denn dieser wird bereits beim meinem Router ausgesperrt.

Als Belästigung und Sicherheitsrisiko sehe ich allerdings die Werbung an, welche Strato im Kundenservice-Bereich einblendet. Im Kundenservicebereich melde ich mich mit Kundennummer und Passwort an und kann dort meine Pakete verwalten und konfigurieren. Wenn jetzt hier Strato-interne Werbung z.B. für das HiDrive eingeblendet wird, ist das noch akzeptabel. Die angezeigte Werbung (auf dem Bild die Telekom-Werbung) kommt allerdings von einem externen Anbieter, in diesem Fall von tradedoubler.com.

Das fatale daran ist, daß bei Strato die Session-Id, welche mich als angemeldeten Kunden identifiziert, per URL-Parameter mitgeführt wird. Das sieht dann etwa so aus:

/apps/CustomerService?sessionID=23b67fd695a89dfd013adc295679863e

Beim Anzeigen der Werbung landet dann diese Session-ID als Referer beim externen Werbeanbieter. Ich will nun nicht unterstellen, das dort jemand diese Informationen mißbraucht, aber es wäre technisch kein Problem, sich mit dem Referer und damit meiner Kunden-Identität an meinen Daten und Einstellungen zu schaffen zu machen.

Ich für meinen Teil habe nun zwar tradedoubler.com ausgesperrt, aber es ist schon ein Unding, wie hier Strato mit sensiblen Kundendaten umgeht und diese einfach an externe Anbieter überträgt.

Die einfache Lösung für das Problem wäre es, auf externe Werbeeinblendungen zu verzichten oder zumindest die SessionId nicht als URL-Parameter mitzuführen. Das ist um so unverständlicher, da die Id sowieso in einem Cookie gespeichert wird. Wozu dann noch als URL-Parameter?

Ich kann nur hoffen, daß sich mit der groß angekündigten neue Optik und neue Menüführung ab 1. März bei Strato auch im Bereich Werbung bzw. Session-ID etwas tut.

Nachtrag 21. Februar 2011:
Habe mal noch etwas weiter geforscht und festgestellt, daß die Werbung nicht direkt, sondern über ein IFRAME mit einer Adresse des Strato-Servers eingeblendet wird:

/assets/ksb/strato/shared/t1.html

Dadurch wird dann als Referer eben nicht die URL mit der Session-ID, sondern diese an den externen Werbeanbieter übertragen.
Insofern muß ich den Vorwurf an Strato zurücknehmen, mit den sensiblen Kundendaten wurden also nicht leichtfertig umgegangen.

Keine Kommentare »

Forex trading, web promotion tips, seo basics, internet tv

forex trading

Es fing am 10. Dezember mit dem Kommentar von „great Forex Trading Education FREE“ an:

Vielen Dank, gute Arbeit! Dies war das Zeug, das ich hatte zu haben.

Drei Tage später meldet sich „forex currency trading“ nochmal:

Als Newbie bin ich immer auf der Suche online nach Artikeln, die mir helfen kann. Danke Wow! Vielen Dank! Ich wollte immer in meiner Website so etwas zu schreiben. Kann ich an Ihrer Post in meinem Blog?

Das ist doch mal nett, nicht immer nur so unverständliches Wirrwarr aus Buchstaben und Zahlen und auch keine russischen Texte, die ich eh nicht verstehe. Ja, Sie können an meine Post in Ihrem Blog, nunja, was auch immer.

web design and promotion tips

Am 17. Dezember schrieb dann „web design and promotion„:

Awesome Informationen, vielen Dank an den Beitrag Schriftsteller. Es ist verständlich, mir jetzt, wird die Wirksamkeit und Bedeutung überwältigend. Nochmals vielen Dank und viel Glück!

Also Schriftsteller ist vielleicht etwas übertrieben formuliert, aber danke für die Blumen. Scheinbar war doch nicht alles so verständlich und überwältigend, ein paar Minuten später fragt „web promotion tips“ noch mal nach:

Wie kann ich Sie bitten um weitere Informationen? Great post müssen mehr wissen …

Was soll ich sagen, einfach noch mal den Artikel in Ruhe lesen, da steht eigentlich alles drin.

live streaming tv – watch shows online – internet television

Die nächsten Kommentare vom 19. Dezember fasse ich mal zusammen, sie kamen von „live streaming tv„, „watch shows online“ und „internet television„:

Was für ein schöner Beitrag. Ich liebe das Lesen dieser Arten oder Gegenstände. Ich kann t abwarten, was andere zu sagen haben. Ich habe einige wunderbare Weisheit.
Ich normalerweise nicht in Blogs posten, aber Ihr Blog zwingt mich dazu, erstaunliche Arbeit .. schön …

Also bitte, ich zwinge doch niemanden zu etwas. Was andere zu sagen haben (vermutlich unter Zwang), ließ nicht lange auf sich warten.

seo basics – seo articles

Bereits am nächsten Tag meldete sich schließlich der SEO-Experte „seo basics“ zu Wort:

Es gibt offensichtlich eine Menge zu wissen. Ich glaube, Sie haben einige gute Punkte in Funktionen auch. Halten Sie Ihren Arbeitsbereich, great job!

Ja, ich bemühe mich meinen Arbeitsbereich zu halten und ebenso die Punkte in Funktion. Aber auch für den SEO-Profi „seo articles“ scheinen die Informationen nicht auszureichen:

Wie kann ich Sie bitten um weitere Informationen? Great post müssen mehr wissen …

Also Leute, lest Euch doch den Artikel einfach nochmal genau durch. So schwer kann das doch nicht doch nicht sein, es ist doch nur ein WordPress-Plugin. Oder liegt es an den schlechten Sprachkenntnissen?

{url}{keyword}

Noch einen drauf setzt Kayleigh Williams mit diesem Kommentar:

<a href={url}>{keyword}</a>
<a href={url}>{keyword}</a>
<a href={url}>{keyword}</a>
<a href={url}>{keyword}</a>
<a href={url}>{keyword}</a> <a href={url}>{keyword}</a>

Liebe Spammer, bitte werft doch vor der Benutzung Eurer Spam-Software oder Spam-Bots einen Blick in die Bedienungsanleitung, dann klappt es auch mit brauchbaren URLs und Keywords.

Nun ja, Spammer sind halt auch nur Menschen :-)

3 Kommentare »

Auch Spam-Bots sind nur Menschen

Ich war es nicht

Menschen machen Fehler. Aber nicht nur Menschen, oft sind auch Technik und Programme nicht fehlerfrei. Was aber nicht verwundert, denn die sind in aller Regel von Menschen gemacht.

Ich kann mich ja immer wieder über den Spammer-Dialog auf dem TagSEOBlog köstlich amüsieren. Ich denke mal, Martin hat das gleich passend für den letzten und den aktuellen Webmaster-Friday konzipiert und so gewissermaßen zwei Fliegen mit einer Klappe geschlagen. :-)

Viele der Spamtexte kannte ich auch schon, aber in der Dialog-Bearbeitung erreichen sie eine ganz neue Qualität. Heute nun hat es aber jemand übertrieben und mir gleich eine Liste mit 64 dieser Spam-Texte als „Kommentar“ zukommen lassen.

Ich denke mal, daß das keine Absicht war, denn irgendwie ist das schon ein bißchen unglaubwürdig, so ein Kommentar mit 64 praktisch nichtssagenden Sätzen. Außerdem sind die Paragraph-Zeichen am Anfang jeder Zeile für einen richtigen Kommentar doch eher ungewöhnlich.

Hier hat entweder der Spambot versagt, der vermutlich nur immer jeweils einen Satz zufällig pro Kommentar auswählen soll, oder der Nutzer hat keine Ahnung, wie das funktioniert und irgendwas falsch eingestellt. Oder aber das ist ein Scherz und jemand hat mir seine gesammelten Spam-Texte zukommen lassen, warum auch immer.

Ich denke aber, es war ein Fehler. Menschen machen nun mal Fehler.

Das ist kein Beitrag zum Webmasterfreitag, auch wenn ich dorthin verlinke.

Weitere Artikel mit Bezug zu diesem:
Ein Kommentar »

Permalinks – Was verwenden die 33 deutschen Top-Blogs

Welcher Permalink ist das beste Ding?

Die Diskussion taucht immer wieder mal auf, wie sieht optimalerweise ein Permalink, also die Struktur der URL aus. Sollten das Datum oder die Artikel-ID enthalten sein, ist es sinnvoll Kategorien oder Tags mit aufzunehmen?

Eine allgemeingültige und endgültige Empfehlung kann es nicht geben, wenn man die unterschiedlichen Sichtweisen dazu berücksichtigt, die dann zu eher widersprüchliche Aussagen führen.

Betreibt man ein Blog im Sinne eines Tagebuches, ist sicher das Datum oder Bestandteile davon eine gute Wahl. Aus SEO-Gesichtspunkten bzw. für eine eher thematische Ausrichtung wird oft die Kategorie mit in die Permalinkstruktur aufgenommen. Für eine Webseite mit vielen Schreibern könnte auch der Autorenname eine geeignete Option sein.

Ich habe mir einfach mal die Permalink-Struktur der 33 deutschen Top-Blogs angesehen. Vielleicht läßt sich ja daraus eine Empfehlung ableiten.

Die Permalink-Struktur der 33 deutschen Top-Blogs

Zunächst stellt sich natürlich die Frage, welche sind denn die Top-Blogs in Deutschland? Auch hier kann man sich endlos streiten, wenn man will. Ich habe als erste Näherung einfach die aktuell zusammengerechnete Liste von heute, dem 24.02.2010, genommen. Die Permalinkstruktur habe ich in Gruppen zusammengefaßt, vor dem jeweiligen Blog steht der aktuelle Platz in der Top-33-Liste :

Mehr als die Hälfte (57,6%) der Top-33-Blogs verwendet neben dem Artikelnamen das Datum oder einen Bestandteil davon in der URL. Bei allein fast 40% findet man das komplette Datum mit Jahr, Monat und Tag im Permalink. Gut 18% benutzen nur den Namen des Artikels als Permalink und weitere etwa 12% kombinieren dazu noch eine Nummer (Artikel-ID). Immerhin knapp 10% der Top-Blogs verwenden keine Permalinks, sondern setzen auf die Artikelnummer als URL-Parameter (?id=1234).

Erste Ableitung des Permalink-Aufbaus

Wenn man Permalinks verwendet, ist der Artikelname (in seiner Umwandlung zu einem URL-Pfad) gewissermaßen eine feste Größe. Die Einbeziehung des Datums oder von Teilen kann so schlecht nicht sein, diese Verwendet ein Großteil der Top-Blogs. Auch ganz auf Permalinks zu verzichten, hat gewisse Vorteile. Die URLs sind kurz und bleiben immer gültig, auch wenn man mal was am Artikel-Titel, dem Datum oder sonstigen Einflußfaktoren ändert.

Ich habe mir stichprobenartig noch weitere Blogs der Top-100 angesehen und zumindest keine Seite entdeckt, die etwa die Kategorie oder gar Tags in der URL verwendet. Mal davon abgesehen, daß Tags bei WordPress bis zur Version 2.9.x nicht als Bestandteil der Permalinks funktionieren (obwohl in der Dokumentation genannt), gibt es auch noch andere Probleme.

Kategorie oder Tag im Permalink

In WordPress kann man Artikel in mehreren Kategorien ablegen. Einem Artikel können zudem auch mehrere Tags zugeordnet werden. Verwendet man Kategorien oder Tags in Permalinks, erstellt WordPress die die URL aus der Kategorie oder dem Tag mit der kleinsten ID. Ändert man nun die Kategoriezuordnung oder die Tags, kann sich möglicherweise auch die URL ändern.

Das ist aber erstmal nicht weiter schlimm, denn der Artikel wird auch weiterhin mit der alten Kategorie gefunden und angezeigt. WordPress geht sogar soweit, einfach die Kategorie beim Auflösen der Permalinks zu ignorieren. Damit ergeben sich dann theoretisch beliebig viele URLs für einen Artikel.

Als Beispiel ist das auf meinem Testblog zu sehen. Die Permalink-Struktur sieht so aus:

/%category%/%postname%/

Der Artikel ist in der Kategorie „Allgemein“ einsortiert, die URL sieht so aus:
http://testblog.schnurpsel.de/allgemein/hallo-welt/

Er ist aber auch mit der Kategorie „Blafasel“, „Hundekuchen“ oder „Gibtesnicht“ aufrufbar:
http://testblog.schnurpsel.de/blafasel/hallo-welt/
http://testblog.schnurpsel.de/hundekuchen/hallo-welt/
http://testblog.schnurpsel.de/gibtesnicht/hallo-welt/
Genau, diese Kategorien gibt es gar nicht.

Man hat damit potentiell also ganz viel bösen „Duplicate content“ (DC). Da sage noch einer, die Kategorie im Permalink sei unter SEO-Gesichtspunkten empfehlenswert. ;-)

Permalink, so oder so

Letztendlich muß jeder selbst entscheiden, ob und wie er seine Permalinks gestaltet. Bei Putzlowitsch habe ich mich für das Datum entschieden, da ich dort eher im Sinne eines Tagebuchs schreibe. Hier verwende ich eine Kombination aus Artikelname und Artikel-ID, weil die sichtbare ID schnelle interne Links mit dem 123 IntLink-Plugin ermöglicht. Bei Twitter verwende ich übrigens gerne die WP-Shortlinks mit der ID als URL-Parameter, die sind schön kurz und funktionieren auch ohne Shortlink-Dienst.

Ein Kommentar »