Das Putzlowitsch Test- und SEO-Blog

XoviLichter-Rankings scrapen? Nicht bei aus.gerech.net!

Xovilichter

Zufällig habe ich auf GitHub ein Projekt entdeckt, welches PHP-Skripte zum scrapen der Ranking-Seiten von Dynapso und Xovi bereitstellt.

Für den Ranking-Monitor von aus.gerech.net ist soetwas nicht erforderlich. Dort werden die Daten maschinenlesbar im JSON und XML-Format zur Verfügung gestellt. Nur ist das bisher nicht dokumentiert und so weiß niemand was davon. :-)

Die URLs lauten:

  • JSON: http://aus.gerech.net/data/xovilichter/top123.json
  • XML: http://aus.gerech.net/data/xovilichter/top123.xml

Der Aufbau ist recht einfach und weitestgehend selbsterklärend. Im Kopf gibt es drei Datenfelder:

  • nam – Name bzw. Suchbegriff
  • upd – Datum und Zeit des letzten Updates der Liste
  • cnt – Anzahl der Google-Suchergebnistreffer (nicht Listeneinträge!)

Es folgt in rnk eine Liste der Suchergebnisse mit folgenden Datenfeldern:

  • pos – Position in den Suchergebnissen
  • url – URL der Seite
  • typ – Typ des Suchergebnisses, mögliche Werte
    • txt – normales Suchergebnis
    • new – Google-News
    • img – Universal Search Bilder
    • vid – Video
  • img – URL des Bildes, wenn Typ img ist (optional)
  • aut – Name des Autors, falls verfügbar (optional)
  • lpo – letzte Position, 1000 falls neu in der Liste

Bei der Position für Universal-Search Ergebnisse wird eine Unternummerierung vorgenommen. Das erste Ergebnis bekommt .1, das zweite .2, das dritte .3 usw. an die eigentliche Position angehängt. Befinden sich zum Beispiel vier Bilder an der Position 13, so erhalten sie die Positionen 13.1, 13.2, 13.3 und 13.4 in pos zugeordnet.

Die Daten werden stündlich zu vollen Stunde erhoben. Es dauert aber ein paar Minuten, bis sie dann tatsächlich vorliegen. Also sollten die Daten ein paar Minuten nach der vollen Stunde abgefragt werden. Den aktuellen Zeitpunkt der Daten sieht man ja in den Kopfdaten.

Das Top-10 Diagramm im PNG-Format liegt auch zu diesem Zeitpunkt vor. Es gibt ein 24-Stunden-Diagramm und ein 3-Wochen-Diagramm:

  • 24 Stunden: http://aus.gerech.net/charts/xovilichter/ctop10.png
  • 3 Wochen: http://aus.gerech.net/charts/xovilichter/wtop10.png

Und morgen zeige ich dann, wie ich mit ein paar Zeilen PHP-Code das Ranking von aus.gerech.net hier bei Schnurpsel einbinde. :-)

6 Kommentare »

Plug and Play die Zweite

Webmasterfriday - WMF

Das mit den Plugins für WordPress ist ja wirklich eine feine Sache. Es gibt deren viele und sie leisten teilweise Dinge, von denen man gar nicht wußte, das man sie jemals gebrauchen könnte.

Ja, auch ich verwende Plugins. :-)

Das aktuelle Thema des Wabmasterfridays lautet „Die hilfreichsten WordPress Plugins“ und so habe ich hier im Blog-Adminbereich einfach mal nachgeschaut. Es sind derzeit ganze 24 aktive Plugins, die ich jetzt aber nicht alle ausführlich vorstellen werde.

Der Grund ist einfach. Das hier ist mein Test- und Entwicklungsblog und so laufen da viele Sachen zu Testzwecken. Von den 24 Plúgins sind bis auf eines alles Eigenentwicklungen. Man erkennt sie an dem „123 Irgendwas“-Namen.

Fremde Plugins

Das einzige fremde Plugin ist DoFollow. Damit wird des nofollow-Attribut bei Links in Kommentaren entfernt. Das stellt aber keinen Freifahrtschein für jeden Mist dar. Erstkommentare werden moderiert und gegebenfalls Entlinkt oder Entfollowt.

Eigene Plugins

Viele Plugins sind nur kleine Helferlein, teilweise sogar ohne Optionenseite, manche bügeln nur Fehlkonfigurationen der Webhoster aus.

Ein paar haben aber schon einen etwas größeren Umfang und Nutzwert.

  • 123 IntLink
    IntLink zählt zu meinen ältesten Plugins und hat sogar Editor-Buttons. Mit dem Plugin kann man mit der Artikel-ID (bzw. Kommentar-ID) einfach auf bloginterne Artikel, Seiten oder auch Kommentar verlinken. Die Links werden erst zur Laufzeit generiert. Damit passen sie immer, egal ob man mal die Permalinks ändert oder mit dem ganzen Blog umzieht.
  • 123 Shrink Link
    Wer kennt das nicht, im Kommentar hinterläßt jemand einen monstermäßig langen Link, der dann weit nach rechts über den Rand hinausragt und das in mühsamer Arbeit erstellte Design zerstört. Mit Shrink-Link werden solche Links für die Anzeige gekürzt. Mit ein paar Optionen kann man das Kürzungsverhalten steuern.
  • 123 Homelink
    Lange Zeit war es in WordPress nur möglich einen Menüeintrag mit einem Link zur Startseite im Theme zu programmieren. Das Plugin ermöglicht das Hinzufügen des Startseiten Links im Backend, außerdem das Ein- und Ausblenden von Seiten aus dem Menü un das ändern der Menütexte.
    Seit WP 3.0 ist das alles mit den Benutzermenüs ja bereits fest eingebaut.
  • 123 Tools
    Das Plugin ist eine Art Sammelplugin für kleinere Funktionen, für die sich kein eigenes Plugin lohnen würde. Ein Werkzeugkasten halt. :-)

Dann gibt es noch mehrere nicht öffentliche Plugins, die ganz unterschiedliche Funktionen haben. Mit dem „123 Character Mixer“ kann man Buchstaben vertauschen, so daß eigenartig fremdsprachig anmutende Texte entstehen.

Ein brandneues Plugin ist „123 Inline Image“, mit dem die Thumbnails der WordPress-Gallery als sogenannte Inline-Images auf der Seite integriert werde. Das soll dann auch noch für die Thumbnails von Einzelbildern funktionieren.

Auch noch relativ neu ist „123 Author Info“, welches die Autoreninfos und Profil-Links bei Artikeln bzw. im Impressum integriert.

Zu guter Letzt verwende ich für die Spam-Abwehr schon seit Jahren meine eigenes „123 AntiSpam“-Plugin, welches recht ordentlich seinen Dienst im Hintergrund verrichtet.

Feine Plugins

Die WordPress-Plugins sind schon eine feine Sache, wenn man weiß, was man tut und es nicht übertreibt. :-)

8 Kommentare »

Ich will den alten Datei-Hochlader in WordPress zurück haben!

Bis zur Version 3.4 war die WordPress-Welt für mich noch in Ordnung.

Doch mit Version 3.5 wurde ein neuer Dialog zum Hochladen von Dateien installiert, der mir überhaupt nicht zusagt.

Das linke Bild zeigt den alten Dialog, das rechte den neuen.

Gut, es gibt nun eine hübsche Thumbnail-Übersicht, aber darunter leiden die Beschreibungs- und Beschriftungsfelder zum Bild. Sie sind einfach zu schmal.

Außerdem ist mir die Handhabung der neuen Galerie-Funktion zu umständlich. In der alten Version konnte ich einfach alle zum Artikel hochgeladenen Bilder als Galerie einfügen. Jetzt muß ich erst eine Galerie erstellen.

Ich weiß nicht, wie es Euch geht, mir zumindest hat der alte Medien-Dialog besser gefallen.

Kurz und gut, ich habe mich durch die WordPress-Dateien gewühlt und den alten Upload-Dialog wieder hervor geholt. Es war letztendlich einfacher, als ich dachte. Mit ein paar Zeilen PHP-Code kann man den guten alten Datei-Hochlader wieder ans Licht holen.

Diese paar Zeilen PHP habe ich in ein kleines Plugin verpackt, welches Ihr hier findet:
123 Old Uploader

Nun will ich mal hoffen, daß der Code für den alten Uploader von WordPress nicht entfernt wird, dann sähe es nämlich schlecht aus. Aber solange die Möglichkeit besteht, werde ich den alten Uploader nutzen.

Ein Kommentar »

Strato aktualisiert endlich den WebDatabaseManager

Vor etwa 4½ Jahren hatte ich mal ein größeres Problem mit einer Datenbank bei Strato. Die technische Ursache war eine damals schon drei Jahre alte Version (2.6.4-pl3) der MySQL-Verwaltungssoftware phpMyAdmin.

Als ich nun heute mal wieder den WebDatabaseManager, der übrigens auch unter „Profi-Features“ in der Beschreibung der Webhostingpakete aufgeführt ist, für eine meiner Datenbanken startete, war ich doch positiv überrascht.

Strato WebDatabaseManager (phpMyAdmin 3.5.3)

Strato hat es nach nunmehr fast 7 Jahren geschafft, den Hosting-Kunden eine halbwegs aktuelle Version (3.5.3 vom Oktober 2012) von phpMyAdmin als WebDatabaseManager bereitzustellen.

Nun hängt nur noch 1&1 hinterher, da läuft immer noch das uralte phpMyAdmin 2.6.4-pl3.

Keine Kommentare »

Stümperhaft programmiert – wie falsche Links entstehen

Fehler über Fehler

WMT Fehler 404  https-Links

Ich habe zur Zeit nicht wirklich viele Fehler in den Google-Webmastertools für meine Domain schnurpsel.de zu stehen, aber die oben gezeigte Liste hat mich erstmal stutzig werden lassen.

Was habe ich mit Google-Plus-Profilen zu schaffen und wieso sind die alle falsch? Zunächst dachte ich an meinen Autoren-Link aus der Info-Seite, aber da ist alles in Ordnung. Das wäre auch schon eher mal aufgefallen, denn die Links zu meinen Profilen stehen da schon seit mehreren Monaten drin und ich habe daran in letzter Zeit nichts geändert.

Fehlersuche

In den Webmastertools erhält man meistens auch eine Information zur Linkquelle des fehlerhaften Links. Bei allen diesen Google+-Profillinks wird eine Seite als Linkgeber genannt: www.myip.net, eine dieser vielen Website-Bewertungsseiten. Dort gibt es auch eine Seite mit Informationen zu den internen Links und da finde ich dann das:

Interne Links bei myip.net

Beim Anblick der Namen war mir sofort klar, das diese Links aus meinem Rückblick zur SEO-Campixx 2013 stammen. Dort habe ich die genannten Personen mit ihrem jeweilgen Google+-Profil verlinkt. Allerdings sind die Links korrekt als externe Links eingetragen:

<a href='https://plus.google.com/1...8/about'>Name</a>

Stümperhaft programmiert

Ich kann mir allerdings denken, was dort bei MyIP.net passiert ist.
Die Seite wird eingelesen und dann werden die Links nebst Ankertext extrahiert. Keine große Sache, das bekommt man sogar noch recht überschaubar mit regulären Ausdrücken hin. Man kann natürlich auch einen DOM-Parser verwenden, aber eigentlich ist das egal, Hauptsache man erhält eine Liste mit den Links.

Nun kommt das eigentlich spannende, wie unterscheidet man ausgehende und interne Links?

Auch das ist nicht schwer, wird sich der Programmierer gesagt haben, ausgehende Links beginnen mit http://. Dabei hat er alledings nicht bedacht, daß es auch noch andere Protokolle im Internet gibt, eben z.B. https://. Klar, https:// ist nicht http://, also ist es ein interner Link, nur leider ist das falsch.

Tja, und deswegen habe ich jetzt 15 falsche Fehler in den Webmastertools zu stehen.

2 Kommentare »