Das Putzlowitsch Test- und SEO-Blog
Thema: Internet

Das Siebtlingsgeburt-Ranking im Blog mit meinem Plugin einbinden

Gestern hatte ich ja bereits die maschinenlesbaren Daten von ranking-123.de vorgestellt. Ihr könnt diese Daten selbst nutzen und auswerten (wenn Ihr es könnt :-). Oder Ihr benutzt einfach mein WordPress-Plugin, das ich hier kurz vorstellen will.

Siebtlingsgeburt Top-100

123 Top-100 Plugin

Das Plugin besteht im wesentlichen aus zwei Funktionen.

Die erste Funktion agn_top100_read_data ist für das Abholen der Daten im JSON-Format zuständig. Hier habe ich etwas mehr Aufwand betrieben, um unnötige Requests und Datenübertragungen zu vermeiden. Die Daten werden lokal auf dem Server der WordPress-Installation im Verzeichnis wp-content/uploads gespeichert. Dieses muß daher von WordPress beschreibbar sein, damit das Caching funktioniert.

Die zweite Funktion agn_top100_shortcode implementiert einen WordPress-Shortcode, mit dem man sich die gewünschten Daten im Artikel oder auf der Seite ausgeben lassen kann.

Im einfachsten Fall sieht das dann so aus:
...
Hier findet ihr die aktuelle Siebtlingsgeburt Top-100:
<table class='chart-list'>[agn_top100 nam='siebtlingsgeburt']</table>
...

Per Voreinstellung wird die Liste als Tabelle ausgegeben, allerdings ohne Table-Tags. Die müßt Ihr selbst drumrum packen. Das hat den Vorteil, daß Ihr der Tabelle einfach eine CSS-Klasse oder sonstige Formatierungen mitgeben könnt.

In der Voreinstellung ergibt sich damit eine Tabelle wie auf dieser Beispielseite (ohne Grafik). Die Platzierung wird einfach durchnummeriert, vor der URL steht ggf. ein Symbol für den Ergebnistyp, hinter der URL folgt ein Link-Symbol mit einem (nofollow!) Link zur Seite. URLs, die Länger als 70 Zeichen sind, werden am Ende mit … verkürzt.

Über Shortcode-Parameter kann die Ausgabe angepaßt werden. Folgende Einstellungen sind möglich:

  • nam – Name der Daten
    Vorgabe: ‚xovilichter‚, hier also siebtlingsgeburt eintragen :-)
  • ret – Was soll der Shortcode zurückgeben?
    Vorgabe: ‚rnk‚, mögliche Werte

    • rnk – Ranking Tabelle/Liste (siehe lit)
    • upd – Datum und Zeit des letzten Updates (siehe dtf)
    • cnt – Anzahl der gefundenen Treffer insgesamt
  • max – Maximal Anzahl auszugebender Treffer
    Vorgabe: ‚100‚, eine Zahl zwischen 1 und 123
  • dtf – Ausgabeformat des letzten Updates (siehe ret:upd)
    Vorgabe: ‚‚d.m.Y H:i‘‚, Format entsprechend PHP-Date-Funktion
  • lit – Listentyp: Tabelle oder Liste?
    Vorgabe: ‚tab‚, mögliche Werte

    • tab – Tabelle (table)
    • lst – Liste (ol)
  • cut – Anzahl Zeichen, ab der eine URL verkürzt wird
    Vorgabe: ‚70‚, eine Zahl zwischen 0 (keine Verkürzung) und größer
  • sym – Typ-Symbol vor der URL anzeigen
    Vorgabe: ‚1‚, zum ausschalten ‚0‘ verwenden
  • lnk – Link am Ende der URL ausgeben
    Vorgabe: ‚1‚, zum ausschalten ‚0‘ verwenden

Hier ein paar Beispiele:
...
<ol>[agn_top100 nam='siebtlingsgeburt' max='33' lit='lst' sym='0']</ol>
...

Gibt maximal 33 Einträge als HTML-Liste (OL) ohne vorangestelltem Typ-Symbol aus.

...
Top-100 vom [agn_top100 nam='siebtlingsgeburt' ret='upd' dtf='l, d.m.Y H:i'] Uhr
...

Gibt den Zeitpunkt des letzten Updates formatiert aus.

Technische Voraussetzungen und Download

Technische Voraussetzungen:

  • WordPress 3.8 oder höher
  • PHP 5.2 oder höher mit curl-Funktion
  • Verzeichnis wp-content/uploads muß von WordPress beschreibbar sein

Download Version 0.18: 123 Top-100 Plugin

Falls es Unklarheiten oder Fragen gibt, einfach fragen. :-)

1 Kommentar »

Siebtlingsgeburt-Rankings bei ranking-123.de als XML und JSON

Siebtlingsgeburt

Wie schon letztes Mal gibt es auch beim aktuellen SEO-Wettbewerb Siebtlingsgeburt die Ranking-Daten von ranking-123.de im XML- und JSON-Format.

Die URLs lauten:

Der Aufbau ist recht einfach und weitestgehend selbsterklärend. Im Kopf gibt es drei Datenfelder:

  • nam – Name bzw. Suchbegriff (z.B. Siebtlingsgeburt)
  • upd – Datum und Zeit des letzten Updates der Liste
  • cnt – Anzahl der Google-Suchergebnistreffer (nicht Listeneinträge!)

Es folgt in rnk eine Liste der Suchergebnisse mit folgenden Datenfeldern:

  • pos – Position in den Suchergebnissen
  • url – URL der Seite
  • typ – Typ des Suchergebnisses, mögliche Werte
    • txt – normales Suchergebnis
    • new – Google-News
    • img – Universal Search Bilder
    • vid – Video
  • img – URL des Bildes, wenn Typ img ist (optional)
  • aut – Name des Autors, falls verfügbar (optional)
  • lpo – letzte Position, 1000 falls neu in der Liste

Bei der Position für Universal-Search Ergebnisse wird eine Unternummerierung vorgenommen. Das erste Ergebnis bekommt .01, das zweite .02, das dritte .03 usw. an die eigentliche Position angehängt. Befinden sich zum Beispiel vier Bilder an der Position 13, so erhalten sie die Positionen 13.01, 13.02, 13.03 und 13.04 in pos zugeordnet.

Die Daten werden stündlich zu vollen Stunde erhoben. Es dauert aber ein paar Minuten, bis sie dann tatsächlich vorliegen. Also sollten die Daten ein paar Minuten nach der vollen Stunde abgefragt werden. Den aktuellen Zeitpunkt der Daten sieht man ja in den Kopfdaten.

Das Top-10 Diagramm im PNG-Format liegt auch zu diesem Zeitpunkt vor. Es gibt ein 24-Stunden-Diagramm und ein 3-Wochen-Diagramm:

Leider liegen die Bilder nicht als https vor, so daß eine Einbindung in https-Seiten problematisch ist. Ich behelfe mir da derzeit mit einem kleinen lokalen „Proxy“, der die Bilder per PHP-Skript bei der Originalseite abholt und über eine „virtuelle“ lokale URL bereitstellt. Aber das ist ein Thema für sich… :-)

0 Kommentare »

Stockfoto-Anbieter Alamy startet in Google-Bildersuche bei google.de durch

alamy.de – Bidox-Aufsteiger der letzten Wochen

bidox: alamy.de (Google-Bildersuche)

Die Website alamy.de gehört in den letzten Wochen kontinuierlich zu den Gewinnern im Bilder-Domain-Index Bidox. Mittlerweile hat sie Platz 64 in der Top-100 erreicht. Wenn eine Seite derartig schnell aus dem Nichts die Google-Bildersuche stürmt, werde ich stutzig, denn das geht normalerweise nur mit bereits vorhandenen, gut rankenden Bildern.

Üblicherweise stecken hinter solchen Erfolgen Hotlinkfarmen oder Bildkopierer, die sich schamlos an fremdem Bildern bedienen und Bilderspam-Seiten mit Hotlinks oder Bildkopien aufziehen.

Im ersten Moment dachte ich auch bei alamy.de an eine Hotlinkfarm, nur eben nicht mit einer üblichen .tk- oder .xyz-Domains. Die Bilderspammer setzen zunehmend auch auf expired Domains mit „normalen“ TLDs wie .de oder .com.

Ein Blick auf die Seite hat mich dann eines Besseren belehrt, denn hinter alamy.de steckt die Stockfoto-Agentur „Alamy Limited“ aus England. Die Seite ist schon länger auch im Bidox mit ihrer .com-Domain vertreten, sie war mir nur bisher nicht aufgefallen.

Erfolgreich mit neuer Domain

Genau genommen habe wir es hier mit Hotlinks zu tun, allerdings ganz legalen. Die neuen DE-Seiten verwenden die selben Bilder wie die alamy.com-Seite. Diese werde nun in einer neuen, frischen Umgebung präsentiert und sind damit für Google gute Rankings wert. Zudem befinden sie sich nun in einer deutschsprachigen Umgebung, was dem Ranking in der Bildersuche bei google.de durchaus auch zuträglich ist.

Viele Bilder ranken zu Namen von Prominenten, zu Eigennamen wie Marken, Sehenswürdigkeiten und Städten. Diese Suchbegriffe unterscheiden sich im Englischen und Deutschen nicht und so hat Alamy viele der guten Rankings auf die DE-Seite übertragen können.

Durch die Übersetzung der Bildbeschreibungen und Stichwörter ins Deutsche konnten auch viele neue Rankings in der Bildersuche dazugewonnen werden.

Es kann sich also durchaus lohnen, neue Rankings in der Bildersuche mit länderspezifischen Seiten und Domains zu erobern. Auch Pinterest ist kürzlich diesen Weg erfolgreich gegangen, wenngleich hier die com-Domain zunächst deutliche Verluste einstecken mußte.

Bidox: pinterest-Domains im Vergleich

Bei Alamy gab es auch einen kurzen Einbruch, aber die com-Seite hat sich schnell erholt und einen neuen Höchststand im bidox erreicht.

Bidox: alamy-Domains im Vergleich

Alles richtig gemacht, würde ich sagen.

0 Kommentare »

Absturz meine Wand-Bildes – alles Zauberei?

Die Erfolgswand stürzt ab

Wand

Wand

Seit ein paar Jahren hält sich das oben gezeigte Bild (bzw. eine Kopie davon) ganz tapfer in der Bildersuche zum Suchbegriff Wand. Es bewegt sich zwischen Platz 1 bis 5 im Ranking, da kann man nicht meckern.

Nun hat mir ein Blick in meine Bilderüberwachung gezeigt, daß das Wand-Bild am 20. August deutlich im Ranking abgestürzt ist:

bibeo: wand (2017-09-12)

Aber was ist der Grund dafür? Habe ich irgend etwas mit meinen Seiten falsch gemacht, gab es eine Abstrafung durch Google oder gibt es plötzlich ganz viele neue Bilder von Wänden, die besser sind als mein Bild?

Wand ist nicht gleich Wand

Die Lösung ist recht einfach. Google hält andere Wand-Bilder für wandiger als Wände, nämlich Zauberstäbe. Bereits Anfang April war mir aufgefallen, daß für einige Suchanfragen wie Wand, Mist oder Rock in der Bilderbox keine Wände, kein Mist und keine Röcke, sondern Zauberstäbe, Nebel und Steine angezeigt werden.

Google-Bildersuche: Wand

In der Bildersuche selbst war die Welt aber noch in Ordnung. Die meisten Bilder zeigten Wände, nur vereinzelt werden Zauberstäbe eingestreut. Mein Wandbild war auf Platz 2 zu finden.

Aktuell sieht das Ergebnis für Wand in der Bildersuche aber so aus:

Google Bildersuche: Wand (zeigt Zauberstab)

Mein Bild ist zwar auch noch zu finden, aber eher unter „ferner liefen“ auf Platz 33. Klar, gegen die große, englischsprachige Shops und Harry-Potter-Seiten habe ich schlecht Karten.

Was hat Goolge geändert?

Bei so plötzlichen, gravierenden Rankingänderungen liegt der Verdacht nahe, daß Google Rankingfaktoren in der Bildersuche neu gewichtet hat. Zumal nicht nur meine Bilder betroffen sind, sondern auch die vieler anderer deutscher Wand-Anbieter.

Zwei Dinge fallen mir dazu ein.

Übereinstimmung der Sprache

Ein möglicher Rankingfaktor könnte die Übereinstimmung der Sprache des Nutzers mit der des Suchergebnisses sein. Vor dem 20. August wurden dem Nutzer aus Deutschland oder mit der Spracheinstellung „Deutsch“ vorzugsweise Bilder von deutschsprachigen Seiten angezeigt bzw. im Ranking höher bewertet. Entsprechend sind halt Bilder von Wänden vorne zu finden.

Wenn nun die Sprachübereinstimmung weniger gewertet wird, kommen andere Rankingfaktoren mehr zu tragen und da haben kleiner Seiten z.B. gegen amazon.com, pixabay.com und andere große, englischsprachige Seiten kaum eine Chance.

Bilderkennung mit KI

Es ist ja kein Geheimnis, daß Google einiges in die automatische Bilderkennung mit Künstlicher Intelligenz (KI) investiert. Was damit schon möglich ist, kann man selbst so ein bißchen durch der „Bildersuche mit Bild“ testen:

Google-Bildersuche mit Bild: brick

Die „Vermutung für dieses Bild“ ergab sich früher aus der Suche nach ähnlichen Bildern und deren bekanntem Kontext, also dem zugeordneten Text.

Seit einer Zeit steckt zumindest teilweise meiner Meinung nach eine echte Bilderkennung dahinter. Das sieht man zum einen an den eher allgemeinen Begriffen und daran, daß sie auf englisch sind.

Wenn nun diese automatisch erkannte Zuordung im Ranking ein höher gewichteter Faktor ist, dann ist auch klar, warum englische Zauberstäbe den deutschen Wänden den Rang ablaufen.

Der Zauberstab wurde als „wand“ von der KI klassifiziert, die deutsche Wand aber als „brick“ oder „wall“, was halt nicht mit der Suchanfrage „wand“ übereinstimmt, also schlechter ranken muß.

Durch einen Kommentar im TagSeoBlog bin ich auf dieses Google-Tool aufmerksam geworden: Vision-API

Wie schon vermutet, wird meine Wand-Bild als Brick und Wall und Ähnliches klassifiziert, aber eben nicht als Wand:

Google-Vision-API: Meine Wand

Möglicherweise spielen auch beide Faktoren eine Rolle oder etwas ganz anderes. Nichts Genaues weiß man nicht. :-)

0 Kommentare »

Google „People also ask“ dynamisch – viele Antworten auf viele Fragen

Googles „People also ask“ – die PAA-Box

Google „People also ask“: Fourth of july

Seit einiger Zeit zeigt Google bei bestimmten Suchanfragen eine sogenannte PAA-Box an. Unter der Überschrift „People also ask“ werden bis zu vier Fragen und nach klick deren Antworten eingeblendet. Bei google.de in Deutschland habe ich das allerdings bisher noch nicht gesehen.

Da ich wegen der Google-Doodle hin und wieder bei google.com nachschaue, ist es mir dort besonders aufgefallen. So auch heute zum Unabhängigkeitstag der USA mit der Suchanfrage „Fourth of July“. Auch dazu werden vier Fragen (siehe Bild oben) eingeblendet. Meist klicke ich da aber nicht drauf, heute aber schon. Zunächst dachte ich, ich hätte micht verguckt, denn da waren auf einmal sechs und nicht vier Fragen zu sehen.

Noch mehr Fragen (und Antworten)

Sind da etwa zwei Fragen dynamisch dazu gekommen? Und tatsächlich, beim nächsten Klick waren es plötzlich acht Fragen. Ich habe das hier mal in einem Video dokumentiert:

Mit jedem Klick kommen zwei Fragen (und Antworten) dazu. Bei 100 Fragen habe ich dann aufgehört.

Interessant ist auch die thematische Entwicklung der Fragen. Man kommt z.B. von „What is celebrated on Independence Day?“ über „Is September 5 a Holiday?“ bis zu „Can you use superglue to close a wound?“. Es geht doch deutlich von der Ausgangsfrage bzw. Suchanfrage weg.

Google bewegt sich also immer mehr weg von einer Suchmaschine hin zu einer (Frage- und) Antwortmaschine. Ob es nun aber sinnvoll ist, die „People also ask“-Fragen praktisch „unendlich“ weiterzuspinnen, da habe ich so meine Zweifel.

Und in DE scheint es das auch noch nicht zu geben, oder hat das von Euch schon mal jemand bei google.de gesehen?

4 Kommentare »

Google-Bildersuche rankt PDF-Dokumente

Google findet Bilder mit Bildern in PDF-Dateien

Google – Bildersuche mit Bild (pdf)

Daß man Bilder in PDF-Dateien über die Bildersuche finden kann, war mir bereits im Oktober 2013 aufgefallen.

Allerdings war damals die PDF-Datei nicht die Referenz-Seite für ein Bild in der normalen Bildersuche, sondern ein Treffer als Ergebnis der Suche mit Bild (Seiten mit übereinstimmenden Bildern).

Diese Suchergebnisseiten sind keine Bildersuche-Ergebnisse, sondern entsprechen eher der Video-Suche.

Der Klick auf das Ergebnis führt zu der entsprechende Seite, also bei einem PDF-Treffer direkt zur PDF-Datei. Mit dem Klick auf das Thumbnail gelangt man wieder in die Inline-Ansicht der Bildersuche, allerdings nur für genau dieses eine Bild.

Echte PDF-Treffer in der Google-Bildersuche?

Heute ist mir nun das erste Mal ein echter Treffer in der Google-Bildersuche aufgefallen, der eine PDF-Datei, also keine Webseite als Bildreferenz verwendet.

Bei der Suche nach „Schule“ findet man recht weit vorn ein Ergebnis der Uni-Hildesheim:

Google-Bildersuche: PDF-Datei

In der Inline-Ansicht fehlen die Klickflächen [Seite besuchen], [Bild ansehen] und [Teilen], stattdessen gibt es nur den Button [PDF ansehen]. Klar, ein in einer PDF-Datei eingebettetes Bild hat keine eigene URL, mit der man sich das Bild einzeln ansehen könnte.

Aber das stimmt so nicht ganz, denn was hier Google in der Bildersuche als Treffer liefert, ist gar nicht das in der PDF-Datei enthaltene Bild. Es ist mal wieder nur die URL eines Bildes, die als Link oder sogar nur als Text in der PDF-Datei auftaucht:

Bilder-Text-URL in PDF-Datei

Ganz unten wurde als Bildquelle die URL des Bildes aufgeführt, als einfacher Text der URL. Genau das ist auch das Bild, das in der Bildersuche rankt (sichtbar mit dem Bilder-Liste Bookmarklet):

Google-Bildersuche: Text-URL im PDF

Daß nicht das Bild selbst rankt sieht man auch daran, daß das bunte Bilder der Schule gar nicht im PDF-Dokument verwendet wird, sondern eine aufgehellte Graustufenversion als Hintergrundbild.

Ich habe mir noch ein paar weitere PDF-Treffer in der Bildersuche angesehen. Bei allen verhält es sich wie bei der „Schule“ oben. Das Ranking in der Bildersuche erfolgt nicht für das Bild in der PDF-Datei, sondern für eine Bild-URL darin, die einfach z.B. als Bildquelle im Text aufgeführt wird.

Ein weiteres Beispiel ist „Thermometer„:

Google-Bildersuche: PDF-Datei (Thermometer)

Sie sieht das in der PDF-Datei aus:

Bilder-Text-URL in PDF-Datei (Thermometer)

Auch hier ist wieder gut zu sehen, daß das Bild in der PDF-Datei nicht das ist, welches in der Bildersuche rankt. Im PDF-Dokument wird nur das mittlere, grüne von den drei Thermometern im Originalbild verwendet.

Nur der Link- bzw. Text-URL-Effekt

Bilder aus PDF-Dokumenten ranken nicht wirklich in der Bildersuche. Wenn dort ein PDF-Dokument als Referenz für das Bild verwendet wird, ist es nur eine weitere „Ausprägung“ des Link- bzw. Text-URL-Effekts. Dieser besagt, daß eine Seite in der Google-Bildersuche ranken kann, die nur eine Link zu einem Bild gesetzt hat oder sogar nur die Bild-URL als Text auf der Seite zu stehen hat.

Ich habe bei meiner Recherche entdeckt, daß es angeblich bereits seit August 2015 möglich ist, Bilder in PDF-Dateien mit Google zu finden. Mir war das zumindest bisher nicht aufgefallen. Möglicherweise gab es die Funktion auch zunächst nur bei google.com. Ob damals wirklich die Bilder aus PDF-Dokumenten gefunden wurden, oder doch nur enthaltene Bild-URLs, kann ich nicht sagen.

Im Moment scheint es aber so zu sein, daß nur die Bild-URLs zum Ranking führen.

Google-Bildersuche in PDF-Dateien? Nicht wirklich!

0 Kommentare »

So ein Mist, voll gegen die Wand gefahren!

Eine Wand ist eine Wand, oder?

Google-Suche: Wand

Das es wand auch als englisches Wort gibt, was soviel wie Zauberstab heißt, ist sicher eine interessante Information. Wenn ich bei google.de mit der Sprache „Deutsch“ nach Wand suche, will ich aber bestimmt keine Bilder von Zauberstäben sehen, sondern von Wänden. Oder geht das nur mir so?

In der Bildersuche selbst wird meine Erwartung durchaus befriedigt:

Google-Bildersuche: Wand

Gut, auch hier sind ein paar Zauberstäbe zu finden, im Großen und Ganzen aber doch die erwarteten Wände. Die Zauberstäbe sind allerdings größtenteils andere, als in der organischen Suche. Keine Ahnung, wo Google die in der Bilderbox angezeigten Zauberstäbe herzaubert.

Nachtrag 13.09.2017: Mittlerweile zeigt Google auch in der Bildersuche praktisch nur noch Zauberstäbe an:

Google Bildersuche: Wand (zeigt Zauberstab)

So ein Mist

Also ich finde schon, daß das Mist ist, was Google da in der Suche mit den Bildern macht.

Google-Suche: Mist (Bilder-Box)

Google-Suche: Hut (Bilder-Box)

Google-Suche: Gaul (Bilder-Box)

Da muß man schon auf der Hut sein, bei diesen teils seltsamen Bilder-Suchergebnissen. Aber andererseits ist die Google-Suche ja umsonst, dann gilt hier wohl das Sprichwort „Einem geschenkten Gaul schaut man nicht ins Maul“.

Ist das nun gut oder bad, ähhmmm schlecht, was Google da macht?

Google-Suche: bad (Bilder-Box)

Zweifel kommen spätestens dann auf, wenn man sich das entsprechende Ergebnisse der Bildersuche ansieht.

Google-Bildersuche: Bad

Oder ist es nur ein Fehler?

Google-Suche: Rock

Na wenigstens lassen sich die Google-Shopping-Ergebnisse durch die Übersetzung aus dem Englischen nicht auf eine falsche Fährte locken.

Fehler oder Absicht?

Handelt es sich hier nur um Fehler, oder weiß Google einfach mehr über die Suchintention der Nutzer, als man selbst annimmt?

Es ist ja durchaus denkbar, daß viele Nutzer bei der Suche nach Wand eigentlich einen Zauberstab meinen oder nicht auf der Suche nach einem neuen Rock, sondern nach hübschen Steinen sind.

Ich kann mir das ehrlich gesagt nicht vorstellen. Zumindest ich würde bei der Suche nach den oben gezeigten Beispielen etwas anderes erwarten. Aber ich bin ja nur ein ganz kleines Körnchen in Googles riesigem Datenschatz.

2 Kommentare »