Das Putzlowitsch Test- und SEO-Blog
Stichwort: Fehler

Google-Suchanalyse funktioniert nun für Bildersuche in DE

Vor knapp vier Monaten war mir ein Problem in der neuen Google-Suchanalyse mit der Bildersuche bei google.de aufgefallen. Mittlerweile hat Google das Problem behoben. Seit dem 4. August werden jetzt auch brauchbare Daten beim Filter „Bild“ geliefert:

Links die alten Suchanfragen, rechts die neue Suchanalyse, jeweils für den Suchtyp Bild und den Zeitraum der letzten 28 Tage. Die aktuellen Zahlen:

Tool Impressions Klicks Impressions (de) Klicks (de)
Suchanfragen 1.097.952 10.322 840.490 8.185
Suchanalyse 774.157 5.596 582.169 5.292
Anteil in % 70,51 54,16 69,27 64,65

Warum die Zahlen der Suchanalyse möglicherweise insgesamt geringer als die der alten Suchanfragen sind, wird in den Hilfetexten erläutert.

Nun stimmt aber das Verhältnis von Impressionen und Klicks zwischen Suchanalyse und Suchanfragen halbwegs überein. Man kann es auch an der CTR für DE sehen, die zwischen Suchanalyse (0,91%) und Suchanfragen (0,97%) in etwa gleich ist.

So ist nun die Suchanalyse auf für die Bildersuche in DE brauchbar. Jetzt kann ich mich auch mal mit der Suchanalyse-API beschäftigen. Zur Zeit rufe ich die Daten für meine interne Statistik noch über die alten Suchanfragen ab. Die funktioniert zwar noch, aber bestimmt nicht ewig.

1 Kommentar »

Das Problem mit WordPress und den ungültigen URL-Parametern

WordPress hat ein Problem mit ungültigen URL-Parametern. Wenn jemand an die Blogadresse einfach einen Parameter mit einem Wert anhängt, wird das von WP klaglos akzeptiert, obwohl es völlig unsinnige Werte sein können.

Ein Beispiel:
http://vierzehnfuffzig.de/?url=http://www.heise.de
oder
http://vierzehnfuffzig.de/?blafasel=trallalla
oder was auch immer.

In allen Fällen gibt WordPress brav die Startseite meines Test- und Probierblogs aus. Das ist aus SEO-Sicht natürlich schlecht, denn es kann dadurch ganz viel DC enstehen.

Die Abhilfe ist recht simpel, die URL-Parameter müssen einfach gegen die in WordPress bekannten Parameter getestet werden. Das sind nur ein paar Zeilen PHP-Code.

Ich habe das mal in eine kleines Plugin verpackt, welches ich hier zum Download anbiete: 123 Check URL Para Version 0.11

Das war’s, mehr wird nicht benötigt. Probleme könnte es nur geben, falls Plugins oder Themes URL-Parameter verwenden, die nicht in WordPress registriert wurden. Das ist dann aber schlecht programmiert. E sgibt jetzt im Plugin-Quelltext weitere erlaubte Parameter einzutragen:

$para = array( 'p1', 'p2', 'p3' );  // zusätzlich erlaubte URL-Parameter

Einfach die erlaubten Parameter im array wie im Beispiel oben eintragen.

5 Kommentare »

Neue Google-Suchanalyse für Bildersuche in DE unbrauchbar

Seit heute ist die neue Suchanalyse in den Google-Webmastertools für alle verfügbar. Erfreulicherweise kann man sich auch noch die Daten der alten „Suchanfragen“ ansehen, was einen Vergleich der beiden Statistiken ermöglicht. So sieht das z.B. bei die Bildersuche für meine Putzlowitsch-Seite aus:

Links die alten Suchanfragen, rechts die neue Suchanalyse, jeweils für den Suchtyp Bild und den Zeitraum der letzten 28 Tage. Die ernüchternden Zahlen:

Tool Impressions Klicks Impressions (de) Klicks (de)
Suchanfragen 1.604.929 12.413 1.205.558 8.451
Suchanalyse 1.096.689 300 795.956 20
Anteil in % 68,33 2,41 66,02 0,23

Gut, bei den Impressions sind es nur noch ca. zwei Drittel, daß kann ich nicht wirklich beurteilen, liegt aber im Rahmen der verbesserten Genauigkeit, die in der Hilfe beschrieben wird:

Aber nur noch etwa 2,5% bei den Klicks erscheint mir sehr wenig zu sein. Wenn ich die Daten nach Deutschland filtere, wird es noch dramatischer. Nur noch lächerliche 0,23% bleiben da übrig. Mit anderen Worten, in 4 Wochen haben nur 20 Leute auf eines meiner Bilder geklickt. Dabei findet man meine Bilder durchaus an vorderen Positionen und auch in der Bilder-Box der Websuche und im Knowledge-Graph.

Zum Thema Bilder und Bildersuche gibt es natürlich auch Hinweise und Erklärungen in der Hilfe:

Anzahl der Klicks für Bilder verringert. Der neue Bericht „Suchanalyse“ zählt bei einem Bildersuchergebnis, das auf Ihre Seite verweist, nur Klicks auf ein maximiertes Bild oder auf den Link „Seite besuchen“. Der ältere Bericht „Suchanfragen“ hat jeden Klick auf ein Bild sowohl bei der Websuche als auch bei der Bildersuche gezählt, auch wenn das Bild nicht maximiert wurde. Dies bedeutet, dass die Anzahl der Klicks im neuen Bericht niedriger ausfällt, aber sehr viel aussagekräftiger ist.

Und weiter:

Was zählt als Klick?
Klicks werden nur gezählt, wenn sie den Nutzer zu Ihrer Property leiten. Klicks werden nicht gezählt, wenn sie zur Weiterleitung innerhalb der Suchergebnisse führen. Beispiel:
– Der Klick auf ein Bild in Websuchergebnissen wird nicht als Klick gezählt. Bilderklicks werden nur gezählt, wenn der Klick zur Website führt, etwa beim Klicken auf das Bild oder den Link „Seite besuchen“ innerhalb der Bildersuche. Beim Klick auf ein Bild in der Websuche gelangt der Nutzer üblicherweise zur Bildersuche, wo das angeklickte Bild maximiert wird, was nicht als Klick zählt.
– Klicks, die zu anderen suchinternen Funktionen führen, wie die meisten Knowledge Graph-Klicks, werden im Bericht nicht gezählt.

Und genau da liegt der Hase begraben, oder die Ursache des Problems. Bei der Websuche oder Bildersuche auf google.de führt der Klick auf ein Ergebnis, sei es nun in der Bildersuche oder Websuche (Bilderbox, Knowledge-Graph) eben nicht zum vergrößerten Bild oder intern zur Bildersuch, sondern zu meiner Seite (im alten Bildersuche-Frameset). Um es mit Google zu formulieren, der Klick leitet den Nutzer zu meinem Property, wir nun aber trotzdem nicht gezählt.

Entweder Google bessert da nochmal nach, oder man kann die neue, schicke Suchanalyse für die Bildersuche in DE nicht gebrauchen. Leider soll die alte Suchanfragen-Statistik in drei Monaten abgeschaltet werden. Mit der könnte ich gut auch noch länger weiterleben. :-)

5 Kommentare »

Google Webmaster-Tools: 404 Fehler von 404-Fehlerseiten verlinkt

Nicht gefunden

URL: httрs://рutzlοwitsсh.dе/wp-cοntеnt/uрlοads/2011/06/kindеrtag-

Fehlerdetails

Zuletzt gecrawlt am: 29.12.14
Erstmals erkannt am: 29.12.14

Der Googlebot konnte diese URL nicht crawlen, da keine zugehörige Seite existiert. Im Allgemeinen wirken sich 404-Codes nicht auf die Leistung Ihrer Website bei der Suche aus. Sie können sie jedoch zur Verbesserung der Nutzererfahrung verwenden.

Verlinkt über

httр://рutzlοwitsсh.dе/wp-cοntеnt/uрlοads/2011/06/kindеrtag-

Möglicherweise werden nicht alle URLs aufgeführt.

Google WMT-Fehler-404 mit Link von 404-Seite

Das habe ich gerade in den Google-Webmaster-Tools entdeckt. Die angegebene URL zeigt in Uploads-Verzeichnis, also dahin, wo die Bilder liegen.

Wie solche URLs enstehen können, darüber habe ich ja schon ein paar Mal etwas geschrieben [1][2][3].

Selbstreferenzielle Fehler

Das Interessante ist nun aber, welche Seite in den Google-WMT als Link-Quelle (Verlinkt über…) angezeigt wird. Das ist nämlich die Seite selbst, oder genau genommen, die Fehlerseite.

Der Webserver liefert den passenden HTTP-Statuscode 404 zurück und noch einen mehr oder weniger nützlichen Text für den Nutzer. Dieser sieht den Statuscode ja normalerweise nicht.

Die Standard-Fehlerseite des Apache-Webservers ist eher schlicht gehalten:

Not Found
The requested URL /wp-cοntеnt/uрlοads/2011/06/kindеrtag- was not found on this server.

Die angeforderte URL sowieso wurde auf diesem Server nicht gefunden.

Fehlerseite 404

Genau da liegt wohl das Problem, denn die fehlerhafte URL wird auf der Fehler-Seite als Text (!) ausgegeben. Kein Link, nicht mal ein http:// oder https:// steht vorne dran.

Aber wie wir wissen, reimt sich Google bzw. der Google-Bot gerne mal URLs aus Sachen zusammen, die irgendwie entfernt nach einer URL aussehen.

Ein Teufelskreis?

Nun ensteht dadurch ein Problem, denn die angeblich verlinkende Seite existiert natürlich und wird auch weiterhin existieren. Es ist ja schließlich die Fehlerseite des Webservers.

Wenn ein „Link“ aber weiterhin besteht, wird Google auch immer mal wieder die Seite aufrufen um zu sehen, ob sie vielleicht doch existiert. Im Ergebnis wir dann die Link-Quelle auch immer aktualisiert und bleibt bestehen. Ein endloser Kreislauf. Oder doch nicht?

Ich könnte zwar die Fehlerseite anpassen, so das die nicht gefunden URL nicht mehr angezeigt wird, aber warum? Soll der Google-Bot doch Zeit mit Fehlern verplämpern, ist nicht mein Problem.

Die wahre Fehlerquelle

Ich habe auch die wahrscheinlich wirkliche Fehlerquelle gefunden:

Umgebrochener Linktext in Google-Groups

In diesem Beitrag bei Google-Groups wir der sichtbare Linktext umgebrochen und damit die URL an der Stelle abgeschnitten, so wie es oben als fehlerhafte URL zu sehen ist. Der darunter liegende Link zum Bild funktioniert hingegen einwandfrei.

Der Text httр://рutzlοwitsсh.dе/wp-cοntеnt/uрlοads/2011/06/kindеrtag- sieht halt so schön nach einer URL aus, also nimmt Google ihn als URL mit und schickt den Google-Bot vorbei.

Wie sagt John Müller das doch so schön im Webmaster-Hangout:

„Wir möchten sichergehen, dass wir nichts verpasst haben.“

Und die Moral von der Geschicht

Trau den Google-Webmaster-Tools nicht. Zumindest nicht immer.

Wenn in den Google-Webmastertools der Beitrag bei Google-Groups als Link-Quelle angezeigt werden würde, dann wäre das wirklich hilfreich. Aber die Fehlerseite selbst als Quelle anzugeben, halte ich, nun ja, für einen Fehler.

0 Kommentare »

Das letzte (Bild) beißen die Hunde

Von den glorreichen Sieben ist nur noch eins übrig. Ich hatte ja gehofft, daß die Aktion bis Ende Oktober abgeschlossen sein wird, aber wie es im Moment aussieht, wird das wohl nichts.

Google Bildersuche schnurpsel.de

Morgen zu Halloween ist dann die letzte Chance für Google, auch das letzte verbliebene Bild aus der Suche zu entfernen. Mal sehen, ob es noch was wird…

3 Kommentare »

Die glorreichen Sieben (Bilder)

Seit Ende Januar dieses Jahres versuche ich alle Bilder hier von schnurpsel.de bei Google aus dem Index zu bekommen. Beim Start waren es gut 650 Bilder und zunächst ging es auch recht gut voran. Aber seit etwa drei Wochen tut sich praktisch gar nichts mehr. Die letzten Bilder wollen und wollen einfach nicht verschwinden. Genau sieben Bilder (Die glorreichen Sieben :-) halten sich hartnäckig:

Die glorreichen Sieben (Bilder)

Irgendwie merkt Google nicht, daß auch diese Bilder, zumindest für den Google-Bot, nicht mehr existieren. Deshalb packe ich sie alle nochmal in den Artikel hier.

Bild 1 Bild 2 Bild 3 Bild 4 Bild 5 Bild 6 Bild 7

Mal sehen, ob was passiert…

4 Kommentare »

Google und die Textlinks sind keine Freunde

Links die keine sind

Mittlerweile habe ich mich fast schon daran gewöhnt, daß Google alles was auch nur annähernd nach URL aussieht, wie einen Link behandelt und entsprechend den Crawler darauf losläßt. Selbst unsinnige URLs mit drei Punkten in der Mitte oder am Ende werden verfolgt. Alle diese erfundenen URLs werden dann natürlich als Fehler in den Webmastertools gemeldet, denn der Webserver liefert einen „404 Not found“ zurück.

Nun bin ich kürzlich mal wieder so einer von Google ausgedachten URL nachgegangen. Meist kann man in den Webmastertools auch die Quelle des „Links“ sehen.

Das ist wieder so eine abgeschnittene URL, normalerweise geht es um diesen Artikel. Allerdings fehlen da die drei kleinen Punkte am Ende, mal sehen, was dort auf der „verlinkenden“ Seite verzapft wurde.

Quelle des fehlerhaften "Links"

Einen richtigen Link zu meinem Artikel gibt es dort erwartungsgemäß nicht, aber zumindest ist die URL selbst textlich korrekt und unverkürzt dargestellt. Allerdings sind die Suchwörter, für die meine Artikel dort auf der Seite erscheint, hervorgehoben.

HTML als Stolperfalle

Im Quelltext der Seite sieht das dann so aus:

HTML-Text der URL

Zur Hervorhebung sind die Keywords mit dem HTML-Tag b als fett ausgezeichnet. Ich hätte ja nun irgendwie erwartet, daß Google mit HTML-Tags umgehen kann. Erstaunlicherweise hat nicht das erste HTML-Tag die URL-Raterunde beendet, sonder erst das zweite, schließenden Tag. Der Google-Link endet hinter …datenbank:
/sicher-ist-sicher-datenbank

Ich kann es gerne nochmal wiederholen. Wie auch die Erkennung der drei Punkte in den unsinnigen URLs würde das Entfernen der HTML-Tags wohl jeder mittelmäßige Programmierer hinbekommen. :-)
Ich hätte gedacht, daß Google bei der richtigen Interpretation von HTML etwas weiter ist.

Es ist ein Fehler

Selbst wenn ich die Verfolgung von mit drei Punkten verkürzten Textlinks für unsinnig und falsch halte, habe ich mich damit zumindest abgefunden. Aber nicht existierende URLs zu crawlen, die durch mangelhafte Interpretation von HTML entstehen, steht einem Weltkonzern wie Google schlecht zu Gesicht. Das sind aus meiner Sicht einfach nur Fehler.

Fehler sind ja auch dazu da, daß sie behoben werden können. Ich will mal hoffen, Google schafft das und kann sich dann wieder den echten Links und anderen Problemen zuwenden.

3 Kommentare »