Das Putzlowitsch Test- und SEO-Blog

Google Fehler 403 – da hat es den Bot zerlegt

Google Error 403 Seite

Twitter ist ja für seine lustigen Fehlerseiten bekannt. Das ist doch mal eine nette Fehlerseite von Google mit dem zerfallenden Roboter. :-)

Der kann einem fast ein bißchen Leid tun, der arme Bot. Eigentlich bekommt man als normaler Nutzer diese Seite nicht zu sehen. Ich habe mal mit unterschiedlichen Browser-Kennungen (Useragent) rumprobiert und auf libwww-perl reagiert Google mit dem Fehler 403 – Zugriff verweigert. Man soll halt nicht die SERPs mit irgendwelchen Perl-Skripten abfragen oder wenigstens einen vernünftigen Useragenten eintragen.

Ich bin da bei meinen PHP-Skripten ehrlich und schreibe auch keinen normalen Browser rein, der ich nicht bin. Im Moment melde ich mich als „123GoogleRank/0.42“. Allerdings gibt es in letzter Zeit einige Abweichungen zwischen den erfaßten und sichtbaren Rankings. Da muß ich mal forschen, woran das liegen könnte…

Weitere Artikel mit Bezug zu diesem:
Keine Kommentare »

Google-Bildersuche: SafeSearch strict „unsichtbar“

Bei der Google-Bildersuche und auch der normalen Suche gibt es die Möglichkeit, anstößige, nicht jugendfrei Inhalte zu filtern. Die entsprechenden SafeSearch-Einstellungen können z.B. direkt rechts neben der Such-Schaltfläche vorgenommen werde:

Google Safesearch - Optionen

Es ist auch möglich, die SafeSearch-Option als URL-Parameter safe= zu übergeben. Folgende Einstellungen sind möglich:

  • on (strict, active) – es wird alles gefiltert, was nur entfernt nach jugendgefährdenden Inhalten aussieht
  • images (moderate) – es wird alles gefiltert, was eindeutig nach jugendgefährdenden Inhalten aussieht
  • off – es wird nicht gefiltert

Kürzlich ist mir beim Durchsehen der Google-Bildersuche-Treffer ein weiterer Wert für den Parameter safe= aufgefallen: vss.
Dieser wirkt genauso wie der Wert strict (oder on) mit dem Unterschied, daß die Anzeige der aktuellen Einstellung und die Auswahlmöglichkeiten rechts neben dem Such-Button ausgeblendet sind. Am Beispiel „Pflaume“ sieht das so aus:

Die Suchergbnisse sind identisch, nur das [SafeSearch – Strikt ▼] ist nicht mehr zu sehen.

Wofür das nun gut ist, weiß ich auch nicht genau. Ich könnte mir vorstellen, daß es eine Art „Kindersicherung“ ist. Gewissermaßen ein voreingestelltes SafeSearch-Filter strikt ohne der Möglichkeit, etwas daran zu ändern. Das Problem ist nur, wie bekommt man den Parameter an jede Google-Such-URL angehängt. Das könnte mit einem Proxy oder einer Firewall gehen, der/die URLs umschreiben kann.

2 Kommentare »

WordPress Bilder – welcher Text kommt wo hin

Bilder in WordPress nutzen

Ich benutze für meine Bilder den in Wordpess vorhandenen Dateiupload und auch die integrierte Gallery-Funktion. Zusätzliche Plugins sind dafür bei mir nicht im Einsatz.

Wenn ich in WordPress ein Bild hochlade, bekomme ich gleich vier Felder für Texteingaben angeboten. Doch was kommt in welches Feld und wo wird es später angezeigt?

Wordpress Bilderupload - Texte und Beschriftungen (alt)

Die neue Version des Media-Uploaders sieht etwas anders aus (links). Am konfortabelsten lassen sich die Informationen und Texte zu einem Bild im Editor der Mediathek (rechts) bearbeiten

Titel – Title

Das erste Feld ist selbsterklärend, hier schreibe ich den Titel, die Überschrift für das Bild rein. Der Titel ist mit dem Dateinamen des Bilder vorbelegt und ein Pflichtfeld. Falls vorhanden, wir das Titelfeld mit den passenden EXIF/IPTC-Daten belegt.

Die Daten zu Bildern werden in WordPress genau wie Artikel und Seiten gespeichert. Also entspricht der Titel eines Bilder dem, was ich für einen normalen Beitrag als Titel eingebe.

Wenn ich ein Bild in einen Artikel einfüge, wird der Titel später auf der Seite nicht direkt sichtbar. Er wandert in das title-Attribut des img-Tags und wird vom Browser als Tooltip beim überfahren mit der Maus eingeblendet.

Auf einer Bilder-Einzelseite ist der Titel wie bei Artikeln und Seiten die Überschrift (h2).

Alternativtext – Alternate Text

Die deutsche Übersetzung des zweiten Textfeldes ist seit WP 3.x etwas unglücklich ausgefallen, denn hier kann ich den alternativen Text eintragen. In der aktuellen WP-Version (4.1) ist das richtig mit „Alternativer Text“ bzw. „Alternativtext“ beschriftet. Dieser erscheint dann im alt-Attribut des Image-Tags.

Falls ich „Alternativtext“ leer lasse, wird der Titel-Text als alt-Text übernommen. Der Alt-Text wir immer dann ausgegeben, wenn aus irgend einem Grund keine Bilder angezeigt werden können oder sollen. Außerdem spielt dieser Text eine wichtige Rolle für die Suchmachinen, denn die Suchmaschinenbots können Bildinhalte auch nicht „sehen“.

Beschriftung – Caption

Wordpress Bild - TextIn das dritte Textfeld trage ich eine Bildunterschrift ein. Dieser Bildtext kann eine kurze Beschreibung des Bildinhaltes oder auch ein Hinweis auf den Urheber sein. Falls vorhanden, wir das Beschriftungsfeld mit den passenden EXIF/IPTC-Daten belegt.

Der Text wird je nach verwendetem WordPress-Theme direkt unter dem Bild angezeigt. Deshalb sollte dieser Text auch nicht zu lang sein.

Auch dieser Text ist für Suchmaschinen wichtig, falls er als Bildunterschrift sichtbar ist, da er sich in unmittelbarer Nähe des Bildes befindet.

Beschreibung – Description

Im vierten Feld kann ich eine längere Beschreibung des Bildes eintragen. Dieser Text enspricht dem normalen Inhalt bei Artikeln oder Seiten. Hier kann ich auch HTML-Tags verwenden und Links einfügen.

Der Text wird auf der Bilder-Einzelseite angezeigt. Diese Seite enthält alle vier Text-Elemente, die einem Bild zugeordnet werden können.

Der Titel erscheint als Seitenüberschrift, danach kommt das Bild mit dem Alt-Text gefolgt von der Bildunterschrift. Darunter wird die Beschreibung als Artikeltext ausgegeben.

Ein Bild sagt nicht immer mehr als tausend Worte

Auch wenn es mehr Arbeit bedeutet, ich trage immer sinnvolle Texte in die vier Textfelder ein. Naja, fast immer.

Beim „Alternate Text“ spare ich mir einen extra Eintrag, da dieser dann mit dem Titel-Text identisch ist. Ein guter Titel ist jedoch wichtig. In die Beschriftung kopiere ich meist den Titel rein. Ja, ich bin auch ein bißchen faul. :-)

Die ausführliche Beschreibung fülle ich nur dann aus, wenn ich nicht auf das Bild selbst, sondern die Bildseite verlinke. Das mache ich zunehmend bei der Putzlowitscher Zeitung, hier bei Schnurpsel aber nicht.

Ganz ohne Text geht es nicht. Besonders wenn der Bilddateiname z.B. DSC00547.JPG ist, würd ich immer zumindest einen ordentlichen Titel vergeben. Noch besser ist es, der Datei selbst schon einen schönen Namen zu geben, dann klappts auch mit der Google-Suche.

14 Kommentare »

Lustige Link-Liste *lach*

Google: lustige LinklisteHeute gab es bei seokratie.de eine Diskussion über den Googlebot. Dieser holt sich wohl auch Seiten, die per robots.txt gesperrt sind.

Ich wollte es ja nicht glauben, denn ich habe z.B. ein paar Botfallen ausgelegt, in die regelmäßig nur die ganz wilden Bots rennen, die sich eben nicht an die Vorgaben in der Robots-Datei halten.

Nun habe ich mir mal eine meiner Seiten angeschaut, die von Anfang an jedem Bot alles verbietet. Mit der Google-Site-Abfrage ergibt sich da eine lustige Linkliste, praktisch ohne Inhalten und zum großen Teil auch ohne Seitentitel. Da wo es Seitentitel gibt, sind diese mehrere Jahre alt, denn ich hab mittlerweile die Titel etwas umgebaut.

Als ich damals gemerkt hatte, daß einige Seiten im Google-Index auftauchen, habe ich die komplette Website in den Webmastertools gesperrt. Seitdem (Dezember 2009) hält sich der Googlebot auch daran, wie ich in den Logfiles gesehen habe.

Ich könnte mir vorstellen, daß die robots.txt aus welchen Gründen auch immer kurzzeitig nicht erreichbar/lesbar war und der Bot daher angefangen hatte, die Seiten einzulesen. Kürzlich ist mir der Googlebot wegen eines Serverproblems in die Botfalle getappst. Bis ich das gemerkt hatte, war er für knapp eine Woche ausgesperrt. Das Ergbnis war deutlich zu sehen. :-)

Keine Kommentare »

Googlebot-Image aus dem Winterschlaf erwacht?

Googlebot - Erfassung von Bildern nach Tagen 03/2011

Ich beobachte ja praktisch alles und jeden. :-)

So ist mir heut aufgefallen, daß der „Googlebot-Image/1.0“ seit dem 9. März wieder sehr fleißig bei der Erfassung von Bildern mitarbeitet und nicht fast alles dem normalen „Googlebot/2.1“ überläßt. Zwischen 75 und 115 Bildern am Tag holte sich der Bot in den letzen Tagen bei putzlowitsch.de ab, das ist ein recht ordentlicher Wert.

Ab November/Dezember 2010 hatte der Googlebot-Image seine Aktivitäten stark zurück gefahren.

Googlebot - Erfassung von Bildern nach Monaten 03/2011

Von Dezember 2010 bis Februar 2011 hatte der Googlebot-Image (rot) im monatlichen Tagesmittel weniger Bilder erfaßt, als der normale Googlebot (blau).

Ich weiß zwar noch nicht genau, was das alles zu bedeuten hat, werde aber weiter dranbleiben und gegebenenfalls berichten.

Ein Kommentar »