Das Putzlowitsch Test- und SEO-Blog

Bananen – gelber als gelb und größer als groß

Google-Bildersuche: Bananen

Meine Bananen mit dabei

Wenn man in der Google-Bildersuche nach Bananen sucht, zeigt sich derzeit eine Ergebnisseite wie oben abgebildet. Das Bild auf Platz 3 ist von mir (putzlowitsch.de).

Die Ergebnisse der Bildersuche kann man nach einigen Kriterien filtern, so z.B. nach Farbe, Größe und Bildtyp (Foto, Clipart, Zeichnung). Mit jedem Filter oder deren Kombination fallen Bilder unter den Tisch, weil sie nicht den Filterbedingungen entsprechen. Auch das Ranking ändert sich, da die Filterwerte wohl auch quantitativ gewertet werden.

Bananen gelber als Gelb

Google-Bildersuche: Bananen (gelb)

Mein erster Test gilt dem Farbfilter. Bei Bananen erwartet ich, daß sie schön gelb aussehen, zumindest dann, wenn sie schon reif sind, nicht etwa weiß. :-)

Das Gelb-Filter filtert die etwas blasse Lachbanane aus, die vorher auf Platz 2 lag. Ein anderes Bananenbild (vorher Platz 5) schiebt sich vor mein weiterhin drittplatziertes Bananenbild. Vermutlich ist es gelber als mein Bild, hat einen großeren Gelbanteil.

So weit, so gut. Allerdings ist das Bild auf Platz 3 nicht mehr mein Bananen-Bild, sondern eine Kopie auf einer anderen Webseite. Nun frage ich mich, oder besser gesagt Google, was an der anderen Seite in Bezug auf gelbe Bilder besser ist. Ist die Seite selbst etwa gelb oder gibt es da noch mehr gelbe Bilder oder warum ist meine Seite nicht mehr gut genug?

Auf meiner Bananen-Seite gib es auch noch schöne, gelbe Bananen-Bilder. Die geklaute Banane bei gesundlichleben.com ist wohlgemerkt eine exakte, auf das Byte übereinstimmende Kopie meines Bildes. Das Bild selbst kann also nicht für den veränderten Treffer verantwortlich sein. Aber was dann?

Bananen größer als groß

Beim Größenfilter sieht es ähnlich aus, die Suche nach großen Bildern sieht mein Bild sogar auf Platz 1, allerdings auch wieder nur die geklaute Kopie. Das Bild scheint nicht nur gelber als Gelb, sondern auch größer als groß zu sein.

Auch bei der Suche nach Fotos macht die Kopie eine bessere Figur als mein Original-Bananen-Bild. Interessanterweise ist mein Bananenbild sowohl Foto als auch Clipart, denn auch beim Filter „Clipart“ wird es angezeigt, oder besser gesagt die Kopie meines Bildes.

Google – die Qualitäts-Suchmaschine

Ich finde es erstaunlich, daß es ein und dasselbe Bild je nach Bilder-Filter bei der Google-Bildersuche zu anderen Bildern (Kopien) bzw. Seiten führt.

Mir ist schon klar, daß es aus Benutzersicht egal ist, welches Bild auf welcher Seite bei identischen Kopien angezeigt wird. Bild ist Bild und bleibt Bild. Mich würde eher der technische Hintergrund interessieren, der zu diesen, meiner Meinung nach nicht logisch nachvollziehbaren Ergebnissen führt.

Aber was ist bei der Bildersuche oder Suche ganz allgemein schon logisch? Manchmal habe ich den Eindruck, daß die Ergebnisse einfach ausgewürfelt werden. Aber Gott (Google) würfelt doch nicht! :-)

Keine Kommentare »

Weiße Banane auf weißem Grund

Google-Bildersuche: Weiße-Banane

Spitzen-Banane unsichtbar

Wenn man in der Google-Bildersuche nach Banane sucht, zeigt sich derzeit eine Ergebnisseite wie oben abgebildet. Das Bild an der Top-Position oben links scheint zu fehlen. Zunächst dachte ich an einen Übertragungsfehler oder etwas ähnliches.

Beim Überfahren mit der Maus ploppt aber das gewohnte Fenster mit den Datails auf. Auch hier ist kein Bild zu sehen, zumindest stehen dort aber die Bildinfos wie Größe, Bildtyp und Name. Demnach handelt es sich um ein 600 x 350 Pixel großes Gif-Bild mit dem Namen „baum.gif“.

Wenn man dem Link folgt, landet man auf der Startseite der Bananen-Seite. Hier mußte ich das Bild erstmal suchen. Es ist kein weißes Bild, sondern ein transparentes GIF-Bild, welches über dem „Ich bin eine Beere“-Bild liegt, warum auch immer (als „Kopierschutz“?).

Weitere Größen und Suche mit Bild

Interessant wird es dann, wenn man die Option „Weitere Größen“ anklickt. Hier präsentiert Google eine bunte Liste von Bildern einfarbiger Flächen, immerhin sagenhafte 167 Millionen.

Auch die Verwendung des Bildes kann sich sehen lassen. Die Suche mit Bild fördert gut 33 Millionen Seiten mit übereinstimmenden Bildern zu Tage. Besonders beeindruckend finde ich die „Vermutung für dieses Bild“: schwarzer Hintergrund.

So abwegig ist das gar nicht mal, denn das GIF-Bild enthält eine Farbpalette mit vier Werten. Enthalten sind zweimal Schwarz (Index 0 und 3), einmal Weiß (Index 1) und einmal Transparenz (Index 2). Aller „sichbaren“ Pixel im Bild zeigen aber auf Index 2.

Andererseits steht das etwas im Widerspruch zum Farbfilter in der Bildersuche. Nur wenn man dort die weiße Auswahlfläche anklickt, wir das Bild angezeigt. Also ist Google wohl doch eher der Meinung, daß es eine weiße Banane auf weißem Grund ist. :-)

Google – die Qualitäts-Suchmaschine

Ich finde es erstaunlich, daß es ein inhaltsleeres Bild, welches zudem noch baum heißt, bei der Google-Bildersuche nach Banane auf Platz 1 liegt.

Mir ist schon klar, daß die Bildersuche noch meilenweit von einer inhaltsbasierten Bilderkennung entfernt ist. Die Zuordnung wird immer noch aus dem textlichen Kontext abgeleitet. Aber so ein bißchen Bildinhalt analysiert Google schon, seien es nun die Farben, Gesichter, ähnliche Bilder usw.

Selbst mit recht primitiver Statistik über das Bild sollte klar sein, daß da nichts enthalten ist, keine Kontraste, überhaupt nichts. Und so ein „Bild“ hebt Google auf den ersten Platz der Bildersuche nach Banane. Da ist noch einiges an Verbesserung und Arbeit zu leisten, würde ich sagen.

Weitere Artikel mit Bezug zu diesem:
3 Kommentare »

Bilder-Links setzen und Hijacking verhindern – mit nofollow

Was ein Hotlink ist und wie man Hotlinks mit der Google-Bildersuche aufspüren kann, hatte ich kürzlich erläutert. Wirklich verhindern kann man das Hotlinking und Hijacking durch andere auf die eigenen Bilder nicht. Für den umgekehrten Weg gibt es aber eine einfache Möglichkeit.

Simsalaseo zeigt den Weg

Schon in den ersten Tagen des Simsalaseo-Bilder-SEO-Wettbewerbs zeigte sich, daß einige unvorsichtigerweise in den Kommentaren anderer Teilnehmer verlinkten Bilder dann plötzlich in den Bilder-Suchergebnissen mit den Seite der jeweilgen Kommentare assoziiert wurden.

Bei meiner Top-100 gab es auch zunächst Bedenken, ob etwas Ähnliches passieren könnte. Immerhin werden da nicht nur die besten 100 Seiten, sondern auch die jeweiligen Bilder direkt verlinkt.

Da ich aber sowohl die Seiten als auch die Bilder mit dem Attribut rel=’nofollow‘ verlinkt habe, passierte nichts. Alle Bilder blieben in den Bilder-SERPS mit ihren Ursprungsseiten verknüpft.

Der Grund dafür hätte aber auch nicht das nofollow sein können, sondern einfach eine zu schwache Seite. Das Hijacking funktioniert nur für ausreichend starke Zielseiten. Als Test habe ich nach Ende des Wettbewerbs am Freitag abend das rel=’nofollow‘ bei der Top-100 entfernt.

Alle Bilder zu schnurpsel.de

Simsalaseo Bilder-Hijacking durch schnurpsel.deDie Auswirkungen zeigten sich recht schnell, bereits gegen Mitternacht waren viele Simsalaseo-Bilder zu schnurpsel.de „umgezogen“. Im Laufe des Samstags wurden es immer mehr, bis zeitweilge 80 bis 90% davon betroffen waren.

Am Sonntag habe ich dann das nofollow in die Links reingenommen und wenige Stunden später war der Spuk auch schon vorbei.

Hijacking mit nofollow verhindern

Als Ergebnis des Tests läßt sich feststellen, daß bei Links auf Bilder mit dem Attribut rel=’nofollow‘ das Hijacking dieser Bilder wirksam verhindert werden kann. Wer also aus welchen Gründen auch immer fremde Bilder verlinkt, sollte dieses mit nofollow tun, zumindest dann, wenn eine „feindliche Übernahme“ der Bilder nicht beabsichtigt ist.

Das Attribut rel gibt es allerdings nur für Links wie

<a href="..." rel="nofollow">Text</a>

Für direkt per Image-Tag eingebundene Bilder wie

<img src="...">

funktioniert das nicht. Da ist im HTML-Standard kein rel-Attribut vorgesehen und es wird folglich ignoriert.

Weitere Artikel mit Bezug zu diesem:
6 Kommentare »

Google meint: WordPress Aktualisierung verfügbar

Google-Webmastertools: WordPress Aktualisierung

Heute begrüßten mich die Google-Webmastertools wieder mal mit drei wichtigen Meldungen zur WordPress-Aktualisierung. Das ist nicht das erste Mal und meistens hat Google auch recht. Bei meinem extra neu für Simsalaseo Ende August aufgesetzten WordPress bei gerech.net stimmt das aber definitiv nicht. Mir ist zumindest nicht bekannt, daß es im Moment eine neuere WordPress-Version als 3.2.1 gibt.

The latest stable release of WordPress (Version 3.2.1) is available in two formats from the links to your right.

So steht es auf der Download-Seite bei WordPress.org.

Da stellt sich mir die Frage, wie Google eigentlich die WordPress-Version einer Seite erkennen will. Der Meta-Eintrag im Header der Seite kann es nicht sein, da steht bei gerech.net folgendes drin:

<meta name="generator" content="WordPress 3.2.1" />

Es gibt ja noch ein paar andere Möglichkeiten, die WordPress-Version herauszufinden. Aber auch im Feed und in der readme.html bzw liesmich.html steht WordPress 3.2.1.

Also wo liegt das Problem? Hat Google die Version bei der Seite nicht erkannt oder nimmt Google fälschlicherweise an, daß es bereits eine neuere WordPress-Version als 3.2.1 gibt?
Ich habe keine Ahnung.

Keine Kommentare »

Google Apps Probeaccount – Spam, Phishing oder was?

Komische E-Mails

Vor ein paar Tagen erhielt ich eine E-Mail mit Zugangsdaten für einen „Google Apps Professional Edition„-Probezugang. Da diese E-Mail an eine nicht existierende Adresse ging und ich auch mit einem „integrierten Angebot für Unternehmen“ nichts anfangen kann, schließlich bin ich keine Firma, habe ich die Sache als Spam oder Phishing beiseite gelegt.

Heute kam dann diese freundliche Erinnerung:

Hello,

We hope this sample account has helped your business evaluate Google Apps. This is just a friendly reminder that your sample account will expire in 4 days on Sep 25, 2011.

Thanks again,
The Google Apps Team

Auch diese ging an dieselbe, nicht existieren E-Mail-Adresse und auch hier gab es als Anrede nur ein „Hello“, keinen Namen. Aber bei soviel Hartnäckigkeit wollte ich nun doch mal sehen, was dahinter steckt.

Alles echt?

Soweit ich das beurteilen kann, kommen die E-Mails tatsächlich von Google. Im Mail-Header findet man als Ausgangspunkt folgende Stationen:

  • gye5.prod.google.com
  • wpaz13.hot.corp.google.com
  • smtp-out.google.com

So ähnlich sieht das auch bei einer E-Mail aus, die ich vom Google-Support zu einem AdWords-Problem erhalten hatte.

Die Loginseite gibt es wirklich, sie liegt auf www.google.com mit einem gültigen SSL-Zertifikat. Der Login funktioniert mit genau der angegebene Subdomain allysonschnurpselde.sample-ga.com, alle Abweichungen erzeugen eine Fehlermeldung.

Die Domain sample-ga.com führt zwar nur ins Nichts, ist aber eine von „Google Inc. Mountain View CA 94043“ registrierte Domain.

Nach dem erfolgreichen Login landet man im Dashboard:
Google-Apps: Dashboard

Sieht erstmal aufgeräumt aus, alle Menüpunkte lassen sich auswählen und führen zu entsprechenden Unterseiten, wie z.B. Settings. Nur beim Aufruf der Punkte „Organization & users“ und „Groups“ wurde ich zu einer „Verify your account„-Seite umgeleitet. An der Stelle bin ich dann ausgestiegen. Meine Mobilfunknummer gebe ich nicht irgendwo zum Spaß ein.

Ich bin ratlos

Alle technischen Parameter sprechen dafür, daß die Sache tatsächlich von Google kommt. Was mich aber etwas ratlos macht ist die Tatsache, daß die E-Mail an eine geratene E-Mail-Adresse auf Verdacht an eine Domain geschickt wurde. Immerhin richtet sich das Angebot an Unternehmen und schnurpsel.de ist gewiß keine Firma.

Sollte es etwa daher kommen, daß ich in den letzten Wochen ein paar AdWords-Anzeigen für simsalaseo und JahresendSEO geschaltet hatte? Das könnte für Google ein Indiz dafür gewesen sein, daß schnurpsel.de ein Unternehmen sein könnte. Wer schaltet denn auch nur zum Spaß AdWords-Anzeigen? :-)

Warum wurde dann aber diese E-Mail nicht an meine bei AdWords hinterlegten Daten geschickt, sondern an eine zufällige Adresse und ohne Anrede? Sowas ist ja ein typische Muster für Spam- und Phishing-Mails.

Wie auch immer, ob das nun alles mit rechten Dingen zugegangen ist oder nicht ist egal. Ich brauche zumindest keine „Google Apps Professional Edition“ für mein nicht existierendes Unternehmen. Und Geld soll es dann auch noch kosten:

Like what you’ve seen? Get Google Apps for your business for €40.00 per user per year

Also doch Spam? :-)

Update 26. September:
Nachdem nun der alte Probeaccount gestern abgelaufen war und heute tatsächlich nicht mehr existiert, gab es gleich einen neuen. Diesesmal ist der Name noch abstruser:

chalupanrzqcschnurpselde.sample-ga.com

Irgendwas läuft da schief. Entweder ist doch alles nur ein Fake, dann aber sehr aufwändig gemacht, oder Google mutiert langsam zum Spam-Versender.

Update:
Wie ich gerade gesehen habe, kann sich praktisch jeder für so einen Probeaccount anmelden. Ich weiß zwar nicht genau wie, aber möglicherweise könnten Spammer das geschickt ausnutzen, um E-Mail-Adressen zu verifizieren. Zumindest sind die zwei E-Mail-Adressen, an die das bisher bei mir ging, typische, geratene Adressen, wie Spamversender sie oft verwenden.

Weitere Artikel mit Bezug zu diesem:
Keine Kommentare »