Die UND-Verknüpfung der Suchbegriffe
Bisher hatte ich gedacht, daß Google eingegebene Suchwörter UND-verknüpft, also jedes weitere Wort die Suche einschränkt. Nach dieser Vorstellung müßte sich die Trefferzahl mit jedem weiteren Suchbegriff verringern.
Oder anders herum gesagt sollte die Anzahl der ungefähren Ergebnisse steigen, wenn ich einen Teil der Suchphrase entferne. Zumindest sollte die Zahl nicht kleiner werden, denn die Suche ist ja dann weniger spezifisch. Das scheint aber nicht der Fall zu sein.
Aufgefallen ist mir das bei der Suche nach 111111 km. Ich hatte da kürzlich bei Putzlowitsch etwas zum Kilometerstand 111111 geschrieben. Als Ergebnis zeigt Google eine Trefferzahl von knapp 70 Millionen an:
Nun wollte ich sehen, wo mein Bild nur für die Zahl 111111, also ohne km (Kilometer) zu finden ist:
Erwartungsgemäß landet das Bild weiter hinten, so auf Position 20, was schonmal daran liegen dürfte, daß es ja viel mehr Treffer ohne km geben wird. Aber was zeigt Google da oben an? Angeblich gibt es nur ungefähr 1,5 Millionen Ergebnisse.
Die Frage ist nun, warum das so ist. Stimmt einfach die angezeigte Anzahl der ungefähren Ergebnisse nicht, hier immerhin um Größenordnungen, oder ist meine Annahme der impliziten UND-Verknüpfung einfach falsch. Oder ist der Grund ein ganz anderer?
Wie filtert das SafeSearch-Filter
Schon vor einiger Zeit war mir eine andere Ungereimtheit aufgefallen. Beim SafeSearch-Filter in der Google-Bildersuche gibt es drei Stufen, strikte Filterung, moderate Filterung und keine Filterung. Google hat erst kürzlich SafeSearch in einem kleinen Video erklärt, man kann eine kurze Beschreibung der drei Filtertypen auch hier nachlesen.
Die Voreinstellung ist „SafeSearch – Moderat“, für die Suche nach Gurke wird eine Anzahl von ungefähr 386000 Ergebnissen ausgegeben:
Wenn ich nun das SafeSearch-Filter auf „Aus“ stelle, werden es nicht etwa mehr, sondern weniger Bilder, nämlich 359000:
Nach meinem Verständnis müßten es aber mehr Treffer werden, denn es wird ja nun gar nicht mehr gefiltert. Selbst wenn ich annehme, daß es überhaupt keine anstößigen Bilder gibt und deshalb bereits bei moderater Filterung alle Bilder angezeigt werden, sollt der Wert dann aber zumindest gleich bleiben und nicht kleiner werden.
Die Abweichung ist beim SafeSearch-Filter zwar nicht so groß, wie bei der UND-Verknüpfung, logisch nachvollziehen kann ich das aber irgendwie nicht. Vielleicht ist ja alles doch nur eine Anzeigeproblem, wer weiß.
Google-Bildersuche, das unbekannte Wesen
Das sind nur zwei der Geheimnisse der Google-Bildersuche, es gibt noch ein paar andere, die eher das Ranking der Bilder betreffen. Die Google-Suche ist ohnehin weitestgehen eine große Blackbox, deren innere Funktion sich mir (und auch anderen) wohl nie erschließen wird.