Internet « Schnurpsel

Gibt es „duplicate content“ bei der Bildersuche?

01.04.2010 20:49 von schnurpselchen in Bildersuche, Internet

Klar gibt es duplicate content (DC) bei der Bildersuche. Wenn ein Bild als Kopie mehrfach existiert, dann ist das „Duplizierter Content„. Es gibt bestimmt nicht wenige Bilder, die nicht nur zweifach, dreifach sondern tausendfach, ja sogar millionenfach existieren. :-)
Nehmen wir nur diese kleinen Kollegen hier, die kommen bestimmt in fast jedem Forum oder Blog dieser Welt vor. Das eigentliche Problem für die Suchmaschinen ist nun, welches der mehrfach vorhandenen Bilder optimalerweise in den Suchergebnissen angezeigt wird.

Instabiles Brötchen

Durch die Brötchen-Ritter-Aktion habe ich seit Ende Januar 2010 die Brötchenbilder unter Beobachtung. Dabei ist mir eher zufällig das Bild auf Platz 9 der Bilder-Suchergebnisse aufgefallen. Das Bild ist immer dasselbe, nur die Bild-URL und referenzierende Seite änderten sich ständig. Des Rätsels Lösung ist erstmal recht einfach, die Website der Bäckerei Soetebier existiert unter drei Domainnamen. Unter www.ihr-broetchendienst.de, www.dorfbaeckerei-soetebier.de und www.baeckerei-soetebier.de werden identische Inhalte und auch identische Bilder angezeigt.

Google konnte sich vom Beginn meiner Brötchenbeobachtung für etwa 10 Tage nicht für eine Seite enscheiden. Ist auch nicht einfach, bei exakt denselben Inhalten und Bilddaten. Die Onpage-Faktoren könne so kaum einen Anhaltspunkt liefern.

Brötchen fast stabil

Ungefähr ab dem 11. Februar bis zum 6. März ist dann eine recht stabile Phase zu beobachten, die nur wenige, einzelne Aussetzer beinhaltet. Google hatte sich für die Domain www.dorfbaeckerei-soetebier.de entschieden. Aber warum? Darüber kann ich jetzt nur spekulieren.

Ein paar Onpagefaktoren gibt es natürlich schon, wenn man einen Bezug zum Domainnamen herstellt. So wird auf der Startseite gleich am Anfang die „Dorfbäckerei Soetebier“ genannt. Zudem gib es auf jeder Seite im Kopfbereich die Kontaktdaten, wo mit einer E-Mail-Adresse auf dorfbaeckerei-soetebier.de verwiesen wird. Das spricht für die Dorfbäckerei-Domain.

Andererseits steht im Titel-Tag der meisten Seiten „Bäckerei Soetebier“ ohne Dorf, was eher auf die Nur-Bäckerei-Domain hindeutet. Schließlich findet man den Begriff Brötchendienst überhaupt nicht auf einer der Seiten, was gegen „Ihr Brötchendienst“ spricht.

Das alles hilft zwar vielleicht für Dorfbäckerei oder Bäckerei, aber nicht beim konkreten Suchbegriff „Brötchen“ weiter, denn dafür würde ich ihr-broetchendienst.de favorisieren. Schließlich ist dort das Keywort im Domainnamen enthalten.

Vermutlich spielen eher die externen Faktoren wie die Verlinkung eine wichtigerer Rolle. Dazu habe ich den Yahoo-Siteexplorer befragt und ein recht überschaubares Ergebnis erhalten. Rein quantitativ betrachtet liegt hier dorfbaeckerei-soetebier.de mit 11 Backlinks vor baeckerei-soetebier.de mit nur 4 Links. Die Domain ihr-broetchendienst.de kennt Yahoo (noch) nicht.

Das Alter einer Domain läßt sich ja für DE-Domains nicht direkt ermitteln. Netcraft sagt für alle drei Domains „first seen“ September 2001. Bei der WayBack-Machine findet man für baeckerei-soetebier.de den ersten Eintrag vom Mai 2001, für dorfbaeckerei-soetebier.de vom August 2002 und für ihr-broetchendienst.de gar nichts.

Plausibel oder irgendwie nachvollziehbar ist das alles aber nicht.

Brötchen wieder in Bewegung

Seit nunmehr über drei Wochen denkt Google wieder drüber nach, welche Seite denn nun für das Brötchenbild am relevantesten ist. Dieser Zeitraum deckt sich übrigens recht gut mit den schon länger anhaltenden Schwankungen in der Bildersuche. Sollte die Bildersuche insgesamt nun dynamischer geworden sein, als jemals zuvor?

Wie auch immer, Duplicate Content stellt für die Bildersuche selbst kein Problem dar. Nur für die Suchmaschine ist die Entscheidung schwerer, welche Seite denn für ein Suchergbnis konkret angezeigt werden soll.

Dem Bildersuchenden kann es letztendlich egal sein, denn er sucht ja das Bild. Und Bild bleibt Bild, egal auf welcher Website.

Nachtrag 8. April:
Da hatte ich diesen Artikel hier grad fertiggestellt und was passiert einen Tag später? Es kommt eine weitere Bäckerei-Domain hinzu:

Für diese neue aufgetauchte Domain www.ihr-online-beacker.de trifft dasselbe zu, wie für www.ihr-broetchendienst.de. Der Yahoo-Sitexplorer kennt sie nicht, Netcraft behauptet „first seen“ im September 2001 und die WayBack-Machine findet gar nichts.

Mal sehen, wieviele Domains in Zukunft noch hinzukommen … :-)

2 Kommentare »

Hurra, hurra, Rivva ist wieder da! :-)

30.03.2010 08:55 von schnurpselchen in Blog, Internet

Rivva hatte in den letzen Tagen auf Grund von Serverausfällen mit einigen Problemen zu kämpfen, war tagelang nicht erreichbar. Dann war auch noch Rivva-Mastermind Frank Westphal krank geworden.

Wenn Rivva down ist, fehlt der schnelle Überblick über die angesagten Themen der deutschen Blog- und Twitterlandschaft. Zum anderen ist Rivva ein wichtiger Faktor in der zusammengerechneten Blog-Top-Liste.

Nun ist Rivva wieder da, die Leitmedien zwar noch auf dem Stand vom 26. März, aber zumindest kann man schauen, was so los ist. Da will ich mal hoffen, daß das nun etwas länger so bleibt. Ich bin auch gern dazu bereit, etwas dafür zu tun, einen Beitrag zu leisten, aber wie und was könnte helfen?

Keine Kommentare »

Aktuelle Brötchen-News vom 27.03.2010

27.03.2010 19:31 von schnurpselchen in Bildersuche, Internet

Nach den positiven Meldungen vom12. und vom 17. Februar kann ich dieses mal nur wenig erfreuliches berichten.

Die gute Nachricht zuerst: Ritter Gerald steht mit seinem SEO-Brötchen tapfer wie eine Eins direkt auf Platz 2 unmittelbar hinter der dunklen Brötchen-Macht. Er hat sich von den Kämpfen auf dem Brötchfeld bisher nicht beeindrucken lassen.

Und nun die schlechte Nachricht: Ritter Ingo mußte mit seinem Brötchen ein paar Federn lassen und ist auf den 5. Platz zurückgefallen. Wie man beim Brötchen-Beobachter sehen kann, ging es in zwei Tagen um zwei Plätze nach unten. Das kann man schon fast als erdrutschartige Verluste bezeichnen, zumal es sich diesmal nicht nur um Filtereffekte von Google SafeSearch handelt.

Sollte etwa meine Linkaufbau-Strategie nach hinten losgegangen sein? Oder hängt das einfach nur mit den derzeitigen Schwankungen bei der Bildersuche zusammen?

Das muß man einfach abwarten. Allerdings habe ich das unbestimmte Gefühl, daß sich in den nächsten Tagen noch einiges mehr in der Google-Bildersuche bewegen wird. In welche Richtung kann ich nicht sagen, aber es wird nichts mehr sein wie früher. :-)

Google-Bildersuche instabil

26.03.2010 22:36 von schnurpselchen in Bildersuche, Internet

: Google-Bildersuche: Banane

: Google-Bildersuche: Katze

: Google-Bildersuche: Bildersuche

Im Moment, oder genau genommen schon länger, sind die Ergebnisse der Google-Bildersuche äußerst instabil. Das betrifft einerseits das Ranking, aber andererseits besonders auch die Anzahl der Bilder. Bei Banane schwanken die Zahlen z.B. zwischen 225000 und 773000 hin und her, bei Katze zwischen 260000 und 832000 und bei Bildersuche zwischen 136000 und 226000.

Besonders gut kann man das sehen, wenn man für den gleichen Suchbegriff einmal images.google.de und dann www.google.de befragt. Es klappt nicht immer, aber nach ein paar Versuchen ergeben sich die Unterschiede. Die Frage ist nun, welche Werte stimmen bzw. die neuen sind und welche noch nicht aktualisiert wurden. Naja, muß man halt alles weiter beobachten…

Referertrick – Referer-Spam mit System

25.03.2010 20:04 von schnurpselchen in Geld verdienen, Internet

Referer-Spam ist ja nichts Neues, dazu habe ich schon vor einiger Zeit etwas geschrieben.

Gefälschter Referer -> Spam

Der Referer wird normalerweise beim Aufruf einer Seite vom Web-Browser des Benutzers an den Webserver im sogenannten HTTP-Request mitgeschickt, kann aber ebenso fehlen oder sonst irgendwie verändert sein. Da diese Information beliebig gesetzt werden kann, ist nicht gewährleistet, das sie auch stimmt. Genau solche „gefälschten“ Referer machen sich Spammer zu Nutze und setzen den Refefer auf eine Seite, von der gar kein Link auf die aufgerufene Seite zeigt.

Spamziel -> Neugierige Webmaster und öffentliche Statistik

Was hat ein Spammer nun von so einem auf eine „beworbene“ Seite zeigenden, falschen Referer? Zwei Aspekte spielen dafür eine wichtige Rolle.

Zum einen die Neugier des Webmasters, der gerne wissen möchte, wer denn da und warum auf die eigene Seite verlinkt. Damit hat die bespammte Seite schonmal einen Besucher mehr. Ich gebe zu, ich gucke da auch manchmal nach, woher die Links kommen :-)

Zum anderen gibt es Webseiten, die ihre Zugriffsstatistik öffentlich einsehbar auf einer Seite bereitstellen. Meist gibt es da auch einen Bereich mit der Herkunft der Besucher, als der referenzierenden Webseite, die dann oft sagar als Link ausgegeben werden. Über die Bedeutung von Links im allgemeinen und für das Suchmaschinen-Ranking im besonderen brauche ich wohl keine großen Worte verlieren.

Referer-Spam mit System

Seit ein paar Tagen, konkret seit dem 18. März, befinden sich in meinen Log-Dateien Referer von der Seite referertrick.com (seit kurzem auch mit .de).
Die Zugriffe kommen bisher von den drei IP-Adressen 87.118.82.66, 87.118.82.104 und 87.118.116.23. Ich habe noch etwas „zurückgeblättert“ und festgestellt, daß es bereits im Dezember 2009 ein paar Zugriffe von einem Bot namens „SourceSpider/2.1“ über die IP 87.118.82.66 gab. Im Januar wurde vermutlich eine Testlauf gestartet, da tauchte dieser Server mit „Kunden-Referer“ auf.

Auf der referertrick-Webseite heißt es ganz unverblümt:

Wir senden HTTP-Pakete an alle Webseiten des Internets. Dabei wird Ihre Webseite als Referer aufgelistet.
Die Inhaber dieser vielen (teilweise Millionen) anderen Webseiten glauben daher, dass Sie auf diese Webseite verlinken würden, und besuchen Ihre Webseite aus Neugierde.
Jeder Besucher ist ein potentieller Kunde, ganz zu schweigen von der Suchmaschinen-Optimierung durch die vielen Statistik-Links!

Geld verdienen im Internet

Das Ganze klingt natürlich erstmal nach einer cleveren Geschäftsidee. Ich halte es allerdings für eine weitere Art von Spam, die irgendwann nur nervig ist.

Irgendwie paßt das auch ganz gut zum aktuellen Thema des Webmasterfridays „Was ist die richtige Linkbuilding-Strategie?“ :-)
Allerdings denke ich, daß dieser Art gekauftes „Linkbuilding“ über gefakte Referer auf Statistikseiten keine gut Strategie ist.

Google-Analytics und externe Statistik nicht betroffen

Wenn sich nun jemand wundert, daß bei ihm noch keine Referertricks angekommen sind, liegt es vielleicht daran, das die Statistik nicht über die Serverlogdatei funktioniert oder direkt auf dem Server läuft. Technisch bedingt sind keine Statistik-Tools betroffen, die extern per Javascript oder „Zählerpixel“ eingebunden werden. Der Referertrick-Bot führt, davon gehe ich einfach mal aus, schließlich kein Javascript aus oder lädt per IMG-Tag eingebundene Grafiken nach. Somit sehen Statistik-Tools wie Google-Analytics, WordPress.com Stats oder auch Piwick diese falschen Referer erst gar nicht.