Das Putzlowitsch Test- und SEO-Blog

Mit der Google-Bildersuche Hotlinks finden

Was ist ein Hotlink?

Wer weiß, was Hotlinks sind, was sie bewirken und was man gegen Hotlinks tun kann, der kann gleich zur Google-Bilder-Hotlinksuche springen.:-)

Hotlink Infografik

Seite A hat einen Artikel zum Thema Blumen erstellt. Dazu wurde auch ein schönes Blumenbild hochgeladen und in den Artikel eingebunden.

Seite B findet das Blumenbild auch ganz toll und bindet es in einem eigenen Artikel direkt von Seite A ein. Jedesmal, wenn Seite B aufgerufen wird, wird dort das Bild von Seite A abgerufen und angezeigt. Das ist ein echter Hotlink.

Seite C schreibt einen Artikel über Blumenvasen und setzt auf das Bild von Seite A einen normalen Link. Das Bild von Seite A wird nur dann abgerufen und angezeigt, wenn ein Leser auf den Link klickt. Das ist ein Link aber eigentlich kein Hotlink.

Was bewirkt ein Hotlink?

Der echte Hotlink durch Seite B hat zur Folge, daß jeder Aufruf der Seite B auch zusätzlichen Datenverkehr bei Seite A erzeugt. Dabei kann je nach Bildgröße und Besucherzahl einiges an Datenvolumen zusammen kommen. Wer in seinem Webhosting-Paket nur einen begrenztes monatliches Transfervolumen hat, für den könnten dadurch zusätzliche Kosten entstehen.

Blumen Bilder SERPsFür die Suchergbnisse von Suchmaschinen bewirkt ein Hotlink unter Umständen, daß nicht mehr die Ursprungsseite, sondern die hotlinkende Seite als Ergebnisseite angezeigt wird.

Bei der Google-Bildersuche würde z.B. zwar das Bild von Seite A angezeigt werden, allerdings führt ein Klick auf das Ergebnis zur hotlinkenden Seite B.

Aber auch der einfache Link auf ein Bild, obwohl er streng genommen kein Hotlink ist, kann in der Bildersuche dieselben Auswirkungen wie ein echter Hotlink haben.

Was kann man gegen Hotlinks tun?

Neben der Möglichkeit den Hotlinker zu bitten das Bild zu entfernen, notfalls auch mit juristischem Nachdruck, gibt es auch technische Mittel gegen Hotlinks.

So eine Hotlinksperre schützt streng genommen nicht vor dem Hotlinking selbst, sondern verhindert nur, daß ein Nutzer die Bilder auf der hotlinkenden Seite sieht. Die Links zu den Bildern bleiben bestehen und die Suchmaschinen-Bots merken nichts von der Sperre. So kann es passieren, daß die Hotlinkseite B trotz Hotlink-Sperre bei Google mit dem ursprünglichen Bild rankt bzw. die Ursprungsseite A ersetzt.

Wie kann man Hotlinks aufspüren?

Bei Hotlinks landen die Zugriffe auf ein Bild durch Seite B im Serverlog der Ursprungsseite A. Eine gute Möglichkeit, Hotlinks aufzuspüren, ist die Auswerteung des Referers in den Server-Logdateien. Da ein einfaches Durchsehen recht aufwändig sein kann, erledigt man das am besten mit Hilfe eines Programms oder z.B. eines PHP-Skripts.

Eine Empfehlung für ein passendes Programm oder PHP-Skript kann ich zwar nicht geben, werde demnächst aber hier mein eigenes, kleines PHP-Tool veröffentlichen.

Auch die Google-Bildersuche bietet die Möglichkeit, Hotlinks zu finden.

Wie kann man Hotlinks mit Google finden

Da die imagesite:-Abfrage leider nicht mehr funktioniert, muß man sich nun mit inurl: behelfen. Die inurl:-Abfrage wird dann mit einer außschließenden site:-Abfrage kombiniert.

Für die Bildersuche ergibt die Kombination

inurl:http://seite-a.de -site:seite-a.de

Treffer mit einem Bild von Seite A, welches nicht auf Seite A zu sehen ist. Das ist bei Hotlinks und Links der Fall. Für putzlowitsch.de sieht das z.B. so aus.

Man kann aber auch gezielt nach Hotlinks von einer bestimmten Seite suchen:

inurl:http://seite-a.de site:seite-b.de

Damit werden Bilder von Seite A angezeigt, die von Seite B gehotlinkt bzw. gelinkt werden. Bei blogspot.com werden z.B. diese Bilder von putzlowitsch.de eingebunden.

Für eine schnellere Übersicht könnte man die Ausgabe auf das alte Layout mit dem Parameter sout=1 erzwingen, zudem liefert die Abfrage in Abhängigkeit von der Sprache und den SafeSearch-Einstellungen bisweilen andere Ergebnisse.

Damit ihr euch die kompliziert Abfrage nicht per Hand zusammenbasteln müßt, habe ich ein Formular mit etwas Javascript drum herum erstellt. Damit kann die Hotlinksuche bequem erstellt werden.

Das Hotlink-Suchformular

Damit das Formular sichtbar ist und funktioniert, muß Javascript aktiviert sein.

In Domain kommt die Ursprungsseite der Bilder, falls es eine Subdomain ist, muß diese mit angegeben werden (z.B. images.seite-a.de).

Bei Weitere Seiten kommen die mit Leerzeichen getrennten Namen von Seiten rein, für die mit (●) ausschließen keine Hotlinks angezeigt werden sollen. Ist (●) einschließen ausgewählt, wird die Logik umgedreht. Es werden dann nur Hotlinks von den angegebenen Seiten angezeigt.

Die Optionen sind selbsterklärend, würde ich sagen.

Auf [Los] gehts los. Es wird ein neues Browserfenster mit der erstellten Google-Suche geöffnet. Falls das Fensteröffnen in den Browsereinstellungen nicht erlaubt ist, kann auch der links eingeblendete Link „Hotlinks finden“ angeklickt werden.

Ich will auch einen wesentlichen Nachteil der inurl:-Suche gegenüber der imagesite:-Suche nicht verschweigen. Die site:– bzw. frühere imagesite:-Abfrage beziehen sich tatsächlich auf den Domainnamen der Seite. Die inurl:-Abfrage ist da, wie der Name auch erwarten läßt, deutlich größzügiger.

Die Abfrage

inurl:http://seite-a.de

findet auch Bilder wie z.B.

http://seite-b.de/screenshot/?s=http://seite-a.de

. Das ist natürlich kein Hotlink oder Link zur Ursprungsseite. Aber solche Treffer muß man dann einfach ignorieren.

6 Kommentare »

Nicht atomare Ranking-Abfrage in der simsalaseo-Bildersuche

Nicht in einem Rutsch

Das Problem hatte ich schon vor einiger Zeit im Zusammenhang mit dem reVierphone SEO-Wettbewerb geschildert. Beim Erstellen von Rankinglisten aus Suchergebnisseiten von Suchmaschinen können prinzipbedingt immer Fehler auftreten.

Eine Abfrage der SERPs kann nicht fehlerfrei sein, da sie nicht atomar erfolgen kann. Das heißt, die Suchergebnisse können nicht in einer einzigen Abfrage zusammengefaßt werden und somit ändert sich möglicherweise der Zustand (das Ranking) von einer Abfrageseite zur nächsten.

Simsalaseo Top-100

Simsalaseo Top 100Auch bei meiner aktuellen simsalaseo-Top-100 kann es deshalb vorkommen, das Bilder doppelt in der Liste erscheinen. Zunächst dachte ich an einen Programmfehler in der Auswertung, aber die Rohdaten enthielten auch diese Duplikate.

Im Moment ist das zwar nicht mehr so häufig der Fall, aber in den ersten Tagen des Simsalaseo-Wettbewerbs habe ich das öfter beobachtet.

Besonders stark tritt der Effekt natürlich dann auf, wenn die SERPs noch heftig in Bewegung sind, wie das bei neuen Suchwörtern immer der Fall sein dürfte.

Für eine Top-100-Liste der normalen Suchergebnisse kann man sich noch mit Angabe der Ergebnisanzahl behelfen (Google: num=100), bei der Bildersuche gehen aber maximal 21 Treffer pro Abfrage.

Google SERPs nicht atomar

Doppelungen in den Google-Bilder-SerpsAber auch die Google-Suchergebnisseiten selbst haben das Problem der Nichtatomarität. Wenn man Seitenweise blättert, fällt das in der Regel nicht auf.

Bei der neuen Bildersuche hingegen kann man weich durch die Ergebnisse scrollen und so sind das Ende der aktuellen Seite und der Anfang der nächsten Seite gleichzeitig sichtbar. An diesem Übergang fallen Doppelungen besonders aus, wie in dem Screenshot zu sehen ist.

Es handelt sich dabei auch nicht etwa um jeweils dieselben Bilder in unterschiedlichen Größen, was zu einer nur scheinbaren Doppelung führen würde.

Google lädt erst bei Nutzeranforderung z.B. durch Scrollen weitere Ergebnisse per Javascript im Hintergrund nach. Dadurch können sich die Rankig in der Zwischenzeit bereits verändert haben.

Nicht wundern

Falls sich also jemand über Doppelungen in der simsalaseo-Top-100 oder in den SERPs wundern sollte, da kann man nichts machen, das ist nun mal so und liegt in der Natur der Sache.

Nachtrag:
Ganz lustig finde ich, was mir die MS-Word Rechtschreibkorrektur zu SEO-Wettbewerb vorschlägt:
Vorschlag der MS-Word Rechtschreibkorrektur zu Seo-Wettbewerb

Keine Kommentare »

HTML Bild-Attribut longdesc für Suchmaschinen nicht relevant

Ich kann es kurz machen. Das für die längere Beschreibung eines Bildes seit HTML 4.0 vorhandene Attribut longdesc (im img-Tag) hat für Suchmaschinen keine Bedeutung.

Der longdesc-Test

Im Nachgang zur SEO-Campixx 2011 hatte ich angeregt durch eine Diskussion im Workshop „Klare Sicht im Website Urwald – Barrierefreies Webdesign“ einen kleinen Test aufgesetzt. Mitte März habe ich ein paar Bilder hier und bei Putzlowitsch mit dem longdesc-Attribut versehen.

Laut HTML-Spezifikation ist für longdesc als Wert eine URI erlaubt, also ein Verweis zu einem Dokument, welches eine ausführliche Beschreibung des Bildinhaltes enthält. In erster Linie ist das z.B. für Screen-Reader gedacht oder wenn aus verschiedenen Gründen ein Bild nicht dargestellt werden kann.

Die Beschreibungen zu den Testbildern habe ich in einem extra Verzeichnis als Textdateien abgelegt. In einem Fall war ein sinnvoller Text enthalten, der sonst auf meiner Seite nicht auftaucht. Die anderen Testtexte bestanden aus künstlichen Wörtern, die keinen Sinn ergeben.

Ich wollte so überprüfen, ob die Bilder von den Suchmaschinen mit diesen Texten in Zusammenhang gebracht werde.

Ergebnis

Das Ergebnis ist ernüchternd. In den gut 5 Monaten seit der Veröffentlichung hat kein Suchmaschinen-Bot die Text auch nur angefaßt. Weder Google, Bing noch Yahoo interessieren sich für die als longdesc referenzierten Daten.

Damit erübrigt sich dann natürlich auch die Suche nach den Bildern im Zusammenhang mit den Test-Texten, diese wurden ja schlicht und ergreifend einfach nicht erfaßt.

Neben meinen eigenen Testzugriffen gab es aber doch ein paar „Besucher“ für meine beschreibenden Dateien. Am 4. April interessierte sich „Kintiskton“ für die langen Beschreibungen. Ein paar Tage später kreuzte dann erstmals der picmole-Bot auf, seit Ende Juli verirrt sich auch ein gewisser SeoKicks-Bot zu den Texten und vor ein paar Tagen kam einmal der archive.org_bot vorbei.

Von den Bots der großen Suchmaschine oder gar normalen Besuchern ist weit und breit nichts zu sehen.

Fazit

Gut, der Versuch mit meinen fünf Testbildern ist nicht unbedingt repräsentativ. Insofern kann ich nur sagen, daß bei meinen Seiten das longdesc-Attribut für Suchmaschinen nicht relevant ist.

Keine Kommentare »

Simsalaseo und Maggi?

simsalaseoDer eine oder andere wird sich vielleicht gefragt haben, was denn da auf meinem Bild simsalaseo mit Maggi zu tun hat.

Lest Euch selbst das Wort Maggi einmal Laut vor! Wenn man das „I“ hinten etwas betont und länger zieht erhält man nämlich was? Richtig, Magie. :-)

Magie, die Zauberkunst, Geheimkunst, Trickkunst, die Zauberkraft und der Zauber. Von der Zauberei kommt man über Simsalabim auf direktem Wege zu simsalaseo.

Ich hatte überlegt, was ich denn zum Thema Simsalaseo für ein Bild bringen könnte. Es sollte auf jeden Fall ein Foto sein, nicht nur ein künstlich erzeugter Text mit ein paar Sternen oder so. Beim Durchsehen meines Bildarchivs bin ich dann über das Maggi-Schild gestolpert.

Als ich den Text „Altbewährt – Maggi – Suppen-Artikel – hier zu haben“ so vor mich hin gelesen hatte, machte es plötzlich Klick! Maggi klingt fast wie Magie, das war perfekt und nicht zu direkt.

Das Bild habe ich übrigens im Sommer 2009 bei einem Besuch im Hessenpark aufgenommen.

„Mehr als 100 historische Gebäude, kulturgeschichtliche Objekte aus vier Jahrhunderten, altes Handwerk und traditionelle Landwirtschaft – im Freilichtmuseum Hessenpark können Sie wie auf einer Zeitreise das ländliche Hessen von früher entdecken.“

Simsalaseo im HessenparkSo steht es dort auf der Internetseite und ich kann jedem nur empfehlen, den Hessenpark zu besuchen. Wir waren dort in der Nähe und da bot sich ein Besuch an.

Wir haben dort viele interessante Dinge gesehen und entdeckt.

Es gibt viele Fachwerkhäuser z.B. als Wohnhäuser, Ställe, Scheunen und Werkstätten, eine Schule und eine Kirche. Auch allerlei Tiere wie Rinder, Schweine, Ziegen und Esel findet man auf dem Gelände. Man kann aber nicht nur Sachen ansehen, man kann auch Dinge kaufen. Wir waren dort in der Bäckerei und beim Bürstenmacher.

Simsalaseo - FunktechnikBesonders interessant war für mich als gelernten Nachrichtentechniker das Funktechnische Museum.

Neben allerlei Funkgeräten aus vielen Jahrzehnten Technikgeschichte habe ich auch einen alten bekannten, das Kurzwellen-Sende-Empfangsgerät SEG 15 D, entdeckt.

Während meiner Zeit als Funkobermechaniker bei der NVA hatte ich diesem Teil des Öfteren in den „Eingeweiden“ rumfuhrwerkt.

Simsalaseo und Maggi

Ich komme vom Thema ab, also zurück zu Maggi und SIMSALASEO. Ob nun Simsalabim, Abrakadabra oder Simsalaseo, all diese magischen Formeln und Zauberwörter haben irgendwie mit Zauberei, mit Magie zu tun.

5 Kommentare »

Der Googlebot ist ganz schön zackig

Googlebot im Sommer 2011

Ich beobachte ja praktisch alles und jeden. :-)

Dabei ist mir in letzter Zeit aufgefallen, daß der Googlebot/2.1 (graue Linie) bei meiner Putzlowitsch-Seite sehr zackig vorgeht. Zumindest sieht das so aus, wenn man sich den zeitlichen Verlauf der pro Tag abgerufenen Seiten als Diagramm darstellen läßt.

Jeden zweiten Tag liegt er bei 1000 Seiten oder darunter, die Tage dazwischen bei ungefähr 1500 Seiten oder darüber.

Am 13.07. war der Bot besonders faul, da geht die Zacke fast bis zur Null-Linie runter. Der Bilderbot (Googlebot-Image, rote Linie) hält sich in letzter Zeit auch etwas zurück, wird aber zum Teil vom normalen Bot (Blaue Linie) bei den Bildern unterstützt.

In den Google-Webmastertools sieht das Diagramm übrigens ähnlich aus:

Webmastertools - Seitenabrufe im Mai bis August 2011

Ist bei Euch der Googlebot auch so zackig?

2 Kommentare »