Google bezieht seine Informationen aus den
HTML-Webseiten im Internet. Dazu werden die HTML-Seiten von seinem Spider angefordert und analysiert. Bisher hat Googlebot im HTML-Code referenzierte Stylesheets, Javascripts usw. nicht geladen und nicht in die Analyse einer Seite einbezogen (
Ausnahmen bestätigen die Regel).
Heute fällt mir jedoch bei meiner Log-Analyse jedoch folgendes auf:
66.249.66.203 - - [23/Jun/2006:03:23:44 +0200] "GET /blog/serendipity.css HTTP/1.1" 200 6574 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
Im Klartext: Der Googlebot findet die Stylesheet-Datei aus meinem
Blog im HTML-Code und ist schlau genug, diese auch für die Bewertung meiner Seite einzubeziehen.
Warum sollte Google sich .css-Files angucken?
Zunächst einmal bietet eine CSS-Datei doch nur Styleangaben. Wird jetzt etwa geguckt, wie gut eine Seite aussieht oder was will Google damit?
Ganz einfach. Im Wettrüsten zwischen Suchmaschinenoptimierern und Suchmaschinenbetreibern gibt es diverse Tricks, die Seiten im Index nach oben pushen,
die da nur zweifelhaft hingehören.
Eine immernoch beliebte und effektive Möglichkeit ist das Verstecken von Text.
Schreibe ich 1000 Mal mein gewünschtes Keyword in weißer Schrift auf weißem Hintergrund, so hat mich das früher an Spitzenpositionen zum Keyword gebracht. Heute funktioniert das nicht mehr....sagt man.
Jedoch ist auch die Web-Technologie ein wenig weiter forgeschritten.
Per CSS-Stylesheet sind die Positionen, Farben, Sichtbarkeiten von Elementen (z.B. DIV-Ebenen) nach Belieben veränderbar. So kann ich meinen "Faketext" in eine Ebene schreiben und diese dann an Position x: 2000 Pixel, y: 4000 Pixel verschieben, wo sie weit aus dem sichtbaren Bereich ist. Auch die Angabe "unsichtbar" ist möglich und für die Suchmaschinenmanipulation hilfreich.
So wurde der Wunsch an Google immer lauter, doch auch die Styleangaben in die Bewertung und Analyse mit einzubringen.
Diesem Wunsch wird nun vielleicht (in einem Versuch) versucht Rechnung zu tragen. Ob es die Spamseiten zu vielen Suchbegriffen aus dem Index drückt, die da aktuell noch zu finden sind, bleibt abzuwarten.
Auch
Javascript wird vereinzelt mal von Google angefordert - allein wirklich damit umzugehen scheint der Suchmaschinenführer noch nicht zu können. Viele Weiterleitungen per Brückenseiten (Doorwaypages) in den Suchergebnissen belegen dies.
PS: Hoffentlich wissen die Blackhat SEO nicht, dass man das Spidern eines Files ganz einfach per
robots.txt-Datei ausschließen kann und somit noch ein paar Monate mit gefakten Suchergebnissen Urlaubsgeld verdienen kann...
User-agent: *
Disallow: /css/meine-spam-css.css