November 2003 > mehr wissen > Suchmaschinen
 
Liefern Suchmaschinen neutrale Ergebnisse?
Von Florence Maurice
 
Zugangswege ins Internet
Wem gehört das Internet? Natürlich niemandem, da es ein weltweiter Verbund einzelner Rechner und Netzwerke ist. Stimmt das so ganz?
Wenn man eine Information benötigt und nicht weiß, unter welcher Adresse sie zu finden ist, wird man eine Suchmaschine befragen. Die Suchmaschinen sind somit die Zugangswege ins Internet. Und da stellt sich eine andere Frage: Wem gehören die Suchmaschinen? Und liefern diese eigentlich neutrale Ergebnisse?

Drei Typen von Suchmaschinen
Es werden drei verschiedene Typen von Suchmaschinen unterschieden: Volltextsuchmaschinen, Web-Kataloge und Metasuchmaschinen.

Bei Volltextsuchmaschinen werden kleine Programme eingesetzt, die das Internet auf der Suche nach neuen Seiten durchforsten und diese mitsamt der Adresse dann in der internen Datenbank speichern. Prominentester Vertreter einer Volltextsuchmaschine ist Google.

Außer den Volltextsuchmaschinen gibt es auch noch die Web-Kataloge oder Web-Verzeichnisse. Bei diesen werden die Seiten nicht wie bei den Suchmaschinen von automatischen Datensammlern, sondern von einem Team von Redakteuren zusammengestellt. Diese beurteilen die einzelnen Seiten nach ihrer Relevanz für ein bestimmtes Thema und ordnen sie dann verschiedenen Rubriken zu. Der Vorteil liegt auf der Hand: Dieses Verfahren kann eine gewisse Qualität sichern; der Nachteil ist jedoch, dass natürlich wesentlich weniger Seiten erfasst werden als bei einer Suchmaschine im eigentlichen Sinne. In den Anfangszeiten waren noch Suchmaschinen und Web-Kataloge in Reinform vertreten, jetzt kooperieren diese meist miteinander. Beispiele für Web-Kataloge sind Open Directory Project (www.dmoz.org) oder Yahoo (www.yahoo.de).

Neben Suchmaschinen und Web-Katalogen existieren Metasuchmaschinen, die mehrere Suchmaschinen nach dem gewünschten Begriff durchforsten. Damit erspart man es sich, verschiedene Suchmaschinen nacheinander einzeln aufzurufen und bekommt das Gesamtergebnis übersichtlich zusammengefasst. Hiermit werden natürlich am meisten Seiten erfasst.

Bei einem Vergleich der Techniken, wie Seiten gesammelt werden, mag man meinen, dass Suchmaschinen neutrale Quellen par excellence sind - denn die Indizes werden automatisch erstellt. Zwei Dinge jedoch stehen der neutralen Information und Auflistung entgegen: als solche nicht gekennzeichnete gekaufte Links und manipulierte Trefferlisten.

Gekaufte Links
Auch Suchmaschinen wollen leben und finanzieren sich über zu den Suchergebnissen passende Werbung. Wenn die Werbung als Link in der Trefferliste aufgeführt ist, spricht man von "sponsored links". Bei Google beispielsweise werden diese deutlich als solche markiert: Sie sind mit einer anderen Farbe hinterlegt und mit "Anzeige" gekennzeichnet.

Nicht alle Suchmaschinen sind hier aber so korrekt und trennen die gekauften Links, die Werbung beinhalten, von anderen Links. Dann ist nicht ersichtlich, welche Informationen aus einer neutralen Quelle stammen und welche von Firmen, deren Interesse es ist, ein Produkt zu verkaufen. Um sich das zu vergegenwärtigen, braucht man bloß einmal "Digitalkamera" als Suchbegriff bei MSN (www.msn.de) einzugeben. Alle Links der ersten Seite sind Werbung und das besonders Dreiste daran: bei einem Teil der Links ist "Gesponserte Webseite" angegeben, was suggeriert, die anderen wären es nicht.

Auf die ersten Plätze ... fertig ... los
Wie aber werden Trefferlisten organisiert? Welche Ergebnisse stehen am Anfang? Untersuchungen zeigen immer wieder, dass nur die ersten Treffer, die in einer Trefferliste aufgeführt werden, von Surfern angeklickt werden. So ist es natürlich für eine Firma sehr wichtig, ihre Site unter den ersten Treffern zu platzieren.

Um die Reihenfolge der Treffer festzulegen, setzen Suchmaschinen verschiedene Methoden ein wie z.B. die Auswertung von Metatags oder die Häufigkeit von bestimmten Begriffen als Überschriften etc. Google ging hier einen eigenen Weg und wählte als Kriterium etwas, das nicht innerhalb der Seite selbst liegt, sondern außerhalb: die Häufigkeit von Links auf diese Seite. Ein Kriterium, das dem Wesen des Internets, eben der Vernetzung und der Verlinkung, entspricht. Und der Grund auch für die treffenden Ergebnislisten und damit auch den Erfolg von Google.

Inzwischen wird aber dieses Verfahren durch spezielle Tricks wie z.B. eigens eingerichtete Link-Farmen, d.h. Seiten, die nur Linksammlungen für andere Seiten beinhalten, ausgehebelt. Und immer häufiger liefert Google jetzt neben Links die durch Manipulation an Top-Positionen gekommen sind, sogar Links, die nichts mehr mit der Suchabfrage zu tun haben.

Freiheit und Kommerz
Erhält man zu einem Thema keine brauchbaren Ergebnisse von Google, bleibt einem nichts anders übrig, als zu Konkurrenten zu wechseln, Meta- oder Spezialsuchmaschinen zu befragen. Wenn sich diese Entwicklung fortsetzt, wird Google seine derzeitige Top-Position nicht halten können - die sich ja auch sprachlich dadurch bemerkbar macht, dass das Verb "googeln" ein Synonym für Internetrecherche überhaupt geworden ist.

Das Internet steht immer zwischen Freiheit und Kommerz. Da es sich nicht so sehr als Goldgrube erwiesen hat, wie zu Beginn vermutet, werden die Versuche, doch noch damit Geld zu verdienen, verzweifelter, dreister und härter. Und die manipulierten Trefferlisten bei Google sind nur ein Beispiel dafür.
 

Links und Quellen
Artikel
S. Karzauninkat: Google zugemüllt. Spam überschwemmt die Suchergebnisse.
c't 20/2003. S. 88 ff.

Metasuchmaschinen
www.metager.de
www.vivisiimo.com
www.metaspinner.de

Suchtechniken
www.klug-suchen.de
www.suchlexikon.de
www.suchfibel.de

Autorin
Florence Maurice
Kontakt: florence.maurice@ mediella.de