8. Februar 2011

Kennen Sie schon den Google NGram Viewer? Ein neues geniales Projekt von Google. Sie werden fasziniert sein. Vielleicht

Die Tochter einer Bekannten von uns arbeitet bei Google. Noch vor einigen Jahren sagte sie das mit Stolz; und die jeweiligen Gesprächspartner reagierten mit Neugier und Interesse. Heute vermeidet sie es möglichst, ihren Arbeitgeber zu nennen. Tut sie es, dann geht es ihr ungefähr so, wie es vor einigen Jahrzehnten jemandem passierte, der sagte, daß er aus Südafrika kommt. "Und die Apartheid?" war die unvermeidliche Reaktion. Bei Google ist heute die Reaktion: "Und diese Datensammelwut?" "Und Google Street View, das uns ausspäht?".

Die ewigen Bedenkenträger, die Besorgten, Vergrämten und Verbitterten, die Mißtrauischen und diejenigen, die schon deshalb gegen Google sind, weil es so amerikanisch ist wie apple pie: Sie haben es geschafft, eine der grandiosesten Firmen, die auf diesem Erdball jemals entstanden sind, in ein schlechtes Licht zu rücken.



Als ich in den neunziger Jahren damit begann, mich im Internet umzutun - erst beruflich, bald auch privat -, da benutzte man Suchmaschinen wie Lycos, AltaVista und dann zunehmend Yahoo!. Sie listeten unselektiv und umständlich auf, was sie gefunden hatten; das Suchen in dem Wust der Suchergebnisse war die eigentliche Suche.

Dann kam Google, im Jahr 1998; erst ein Geheimtip. Ich habe damals gern eine WebSite aufgesucht, die "Der literarische Rätselsalon" hieß. Man stellte einander literarische Aufgaben - Fragen nach dem Autor einer Zeile, der Biographie eines Autors; dergleichen. Wer nach einem manchmal langen Frage-und-Antwort-Spiel die Lösung fand, der bekam eine symbolische Rose überreicht; später auch allerlei andere virtuelle Preise.

Auf einmal purzelten die Lösungen nur so: Kaum hatte jemand nach dem Autor einer Textstelle gefragt, da lieferte ein anderer schon die Antwort. Es war ein anderer, der bereits Google entdeckt hatte. Bald kannten alle Google.

So machte das Raten natürlich keinen Spaß mehr. Einige schlugen vor, das Googeln (so nannte man es damals allerdings noch nicht) beim literarischen Rätseln zu verbieten - aber wie will man das anderen verbieten, wie will man es vor allem auch sich selbst verbieten? Was sich stattdessen durchsetzte, war, daß man die Rätsel "googlefest" machte; sie also so formulierte, daß niemand allein durch Googeln auf die Lösung kommen konnte. - Leider gibt es diesen schönen Literarischen Rätselsalon schon lange nicht mehr.



Google war damals eine zunächst kleine, aber pfiffige Suchmaschine. Ihr Geheimnis bestand darin, daß die Ergebnisse nicht in irgendeiner dummen Reihenfolge (sortiert etwa danach, wie oft der gesucht Begriff auf einer Seite erschien) angeboten wurden, sondern aufgrund eines Algorithmus, dessen Grundgedanke darin besteht, eine Seite umso weiter oben in der Fundliste zu plazieren, je öfter auf sie verlinkt wird; wobei jeder Link wiederum danach gewichtet wird, wieviele Seiten auf die verlinkende Seite verlinken.

Das war die Idee, die eine dieser märchenhaften kalifornischen Erfolgsgeschichten hervorbrachte. Entstanden war sie in den Köpfen von zwei Stanford-Studenten, Larry Page und Sergey Brin. Als die beiden allerdings fanden, daß Google ihnen zuviel Zeit wegnahm - sie waren ja mit Promovieren beschäftigt -, wollten sie es für eine Million Dollar verkaufen; aber dem ins Auge gefaßten Käufer, der Firma Excite, war das zu teuer. Heute, ein gutes Jahrzehnt später, hat Google einen Marktwert von ungefähr 150 Milliarden Dollar.



An Google ist alles amerikanisch - der Unternehmungsgeist, der es hervorbrachte; der Glaube an das Gute ("Don't be evil", sei nicht bösartig, ist das offizielle Firmenmotto); die Suche nach pfiffigen und praktischen Lösungen. Und vor allem auch der Gedanke, daß man mit großem Einsatz auch Großes erreichen kann. Im Fall der Suchmaschine nicht nur mit dem intelligenten Algorithmus, sondern auch mit einer gewaltigen Rechen- und Speicherkapazität (es wird geschätzt, daß Google über 450.000 Server verfügt).

So entstand ein Projekt nach dem anderen -
Google Earth und Google Maps beispielsweise, der anfangs gigantisch anmutende Gedanke, jeden Ort der Erde im Satellitenbild zugänglich zu machen; Google Street View, das uns die Straßen einer Stadt so zeigt, wie sie derjenige sieht, der durch sie hindurchfährt; Google Scholar, die ebenfalls gigantische Idee, die gesamte wissenschaftliche Literatur allen ohne Mühe zugänglich zu machen.

Und dann hatte man die noch gigantischere Idee, mittels Google Books alle Bücher der Welt (sofern nicht durch Copyright geschützt) zu digitalisieren und über eine Suchfunktion zu erschließen. Google schätzt, daß es auf der Welt ungefähr 130 Millionen verschiedene Bücher gibt. Davon waren im Oktober 2010 15 Millionen Bücher aus mehr als 100 Ländern in mehr als 400 Sprachen von Google digitalisiert.



Und jetzt das, dessentwegen ich diesen Artikel schreibe: Wenn man einen solchen ungeheuren Bestand an Wissen digitalisiert und mühelos durchsuchbar zur Verfügung hat - was kann man damit alles machen?

Unter anderem das, was sich gegenwärtig im Versuchsstadium befindet und was deshalb unter Google Labs angeboten wird: NGrams.

Die Idee ist wieder bestechend einfach, und wieder hat sie etwas Gigantomanisches: Wenn man diesen riesigen Bestand ("lots of books" sagt Goggle bescheiden-ironisch, eine Menge Bücher) zur Verfügung hat, dann kann man ja danach suchen lassen, wie oft ein Wort, ein Begriff, ein Satz in diesen Büchern vorkommt - in der ganzen Zeitspanne, die von Google Books erfaßt wird; und das ist im Augenblick bis 2008.

Wenn Sie auf die WebSite von Google NGram gehen, dann finden Sie dort einen Viewer, eine Grafik zur Darstellung der Ergebnisse. Voreingestellt ist eine Suche nach den beiden Begriffen "Atlantis" und "El Dorado". Sie sehen an den Kurven, wie von 1800 bis ungefähr 1920 die (relative) Häufigkeit beider Begriffe in etwa der gleichen Weise zunahm und wie dann die Häufigkeit von "El Dorado" zurückging, die von "Atlantis" aber weiter zunahm.

Nun ja. Darüber kann man nachdenken, oder man kann das auch bleiben lassen. Aber wenn Sie ein wenig mit diesem Instrument spielen, dann werden Sie schnell merken, was in ihm steckt.

Wählen Sie zum Beispiel den deutschen Corpus und als Suchzeitraum 1970 bis 2008 und geben Sie die beiden Begriff "imperialistisch" und "neoliberal" ein. Ein interessantes Ergebnis, nicht wahr? Oder versuchen Sie es für denselben Zeitraum einmal mit "Christentum,Islam". Oder sehen Sie sich an, wie sich zwischen 1990 und 2008 die Häufigkeiten der beiden Begriffe "liberal" und "Sozialstaat" entwickelt haben; oder "Freiheit" und "Umwelt".

Sie können auch mehr als zwei Suchbegriffe eingeben. Ihrer Wißbegierde sind keine Grenzen gesetzt.



© Zettel. Für Kommentare bitte hier klicken.Titelvignette: Wegweiser am Eingang zur Google-Zentrale, 1600 Amphitheatre Parkway, Mountain View, Kalifornien. Vom Autor Coolcaesar unter GNU Free Documentation License, Version 1.2 oder später freigegeben (Ausschnitt).