chevron_left
chevron_right

Eine unerschöpfliche Quelle

web.archive.org

Seit 1996 existiert das Internet Archive in San Francisco (www.archive.org). Aus bescheidenen Anfängen ist eine Organisation entstanden, die eine einzigartige elektronische Bibliothek betreibt. Deren Credo ist es, Information zu Bildungs- und Recherchezwecken mit freiem Zugang für jedermann, weltweit zur Verfügung zu stellen. Das Archiv gehört zu den 300 meistbesuchten Homepages.

 

» Theodor Klossner, Associate Consultant

Bruster Kahle, ein erfolgreicher und visionärer Technologieexperte und Firmengründer, hat 1996 das Internet Archive als Non-Profit-Gesellschaft gegründet. Er war Mitinitiator und Gründer von WAIS (Wide Area Information Server), ein unter anderem von Thinking Machines Inc. entwickeltes Protokoll zur Suche von Text in verteilten Server Netzwerken. Das Internet Archive versteht sich als öffentliche Bibliothek, die jedermann freien Zugang zu Information ermöglichen will. Diese Zielsetzung soll die Demokratie stärken, Bildung ermöglichen oder helfen, den Fake-News und den Verschwörungstheorien den Boden zu entziehen. Wichtige Kooperationen mit grossen Bibliotheken auf der ganzen Welt vervielfachen die Zahl der abrufbaren und gespeicherten Inhalte. Das Mengengerüst des Archives ist beeindruckend:

475 Millionen Webseiten
Im Gegensatz zu Google speichert das Archiv den HTML Inhalt einer Website. Ein Crawler besucht die Webseite in bestimmten Zeitabständen und nimmt einen Snapshot auf. Dieses Vorgehen hat den Vorteil, dass man Webseiten rekonstruieren kann, selbst wenn wichtige Files fehlen oder man kann Links, die verloren gegangen sind, im HTML-Code wiederfinden. Ein weiterer praktischer Nutzen liegt zum Beispiel im Bereich der Recherche: Um Urheberrechtsfragen zu klären oder um den Fortschritt seiner eignen Website zu dokumentieren, oder Historiker können ergründen, welche Entwicklung die Website des Bundes seit 1998 genommen hat.

pdf Downloaden um den ganzen Artikel zu lesen oder im Polyscope ePaper ansehen