No Comments

Entdecken Sie die Speicherinfrastruktur des Internetarchivs

 

Das Internet Archive (IA) ist eine gemeinnützige Einrichtung mit Sitz in San Francisco, Kalifornien, die eine Sammlung von Lieder; Videos; Filme; Bücher; Studien; Code für Websites, Software und Spiele im öffentlichen Bereichdh die nicht im Besitz einer Person oder Organisation sind. Darüber hinaus bietet es auch Archivierungsdienste für historische Websites mit Archive-It- und Wayback-Werkzeugmaschinen.

Die Geschichte der KI begann 1996, als das kommerzielle Internet noch nicht weit verbreitet war. Die Organisation bietet derzeit 475 Milliarden archivierte Websites; 28 Millionen Texte, Bücher und Studien; 14 Millionen Audios ((220 Tausend sein Live-Shows), 6 Millionen von Videos (Sein 2 Millionen Fernsehprogramm), 3,5 Millionen Bilder und 580 Tausend Software. „Wir haben eine mehr als 20-jährige Geschichte des Web, auf die über die Wayback-Maschine zugegriffen werden kann, und wir arbeiten mit mehr als 625 Bibliotheken und anderen Partnern über unser Archive-It-Programm zusammen“, schreibt die Folgenabschätzung auf der Seite „Über“ der Website.

Laut Jonah Edwards, Betriebs- und Infrastrukturmanager des Internetarchivs, stellen Sie die Qualität des Service und die Privatsphäre der Benutzer sicher, um mit dieser gewaltigen Menge an Material umzugehen. Die Organisation verwendet keine Cloud-Speicherlösungen. Alle ins Internetarchiv hochgeladenen Dateien werden auf mehr als 20.000 Festplatten gespeichert, aufgeteilt auf die 750 Server, die rund um den Hauptsitz in Kalifornien installiert sind. Insgesamt 200 Petabyte Speicherkapazität oder besser 200 Millionen Gigabyte.

Karte mit dem Standort von 4 Internet Archive-Rechenzentren. Foto: Internetarchiv.
Karte mit dem Standort von 4 Internet Archive-Rechenzentren. Foto: Internetarchiv.

Die Speicherleistung des Internetarchivs wächst um 25% pro Jahr. Dies bedeutet, dass ständig neue Festplatten gekauft werden, um dem wachsenden Speicherbedarf gerecht zu werden. Laut Jonah Die Anzahl der Treffer und die Menge des von der Website heruntergeladenen Materials nahmen während der Pandemie alarmierend zu des neuen Coronavirus (COVID-19), Dadurch investierte die KI noch mehr in die Infrastruktur.

Der Mitarbeiter verfügt über das Äquivalent von 10 Petabyte Festplatten, die für die Integration der Internetarchivinfrastruktur gekauft wurden. Foto: Internetarchiv.
Der Mitarbeiter verfügt über das Äquivalent von 10 Petabyte Festplatten, die für die Integration der Internetarchivinfrastruktur gekauft wurden. Foto: Internetarchiv.

Jonah erklärt das Die Organisation verwendet lokale Serveranstelle von Cloud-Speicherlösungen hauptsächlich wegen des Kostenproblems. Eine solche Infrastruktur, die beispielsweise von Amazon Web Services (AWS) stammt, würde viel mehr kosten als das, was bereits für die physische Struktur ausgegeben wird.

Darüber hinaus kann eine physische Struktur auch einige grundlegende KI-Prinzipien wie Transparenz, Einfachheit, Haltbarkeit, Leistung und Langlebigkeit garantieren. Wenn es ein Problem mit einer Festplatte gibt, kann das zuständige Team es viel effizienter verfolgen und beheben als Cloud-Service-Kunden. Ein weiterer Vorteil der Verwendung lokaler Server besteht darin, dass die KI die Privatsphäre ihrer Benutzer gewährleisten kann, da Cloud-Dienste Nutzungsdaten von ihren Benutzern verfolgen und sammeln können.

Finanzierung

Jonah erklärt, dass das Internetarchiv eine Institution ist, die als Archiv und Bibliothek charakterisiert ist. Aus diesem Grund können sie auf staatliche Finanzierungsvorteile zugreifen, hauptsächlich auf die Vorteile der Federal Communications Commission (FCC) der Vereinigten Staaten. IA akzeptiert auch Spenden von Unternehmen, Nutzern und anderen Institutionen. Auf der Seite “Über” der IA-Website finden Sie eine Liste aller Einnahmequellen für die Organisation.


Quelle: Internetarchiv (1) (zwei).

See the original post at: https://thehack.com.br/conheca-a-infraestrutura-de-armazenamento-do-internet-archive/?rand=48891

Das könnte dir auch gefallen

More Similar Posts

Leave a Reply

Your email address will not be published. Required fields are marked *

Bitte füllen Sie dieses Feld aus.
Bitte füllen Sie dieses Feld aus.
Please enter a valid email address.