Zum Anfang der Bildgalerie springen

Effiziente Datendeduplizierung in Hadoop

Name: Effiziente Datendeduplizierung in Hadoop
SKU: SB2SK2KCDQH
Price: 42.65 CHF
Availability: InStock

Seien Sie der Erste, der dieses Produkt bewertet

CHF 42.65

Auf Lager

SKU

SB2SK2KCDQH

1 Verfügbar

Kostenloser Versand ab CHF 50

Geliefert zwischen Mi., 08.04.2026 und Do., 09.04.2026

Details

Hadoop wird häufig für die Speicherung massiv verteilter Daten verwendet. Obwohl es sehr fehlertolerant und skalierbar ist und auf handelsüblicher Hardware läuft, bietet es keine effiziente und optimierte Datenspeicherlösung. Wenn Benutzer Dateien mit identischem Inhalt in Hadoop hochladen, werden alle Dateien im HDFS (Hadoop Distributed File System) gespeichert, auch wenn der Inhalt identisch ist, was zu einer Duplizierung des Inhalts und damit zu einer Verschwendung von Speicherplatz führt. Datendeduplizierung ist ein Prozess zur Reduzierung der erforderlichen Speicherkapazität, da nur die eindeutigen Dateninstanzen gespeichert werden. Der Prozess der Datendeduplizierung wird häufig in Dateiservern, Datenbankmanagementsystemen, Backup-Speichern und vielen anderen Speicherlösungen eingesetzt. Eine geeignete Deduplizierungsstrategie nutzt den Speicherplatz auf den begrenzten Speichergeräten ausreichend aus. Hadoop bietet keine Lösung zur Datendeduplizierung. In dieser Arbeit wurde das Modul zur Deduplizierung in das Hadoop-Framework integriert, um eine optimierte Datenspeicherung zu erreichen.

Autorentext

Priteshkumar Prajapati hat 2012 seinen Bachelor of Engineering und 2014 seinen Master of Technology (Goldmedaille) am Fachbereich Informationstechnologie des CITC in Changa und am CSPIT in Changa der G.T.U. und der CHARUSAT-Universität erworben. Derzeit arbeitet er als Assistenzprofessor am Fachbereich Informationstechnologie des CSPIT, CHARUSAT, Changa.

30 Tage Rückgaberecht

Weitere Informationen

Allgemeine Informationen
- GTIN 09786202087261
- Genre Informatik & EDV
- Sprache Deutsch
- Anzahl Seiten 76
- Herausgeber Verlag Unser Wissen
- Größe H220mm x B150mm x T6mm
- Jahr 2025
- EAN 9786202087261
- Format Kartonierter Einband
- ISBN 978-620-2-08726-1
- Veröffentlichung 18.09.2025
- Titel Effiziente Datendeduplizierung in Hadoop
- Autor Priteshkumar Prajapati , Parth Shah
- Untertitel DE
- Gewicht 131g

Bewertungen

Schreiben Sie eine Bewertung

Nur registrierte Benutzer können Bewertungen schreiben. Bitte loggen Sie sich ein oder erstellen Sie ein Konto.