Wir verwenden Cookies und Analyse-Tools, um die Nutzerfreundlichkeit der Internet-Seite zu verbessern und für Marketingzwecke. Wenn Sie fortfahren, diese Seite zu verwenden, nehmen wir an, dass Sie damit einverstanden sind. Zur Datenschutzerklärung.
Effiziente Datendeduplizierung in Hadoop
Details
Hadoop wird häufig für die Speicherung massiv verteilter Daten verwendet. Obwohl es sehr fehlertolerant und skalierbar ist und auf handelsüblicher Hardware läuft, bietet es keine effiziente und optimierte Datenspeicherlösung. Wenn Benutzer Dateien mit identischem Inhalt in Hadoop hochladen, werden alle Dateien im HDFS (Hadoop Distributed File System) gespeichert, auch wenn der Inhalt identisch ist, was zu einer Duplizierung des Inhalts und damit zu einer Verschwendung von Speicherplatz führt. Datendeduplizierung ist ein Prozess zur Reduzierung der erforderlichen Speicherkapazität, da nur die eindeutigen Dateninstanzen gespeichert werden. Der Prozess der Datendeduplizierung wird häufig in Dateiservern, Datenbankmanagementsystemen, Backup-Speichern und vielen anderen Speicherlösungen eingesetzt. Eine geeignete Deduplizierungsstrategie nutzt den Speicherplatz auf den begrenzten Speichergeräten ausreichend aus. Hadoop bietet keine Lösung zur Datendeduplizierung. In dieser Arbeit wurde das Modul zur Deduplizierung in das Hadoop-Framework integriert, um eine optimierte Datenspeicherung zu erreichen.
Autorentext
Priteshkumar Prajapati hat 2012 seinen Bachelor of Engineering und 2014 seinen Master of Technology (Goldmedaille) am Fachbereich Informationstechnologie des CITC in Changa und am CSPIT in Changa der G.T.U. und der CHARUSAT-Universität erworben. Derzeit arbeitet er als Assistenzprofessor am Fachbereich Informationstechnologie des CSPIT, CHARUSAT, Changa.
Weitere Informationen
- Allgemeine Informationen
- GTIN 09786202087261
- Genre Informatik & EDV
- Sprache Deutsch
- Anzahl Seiten 76
- Herausgeber Verlag Unser Wissen
- Größe H220mm x B150mm x T6mm
- Jahr 2025
- EAN 9786202087261
- Format Kartonierter Einband
- ISBN 978-620-2-08726-1
- Veröffentlichung 18.09.2025
- Titel Effiziente Datendeduplizierung in Hadoop
- Autor Priteshkumar Prajapati , Parth Shah
- Untertitel DE
- Gewicht 131g