Wir verwenden Cookies und Analyse-Tools, um die Nutzerfreundlichkeit der Internet-Seite zu verbessern und für Marketingzwecke. Wenn Sie fortfahren, diese Seite zu verwenden, nehmen wir an, dass Sie damit einverstanden sind. Zur Datenschutzerklärung.
Déduplication efficace des données dans Hadoop
Details
Hadoop est largement utilisé pour le stockage massif de données distribuées. Même s'il est hautement tolérant aux pannes, évolutif et fonctionne sur du matériel standard, il ne fournit pas de solution de stockage de données efficace et optimisée. Lorsque l'utilisateur télécharge des fichiers avec le même contenu dans Hadoop, celui-ci stocke tous les fichiers dans HDFS (Hadoop Distributed File System), même si le contenu est identique, ce qui entraîne une duplication du contenu et donc un gaspillage d'espace de stockage. La déduplication des données est un processus qui permet de réduire la capacité de stockage requise, car seules les instances uniques de données sont stockées. Le processus de déduplication des données est largement utilisé dans les serveurs de fichiers, les systèmes de gestion de bases de données, le stockage de sauvegarde et de nombreuses autres solutions de stockage. Une stratégie de déduplication appropriée permet d'utiliser de manière optimale l'espace de stockage disponible sur des périphériques de stockage limités. Hadoop ne fournit pas de solution de déduplication des données. Dans le cadre de ce travail, le module de déduplication a été intégré dans le cadre Hadoop afin d'optimiser le stockage des données.
Autorentext
Priteshkumar Prajapati ha conseguito la laurea triennale e magistrale (medaglia d'oro) rispettivamente nel 2012 e nel 2014 presso il Dipartimento di Tecnologia dell'Informazione, CITC, Changa e CSPIT, Changa della G.T.U. e dell'Università CHARUSAT. Attualmente lavora come assistente universitario presso il Dipartimento di Tecnologia dell'Informazione, CSPIT, CHARUSAT, Changa.
Weitere Informationen
- Allgemeine Informationen
- GTIN 09786202087308
- Herausgeber Editions Notre Savoir
- Anzahl Seiten 76
- Genre Mathématiques
- Untertitel DE
- Autor Priteshkumar Prajapati , Parth Shah
- Größe H220mm x B150mm
- Jahr 2025
- EAN 9786202087308
- Format Kartonierter Einband
- ISBN 978-620-2-08730-8
- Veröffentlichung 18.09.2025
- Titel Déduplication efficace des données dans Hadoop
- Sprache Französisch