Webbasierte Datenintegration
Details
Unternehmen und Organisationen verwenden heute enorme Menge an Daten, die durch verschiedene IT-Systeme erzeugt werden. Durch die Heterogenität der Datensätze ist eine ganzheitliche Sicht auf Informationen eine große Herausforderung, deren Lösung aber einen immensen Vorteil bietet. Um eine Integration verschiedener Ausgangssysteme zu erhalten, spielt die Informationsqualität, das Messen dieser, wie auch die Sicherung der Datenqualität eine große Rolle.
Die Autoren diskutieren die Problematik der Datenqualität im Fokus eines Integrationsprozesses. Sie stellen am Markt verfügbare Systeme zur Datenintegration und analyse vor und entwickeln, basierend auf einer Anforderungsanalyse, ein webbasiertes Werkzeug, welches die Integration der Daten ermöglicht und die Qualität der Datenbestände testet. Die Analyse der Bestände, das Auffinden von Duplikaten und die Bereinigung der Daten stehen dabei im Fokus dieses Werkzeuges, welches eine Grundlage für eine umfassende Datenqualitäts- und Bereinigungslösung darstellen kann.
Autorentext
Steven Helmis und Robert Hollmann studierten Angewandte Informatik an der Fachhochschule Erfurt und wurden für ihre Arbeiten mit dem Information Quality Best Master Degree Award der Deutschen Gesellschaft für Informations- und Datenqualität ausgezeichnet.
Inhalt
Datenbereinigung und Konsolidierung von heterogenen Datenbeständen.- Datenqualität.- Dimensionen und Architektur der Informationsintegration.- Data Cleaning.- Konzeption des Data Cleaning Toolkits.- Implementierung.- Zusammenfassung und Ausblick.- Auffinden und Bereinigen von Duplikaten in heterogenen Datenbeständen.- Informationen, Daten und Wissen- ein Definitionsversuch.- Informationsintegration im Fokus der Datenqualität.- Duplikate in Datenbeständen.- Konkrete Verfahren zur Dublettenauffindung und Klassifikation.- Konzept der Datenqualitätsanwendung DCT.- Implementierung, ausgewählte Algorithmen- und Datenstrukturen.- Fazit und Ausblick.
Weitere Informationen
- Allgemeine Informationen
- GTIN 09783834807236
- Genre Sonstige Informatikbücher
- Auflage 2009
- Sprache Deutsch
- Lesemotiv Verstehen
- Anzahl Seiten 198
- Größe H210mm x B148mm x T20mm
- Jahr 2008
- EAN 9783834807236
- Format Kartonierter Einband
- ISBN 978-3-8348-0723-6
- Veröffentlichung 25.11.2008
- Titel Webbasierte Datenintegration
- Autor Steven Helmis , Robert Hollmann
- Untertitel Ansätze zur Messung und Sicherung der Informationsqualität in heterogenen Datenbeständen unter Verwendung eines vollständig webbasierten Werkzeuges
- Gewicht 323g
- Herausgeber Vieweg+Teubner Verlag