Wir verwenden Cookies und Analyse-Tools, um die Nutzerfreundlichkeit der Internet-Seite zu verbessern und für Marketingzwecke. Wenn Sie fortfahren, diese Seite zu verwenden, nehmen wir an, dass Sie damit einverstanden sind. Zur Datenschutzerklärung.
Analyse der Klassifizierung für unausgewogene Daten
Details
Überall auf der Welt werden enorme Datenmengen gesammelt und in Datenbanken gespeichert. Diese Daten werden gebündelt und nehmen jedes Jahr zu. Das Extrahieren von Informationen, die in solchen Datenbanken verborgen sind, und das Klassifizieren der extrahierten Informationen sind die wichtigsten Aufgaben beim Data Mining. Wenn solche Datensätze unausgewogen sind, wird es schwierig, sie zu verarbeiten. Denn die Vorhersage der Zukunft ist eine der grundlegenden Aufgaben im Data Mining. Die Arbeit mit unausgewogenen Datensätzen zur Vorhersage der möglichen Ergebnisse ist eine sehr mühsame Aufgabe. Ein Datensatz ist unausgewogen, wenn er nicht korrekt klassifiziert ist, wenn eine Klasse mehr Instanzen enthält als andere. Sie werden oft als positive Klasse (Minderheit) und negative Klasse (Mehrheit) dargestellt. Die Klasse mit der geringeren Anzahl von Stichproben wird als Minderheitsklasse bezeichnet, die mit der höheren Anzahl als Mehrheitsklasse. Ein unausgewogener Datensatz verursacht viele schwerwiegende Probleme beim Data Mining, da der Standard-Klassifizierungsalgorithmus den Datensatz meist als ausgewogen betrachtet, was wiederum zu einer partiellen Bevorzugung der Mehrheitsklasse führt. Bei Anwendungen wie der medizinischen Diagnose hat dies sehr schwerwiegende Auswirkungen. Daher ist ein ausgeglichener Datensatz für viele Echtzeitanwendungen entscheidend.
Autorentext
Dharmendra Singh Rajput a obtenu son doctorat dans le domaine du regroupement de documents à l'Institut national de technologie de Bhopal, en Inde. Il a plus de 6 ans d'expérience dans l'enseignement, la recherche et l'industrie. Il travaille actuellement comme professeur associé à l'École des technologies de l'information et de l'ingénierie, à l'Université VIT, à Vellore, en Inde.
Weitere Informationen
- Allgemeine Informationen
- GTIN 09786206345428
- Sprache Deutsch
- Genre Sonstige Wirtschaftsbücher
- Anzahl Seiten 72
- Größe H220mm x B150mm x T5mm
- Jahr 2023
- EAN 9786206345428
- Format Kartonierter Einband
- ISBN 978-620-6-34542-8
- Veröffentlichung 16.08.2023
- Titel Analyse der Klassifizierung für unausgewogene Daten
- Autor Dharmendra Singh Rajput , S. Sinduja
- Untertitel DE
- Gewicht 125g
- Herausgeber Verlag Unser Wissen