Wir verwenden Cookies und Analyse-Tools, um die Nutzerfreundlichkeit der Internet-Seite zu verbessern und für Marketingzwecke. Wenn Sie fortfahren, diese Seite zu verwenden, nehmen wir an, dass Sie damit einverstanden sind. Zur Datenschutzerklärung.
Verbesserung der Genauigkeit von automatischen Textklassifizierern
Details
Die Zahl der Textdokumente nimmt in unglaublichem Tempo zu, und sehr oft besteht die Notwendigkeit, diese Dokumente in bestimmte vordefinierte Kategorien einzuordnen. Die Konzepte des Text Mining und des maschinellen Lernens sind bei dieser Aufgabe der automatischen Klassifizierung von Dokumenten sehr hilfreich. Da die Klassifizierung automatisch erfolgt, muss der Klassifizierer gut sein, damit möglichst wenige Fehlklassifizierungen auftreten. Daher ist die Klassifizierungsgenauigkeit sehr wichtig und muss beachtet werden. Es gibt verschiedene Faktoren, die die Klassifizierungsgenauigkeit von Klassifizierern beeinflussen können. Einer dieser Faktoren ist die Methode der Merkmalsauswahl, mit der die Anzahl der Merkmale in den Dokumenten reduziert wird. Der Informationsgewinn (Information Gain, IG) ist eine der populärsten Methoden, die für diese Aufgabe eingesetzt werden, aber diese Methode zur Bewertung der besseren Wörter weist einige Mängel auf. In unserer Arbeit haben wir eine neue Formel entwickelt, um die Wörter in den Dokumenten zu bewerten und so die besseren Wörter zu finden, die für die Klassifizierungsaufgabe nützlicher sind. Unsere Methode zielt darauf ab, diejenigen Wörter zu finden, die eine höhere Unterscheidungskraft als andere haben, und deshalb haben wir unsere Formel Discriminating Power (DP) genannt.
Autorentext
Shivam Rastogi, actualmente a trabalhar como Engenheiro de Desenvolvimento de Software na Amazon India. Estudei Mestrado em Ciência Informática na Universidade Tecnológica de Deli, Deli. Tenho interesses de investigação nas áreas de Data Mining e Machine Learning, e por isso trabalhei nos Classificadores de Texto Automatizados que utilizam estes conceitos.
Weitere Informationen
- Allgemeine Informationen
- GTIN 09786204993645
- Sprache Deutsch
- Genre Sonstige Technikbücher
- Größe H220mm x B150mm x T4mm
- Jahr 2022
- EAN 9786204993645
- Format Kartonierter Einband
- ISBN 978-620-4-99364-5
- Veröffentlichung 19.07.2022
- Titel Verbesserung der Genauigkeit von automatischen Textklassifizierern
- Autor Shivam Rastogi
- Gewicht 96g
- Herausgeber Verlag Unser Wissen
- Anzahl Seiten 52