Wir verwenden Cookies und Analyse-Tools, um die Nutzerfreundlichkeit der Internet-Seite zu verbessern und für Marketingzwecke. Wenn Sie fortfahren, diese Seite zu verwenden, nehmen wir an, dass Sie damit einverstanden sind. Zur Datenschutzerklärung.
Genauigkeit des Clustering von Textdokumenten mit semantischem Ansatz
Details
Im Zeitalter der Informationstechnologie nehmen Textdokumente über das Internet, E-Mail, Webseiten, Offline- und Online-Berichte, Zeitschriften und Artikel spontan zu und werden in elektronischen Datenbanken gespeichert. Millionen von neuen Textdateien werden pro Tag erstellt, durch die fehlende Klassifizierung entgehen den Menschen viele Informationen, die für verschiedene Aufgaben nützlich sind. Die Aufrechterhaltung und der Zugang zu diesen Dokumenten ist ohne eine angemessene Bewertung sehr schwierig, und wenn es eine Klassifizierung ohne jegliche Informationen gibt, nennt man das Clustering. Um solche Schwierigkeiten zu überwinden, sind K-means und andere alte Clustering-Algorithmen ungeeignet, wie man es bei natürlichen Sprachen erwarten kann. Wegen der hochdimensionalen über Texte, das Vorhandensein von logischen Struktur Hinweise innerhalb der Texte und neuartige Segmentierung Techniken haben die Vorteile der Fortschritte in der generativen Thema Modellierung Algorithmen, speziell entwickelt, um Fragen in Intervallen Text zu verschlüsseln Wort Thema Verteilungen. In Anbetracht dieser Einschränkung wurde der COBWEB-Algorithmus für konzeptionelles Clustering auf die vorverarbeiteten Daten angewendet. Um die Genauigkeit der Cluster zu gewährleisten, wurde die f-measure-Genauigkeitsmessmethode für die Bewertung der Cluster ausgewählt.
Autorentext
S.K. Ahammad Fahad ha conseguito il Master presso l'Università Internazionale di Al-Madinah (Malesia). Ha conseguito una laurea presso l'Università IBAIS (Bangladesh). Attualmente si occupa di elaborazione del linguaggio naturale con database semantici e lessicali su diverse lingue.
Weitere Informationen
- Allgemeine Informationen
- GTIN 09786208074814
- Sprache Deutsch
- Genre Anwendungs-Software
- Größe H220mm x B150mm x T9mm
- Jahr 2024
- EAN 9786208074814
- Format Kartonierter Einband
- ISBN 978-620-8-07481-4
- Titel Genauigkeit des Clustering von Textdokumenten mit semantischem Ansatz
- Autor S. K. Ahammad Fahad
- Untertitel Natrliche Sprachverarbeitung mit Semantik mit Hilfe von WordNet. Die Genauigkeit des Clustering wird durch F-Measure sichergestellt
- Gewicht 227g
- Herausgeber Verlag Unser Wissen
- Anzahl Seiten 140