Wir verwenden Cookies und Analyse-Tools, um die Nutzerfreundlichkeit der Internet-Seite zu verbessern und für Marketingzwecke. Wenn Sie fortfahren, diese Seite zu verwenden, nehmen wir an, dass Sie damit einverstanden sind. Zur Datenschutzerklärung.
Auswahl von Merkmalen auf der Grundlage von Multiviewpoint und Link Similarity Measure
Details
Die Erkundung und Nutzung großer Mengen von Textdokumenten ist eine wichtige Frage im Bereich Information Retrieval und Text Mining. Alle Methoden, die darauf abzielen, Gruppen von Entitäten zu finden, verwenden Ähnlichkeits- oder Unähnlichkeitsmaße. Es ist notwendig zu analysieren, wie sich Ähnlichkeitsmaße auf Textdokumenten verhalten, bevor ein gutes Ähnlichkeitsmaß für das Clustering von Dokumenten entwickelt oder modifiziert wird, um die Effektivität der Technik zu verstehen. Eine Ähnlichkeitsfunktion, die in eine Kriteriumsfunktion eingebettet ist, ist zu einem großen Teil dafür verantwortlich, die intrinsische Struktur der Daten zu analysieren. Wenn geeignete Ähnlichkeitsmaße mit einer bestimmten Clustering-Technik verwendet werden, kann die Effizienz und Genauigkeit der Informationsentdeckungsaufgabe verbessert werden. Die Verwendung geeigneter Maße verbessert nicht nur die Herkunft und Glaubwürdigkeit der abgerufenen Informationen, sondern hilft auch, die zeitliche und finanzielle Komplexität des Prozesses zu überwinden. Dieses Buch konzentriert sich auf die Identifizierung der verschiedenen Ähnlichkeitsmaße für das Clustering. Es wird eine zwingende Methode zur Messung der Ähnlichkeit zwischen Textdokumenten veranschaulicht, um die Dokumente mit Hilfe von hierarchischem Clustering und Feature-Selection-Methoden unter Verwendung von Matlab zu clustern.
Autorentext
Dr. Neelam Singh ist außerordentliche Professorin in der Abteilung für Informatik und Ingenieurwesen der Graphic Era Deemed to be University, Dehradun. Sie hat mehr als 15 Forschungsarbeiten in internationalen Fachzeitschriften/Konferenzen im Bereich Machine Leaning, Big Data und Cloud Computing veröffentlicht. Ihre Forschungsinteressen umfassen ML, Big Data und Cloud.
Weitere Informationen
- Allgemeine Informationen
- GTIN 09786204765761
- Genre Sonstige Informatikbücher
- Sprache Deutsch
- Anzahl Seiten 60
- Größe H220mm x B150mm x T4mm
- Jahr 2022
- EAN 9786204765761
- Format Kartonierter Einband
- ISBN 978-620-4-76576-1
- Titel Auswahl von Merkmalen auf der Grundlage von Multiviewpoint und Link Similarity Measure
- Autor Neelam Singh
- Untertitel Clustering von Dokumenten
- Gewicht 107g
- Herausgeber Verlag Unser Wissen