Wir verwenden Cookies und Analyse-Tools, um die Nutzerfreundlichkeit der Internet-Seite zu verbessern und für Marketingzwecke. Wenn Sie fortfahren, diese Seite zu verwenden, nehmen wir an, dass Sie damit einverstanden sind. Zur Datenschutzerklärung.
"Sprachunabhängige Extraktion von Inhalten aus Webseiten"
Details
Die rasante Entwicklung des Internets und der Web-Publishing-Techniken schafft zahlreiche Informationsquellen, die als HTML-Seiten im World Wide Web veröffentlicht werden. Es gibt jedoch auch eine Menge redundanter und irrelevanter Informationen auf Webseiten. Navigationspanels, Inhaltsverzeichnisse (TOC), Werbung, Urheberrechtserklärungen, Servicekataloge, Datenschutzrichtlinien usw. auf Webseiten werden als relevante und irrelevante Inhalte betrachtet. Solche Informationen machen verschiedene Web-Mining-Aufgaben wie das Crawling von Webseiten, die Klassifizierung von Webseiten, das linkbasierte Ranking und die Destillation von Themen komplex.
Autorentext
R Chandramma lavora come professore associato presso il VKIT di Bangalore Ravindranath R C lavora come professore assistente presso il VKIT di Bangalore.
Weitere Informationen
- Allgemeine Informationen
- GTIN 09786205093030
- Genre Rhetorik & Briefe schreiben
- Sprache Deutsch
- Anzahl Seiten 52
- Größe H220mm x B150mm x T4mm
- Jahr 2022
- EAN 9786205093030
- Format Kartonierter Einband
- ISBN 978-620-5-09303-0
- Veröffentlichung 21.08.2022
- Titel "Sprachunabhängige Extraktion von Inhalten aus Webseiten"
- Autor R. Chandramma , Ravindranath R. C. RaviTeja
- Gewicht 96g
- Herausgeber Verlag Unser Wissen