Vision-basierte Deep-Web-Datenextraktion für Web-Dokument-Clustering

CHF 95.55
Auf Lager
SKU
CQVT77U81PS
Stock 1 Verfügbar
Geliefert zwischen Mi., 24.12.2025 und Do., 25.12.2025

Details

Der VDEC-Ansatz besteht aus zwei Phasen: 1) Vision-basierte Webdatenextraktion und 2) Clustering von Webdokumenten. In Phase 1 werden die Webseiteninformationen in verschiedene Chunks segmentiert, aus denen überschüssiges Rauschen und doppelte Chunks mit Hilfe von drei Parametern wie Hyperlink-Anteil, Rauschwert und Kosinusähnlichkeit entfernt werden. Um die relevanten Chunks zu identifizieren, werden drei Parameter wie die Relevanz des Titelworts, die auf der Häufigkeit von Schlüsselwörtern basierende Chunk-Auswahl und Positionsmerkmale verwendet, und dann wird aus diesen Hauptchunks eine Reihe von Schlüsselwörtern extrahiert. Schließlich werden die extrahierten Schlüsselwörter mit Hilfe von Fuzzy C-Means Clustering (FCM) einem Webdokumentencluster unterzogen. Die vorgeschlagene visuelle Datenextraktion für das Deep Web wurde implementiert und mit einem synthetischen Datensatz getestet. Die Ergebnisse werden mit zwei existierenden Algorithmen verglichen, zum einen mit dem Vision-based Data Record Extraction (ViDE) und zum anderen mit dem Mining Data Region (MDR) Algorithmus. Aus den experimentellen Ergebnissen, die auf zwei verschiedenen synthetischen Datensätzen durchgeführt wurden, geht hervor, dass die vorgeschlagene VDEC-Methode stabile und gute Ergebnisse von etwa 99,2 % und 99,1 % Genauigkeit in beiden Datensätzen mit verschiedenen Schwellenwerten erzielen kann.

Autorentext

Le Dr M. Lavanya dirige actuellement le département de maîtrise des applications informatiques, Sree Vidyanikethan Engineering College, A. Rangampet. Elle a terminé son doctorat à SPMVV, Tirupati. Elle a reçu son diplôme de M.CA de SV Univcersity, Tirupati dans l'année 2015. Ses domaines d'intérêt en matière de recherche comprennent l'analyse des données et la science des données.

Weitere Informationen

  • Allgemeine Informationen
    • GTIN 09786205023426
    • Sprache Deutsch
    • Größe H220mm x B150mm x T12mm
    • Jahr 2022
    • EAN 9786205023426
    • Format Kartonierter Einband
    • ISBN 978-620-5-02342-6
    • Veröffentlichung 28.07.2022
    • Titel Vision-basierte Deep-Web-Datenextraktion für Web-Dokument-Clustering
    • Autor M. Lavanya
    • Untertitel Diese Arbeit schlgt einen Ansatz zur visuellen Datenextraktion fr das Clustering von Webdokumenten (VDEC) vor
    • Gewicht 316g
    • Herausgeber Verlag Unser Wissen
    • Anzahl Seiten 200
    • Genre Internationale Wirtschaft

Bewertungen

Schreiben Sie eine Bewertung
Nur registrierte Benutzer können Bewertungen schreiben. Bitte loggen Sie sich ein oder erstellen Sie ein Konto.
Made with ♥ in Switzerland | ©2025 Avento by Gametime AG
Gametime AG | Hohlstrasse 216 | 8004 Zürich | Schweiz | UID: CHE-112.967.470