Wir verwenden Cookies und Analyse-Tools, um die Nutzerfreundlichkeit der Internet-Seite zu verbessern und für Marketingzwecke. Wenn Sie fortfahren, diese Seite zu verwenden, nehmen wir an, dass Sie damit einverstanden sind. Zur Datenschutzerklärung.
Ein Handbuch zur Migration von parallelen Webcrawlern
Details
Die Größe des Internets ist groß und es ist enorm gewachsen, Suchmaschinen sind die Werkzeuge für die Navigation und Suche auf Webseiten. Suchmaschinen führen Indizes für Webdokumente und bieten Suchmöglichkeiten durch kontinuierliches Herunterladen von Webseiten zur Verarbeitung. Dieser Prozess des Herunterladens von Webseiten wird als Web-Crawling bezeichnet. In diesem Buch wird eine Architektur für einen effektiven migrierenden parallelen Web-Crawling-Ansatz mit domänenspezifischer und inkrementeller Crawling-Strategie vorgeschlagen. Die Hauptvorteile des parallelen Web-Crawlers bestehen darin, dass der Analyseteil des Crawling-Prozesses lokal am Aufenthaltsort der Daten und nicht im Repository der Web-Suchmaschine durchgeführt wird. Dies reduziert die Netzwerklast und den Datenverkehr erheblich, was wiederum die Leistung, Effektivität und Effizienz des Crawling-Prozesses verbessert. Ein weiterer Vorteil der Migration eines parallelen Crawlers ist, dass mit zunehmender Größe des Webs die Parallelisierung eines Crawling-Prozesses notwendig wird, um das Herunterladen von Webseiten in vergleichsweise kürzerer Zeit zu beenden. Domänenspezifisches Crawling wird qualitativ hochwertige Seiten liefern.
Autorentext
O Dr. Md. Faizan Farooqui fez MCA,M.Tech, Ph.D., trabalhando como Professor Associado no Departamento de Aplicações Informáticas, Universidade Integral, Lucknow, Índia. Ele tem mais de 18 anos de experiência no campo académico. Está activamente envolvido na investigação e publicou artigos em revistas de renome e também membro de vários organismos profissionais.
Weitere Informationen
- Allgemeine Informationen
- GTIN 09786205058633
- Sprache Deutsch
- Genre Sonstige Wirtschaftsbücher
- Größe H220mm x B150mm x T16mm
- Jahr 2022
- EAN 9786205058633
- Format Kartonierter Einband
- ISBN 978-620-5-05863-3
- Veröffentlichung 07.08.2022
- Titel Ein Handbuch zur Migration von parallelen Webcrawlern
- Autor Md. Faizan Farooqui , Mohd. Muqeem
- Gewicht 405g
- Herausgeber Verlag Unser Wissen
- Anzahl Seiten 260