Population der Daten im Schema der extrahierten Webtabelle
Details
Tabellarische Daten sind eine bestehende Informationsquelle im Internet. Wir haben mit der Sammlung von HTML-Tabellen aus dem Internet begonnen. Zunächst werden Tabellen guter Qualität identifiziert, dann wird ein Schema-Matching durchgeführt. Beim Schema-Matching wird die Anzahl der Übereinstimmungen ermittelt, die die ähnlichen Elemente aus zwei verschiedenen Schemata bestimmen. Die Spalten und Datenwerte werden nacheinander verglichen, um das Schema abzugleichen. Bei der Suche nach tabellarischen Daten im Web kann die Suchmaschine eine URL anstelle von tabellarischen Daten zurückgeben, was das Hauptproblem ist. Wir arbeiten also an diesem Problem, indem wir Daten von tabellarischen Webseiten extrahieren und ihr Schema extrahieren und dann einen Schemaabgleich durchführen, indem wir die Korrespondenz ähnlicher Elemente durch korpusbasierte Technik identifizieren. Nach dem Schemaabgleich füllten wir die Daten der HTML-Seiten auf, indem wir verwandte Tabellen in einer HTML-Tabelle zusammenfügten, die für die Benutzer besser geeignet und hilfreich ist.
Autorentext
Kamran Shaukat rabotaet prepodawatelem informacionnyh tehnologij w Uniwersitete Pendzhaba, kampus Dzhelum. On poluchil stepen' magistra komp'üternyh nauk s zolotoj medal'ü w Uniwersitete Mohammada Ali Dzhinny, Islamabad, i stepen' bakalawra komp'üternyh nauk w Kolledzhe informacionnyh tehnologij Pendzhabskogo uniwersiteta, Lahor.
Weitere Informationen
- Allgemeine Informationen
- GTIN 09786207667543
- Genre Sonstige Informatikbücher
- Sprache Deutsch
- Anzahl Seiten 56
- Größe H220mm x B150mm x T4mm
- Jahr 2024
- EAN 9786207667543
- Format Kartonierter Einband
- ISBN 978-620-7-66754-3
- Veröffentlichung 16.06.2024
- Titel Population der Daten im Schema der extrahierten Webtabelle
- Autor Kamran Shaukat , Nayyer Masood , Sundas Mehreen Fatima Haider
- Gewicht 102g
- Herausgeber Verlag Unser Wissen