Wir verwenden Cookies und Analyse-Tools, um die Nutzerfreundlichkeit der Internet-Seite zu verbessern und für Marketingzwecke. Wenn Sie fortfahren, diese Seite zu verwenden, nehmen wir an, dass Sie damit einverstanden sind. Zur Datenschutzerklärung.
Klassifizierung von Web-Dokumenten
Details
Bei der Web-Archivierung werden Web-Dokumentegesammelt und dauerhaft abgelegt. Um Missbrauchvorzubeugen müssen sensitive Daten identifiziert undgegen unbefugte Zugriffe gesichert werden. Dadurchwerden Anwendungsfälle denkbar in welchen auf Basisvon sensitiven Daten Auswertungen vorgenommen werdenohne dabei die Daten selbst preis zugeben. Bei derGenre-Analyse werden Web-Dokumente aufgrund ihrerForm sowie des Stils einer Seite unabhängig vomeigentlichen Thema klassiffiziert. Zielsetzung dieserArbeit ist es, diese Methode dahingehend zuerweitern, dass es einem Archivierungssystem vonWeb-Dokumenten möglich ist, private und öffentlicheElemente von Web-Dokumenten unterscheiden zu können.Bisherige Ansätze in diesem Bereich agierenausschließlich auf Dokumentenebene. Web-Dokumenteenthalten jedoch häufig mehrere unterschiedlicheGenres. Diese Arbeit entwickelt einen Ansatz zurErkennung von zusammengehörenden Textsegmenten,welcher Absätze und gegebenenfalls damit verbundeneGenre- Übergänge erkennt. Darauf aufbauend wird einAnsatz für die Klassifizierung von privaten undöffentlichen Elementen von Web-Dokumenten aufDokumenten- und Absatzebene vorgestellt.
Autorentext
Bernhard Wachter, Dipl.-Ing.: Studium der Informatik an der
Technischen Universität Wien.
Klappentext
Bei der Web-Archivierung werden Web-Dokumente
gesammelt und dauerhaft abgelegt. Um Missbrauch
vorzubeugen müssen sensitive Daten identifiziert und
gegen unbefugte Zugriffe gesichert werden. Dadurch
werden Anwendungsfälle denkbar in welchen auf Basis
von sensitiven Daten Auswertungen vorgenommen werden
ohne dabei die Daten selbst preis zugeben. Bei der
Genre-Analyse werden Web-Dokumente aufgrund ihrer
Form sowie des Stils einer Seite unabhängig vom
eigentlichen Thema klassiffiziert. Zielsetzung dieser
Arbeit ist es, diese Methode dahingehend zu
erweitern, dass es einem Archivierungssystem von
Web-Dokumenten möglich ist, private und öffentliche
Elemente von Web-Dokumenten unterscheiden zu können.
Bisherige Ansätze in diesem Bereich agieren
ausschließlich auf Dokumentenebene. Web-Dokumente
enthalten jedoch häufig mehrere unterschiedliche
Genres. Diese Arbeit entwickelt einen Ansatz zur
Erkennung von zusammengehörenden Textsegmenten,
welcher Absätze und gegebenenfalls damit verbundene
Genre- Übergänge erkennt. Darauf aufbauend wird ein
Ansatz für die Klassifizierung von privaten und
öffentlichen Elementen von Web-Dokumenten auf
Dokumenten- und Absatzebene vorgestellt.
Weitere Informationen
- Allgemeine Informationen
- GTIN 09783639089066
- Sprache Deutsch
- Genre Wirtschafts-Lexika
- Anzahl Seiten 104
- Größe H220mm x B150mm x T6mm
- Jahr 2012
- EAN 9783639089066
- Format Kartonierter Einband (Kt)
- ISBN 978-3-639-08906-6
- Titel Klassifizierung von Web-Dokumenten
- Autor Bernhard Wachter
- Untertitel Untertitel
- Gewicht 173g
- Herausgeber VDM Verlag Dr. Müller e.K.