Wir verwenden Cookies und Analyse-Tools, um die Nutzerfreundlichkeit der Internet-Seite zu verbessern und für Marketingzwecke. Wenn Sie fortfahren, diese Seite zu verwenden, nehmen wir an, dass Sie damit einverstanden sind. Zur Datenschutzerklärung.
Worte sind nicht gleich: Ein abgestuftes Gewichtungsmodell für Dokumentenvektoren
Details
In den letzten Jahren wurden Verteilungssemantiken oder Vektormodelle für Wörter vorgeschlagen, um sowohl die syntaktischen als auch die semantischen Ähnlichkeiten zwischen Wörtern zu erfassen. Solche Vektoren können für Wörter gewonnen werden, die in einem großen Korpus oder in einem bestimmten Bereich verwendet werden. Da es sich hierbei um sprachfreie Modelle handelt, die auf unüberwachte Weise gewonnen werden können, sind sie für Sprachen mit geringen Ressourcen wie Hindi von Interesse. Wir beginnen mit einem Überblick, der zeigt, dass ein vernünftiges Maß für die semantische Ähnlichkeit in Hindi durch eine Wortvektorkarte erfasst zu werden scheint.
Autorentext
Pranjal Singh : B.Tech.-M.Tech. Dual Degree, Computer Science & Engineering, Indian Institute of Technology Kanpur.
Weitere Informationen
- Allgemeine Informationen
- GTIN 09786204481715
- Sprache Deutsch
- Genre Sozialpädagogik & Soziale Arbeit
- Größe H220mm x B150mm x T4mm
- Jahr 2022
- EAN 9786204481715
- Format Kartonierter Einband
- ISBN 978-620-4-48171-5
- Titel Worte sind nicht gleich: Ein abgestuftes Gewichtungsmodell für Dokumentenvektoren
- Autor Pranjal Singh
- Gewicht 113g
- Herausgeber Verlag Unser Wissen
- Anzahl Seiten 64