Wir verwenden Cookies und Analyse-Tools, um die Nutzerfreundlichkeit der Internet-Seite zu verbessern und für Marketingzwecke. Wenn Sie fortfahren, diese Seite zu verwenden, nehmen wir an, dass Sie damit einverstanden sind. Zur Datenschutzerklärung.
Auf maschinellem Lernen basierende Erkennung von Untertiteln mit NLP
Details
Die spontane Kennzeichnung des Inhalts eines digitalen Bildes ist eine der wichtigsten Schwierigkeiten beim Deep Learning, das die Computervisualisierung und die englische Sprache miteinander verbindet. In dieser Forschungsarbeit haben wir ein propagatives Modell entwickelt, das auf einer tiefen, wiederkehrenden Produktion basiert, die moderne Verbesserungen in der Computervisualisierung und in der Umschreibung von Erfindungen zusammenfasst, und das verwendet werden kann, um regelmäßige Urteile zur Kennzeichnung eines digitalen Bildes zu erzeugen. Das Prototypische wird durchgeführt, um die Wahrscheinlichkeit des objektiven Erklärungsurteils angesichts des passenden digitalen Bildes voll auszunutzen. Diese Arbeit zielt auf die Generierung von Untertiteln für Bilder unter Verwendung neuronaler Sprachmodelle ab. Die Zahl der vorgeschlagenen Modelle für die Untertitelung digitaler Bilder ist stark angestiegen, seit neuronale Sprachmodelle und tiefe Faltungsneuronale Netze (CNN) sich durchgesetzt haben. Unsere Arbeit basiert auf einer dieser Arbeiten, die eine Variante des rekurrenten neuronalen Netzes (RNN) in Verbindung mit einem CNN verwendet. Wir beabsichtigen, dieses Modell zu verbessern, indem wir subtile Änderungen an den Bausteinen vornehmen und Phrasen als elementare Einheiten anstelle von Wörtern verwenden, was zu besseren semantischen und syntaktischen Untertiteln führen kann.
Autorentext
Tarun Jaiswal hat sein dreijähriges Studium der Flugzeugwartungstechnik (AME) am Hindustan Institute of Aeronautics bei der DGCA absolviert und verfügt über die Lizenzpapiere RA, CP und CT gemäß ICAO Type-II. Er ist der Autor der folgenden Bücher: Betriebssysteme, Computergrundlagen, Datenstruktur, Computernetzwerke und Forschungsmethodik.
Weitere Informationen
- Allgemeine Informationen
- GTIN 09786204776576
- Genre Informatik & EDV
- Sprache Deutsch
- Anzahl Seiten 52
- Herausgeber Verlag Unser Wissen
- Größe H220mm x B150mm x T4mm
- Jahr 2022
- EAN 9786204776576
- Format Kartonierter Einband
- ISBN 978-620-4-77657-6
- Titel Auf maschinellem Lernen basierende Erkennung von Untertiteln mit NLP
- Autor Tarun Jaiswal , Sushma Jaiswal
- Gewicht 96g