Wir verwenden Cookies und Analyse-Tools, um die Nutzerfreundlichkeit der Internet-Seite zu verbessern und für Marketingzwecke. Wenn Sie fortfahren, diese Seite zu verwenden, nehmen wir an, dass Sie damit einverstanden sind. Zur Datenschutzerklärung.
Alignement des corpus parallèles
Details
La traduction statistique requiert des corpus parallèles en grande quantité. L'obtention de tels corpus passe par l'alignement automatique au niveau des phrases. L'alignement des corpus parallèles a reçu beaucoup d'attention dans les années quatre vingt et cette étape est considérée comme résolue par la communauté. Nous montrons dans notre mémoire que ce n'est pas le cas et proposons un nouvel aligneur que nous comparons à des algorithmes à l'état de l'art. Notre aligneur est simple, rapide et permet d'aligner une très grande quantité de données. Il produit des résultats souvent meilleurs que ceux produits par les aligneurs les plus élaborés. Nous analysons la robustesse de notre aligneur en fonction du genre des textes à aligner et du bruit qu'ils contiennent. Pour cela, nos expériences se décomposent en deux grandes parties. Dans la première partie, nous travaillons sur le corpus BAF où nous mesurons la qualité d'alignement produit en fonction du bruit qui atteint les 60%. Dans la deuxième partie, nous travaillons sur le corpus EuroParl où nous revisitons la procédure d'alignement avec laquelle le corpus Europarl a été préparé et montrons que de meilleures performances au niveau
Autorentext
Fethi Lamraoui, titulaire d'une maîtrise en informatique, département d'informatique et de recherche opérationnelle à l'université de Montréal, programmeur analyste à Mondoin, Montréal.
Weitere Informationen
- Allgemeine Informationen
- GTIN 09783330866935
- Genre Informatique et technique
- Anzahl Seiten 92
- Herausgeber Éditions universitaires européennes
- Untertitel Traitement des langues naturelles
- Autor Fethi Lamraoui
- Titel Alignement des corpus parallèles
- Veröffentlichung 08.05.2017
- ISBN 978-3-330-86693-5
- Format Kartonierter Einband
- EAN 9783330866935
- Jahr 2017
- Größe H220mm x B150mm
- Sprache Französisch