Docteur en informatique, Université de Caen Basse-Normandie
Thèse (2008-2011)
Titre : "Alignement de documents multilingues sans présupposé de parallélisme" Télécharger le pdf
Encadrement : Cette thèse a été réalisée dans le cadre d'une convention CIFRE. Elle a été co-encadrée par des membres du GREYC (Jacques Vergne et Emmanuel Giguet) et de la société Pertimm (Patrick Constant et Loïs Rigouste)
Objectifs : L'objectif de cette thèse est de produire un système d'alignement de documents, indépendant des langues, permettant de mettre en évidence des correspondances sémantiques entre des chaînes de caractères. Ces travaux ne mobilisent aucune ressource linguistique, ils ne prennent en entrée qu'un corpus de documents traductions les uns des autres : des multidocuments.