[Liste-proml] Soutenance de thèse de G. Wisniewski

Guillaume WISNIEWSKI guillaume.wisniewski at lip6.fr
Mer 28 Nov 09:17:05 CET 2007


Bonjour,

J'ai le plaisir de vous inviter à ma soutenance de thèse intitulée
« Apprentissage dans les espaces structurés. Applications à l'étiquetage 
de séquences et à la transformation automatique de documents » ainsi 
qu'au pot qui suivra.

La soutenance se déroulera le Jeudi 29 novembre à 14h en Salle 549 au 
Laboratoire d'Informatique de Paris 6.

Composition du jury :
- Younès Bennani, Professeur, Université Paris Nord (examinateur)
- Patrick Gallinari, Professeur, Université Pierre et Marie Curie 
(directeur de thèse)
- Éric Gaussier, Professeur, Université Joseph Fourier (examinateur)
- Marc Sebban, Professeur, Université Jean-Monnet (examinateur)
- Marc Tommasi, Maître de Conférences, Université de Lille 3 (rapporteur)
- François Yvon, Professeur, Université Paris Sud (rapporteur)

Résumé :

De nombreux problèmes d'apprentissage consistent à prédire des 
séquences, des arbres ou des graphes. Contrairement aux problèmes de 
classification usuels, ces sorties sont structurées: elles se 
décomposent en un ensemble d'éléments, dont les étiquettes sont 
interdépendantes. L'apprentissage de fonctions utilisant ces dépendances 
entre étiquettes durant l'inférence, appelé apprentissage structuré, est 
un sous-domaine de l'apprentissage statistique qui s'est récemment 
fortement développé.

L'étude de ces différentes méthodes d'apprentissage structuré constitue 
la première partie de cette thèse. Nous y décrivons notamment 
l'application de ces méthodes sur une tâche d'étiquetage de séquences et 
sur une tâche de prédiction d'arbres. Cette dernière tâche est 
directement motivée par la problématique générale d'automatisation de la 
transformation de documents structurés qui est, aujourd'hui, au cœur de 
plusieurs problématiques d'accès à l'information.

Dans une deuxième partie de ce travail, nous nous sommes intéressé à 
deux limites des modèles existants qui rendent ceux-ci inapplicables à 
de nombreux problèmes pratiques : leur complexité élevée et leur 
expressivité limitée qui ne leur permet de ne considérer que des 
dépendances locales. Nous proposons d'aborder ce problème sous l'angle 
de la sélection de caractéristiques et décrivons une méthode 
d'étiquetage de séquences représentant les dépendances par des 
contraintes, ce qui lui permet d'extraire efficacement les dépendances 
non locales et de les utiliser en inférence tout en conservant une 
complexité faible.

Cordialement,



-- 
Guillaume Wisniewski


More information about the Liste-proml mailing list