[Liste-proml] Offre de thèse - Fouille de règles d'association à partir de données complexes : approche guidée par une classification d'entités

Jean Diatta jean.diatta at univ-reunion.fr
Mer 9 Mai 19:39:57 CEST 2012


Sujet : Fouille de règles d'association à partir de données  
complexes : approche guidée par une classification d'entités

Direction de thèse  : Jean Diatta (jean.diatta at univ-reunion.fr) et  
Christian Delhommé (christian.delhomme at univ-reunion.fr)
Mots clés : règles d'association, structures de classification,  
mesures de qualité, familles génératrices minimales, indices de  
(dis)similarité
Ecole Doctorale : Sciences Technologies Santé de la Réunion
Laboratoire d'accueil : Laboratoire d'Informatique et de  
Mathématiques, Université de la Réunion
Financement : Bourse de type contrat doctoral établissement

L'espace de recherche des règles d'association valides dans un  
contexte binaire de fouille de données (ensemble fini d'entités  
décrites par un ensemble fini d'attributs binaires) est fini. Dans un  
tel contexte, il est théoriquement possible d'envisager des approches  
d'exploration exhaustive de cet espace. Par contre, l'espace de  
recherche des règles peut devenir infini (voire non dénombrable)  
lorsque les attributs ne sont pas binaires (ce qui est le cas dans  
bien de situations réelles). Il est alors opportun, dans une telle  
situation, d'envisager des stratégies de segmentation de l'espace,  
permettant de capturer efficacement des règles pertinentes.
L'objectif de cette thèse est de chercher dans quelle mesure une  
classification non supervisée de tout ou partie de l'ensemble des  
entités peut guider le processus d'extraction de règles d'association  
à partir de données non nécessairement binaires, notamment pour :
la détermination d'un espace de recherche pour les prémisses et  
conséquents des règles ;
le parcours de cet espace de recherche ;
l'évaluation de la qualité des candidats règles ;
etc..
La stratégie de classification non supervisée devra, entre autres,  
apporter des réponses aux questions suivantes :
Quelle(s)  structure(s) de classification (allant des arbres  
hiérarchiques aux treillis de Galois) serai(en)t plus appropriée(s) ?
Quel(s) indice(s) de proximité utiliser pour construire le système de  
classification des entités ?
Existe-t-il des propriétés de compatibilité entre certaines structures  
de classification et certaines mesures de qualité de règles  
d'association, sachant que ces mesures de qualité sont des fonctions  
agissant sur les fermetures (de Galois) de sous-ensembles d'entités ?
Candidature : Les dossiers de candidature peuvent être téléchargés via  
le lien : http://bit.ly/I19GzV. La date limite de dépôt des  
candidatures auprès de l'école doctorale est fixée au 25 juin 2012.  
Les candidat(e)s intéressé(e)s sont invité(e)s à prendre contact avec  
les directeurs de thèse, le plus tôt possible (de préférence avant le  
15 juin), en vue d'éventuels entretiens.

Jean Diatta
  +262 (0)262 48 33 95     +262 (0)262 48 33 91
Laboratoire d'Informatique et de Mathématiques
Université de La Réunion

-------------- section suivante --------------
Une pièce jointe HTML a été nettoyée...
URL: <http://lists.lri.fr/pipermail/liste-proml/attachments/20120509/c839a29c/attachment.html>


Plus d'informations sur la liste de diffusion Liste-proml