Dissertation/ Thesis
Classification sur données médicales à l'aide de méthodes d'optimisation et de datamining, appliquée au pré-screening dans les essais cliniques
العنوان: | Classification sur données médicales à l'aide de méthodes d'optimisation et de datamining, appliquée au pré-screening dans les essais cliniques |
---|---|
المؤلفون: | Jacques, Julie |
بيانات النشر: | Université des Sciences et Technologie de Lille - Lille I, 2013. |
سنة النشر: | 2013 |
المجموعة: | CCSD theses-EN-ligne, France |
مصطلحات موضوعية: | [INFO:INFO_LG] Computer Science/Machine Learning, [INFO:INFO_LG] Informatique/Apprentissage, [INFO:INFO_RO] Computer Science/Operations Research, [INFO:INFO_RO] Informatique/Recherche opérationnelle, [MATH:MATH_CO] Mathematics/Combinatorics, [MATH:MATH_CO] Mathématiques/Combinatoire, optimisation combinatoire, classification supervisée, classification partielle, données asymétriques, données médicales, essais cliniques |
الوصف: | Les données médicales souffrent de problèmes d'uniformisation ou d'incertitude, ce qui les rend difficilement utilisables directement par des logiciels médicaux, en particulier dans le cas du recrutement pour les essais cliniques. Dans cette thèse, nous proposons une approche permettant de palier la mauvaise qualité de ces données à l'aide de méthodes de classification supervisée. Nous nous intéresserons en particulier à 3 caractéristiques de ces données : asymétrie, incertitude et volumétrie. Nous proposons l'algorithme MOCA-I qui aborde ce problème combinatoire de classification partielle sur données asymétriques sous la forme d'un problème de recherche locale multi-objectif. Après avoir confirmé les apports de la modélisation multi-objectif dans ce contexte, nous calibrons MOCA-I et le comparons aux meilleurs algorithmes de classification de la littérature, sur des jeux de données réels et asymétriques de la littérature. Les ensembles de règles obtenus par MOCA-I sont statistiquement plus performants que ceux de la littérature, et 2 à 6 fois plus compacts. Pour les données ne présentant pas d'asymétrie, nous proposons l'algorithme MOCA, statistiquement équivalent à ceux de la littérature. Nous analysons ensuite l'impact de l'asymétrie sur le comportement de MOCA et MOCA-I, de manière théorique et expérimentale. Puis, nous proposons et évaluons différentes méthodes pour traiter les nombreuses solutions Pareto générées par MOCA-I, afin d'assister l'utilisateur dans le choix de la solution finale et réduire le phénomène de sur-apprentissage. Enfin, nous montrons comment le travail réalisé peut s'intégrer dans une solution logicielle. |
Original Identifier: | oai:tel.archives-ouvertes.fr:tel-00919876 |
نوع الوثيقة: | Thesis |
اللغة: | French |
الاتاحة: | http://tel.archives-ouvertes.fr/tel-00919876 http://tel.archives-ouvertes.fr/docs/00/91/98/76/PDF/2013-12-02_these-jj_min.pdf |
رقم الانضمام: | edsndl.CCSD.oai.tel.archives.ouvertes.fr.tel.00919876 |
قاعدة البيانات: | Networked Digital Library of Theses & Dissertations |
الوصف غير متاح. |