Les technologies modernes de génomique permettent de caractériser chaque échantillon biologique au niveau moléculaire, générant de grandes quantités de données. L’analyse statistique de ces données peut permettre de trouver des corrélations entre des caractéristiques biologiques des patients et, par exemple, la réponse à certains traitements, ouvrant la voie à la médecine dite « de précision » qui optimiserait les choix thérapeutiques en fonction du génome et des particularités de chaque individu. La détection de corrélations prédictives pose cependant des problèmes mathématiques et informatiques, puisqu’on a affaire à des données de très grandes dimensions, avec des structures particulières, et à un nombre souvent restreint d’échantillon pour l’inférence. Je présenterai certaines techniques que nous développons, permettant de formuler le problème d’apprentissage statistique comme un problème d’optimisation intégrant des connaissances biologiques sous forme de contraintes, et illustrerai leur application dans le cadre de l’étude de cancers.
- ANNÉE 2016-2017
- Archives Séminaire « Des mathématiques »
- Séminaire Des mathématiques