Lead
Dans le contexte actuel du “Big Data”, la découverte de tendances et de signaux cachés dans d’imposantes quantités de données est en train de devenir l’un des défis majeur de la recherche scientifique moderne. Une illustration de l'explosion de la taille des données actuelles se trouve, par exemple, dans les domaines de la santé, du biomédical et de la recherche en sciences sociales où il est estimé que la dimension de la masse des données collectées double chaque année. A cette croissance exponentielle s'ajoute l'augmentation rapide de la complexité des modèles considérés dans de nombreux domaines de recherche. Ces deux facteurs, créent une multitude de défis numériques qui ne peuvent être relevés par les méthodes statistiques classiques actuelles. C'est donc pour répondre à ces besoins croissants de méthodes d’analyse de données adaptées à ces nouveaux défis numériques, que la recherche, notamment dans le domaine de la statistique, se focalise.

Lay summary
Notre principal objectif est de contribuer au développement de nouvelles méthodes statistiques en lien avec les défis numériques d'aujourd'hui. Plus précisément, ces méthodes doivent permettre de considérer des modèles complexes (pour lesquels il n'existe actuellement aucune solution satisfaisante) et/ou l'analyse d’imposantes quantités de données. Ces développements méthodologiques s'appliqueront en particulier (i) dans le contexte des données dites "dépendantes" (dans le temps et l'espace) ainsi que (ii) dans le cadre du problème de la sélection de modèles. Nous considérerons également (iii) le développement de nouvelles méthodes prédictives permettant de répondre directement à des critères de décisions basés sur une expertise scientifique et non sur un critère purement statistique qui peut, dans certains cas, amener à des contradictions. 
 
Ce projet de recherche vise à contribuer au développement de nouvelles méthodes statistiques permettant de répondre à certains défis numériques d'aujourd'hui, en particulier dans l'analyse d’imposantes quantités de données. Cette recherche sera conduite avec la perspective d'applications, dans un esprit interdisciplinaire, à des domaines ayant un fort impact sociétal, tels que les sciences pharmaceutiques ou les médias. Les résultats de ce projet seront mis à disposition de la communauté scientifique, académique et privée, par le biais de logiciels et autres outils numériques.