L'équipe académique

Publié le

Le Machine Learning à Télécom ParisTech

Le machine learning représentant un champ d’investigation essentiel dans les sciences et technologies de l'information et de la communication, du fait de l’importance de ses applications, allant de l'indexation et la recherche automatique de documents à la prédiction de comportements en passant par la détection d’anomalies, la recommandation , la visualisation d’information massive ou encore l’analyse des réseaux sociaux.

Telecom ParisTech regroupe de nombreux spécialistes reconnus dans ce domaine, au sein des Départments TSI et INFRES principalement (Signal & Image, Informatique & Réseaux).

Les techniques d’apprentissage ne sont pas exclusivement utilisées dans ces départements, elles s’avèrent également pertinentes dans le domaine des communications numériques (pour les questions relatives au « location fingerprinting » par exemple). Toutefois, les résultats obtenus dans le domaine de la théorie de l’apprentissage à Telecom ParisTech sont principalement le fruit de l’activité des chercheurs travaillant au sein des groupes de recherche STA, DBWeb, AAO, TII et MM.

L'équipe académique

Stephan Clémençon est Professeur à Télécom-ParisTech, Institut Mines-Télécom, au sein du Département TSI et anime le groupe de recherche STA. Il effectue ses travaux de recherche en mathématiques appliquées au LTCI UMR Télécom ParisTech/CNRS No. 5141. Ses thématiques de recherche se situent principalement dans les domaines du machine-learning, des probabilités et des statistiques. Il est responsable du Mastère Spécialisé « Big Data » à Télécom ParisTech ainsi que du Certificat d’Études Spécialisées « Data Scientist » et titulaire de la chaire industrielle « Machine-Learning for Big Data ». Mots-clés : ranking, clustering, détection d'anomalie, graph-mining, moteurs de recommandation

Olivier Cappé est Directeur de Recherche au CNRS. Il est Directeur du LTCI et effectue sa recherche au sein du groupe STA (Département TSI). Ses thèmes de recherche incluent le machine-learning, les méthodes de type Monte Carlo, la statistique pour le traitement du signal. Professeur associé à l'école Polytechnique, il est récipiendaire du Grand Prix EADS de l'Académie des Sciences en 2012. Mots-clés : apprentissage statistique, HMM, méthodes particulaires, problèmes de bandits, apprentissage en-ligne


Eric Moulines est Professeur à l'Ecole polytechnique et Professeur associé à Télécom ParisTech. Ses thèmes de recherche incluent le machine-learning, les méthodes de type Monte Carlo, la statistique pour le traitement du signal. Editeur en chef de la revue Bernoulli, il est responsable du Master "Mathématiques pour la science des masses de données". Médaille d'argent du CNRS en 2010, il est également récipiendaire du Grand Prix France Télécom de l'Académie des Sciences en 2011. Mots-clés : approximation stochastique, apprentissage statistique, HMM, méthodes particulaires

Joseph Salmon est Maître de conférence à Télécom ParisTech depuis 2012. Il est spécialisé en traitement statistique des images et en apprentissage statistique. Sa recherche porte sur la création et l'étude d'algorithmes pour le traitement de données en grande dimension. Post-doctorat, Duke University, 2011-2012. Doctorat, Université Paris 7, 2010. Master M2MO, Université Paris 7, 2007. ENS de Cachan, 2005-2007. Agrégation de Mathématiques, 2006. ENSAE, 2007. Mots-clés : complétion de matrice, régression linéaire en grande dimension, Lasso, Agrégation d'estimateurs, débruitage d'image.

Fabian M. Suchanek est maître de conférences à Télécom ParisTech. Il a fait ses recherches chez l’Institut Max Planck en Allemagne, Microsoft Research Cambridge/UK, Microsoft Research Silicon Valley/USA, et l’INRIA Saclay. Il est l’auteur principal de YAGO, une des plus grandes bases de connaissances publiques dans le monde. Mots-clés : Web Sémantique, Bases de Connaissances, Extraction d'Informations, Traitement du Langage Naturel, Raisonnement Automatique

Slim Essid est enseignant-chercheur à Télécom ParisTech depuis 2006. Sa recherche s'intéresse au machine-learning pour le traitement du signal et l'analyse de données multimodales. Les applications traitées incluent l'analyse de contenus audiovisuels et musicaux, l'analyse d'activités humaines et la reconnaissance des émotions, et l'analyse des signaux EEG. Il a été impliqué depuis 2005 dans plusieurs projets collaboratifs nationaux et européens (FP6 et FP7). Mots-clés : Apprentissage discriminatif, CRF, analyse en variables latentes, factorisation de matrices, données multimodales.

Alexandre Gramfort est enseignant-chercheur au département Traitement du Signal et de l'Image de Télécom ParisTech. Ses recherches portent sur le traitement du signal, l'apprentissage statistique et le calcul scientifique avec pour application principale la modélisation et l'analyse de données en neurosciences. Il est un des principaux contributeurs du projet logiciel open source Scikit-Learn qui est la librairie standard pour l'apprentissage statistique en Python. Mots-clés : apprentissage supervisé, optimisation, méthodes parcimonieuses, software.

Ons Jelassi est enseignante à la formation continue de Télécom ParisTech. Elle a travaillé dans le domaine de la métrologie et des performances des réseaux dans le cadre de sa thèse et en tant que consultante auprès de grandes entreprises pour des missions d'audit et d'expertise. Ses travaux de recherche au sein du groupe STA portent sur le passage à l'échelle des algorithmes d'apprentissage. Mots-clés : apprentissage, performances, passage à l'échelle, algorithmes distribués.

Chloé Clavel est enseignant-chercheur à Telecom-ParisTech. Ses activités de recherche appartiennent au domaine de l’Affective Computing. Elle a précédemment travaillé en tant que chercheuse à Thales Research and Technology puis à EDF R&D. Ses travaux concernant l’analyse des opinions et des sentiments dans les textes, ont notamment été abordés dans un contexte applicatif de gestion de la relation client sur des corpus riches en expressions spontanées (forums de relation client, transcriptions manuelles et automatiques des centres d’appels, etc.). Mots-clés : analyse des opinions, text mining, apprentissage, traitement de la parole, reconnaissance des émotions.

Pascal Bianchi est né en 1977 à Nancy. Il est titulaire d’un Master en Sciences de l'Université de Paris XI et de  Supélec en 2000 et d’un doctorat de l'Université de Marne-la-Vallée en 2003. De 2003 à 2009, il était Maître de Conférences au Département des télécommunications de Supélec. En 2009, il a rejoint le groupe Statistiques et Applications au LTCI de Télécom ParisTech. Ses intérêts de recherche actuels se trouvent dans le domaine de l'optimisation continue appliquée au traitement du signal et aux systèmes distribués. Mots-clés : traitement statistique du signal, optimisation convexe, optimisation distribuée, réseaux de capteurs.

Laurence Likforman est Professeur Associé (HDR) à Télécom ParisTech depuis 1991. Elle est responsable du cours Reconnaissance des formes et enseigne également en Traitement du signal, Analyse de documents et Statistiques. Mots-Clés : Reconnaissance d'écriture, modèles Markoviens, Réseaux Bayesiens, Réseaux de neurones récurrents.

 

 

Florence d'Alché-Buc est professeur à Télécom-ParisTech, Institut Mines-Télécom depuis 2014. Elle était auparavant professeur à l’Université d’Evry,  titulaire d’une ATIGE et co-directrice du laboratoire IBISC. Ses recherches portent sur l’apprentissage statistique, l’inférence de réseaux, la prédiction structurée et la modélisation de systèmes dynamiques avec des différentes applications à la biologie computationnelle. Mots-clés : apprentissage statistique, méthodes à noyaux, prédiction structurée, prédiction de liens, inférence de réseaux, systèmes dynamiques.

François Roueff est Professeur à Télécom-ParisTech, Institut Mines-Télécom, au sein du groupe STA (Département TSI) et professeur associé au département de mathématiques appliquées de l'École Polytechnique. Ses thèmes de recherche se situent principalement dans les domaines du traitement statistique du signal, de l'analyse et la modélisation aléatoire des séries temporelles et des statistiques pour les processus stochastiques. Mots-clés : longue dépendence, analyse en ondelettes, processus de Hawkes, processus localement stationnaires.


Olivier Fercoq est maître de conférences à Télécom ParisTech. Il a un Master de Paris 6 et de l'Ensta ParisTech. Pendant son doctorat à l'École Polytechnique (2009-2012), il a étudié des problèmes d'optimisation liés au référencement des pages web et à des applications en biologie. Il a passé deux ans à l'Université d'Édimbourg où il a travaillé sur les méthodes de descente par coordonnée. Il a rejoint Télécom ParisTech en 2014. Ses intérêts de recherche actuels portent sur le développement et l'étude d'algorithmes d'optimisation pour des problèmes de grande dimension. Mots-clés : optimisation, algorithmes stochastiques, vitesse de convergence, grande dimension, calculs en parallèle.

Patrice Bertail est professeur de mathématiques (section 26) à l'université Paris-Ouest-Nanterre-La Défense, Professeur associé à Télécom ParisTech. Ses thèmes de recherche portent essentiellement sur les probabilités et la statistique non-paramétrique, avec des travaux notamment sur les méthodes de ré-échantillonnage, les valeurs extrêmes, les bornes exponentielles en apprentissage, en indépendant ou pour des chaînes de Markov. Il développe actuellement des techniques basées sur les sondages et le sous-échantillonnage pour le "big data". Il a été responsable du Master ISIFAR, spécialisé autour du risque pour les assurances, à  l'université Paris-Ouest. Mots-clés : Ré-échantillonnage, Apprentissage Statistique, Extrêmes, Sondages, chaîne de Markov

François Portier est Maître de Conférences dans le groupe STA du département TSI e Télécom ParisTech. François Portier a réalisé son doctorat sur la réduction de la dimension en régression à l’Université de Rennes 1, sous la direction de Bernard Delyon (2010-2013). Il effectue, depuis septembre 2013, un postdoctorat à l’Université catholique de Louvain sous la direction de Ingrid Van Keilegom et Johan Segers. Ses thèmes de recherche portent sur l’asymptotique et le bootstrap des estimateurs semi-paramétriques. Mots-clés : Estimation semi-paramétrique, Efficacité, Bootstrap, Processus empirique, Réduction de la dimension.

Umut Simsekli is a maitre de conference at Telecom ParisTech. He received his PhD degree in 2015 on inference methods for large-scale matrix and tensor factorization models in the Department of Computer Engineering at Bogaziçi University, İstanbul, Turkey. His research interests are in scalable Bayesian machine learning, audio and music processing, and recommendation systems. Keywords: matrix and tensor factorizations, Markov Chain Monte Carlo, audio and music processing.

 

Et aussi :

Doctorants

Nicolas Goix effectue son doctorat au département TSI de Télécom ParisTech (groupe STA) depuis octobre 2013. Normalien en mathématiques à l’ENS Cachan, il a effectué avant sa thèse un stage d'une année de recherche au LPMA (Paris VI). Sa thèse encadrée par Stéphan Clémençon et Anne Sabourin porte sur les méthodes d'apprentissage pour la détection d'anomalies. Il est aussi contributeur de Scikit-Learn dans le cadre du projet Paris-Saclay Center for Data Science, sous l'encadrement d'Alexandre Gramfort. Mots-clés : apprentissage non-supervisé, détection d'anomalies, extrêmes multivariés, réduction de dimension.

Mastane Achab est doctorant au sein du groupe STA depuis le 3 septembre 2016. Il est titulaire du diplôme d'ingénieur de l’Ecole polytechnique et du master MVA de l’ENS Cachan. Sa thèse, encadrée par Stephan Clémençon, Aurélien Garivier et Anne Sabourin, porte sur l'apprentissage par renforcement de stratégies robustes aux risques extrêmes qui existent dans de nombreuses applications (médecine, assurance, finance). Mots-clés : reinforcement learning, multi-armed bandit, risk aversion, extreme value theory.​

Et aussi :

  • Jean Lafond

Etudiants en thèse financée par la Chaire

Claire Vernade est doctorante au LTCI depuis le 1er octobre 2014. Elle est issue de la formation d'ingénieur de Télécom ParisTech ainsi que du master MVA (ENS Cachan) qu'elle a suivi dans le cadre du double diplôme cohabilité par l'école. Sa thèse, sous la direction d'Olivier Cappé, concerne principalement l'étude de modèles d'apprentissage en ligne pour les systèmes de recommandation (Axe 1). Ses thèmes de recherches incluent notamment les méthodes de bandits (multi-armed bandit models), l'apprentissage par renforcement et l'apprentissage en ligne (Online Learning). Mots-clés : recommandation dynamique, problèmes de bandits, apprentissage en ligne, apprentissage par renforcement.

Luis Galárraga est doctorant au département INFRES de Télécom ParisTech (groupe DBWeb) depuis février 2014 sous l'encadrement de Fabian Suchanek et travaille sur l'Axe 2 : graph-mining et analyse des réseaux sociaux. Il avait commencé son doctorat à l'Institut Max Planck à Sarrebruck en 2012. Il a effectué ses études de premier cycle en Ingénierie Informatique à ESPOL (Escuela Superior Politécnica del Litoral) en Équateur. Il est titulaire d’un Master en Sciences de l'Université de Sarre en Allemagne. Ses domaines de recherche incluent l'extraction des règles d'association dans les bases de connaissances et le traitement distribué de données sémantiques (RDF). Pendant son doctorat il a effectué un stage de 3 mois chez Google Inc. Mots-clés : Extraction de règles, Bases de connaissance, Web sémantique, RDF, traitement distribué.

Valentin Barrière est actuellement en doctorat au sein des groupes MM (Multimédia, équipe GRETA) et AAO (Audio, Acoustique et Ondes) de Télécom ParisTech depuis octobre 2015. Sa thèse porte sur la détection et l'analyse d'opinions dans les interactions orales. Il utilise des algorithmes d’apprentissage automatique (Machine Learning) afin de reconnaître des motifs audio et linguistiques caractéristiques d'une expression d'opinion. Mots-clés : analyse des opinions, text mining, apprentissage, traitement de la parole, reconnaissance des émotions.

Guillaume Papa, élève de Télécom ParisTech, en Master Probabilités et Modèles Aléatoires de l'UPMC. Stage financé d'avril à septembre 2014. A partir d'octobre 2014, il a débuté une thèse sous la direction de Stéphan Clémençon et Pascal Bianchi sur l'Axe 4 : cloud learning et algorithmes d'apprentissage distribués.

Eugène Ndiaye est doctorant au sein du groupe STA depuis le 15 octobre 2015 sous la direction d'Olivier Fercoq et de Joseph Salmon. Il est titulaire du master de Probabilités et Statistiques de l'Université Paris-Sud, Orsay ; et travaille principalement sur les algorithmes efficaces de sélection de variables en grande dimension. Mots-clés : coordinate descent, Lasso, sparsity, screening rules.
 

Anna Korba est doctorante au sein du groupe STA depuis le 1er octobre 2015. Elle est titulaire du diplôme de l’ENSAE ParisTech et du master MVA de l’ENS Cachan. Sa thèse, encadrée par Stephan Clémençon, Jérémie Jakubowicz et Eric Sibony, porte sur l’analyse statistique des données de rankings (ordres) qui apparaissent dans de nombreux domaines (élections, compétitions, e-commerce). Ses travaux de recherches concernent principalement l’agrégation de rankings et les systèmes de recommandation. Mots-clés : Ranking, Preference Learning, Analyse Multirésolution, Systèmes de recommandation, Agrégation de rankings.​

Moussab Djerrab est doctorant au sein du groupe STA depuis le 1er octobre 2015. Il est titulaire du diplôme de l’ENSAE ParisTech et du master MVA de l’ENS Cachan. Sa thèse, encadrée par Florence d'Alché-Buc, porte sur le traitement des problèmes de prédictions structurés. Ces méthodes d'apprentissages ont des applications variées depuis les problèmes "image-captionning" aux problèmes de prédiction en bio-informatique (structures des molécules). Mots-clés : Prédiction structurée, méthode à noyaux, manifold learning.