Edito

Les avancées technologiques, l’omniprésence des capteurs et l’explosion des réseaux sociaux s’accompagnent d’un véritable déluge de données, propulsant les sciences de l’information au centre du processus de valorisation des « Big Data ». Le traitement statistique de ces masses de données convoque à la fois mathématiques appliquées et informatique à travers une discipline en plein essor : le Machine Learning. La variété des données disponibles, leur grande dimension et leur volumétrie rendent souvent inopérantes les méthodes statistiques traditionnelles. Le Machine Learning vise à élaborer et étudier des algorithmes permettant à des machines d’apprendre automatiquement à partir des données et à effectuer des tâches de façon performante.

La Chaire « Machine Learning for Big Data » a pour but de produire une recherche méthodologique répondant au challenge que constitue l’analyse statistique des données massives et d’animer la formation dans ce domaine à Télécom ParisTech. Créée en septembre 2013 avec le soutien de la Fondation Télécom et financée par quatre entreprises partenaires : Safran, PSA Peugeot Citroën, Criteo et BNP Paribas, la Chaire est portée par le mathématicien Stéphan Clémençon, enseignant-chercheur, Professeur au sein du Département du Traitement du Signal et des Images de Télécom ParisTech.

Derniers articles

Congrès Big Data 2017 : former les futurs data scientists

Télécom ParisTech participe au Congrès Big Data du 6 au 7 mars 2017 au palais des congrès à Paris. Cet évènement, qui a rassemblé dix milles personnes lors de l’édition précédente, a une forte raisonnance dans l’écosystème du big data à l’échelle nationale.

Lire la suite

Stages de Master 2 au sein de la Chaire pour 2017

La Chaire Machine Learning for Big Data de Télécom ParisTech propose 10 stages de Master 2 qui débutent à partir de mars/avril 2017 : détection de signaux faibles et de communautés, architectures deep kernel, algorithmes de consensus décentralisés...

Lire la suite

Using Scikit-learn and scientific Python at scale

Scikit-learn est une bibliothèque open-source Python qui propose aux développeurs des méthodes de machine learning éprouvées. Scikit-learn étend le langage de programmation général Python avec de nombreux algorithmes de machine learning aussi bien supervisés que non supervisés. Utilisée et continuellement développée aussi bien dans le milieu académique qu'en entreprise, cette solution flexible et puissante peut encore apporter beaucoup aux applications de data science en contexte industriel.

Lire la suite

Palantir, extraire l’intelligence des données

Compte-rendu de l'intervention de Pierre Cholet, Deployment Strategist à Palantir, le 24 novembre 2016 au cours du séminaire du Mastère Spécialisé Big Data. Entreprise américaine, créée en 2004, Palantir s’est bâti une réputation en assistant les agences gouvernementales à extraire de l’intelligence de leurs données. Elle travaille notamment avec l’armée américaine, la CIA, le FBI, etc.

Lire la suite