Edito

Les avancées technologiques, l’omniprésence des capteurs et l’explosion des réseaux sociaux s’accompagnent d’un véritable déluge de données, propulsant les sciences de l’information au centre du processus de valorisation des « Big Data ». Le traitement statistique de ces masses de données convoque à la fois mathématiques appliquées et informatique à travers une discipline en plein essor : le Machine Learning. La variété des données disponibles, leur grande dimension et leur volumétrie rendent souvent inopérantes les méthodes statistiques traditionnelles. Le Machine Learning vise à élaborer et étudier des algorithmes permettant à des machines d’apprendre automatiquement à partir des données et à effectuer des tâches de façon performante.

La Chaire « Machine Learning for Big Data » a pour but de produire une recherche méthodologique répondant au challenge que constitue l’analyse statistique des données massives et d’animer la formation dans ce domaine à Télécom ParisTech. Créée en septembre 2013 avec le soutien de la Fondation Télécom et financée par quatre entreprises partenaires : Safran, PSA Peugeot Citroën, Criteo et BNP Paribas, la Chaire est portée par le mathématicien Stéphan Clémençon, enseignant-chercheur, Professeur au sein du Département du Traitement du Signal et des Images de Télécom ParisTech.

Derniers articles

ICML 2016 : sept articles sur le machine learning par les chercheurs de la Chaire

ICML est la conférence internationale de référence sur le machine learning, soutenue par l'International Machine Learning Society (IMLS). Cette 33e édition se déroulera du 19 au 24 juin à New York. Sept articles seront présentés par des chercheurs de la Chaire : Igor Colin, Joseph Salmon, Stéphan Clémençon, Eric Sibony, Anna Korba, Maxime Sangnier, Olivier Fercoq, Albert Thomas, Nicolas Goix et Claire Vernade.

Lire la suite

General Electric : Predix™, le nouvel environnement digital

Le groupe General Electric a pris une nouvelle orientation stratégique il y a cinq ans en décidant d’investir dans le domaine du digital, considérant ce domaine comme un différenciateur pour l’industrie du futur. Pour cela, GE a créé un centre de recherche dans la silicon valley en Californie (San Ramon) afin de développer un environnement pour l’internet industriel appelé Predix. Robert Plana, CTO/Ecosystem Director de la Digital foundry de Paris, Hervé Sabot, ‎Innovation Director pour GE Automation & Controls, et Jean-François Cabadi, Ingénieur chez General Electric, sont venus parler aux étudiants du Mastère Spécialisé® Big Data des nouvelles actions digitales chez GE, dont l’environnement Predix™.

Lire la suite

Cooperation on Scikit-Learn with New York University

The Machine Learning for Big Data Chair is funding a 3-months-and-half visit for Nicolas Goix at New York University Center for Data Science, from May 16th to September 1st. It aims at providing development and research to the open-source machine learning library scikit-learn, under the supervision of Dr. Andreas Müller, researcher, core developer and maintainer of scikit-learn.

Lire la suite

Données massives : technologies et enjeux pour le secteur de la musique

Jérôme Pons, fondateur de Music Won’t Stop, est parti de la question : quelle est la place de la musique dans l’écosystème Big Data ? Après analyse d’études de cabinets de conseil et d’autres articles sur le Big Data, il a remarqué que le secteur de la musique était peu représenté. Pourtant, ce secteur regroupe plusieurs acteurs (créateurs, producteurs, éditeurs, agrégateurs, plateformes de distribution, opérateurs télécoms…) entre lesquels s’exercent de nombreux échanges nourrissant le secteur d’activité de la gestion de données.

Lire la suite