Filière Datascience et intelligence artificielle
Founded in 2014 - DSIA : La plaquette de présentation
La data science et l'intelligence artificielle font partie des métiers en émergence, et sont parmi les clés de l'industrie du futur (les métiers du bigData). Des métiers en fort essor, avec une rareté des profils, qui ont même été qualifiés de sexiest job of the 21st century.
Les besoins en spécialistes de la data et de l'IA ont été soulignés dans le rapport Villani sur l'intelligence artificielle « Former des talents en IA, à tous niveaux », et dans un rapport de l'INRIA « L'émergence d'une nouvelle filière de formation: datascientist ».
Métiers
- CIDJ: data-analyst, data-scientist
- Cémentine-jobs : fiche métier
- Industrie du futur - les métiers du bigData
- elaee : fiche métier
- Interview
- Le Monde, mai 2017
Qu'est ce que c'est ?
Une définition, parmi d'autres, de la « science des données », est donnée par Field Cady dans "The Data Science Handbook", John Wiley & Sons, 2017.
Data science means doing analytics work that, for one reason or another, requires a substantial amount of software engineering skills.
Il s'agit d'analyser des données, en vue de découvrir, extraire des caractéristiques, informations pour en tirer des décisions et créer de la valeur. Cette analyse requiert des compétences et agilité avec l'outil informatique.
Le spécialiste de la data (data-analyst, data-engineer, data-scientist) possède des compétences à la fois en analyse de données et machine learning, en développement et prototypage informatique, et des compétences métier [Référence].
L'intelligence artificielle inclut le machine learning et va jusqu'à la prise de décision, quand la data science débute avec la collecte, nettoyage des données et features engineering et comprend également le machine learning. Une description de ces différents champs est disponible dans cette présentation.
Qu'est ce qu'on y fait ?
On y fait tout cela...
On y forme des ingénieurs spécialistes de la collecte, du recueil et du traitement des données, spécialistes de l'implantation et du déploiement de solutions d'analytics. La formation a été conçue pour donner des compétences solides en "data engineering", machine learning, programmation et techniques de developpement devOps. Les cas d'usage sont donnés tout au long de la formation via des nombreux TP, mini-projets, compétitions de type Kaggle entre étudiants, et par le biais d'interventions de partenaires industriels.
Des exemples de projets
- Qwant ESIEE, Projet E4
- BDV, autre projet E4
- LeBonCoin
Des exemples de compets
Les points forts
- 200 heures de formation sur les principes et techniques d'apprentissage automatique et IA -- 3 unités de fond sur le machine learning en 4e année, + une unité Bigdata avec Spark + une unité Features engineering + une unité prescriptive analytics (chaire IBM)
- Langages : R, Python, Scala, avec une formation spécifique sur chacun de ces langages. Tous les TP de Data se font en R ou Python.
- Développement : visualisation de données, data-engineering (webscaping, flask, noSQL), deux unités devOps (en collaboration avec OctoTechnology/Digital Accenture)...
Ouverture sur le monde
- Cours sur "datascience et analyse des réseaux sociaux", cours sur l'"Éthique des algorithmes"
- Certains cours sont communs avec les sociologues du master Datascience et société numérique. À moyen terme, il sera possible à des étudiants de la filière d'obtenir le double diplôme.
- Un master en "Science des données" devrait ouvrir dans le cadre de l'université Gustave Eiffel. Certains étudiants de la filière pourront bénéficier d'un aménagement de la scolarité leur permettant d'obtenir un double diplôme.