Python pour la Data Science

Ce cours est un cours avancé et suppose les bases du langage maîtrisées. Le cours Python est un prérequis. Un test technique est proposé pour vérifier les compétences de base.

Sont abordés dans ce cours : l’accès à internet, la géolocalisation, les dataframes. Les structures de données de base, ainsi que les dictionnaires et les fonctions seront approfondies.

Installez le langage et l’environnement de développement VS Code avec cette page.

Le langage Python est élégant, concis, structuré, puissant et permet un code lisible et performant. Les temps d’exécution sont de même ordre de grandeur que ceux des langages compilés (Java, C, …) si on utilise les packages adaptés, des structures de données optimisées (Numpy) ou des accélérateurs (Numba).

Il est devenu depuis plusieurs années le langage scientifique de référence avec le package Numpy qui introduit des structures de données optimisées et la vectorisation. L’écosystème Scipy est une alternative libre et performante à Matlab.

Python est devenu également un des deux langages de la data science (avec R) :

  • pandas introduit le concept de Data Frame, la structure de données de référence pour la data ;

  • plotly est un module de visualisation performant ;

  • et dash permet la construction de dashboards interactifs.

Python fournit également de puissances bibliothèques pour le Machine Learning et le Deep Learning, les technologies de l’intelligence artificielle.

Contents: