Python pour la Data Science
===========================
Ce cours est un cours avancé et suppose les bases du langage maîtrisées. Le cours `Python `_ est un prérequis. Un test technique est proposé pour vérifier les compétences de base.
Sont abordés dans ce cours : l'accès à internet, la géolocalisation, les dataframes. Les structures de données de base, ainsi que les dictionnaires et les fonctions seront approfondies.
Installez le langage et l'environnement de développement VS Code avec `cette page `_.
Le langage `Python `__ est élégant, concis, structuré, puissant et permet un code lisible et performant. Les temps d'exécution sont de même ordre de grandeur que ceux des langages compilés (Java, C, ...) si on utilise `les packages adaptés `_, des structures de données optimisées (`Numpy `_) ou des accélérateurs (`Numba `_).
Il est devenu depuis plusieurs années le langage scientifique de référence avec le package `Numpy `_ qui introduit des structures de données optimisées et la vectorisation. L'écosystème `Scipy `_ est une alternative libre et performante à Matlab.
Python est devenu également un des deux langages de la data science (avec `R `_) :
- `pandas `_ introduit le concept de Data Frame, la structure de données de référence pour la data ;
- `plotly `_ est un module de visualisation performant ;
- et `dash `_ permet la construction de dashboards interactifs.
Python fournit également de puissances bibliothèques pour le `Machine Learning `_ et le `Deep Learning `_, les technologies de l'intelligence artificielle.
Contents:
.. toctree::
:maxdepth: 2
:numbered:
../chapters/00-test
../chapters/01-internet
../chapters/02-geo
../chapters/03-pandas
../chapters/04-numpy
../chapters/05-sequences
../chapters/06-dictset
../chapters/07-functions