Datagouvernance : analyser et Maitriser ses données pour l'IA
Votre formation en détail
Etudions ensemble vos options de financement
Contactez-nous pour monter votre dossier !
14 heures sur 2 jours
à Paris & à distance
(Zoom, Google Meet, etc.).
1 500 € HT / personne
Etudions ensemble vos options
de financement
Objectifs de la formation
Datagouvernance : analyser et Maitriser ses données pour l'IA
Comprendre les méthodes d'analyse de données et les techniques de nettoyage et de management des données.
Maîtriser l'utilisation de Python et de Pandas pour l'analyse de données.
Apprendre à transformer les variables qualitatives et à normaliser les données.
Découvrir les méthodes avancées d'analyse, y compris la régression linéaire et les tests statistiques.
Expérimenter avec des modèles non-linéaires de machine learning tels que K-means, Tree, Random Forest.
Pré-requis pour suivre cette formation
Bonne connaissance et pratique des fondamentaux de Python et de Pandas
A qui s'adresse cette formation ?
Cette formation s'adresse à toute personne souhaitant développer des compétences d'analyse et de management de la donnée avec Python. Que vous soyez un professionnel cherchant à améliorer vos compétences en data analyse, un étudiant cherchant à approfondir vos connaissances, ou simplement un passionné de data science, cette formation est faite pour vous.
Formations recommandées
Aucun programme supplémentaire n'est requis pour suivre cette formation.
Au programme de la formation
Datagouvernance : analyser et Maitriser ses données pour l'IA
Introduction à Pandas et importation des données
- Présentation de la bibliothèque Pandas
- Importation de données (csv)
- Découverte de la structure des DataFrames et des Series
- Aperçu des données importées : head, info
Exploration et analyse univariée
- Identification et comptage des types de données
- Statistiques descriptives : mean vs median, std, quantile
- Visualisations (histogram, pie-chart, boxplot)
Nettoyage des données
- Suppression des constantes, doublons et autres variables inutiles
- Gestion des valeurs manquantes : suppression et méthodes d'imputation
- Détection et gestion des valeurs aberrantes (Z-score, IQR)
Méthodes d'aggregation
- Sélection et filtrage des données
- Regrouppements et pivots
- Jointures et concaténations
Analyse bi/multi-variée
- Analyse des Corrélations
- Visualisations (line/scatter plot, heatmap)
- Analyse en composantes principales (ACP)
Feature engineering
- Transformation variable qualitative (one-hot encoder)
- Normalisation, logarisation
- Création variables : catégorisation, simplification (dates en saisons / age)
Méthodes avancées d'analyse
- Régression Linéaire : sklearn vs statsmodels
- Tests statistiques (Pearson, ANOVA, non-paramétriques)
- Modèles non-linéaires (machine learning) : K-means, Tree, Random Forest
Librairies complémentaires
- Pandas profiling
- Missingno
- Plotly
Méthode pédagogique
8 participants maximum, un poste par stagiaire et un support de cours est remis en fin de stage. La formation est constituée d'apports théoriques, de démonstrations et de mises en pratique basées sur des exercices (méthode démonstrative).
Accessibilité
Cette formation est accessible aux personnes en situation de handicap.
Modalité de validation des acquis
Évaluation continue des connaissances via des exercices et/ou ateliers et des acquis via un questionnaire en fin de formation. Attestation de fin de stage (certificat de réalisation). Émargement quotidien d'une feuille de présence.
Demander des informations
Vous souhaitez en savoir plus ou directement vous inscrire à une session ?
Contactez-nous pour monter votre dossier !

Formations similaires
Ces formations pourraient vous intéresser