Datagouvernance : analyser et Maitriser ses données pour l'IA
14 heures sur 2 jours
à Paris & à distance
(Zoom, Google Meet, etc.).
Nous nous engageons à vous répondre dans un délai de 48h
1 500 € HT / personne
Etudions ensemble vos options de financement
Contactez-nous pour monter votre dossier !
La note de cette formationCe programme n'a pas encore été noté.
Découvrez les avis laissés par nos stagiaires sur Avis vérifiés
Objectifs de la formation
Datagouvernance : analyser et Maitriser ses données pour l'IA
Comprendre les méthodes d'analyse de données et les techniques de nettoyage et de management des données.
Maîtriser l'utilisation de Python et de Pandas pour l'analyse de données.
Apprendre à transformer les variables qualitatives et à normaliser les données.
Découvrir les méthodes avancées d'analyse, y compris la régression linéaire et les tests statistiques.
Expérimenter avec des modèles non-linéaires de machine learning tels que K-means, Tree, Random Forest.
Pré-requis
Bonne connaissance et pratique des fondamentaux de Python et de Pandas
Pour qui ?
Cette formation s'adresse à toute personne souhaitant développer des compétences d'analyse et de management de la donnée avec Python. Que vous soyez un professionnel cherchant à améliorer vos compétences en data analyse, un étudiant cherchant à approfondir vos connaissances, ou simplement un passionné de data science, cette formation est faite pour vous.
Recommandation(s)
Aucun programme supplémentaire n'est requis pour suivre cette formation.
Au programme de la formation
Datagouvernance : analyser et Maitriser ses données pour l'IA
Introduction à Pandas et importation des données
- Présentation de la bibliothèque Pandas
- Importation de données (csv)
- Découverte de la structure des DataFrames et des Series
- Aperçu des données importées : head, info
Exploration et analyse univariée
- Identification et comptage des types de données
- Statistiques descriptives : mean vs median, std, quantile
- Visualisations (histogram, pie-chart, boxplot)
Nettoyage des données
- Suppression des constantes, doublons et autres variables inutiles
- Gestion des valeurs manquantes : suppression et méthodes d'imputation
- Détection et gestion des valeurs aberrantes (Z-score, IQR)
Méthodes d'aggregation
- Sélection et filtrage des données
- Regrouppements et pivots
- Jointures et concaténations
Analyse bi/multi-variée
- Analyse des Corrélations
- Visualisations (line/scatter plot, heatmap)
- Analyse en composantes principales (ACP)
Feature engineering
- Transformation variable qualitative (one-hot encoder)
- Normalisation, logarisation
- Création variables : catégorisation, simplification (dates en saisons / age)
Méthodes avancées d'analyse
- Régression Linéaire : sklearn vs statsmodels
- Tests statistiques (Pearson, ANOVA, non-paramétriques)
- Modèles non-linéaires (machine learning) : K-means, Tree, Random Forest
Librairies complémentaires
- Pandas profiling
- Missingno
- Plotly
Méthode pédagogique
8 participants maximum, un poste par stagiaire et un support de cours est remis en fin de stage. La formation est constituée d'apports théoriques, de démonstrations et de mises en pratique basées sur des exercices (méthode démonstrative).
Accessibilité
Cette formation est accessible aux personnes en situation de handicap.
Modalité de validation des acquis
Évaluation continue des connaissances via des exercices et/ou ateliers et des acquis via un questionnaire en fin de formation. Attestation de fin de stage (certificat de réalisation). Émargement quotidien d'une feuille de présence.