Rencontre 8

On introduit quelques notions pour nettoyer les données

Les données se trouvent [ici]

Un exemple de notebook est à venir

Plan de la séance

  1. Introduction aux techniques de nettoyage de données
  2. Que faire lorsque notre jeu de données a des données manquantes?
  3. Que faire avec les données aberrantes?
  4. Introduction au challenge 1

Introduction aux techniques de nettoyage de données

Que faire lorsque notre jeu de données a des données manquantes?

Plusieurs méthodes d’offrent à nous lorque certaines données sont manquantes dans notre jeu de données. On pourrait naivement enlever toutes les lignes avec des données manquantes. Cependant, la simplicité de cette méthode s’accompagne avec un problème majeur: les données qu’on ignore peuvent contenir de l’information importante. En général, on préfère utiliser des méthodes alternatives d’imputation:

Que faire avec les données aberrantes?

Plusieurs stratégies s’offrent à nous pour trouver les données aberrantes:

Que faire lorsque avec ces données aberrantes? On peut: