Rencontre 1

On introduit le problème de régression avec le dataset shampoo.csv

Les données se trouvent ici

Un exemple de notebook peut se trouver ici

Plan de la séance

  1. Introduction à Google Colab
  2. Exploration du dataset shampoo.csv
  3. Introduction aux méthodes de régression

Introduction à Google Colab

On explique comment rouler un fichier .ipynb dans un Google Colab

Exploration du dataset shampoo.csv

On utilise les libraries pandas et matplotlib pour visualiser les données

Introduction aux méthodes de régression

On voudrait répondre à la question suivante: Prédire la valeur des ventes au 50e mois à l’aide d’une régression linéaire

Notons qu’on peut obtenir la régression linéaire de plusieurs façons:

  1. avec la librairie sklearn
  2. avec un calcul matriciel
  3. en minimisant l’erreur MSE
  4. avec une descente de gradient

Nous avons déjà commencé à discuter de la 3e méthode et on s’attardera à son implémentation lors de la prochaine séance.