Écrit par
Emulie Chhor
le
le
Rencontre 1
On introduit le problème de régression avec le dataset shampoo.csv
Les données se trouvent ici
Un exemple de notebook peut se trouver ici
Plan de la séance
- Introduction à Google Colab
- Exploration du dataset
shampoo.csv
- Introduction aux méthodes de régression
Introduction à Google Colab
On explique comment rouler un fichier .ipynb
dans un Google Colab
Exploration du dataset shampoo.csv
On utilise les libraries pandas
et matplotlib
pour visualiser les
données
- Lecture du jeu de données avec
pandas.read_csv()
- Obtention de statistiques descriptive avec
pandas.DataFrame.describe()
- Visualisation du jeu de données avec
matplotlib.plot()
Introduction aux méthodes de régression
On voudrait répondre à la question suivante: Prédire la valeur des ventes au 50e mois à l’aide d’une régression linéaire
Notons qu’on peut obtenir la régression linéaire de plusieurs façons:
- avec la librairie
sklearn
- avec un calcul matriciel
- en minimisant l’erreur MSE
- avec une descente de gradient
Nous avons déjà commencé à discuter de la 3e méthode et on s’attardera à son implémentation lors de la prochaine séance.