STA 101 : Classification
Suite de l’Analyse en Composantes Principales
La classification est une méthode non objective de réduction des dimensions sur les individus. L’objectif est de pouvoir parler de classes d’individus, qui ne seront ni basées sur les marques ni sur les prix, mais par un nouveau critère, fictif mais homogène, basé sur la proximité des individus par variables dans l’espace.
La classification naturelle d’un produit de grande consommation est souvent réalisée en 3 classes :
- Bas de gamme
- Milieu de gamme
- Haut de gamme
L’objectif de la classification qui sera réalisée est donc de rester proche de cet usage s’il a du sens.
Classification hiérarchique
Figure 10 Courbe des indices de niveau après classification hiérarchique
Classe 1 : 30 individus
Classe 1 : « petites machines, ouverture par-dessus, faible consommation »
Classe 1 : « petites machines, ouverture par-dessus, faible consommation »
Cette classe est celle des « petites machines, ouverture par-dessus, faible consommation »
Classe 2 : 2 individus
Classe 2 : « conseillé par les internautes »
Classe 2 : « conseillé par les internautes »
C’est la classe « conseillé par les internautes »
Classe 3 : 19 individus
Classe 3 : « haut de gamme »
Classe 3 : « haut de gamme »
Cette classe peut-être appelée « haut de gamme »
Classe 4 : 3 individus
La dernière classe n’est pas définie par ses modalités.
Classe 4 : « Familles nombreuses »
Cette classe regroupe des machines pour « Familles nombreuses ».
Affichage des classes sur le plan factoriel des individus
Affichage des classes sur le plan factoriel des individus
Conclusion
L’analyse en composante principale montre sur cet exemple sa force à identifier des corrélations et à résumer graphiquement les informations. Ainsi je n’avais pas remarqué lors de mes recherches sur internet le lien entre le type de chargement et la capacité en linge de la machine. Je ne savais pas non plus à quel point la classification en énergie « a » était devenue obsolète, et qu’il fallait regarder « a+++ » pour obtenir une classification énergétique modernisée.
Ce qui se remarque très facilement sur une représentation graphique d’ACP, peut être totalement invisible sans connaissances préalables si l’on n’utilise que les outils de « comparatif produits » mis à disposition par les sites internet, et qui ne permettent en fait que de comparer qu’un nombre très limité de produits, sur des critères déjà connus.
De même la classification, qui en plus d’identifier des classes très proches de ce que l’on aurait naturellement imaginé (bas de gamme, haut de gamme), distingue une classe « recommandé sur Internet » et une classe « famille nombreuse », beaucoup plus précise et moins subjectif qu’une classe « milieu de gamme » qui aurait été difficile d’appréhender.
Suite à cette étude, je pense que je n’achèterais pas la même machine à laver. Cela m’aurait probablement permis de gagner 200€ en passant d’une Bosch WAS28860FF à une LG F84815SL. Sans compter un gain de consommation d’eau et d’électricité.