Lorsqu’un modèle de régression multiple contient un nombre important de variables explicatives, on peut examiner si un sous-ensemble de ces variables permet d’obtenir un modèle aussi bon voire meilleur que le modèle global.
La méthode de régression ascendante est une méthode pas à pas, en ce sens qu’on inclut une à une les variables explicatives du modèle global à un instant t dans un nouveau modèle.
Elle se décompose en plusieurs étapes :
– la première étape consiste à sélectionner la variable explicative présentant la corrélation la plus élevée de toutes avec la variable expliquée, celle-ci proposant également la plus petite valeur de la somme des carrés résiduels,
– puis on étudie la significativité de son coefficient. Si celui-ci n’est pas significativement différent de 0, la variable explicative correspondante ne sera pas retenue pour faire partie du nouveau modèle,
– on réitère ensuite ce processus, en choisissant à chaque étape la variable explicative qui minimise la somme des carrés des résidus, sans omettre de tester la significativité de son coefficient respectif.
Le tableau ci-dessus nous permet de constater l’ordre dans lequel Modalisa a introduit les quatre variables explicatives sélectionnées pour le modèle final, les résultats de la régression étant présentés dans la fenêtre des coefficients. Ainsi, la première variable introduite dans le modèle est X9, puis X1, ensuite X2, et enfin X3.