Ce graphique présente l’évolution des valeurs des coefficients de la régression pseudo-orthogonalisée en fonction des différentes valeurs de k. L’analyse de ce graphique nous permet de conclure ou non à la stabilité des variables explicatives et ainsi de sélectionner les variables intéressantes à conserver dans la perspective de composer un nouveau modèle de régression.
En faisant varier k, Modalisa » limite » progressivement les effets dus à la collinéarité de certaines variables explicatives. Cet avantage est malheureusement contrebalancé par un aspect quelque peu négatif : le biais des estimations. En effet, plus k augmente, plus le biais augmente et plus les coefficients tendent vers 0.
Une fois les coefficients instables déterminés, il s’agit d’éliminer d’une part les variables explicatives dont les coefficients sont instables et tendent vers 0, et d’autre part celles dont les coefficients sont faibles.
L’analyse du graphique ci-dessus nous permet d’affirmer que les variables explicatives qu’il convient d’éliminer sont les suivantes : X3, X6, X7, X8 et X10. En demandant à Modalisa d’effectuer une nouvelle régression en ne conservant dans le modèle que les variables explicatives X1, X2, X4, X5 et X9, vous pourrez constater que le coefficient de X9 n’est pas significativement différent de 0, il s’agira alors d’éliminer X9 du modèle pour obtenir le modèle final et s’apercevoir que la régression pseudo-orthogonalisée a eu pour effet de limiter les effets de X4 etX5 (variables collinéaires) sans pourtant les éliminer comme le fait la régression orthogonalisée en supprimant la composante 10 et 9, éliminant ainsi les liaisons entre, d’une part X3 et X6, et d’autre part X4 et X5.