Analyse de données ou statistiques ?
Face à un enjeu d’analyse de ces ensembles de données nous établissons, certes formellement, une distinction entre analyse de données et ce que l’on nomme couramment les statistiques. Pour ces dernières, il s’agit d’algorithmes, de modes de calcul, d’écoles concurrentes et de compétences souvent très pointues utilisées dans des secteurs tels que la climatologie, la résistance des matériaux, la démographie, l’épidémiologie…
Lorsque nous parlons d’analyse de données nous circonscrivons notre ambition à l’analyse de données telles que celles produites lors de nos travaux bureautiques. Des analyses qui, sans exiger une formation pointue, permettent d’en tirer des pistes et des enseignements, toujours à confronter avec notre expérience du terrain et celle de nos partenaires.
Nous aurons ainsi à faire parler des tableaux comportant, la plupart du temps, des données sociales, des fichiers de personnes pour rechercher des profils, des questionnaires de satisfaction, des fichiers de suivi d’activité commerciale… tous fichiers se présentant sous la forme d’un tableau à double entrée.
Fichier à plat
Le combustible de nos travaux est le fichier à plat, c’est-à-dire une succession de lignes et de colonnes dont chacune des lignes constitue le plus petit élément de l’ensemble à analyser : un salarié, un questionnaire de satisfaction, une fiche d’intervention…