* Designer Logo Carcassonne
Designer Logo Carcassonne
Article:
L'analyse des données se décline en une famille de méthodes statistiques dont les principales caractéristiques sont d'être multidimensionnelles et descriptives. Certaines méthodes, pour la majorité géométriques, aident à faire ressortir les relations pouvant exister entre les différentes données et à en tirer une information statistique qui permet de décrire de façon plus succincte les principales informations disponibles dans ces données. D'autres techniques permettent de regrouper les données de façon à faire apparaître clairement ce qui les rend homogènes, et ainsi mieux les connaître. L'analyse des données permet de considérer un nombre très important de données et de dégager les aspects les plus intéressants de la structure de celles-ci. Le suc de cette discipline dans les dernières années est dû, dans une large mesure, aux représentations graphiques fournies. Ces graphiques peuvent mettre en évidence des relations péniblement saisies par l'analyse directe des données ; mais surtout, ces représentations ne sont pas liées à une opinion « a priori » sur les lois des phénomènes analysés contrairement aux méthodes de la statistique traditionnel. Les fondements mathématiques de l'analyse des données se sont développés au début du XXe siècle, mais ce sont les ordinateurs qui ont rendu cette discipline agissante, et qui en ont permis une utilisation très étendue. Mathématiques et informatique sont ici intimement liées. Dans l'acception e, la terminologie « analyse des données » laisse entrevoir un sous-ensemble de ce qui est dénommé plus généralement la statistique multivariée. l'analyse des données est un ensemble de techniques descriptives, dont l'outil mathématique majeur est l'algèbre matricielle, et qui s'exprime sans supposer a priori un modèle probabiliste 1,i 1. Elle conçoit l'analyse en composantes importantes (ACP), employée pour des données quantitatives, et ses méthodes dérivées : l'analyse factorielle des correspondances (AFC) usée sur des données qualitatives (tableau d'association) et l'analyse factorielle des correspondances multiples (AFCM ou ACM) généralisant la précédente. l'analyse canonique et l'analyse canonique généralisée, qui sont plus des cadres théoriques que des méthodes aisément applicables 2,b 3, étendent plusieurs de ces méthodes et vont au-delà des techniques de description 4. l'Analyse Factorielle Multiple est adaptée aux tableaux dans lesquels les variables sont structurées en groupes et peuvent être quantitative et/ou qualitatives. La classification automatique, l'analyse factorielle discriminante (AFD) ou analyse discriminante permettent de déceler des groupes homogènes au sein de la population du point de vue des variables étudiées. En marge de l'analyse des données, l'analyse en composantes indépendantes (ACI), plus récente, issue de la physique du signal et connue initialement comme méthode de séparation aveugle de source, est plus proche intuitivement des méthodes de classification non supervisée. l'iconographie des corrélations pour des données qualitatives et quantitatives, organise les corrélations entre variables sous la forme de graphes.