CARACTÉRISATION DES DONNÉES : synthèses numériques des données Cours 10 / SCI6007 Phase 3 : Éléments empiriques Analyse des données > Analyses statistiques > Statistiques descriptives > Caractérisation des données Mesures de dispersion : évaluent la dispersion à l'intérieur d'une distribution (éparpillement, étalement, dispersion ou variation) Pour les données numériques uniquement Coefficient de variation Variation de la dispersion des données en pourcentage lié à (=écart type/moyenne * 100) Moyenne Somme des valeurs d'une série de données divisée par le nombre de données dans la série Pour les données numériques seulement Plus représentative lorsque la distribution est symétrique Écart type Dispersion des observations autour de la moyenne Variance Moyenne des carrés des écarts entre chaque observation et la moyenne des observations lié à (= écart type au carré) Écart type Dispersion des observations autour de la moyenne Écart type Dispersion des observations autour de la moyenne Étendue Écart entre la plus grande et la plus petite valeur d'une série Mesures de distribution caractérisent la forme de la distribution (aplatissement, symétrie) Pour les données numériques seulement Coefficient d'aplatissement (Kurtosis) Type et force de l'aplatissement Valeur nulle = aplatissement normal Valeur positive = moins aplati que la normale Valeur négative = plus aplati que la normale Coefficient d'asymétrie Sens et force de l'asymétrie Valeur nulle = distribution symétrique Valeur positive = asymétrie à droite Valeur négative = asymétrie à gauche Mesures de tendance centrale : résument en une seule valeur la grandeur typique, le milieu ou le centre d'un ensemble de données Pour les données numériques, ordinales et nominales Mode Valeur(s) la(les) plus fréquente(s) dans une série de données; Seule mesure centrale pour les données nominales Moyenne Somme des valeurs d'une série de données divisée par le nombre de données dans la série Pour les données numériques seulement Plus représentative lorsque la distribution est symétrique Médiane Valeur qui occupe la place du milieu au sein des données ordonnées d'une série Pour les données numériques et ordinales Plus représentative que la moyenne pour une distribution asymétrique © Christine Dufour 2005-2018, 2024, EBSI, Université de Montréal (Modifications Virginie Wenglenski et Marielle St-Germain © 2023) Cours 10 / SCI6007 Phase 3 : Éléments empiriques Analyse des données > Analyses statistiques > Statistiques descriptives > Présentation en graphique > Caractérisation d'un histogramme Histogramme Caractéristiques Aplatissement par rapport à une courbe normale, est-il plus "pointu" ou plus "aplati"? Aplatissement faible Kurtosis positif Aplatissement normal Kurtosis nul Aplatissement élevé Kurtosis négatif Symétrie par rapport à une courbe normale, est-il aussi "centré", plus à droite ou plus à gauche? Cours asymétrique à gauche Asymétrie négative mode > médiane > moyenne Courbe asymétrique à droite Asymétrie positive mode < médiane < moyenne Courbe symétrique mode = médiane = moyenne Distribution normale distribution "théorique" d'un caractère continu unimodal symétrique (c'est-à-dire moyenne = mode = médiane) possède Constance dans la distribution des données par rapport à son écart-type : . 68% des données se retrouvent à plus ou moins un écart-type . 95% des données se retrouvent à plus ou moins deux écarts-types © Christine Dufour 2005-2018, 2024, EBSI, Université de Montréal (Modifications Virginie Wenglenski et Marielle St-Germain © 2023) Cours 10 / SCI6007 Phase 3 : Éléments empiriques Analyse des données > Analyses statistiques > Statistiques descriptives > Caractérisation des données > Choix des mesures de centralité MESURES DE TENDANCE CENTRALE : choix en fonction du Type de distribution Combien de modes? Bimodale ou multimodale (deux modes ou plus) Mode Unimodal (un seul mode) Quel type de données? Indicateur ordinal Médiane** Indicateur nominal Mode Indicateur numérique (ratio ou intervalle) symétrique ou non? Asymétrique Médiane Symétrique Moyenne* Source : Vaughan, 2001, p. 32 (notre traduction et adaptation) * Dans une distribution symétrique, la moyenne étant proche du mode et de la médiane, ces derniers pourraient aussi être utilisés. ** Il est à noter que le mode pourrait aussi être utilisé. © Christine Dufour 2005-2018, 2024, EBSI, Université de Montréal (Modifications Virginie Wenglenski et Marielle St-Germain © 2023)