|
|
Traitement des données (Latchoumanin), Cours n°2 : le 17/02/03
Résumé des observations : Les données après avoir été présentées dans un tableau, doivent être les condensées, et donc remplacées par un petit nombre de paramètres. 2 catégories de paramètres, indices ou caractéristiques seront étudiés cette année. Nous parlerons ici d'indice :
Courbes relatives à la distribution de la taille en cm : A et B ont la même taille mais il y a un étalement des tailles plus important chez le groupe B que le groupe A. C et D n'ont pas la même moyenne et en revanche, ils ont le même étalement (7 cm) La moyenne relève d'une convention, il n'est pas obligatoire que cette taille dite de "taille moyenne" soit réellement observée. Il n'est pas obligatoire que cette moyenne représente le plus grand nombre d'individu, c'est à dire il n'est pas nécessaire que la moyenne corresponde au plus grand nombre d'individus à une des valeurs données.
Nous pouvons voir que le plus grand nombre d'individus est à 1,64m toutefois il y a tellement de monde à d'autres tailles que la moyenne ne sera pas à 1,64m. Les Indice de Tendance Centrale (ITC) sont au nombre de 3 :
La moyenne d'une série de valeurs de variables
statistiques est égale à la somme de ces valeurs divisées par leur
nombres. N : nombre d'individus exercice : N=20
n : effectif partiel La médiane : N=21 Pour trouver la médiane, il faut d'abord trouver le rang médian. nc : effectif cumulé Le mode est la valeur affectée du plus gros effectif (il peut y avoir plusieurs valeurs modales). Rang Médian = (N + 1) / 2 donc ici : (21+1) / 2 = 11 (il doit "correspondre" à l'effectif cumulé) Et comme la médiane est une valeur de la variable en reportant le rang médian égal à 11 au niveau des x pour la médiane nous auront 12 comme indiquée par la flèche rouge. N=20 Le Rang Médian ici est (20+1) / 2 = 10.5, on remarque qu'ici on ne trouve pas de rang médian correspond à un effectif cumulé alors on prendra l'effectif cumulé supérieur afin de d'avoir un point de repère pour trouver la médiane. L'effectif cumulé supérieur est 11, il représente le rang médian et donc la médiane correspondante est donc 12 comme indiquée par la flèche rouge. (les flèches vertes ici représente comment trouver le mode) Par convention : Dans un tableau, on ordonne la distribution partant de la plus petite valeur observée à la plus grande. exercice : score de la 4ème A : 11 ; 8 ; 11 , 14 , 12 ; 10 ; 13 ; 9 ; 11 ; 11 ; 13 ; 12 ; 12 ; 10 ; 10 ; 11 ; 12 ; 10 ; 11 ; 9 ; 15 N = 21 Moyenne = (8*1+9*2+10*4+11*6+12*4+13*2+14*1+15*1) / 21 = 11.19 Rang Médian = (21+1) / 2 =11 or il n'y a pas d'effectif cumulé à 11 donc le rang médian sera alors de 13 (effectif cumulé supérieur) et la médiane comme indiquée par la flèche rouge sera de 11. Le plus fort effectif est de 6 comme indiqué par la flèche verte, le mode ici sera de 11. Exercice : Salaire horaire en francs :
Le groupe A et B ont ont au total le même total de salaire horaire c'est à dire 153.50 francs or il y a même nombre de personne dans chacun des 2 groupes donc la moyenne est la même 153.5/5 = 30.70 francs. La variable numérique ont des indices de tendance centrale, le plus utilisé est la moyenne. On peut remarquer par ce tableau qu'il y a une plus grande
disparité (étendue) des salaires dans le groupe B que dans le groupe A. Etendue (Et.) = Valeur maximale (Vmax) -Valeur minimale (Vmin) L'étendue est un indice de dispersion. L'écart interquartile se note "EQ" et l'écart type se note "s". Les quartiles sont 3 valeurs qui séparent une
distribution en 4 parties comprenant chacune le même nombre
d'observations (4 parties égales). QI est la valeur de la variable qui est précédée des valeurs au 1/4 de la population. N / 4 = Rang du QI par correspondance donne ensuite le QI EQ = QS - QI ; EQ représente 50% de la population, il permet de conclure sur l'homogénéité de la population exercice : N=23 Rang du QI = 23/4 = 5.75 EQ = 13 - 7 = 6
Variance d'une distribution : Somme des carrés des écart à la moyenne
N = 5 EtA = 16-6 = 10 QI = 5/4 = 1.25 Les écarts par rapport à la moyenne sont soit positifs soit négatifs La somme des écart à la moyenne : A : (6 -11)2 + (9 -11)2 + (13 -11)2 + (16 -11)2 = 58 B : 32 + 12 + 82 + 42 + 82 = 154 Variance (V) : S (x -m)2 = S x2 - S x2/N
A : 663 - (552 / 5) = 58 B : 759 - (552/5) = 154
L'écart type :
|