forum etudiant ile de la reunion                                
Histoire de l'éducation

Approches sociolinguistiques

Education comparée Approches interculturelles Psychologie et éducation Ecole et violence Approches contextuelles
Méthodes quantitatives

Méthodes qualitatives

Psychopédagogie Didactique Traitement des données Socio. des pratiques d'enseignement Travail social et
ses pratiques
 

Traitement des données (Latchoumanin), Cours n°2 : 

le 17/02/03

 
Echelle Nominale Ordinale Numérique
Modalités, valeurs Peu nombreux,
catégorie, classe, groupe
classement, rang, ordre, hiérarchie nombre, score, quantité
exemple sexe, groupe de TD course, concours note, poids, longueurs

Résumé des observations :

Les données après avoir été présentées dans un tableau, doivent être les condensées, et donc remplacées par un petit nombre de paramètres.

2 catégories de paramètres, indices ou caractéristiques seront étudiés cette année. Nous parlerons ici d'indice :

  1. Indice de Tendance Central (ITC) ou indice de position.

  2. Indice de dispersion (ID)

Courbes relatives à la distribution de la taille en cm :

A et B ont la même taille mais il y a un étalement des tailles plus important chez le groupe B que le groupe A.

C et D n'ont pas la même moyenne et en revanche, ils ont le même étalement (7 cm)

La moyenne relève d'une convention, il n'est pas obligatoire que cette taille dite de "taille moyenne" soit réellement observée. Il n'est pas obligatoire que cette moyenne représente le plus grand nombre d'individu, c'est à dire il n'est pas nécessaire que la moyenne corresponde au plus grand nombre d'individus à une des valeurs données.

 

Nous pouvons voir que le plus grand nombre d'individus est à 1,64m toutefois il y a tellement de monde à d'autres tailles que la moyenne ne sera pas à 1,64m.

Les Indice de Tendance Centrale (ITC) sont au nombre de 3 :

  1. La moyenne

  2. La médiane

  3. Le mode

 

La moyenne d'une série de valeurs de variables statistiques est égale à la somme de ces valeurs divisées par leur nombres.
La somme des observations ne doit pas faire oublier que chaque observation doit être compté autant de fois qu'elle a été constaté.

N : nombre d'individus
x : valeurs de la variable

exercice :

N=20

x 7 8 11 14 15 17 19
n 2 1 3 4 6 3 1

n : effectif partiel
Moyenne = (7*2+9*1+11*3+14*4+15*6+17*3+19) / 20 = 272/20=13.6

La médiane :
C'est une valeur de la variable telle qu'il existe autant d'observation qui lui soit supérieur et inférieures.
C'est donc la valeur qui se situe au centre de la distribution.

N=21

Pour trouver la médiane, il faut d'abord trouver le rang médian.

nc : effectif cumulé

Le mode est la valeur affectée du plus gros effectif (il peut y avoir plusieurs valeurs modales).

Rang Médian = (N + 1) / 2 donc ici : (21+1) / 2 = 11 (il doit "correspondre" à l'effectif cumulé)

Et comme la médiane est une valeur de la variable en reportant le rang médian égal à 11 au niveau des x pour la médiane nous auront 12 comme indiquée par la flèche rouge.

N=20

Le Rang Médian ici est (20+1) / 2 = 10.5, on remarque qu'ici on ne trouve pas de rang médian correspond à un effectif cumulé alors on prendra l'effectif cumulé supérieur afin de d'avoir un point de repère pour trouver la médiane. L'effectif cumulé supérieur est 11, il représente le rang médian et donc la médiane correspondante est donc 12 comme indiquée par la flèche rouge.

(les flèches vertes ici représente comment trouver le mode)

Par convention :

Dans un tableau, on ordonne la distribution partant de la plus petite valeur observée à la plus grande.

exercice :

score de la 4ème A :

11 ; 8 ; 11 , 14 , 12 ; 10 ; 13 ; 9 ; 11 ; 11 ; 13 ; 12 ; 12 ; 10 ; 10 ; 11 ; 12 ; 10 ; 11 ; 9 ; 15

N = 21

Moyenne = (8*1+9*2+10*4+11*6+12*4+13*2+14*1+15*1) / 21 = 11.19

Rang Médian = (21+1) / 2 =11 or il n'y a pas d'effectif cumulé à 11 donc le rang médian sera alors de 13 (effectif cumulé supérieur) et la médiane comme indiquée par la flèche rouge sera de 11.

Le plus fort effectif est de 6 comme indiqué par la flèche verte, le mode ici sera de 11.

Exercice :

Salaire horaire en francs :
Groupe A 27.5 28.5 31 32.5 34
Groupe B 23.5 24 31 32 43

Le groupe A et B ont ont au total le même total de salaire horaire c'est à dire 153.50 francs or il y a même nombre de personne dans chacun des 2 groupes donc la moyenne est la même 153.5/5 = 30.70 francs.

La variable numérique ont des indices de tendance centrale, le plus utilisé est la moyenne.

On peut remarquer par ce tableau qu'il y a une plus grande disparité (étendue) des salaires dans le groupe B que dans le groupe A.
A : 34-27.5 = 6.50
B : 43-23.5 = 19.50

Etendue (Et.) = Valeur maximale (Vmax) -Valeur minimale (Vmin)

L'étendue est un indice de dispersion.

L'écart interquartile se note "EQ" et l'écart type se note "s".

Les quartiles sont 3 valeurs qui séparent une distribution en 4 parties comprenant chacune le même nombre d'observations (4 parties égales).
La médiane est un quartile.
Ce qui se trouve à inférieur à la médiane est le quartile inférieur QI
Ce qui se trouve à supérieur à la médiane est le quartile
supérieur QS

QI est la valeur de la variable qui est précédée des valeurs au 1/4 de la population.

N / 4 = Rang du QI par correspondance donne ensuite le QI
3N / 4 = Rang du QS par correspondance donne ensuite le QS

EQ = QS - QI ; EQ représente 50% de la population, il permet de conclure sur l'homogénéité de la population

exercice :

N=23

Rang du QI = 23/4 = 5.75
Rang du QS = 3*23/4 = 17.25

EQ = 13 - 7 = 6

 

 

Variance d'une distribution : Somme des carrés des écart à la moyenne

  a b c d e
A 9 11 6 13 16
B 8 10 3 5 19

N = 5
Moyenne de A et B = 55/5 = 11.

EtA = 16-6 = 10
EtB = 19-3 = 16

QI = 5/4 = 1.25
QS = 3*5/4 = 3.75

Les écarts par rapport à la moyenne sont soit positifs soit négatifs

La somme des écart à la moyenne :

A : (6 -11)2 + (9 -11)2 + (13 -11)2 + (16 -11)2 = 58

B : 32 + 12 + 82 + 42 + 82 = 154

Variance (V) : S (x -m)2 = S x2 - S x2/N

A :  
x x2
9 81
11 121
6 36
13 169
16 256
Total :          55 663
B:  
x x2
8 64
10 100
3 9
15 225
19 361
55 759

A : 663 - (552 / 5) = 58

B : 759 - (552/5) = 154

 

L'écart type :