forum etudiant ile de la reunion                                
Histoire de l'éducation

Approches sociolinguistiques

Education comparée Approches interculturelles Psychologie et éducation Ecole et violence Approches contextuelles
Méthodes quantitatives

Méthodes qualitatives

Psychopédagogie Didactique Traitement des données Socio. des pratiques d'enseignement Travail social et
ses pratiques
 

Traitement des données (Latchoumanin), Cours n°3 : 

le 19/03/03

Combiner les observations :

Il existe des liens entre 2 ou plusieurs variables.

Comment faire apparaître cette existence de liaison entre 2 ou plusieurs variables ?

Variable numérique : étude de la réussite scolaire d'un groupe dans 2 disciplines, 2 épreuves, l'une Verbale (V) et l'autre Non-Verbale (NV).

Elèves A B C D E F G H I J
Notes pour V 3 1 5 1 2 4 1 4 3 2
Notes pour NV 4 1 5 4 2 1 4 3 2 2


 

Variable ordinale : Classement de 12 sujet à l'issue d'une épreuve de statistique. X et Y sont des professeurs. Les rangs sont attribués après l'épreuve.

Elèves A B C D E F G H I J K L
Rang pour X 10 1 5 2 5.5 3.5 7 8.5 3.5 11 6 12
Rang pour Y 8 2.5 6 1 9.5 5 7 12 2.5 11 4 9.5

Comment mesurer l'existence d'une corrélation ?

La corrélation exprime correspondance qui existe entre les différentes valeurs associées des 2 variables dépendantes d'une distribution.

Cette correspondance, liaison, corrélation indique en quoi la connaissance de X nous renseigne sur la valeur correspondante Y.

On se demande ce qui se passe en Y quand X prend des valeurs de plus en plus grande.

  1. Le sens de la liaison

Quand X augmente alors Y augmente, nous concluons à l'existence d'une corrélation positive (cor +)

Les meilleurs de la première épreuves reste les meilleurs de la 2ème épreuve.
Les moyens de la première épreuves reste les moyens de la 2ème épreuve.
Les faibles de la première épreuves reste les faibles de la 2ème épreuve.

Quand X augmente et Y diminue, alors nous concluons à l'existence d'une corrélation négative (cor -)

Il y a donc des liaisons positives ou négatives (+ ou -).

  1. Force de la liaison

Si la connaissance de X détermine avec exactitude la connaissance de Y alors j'ai une corrélation parfaite, une liaison fonctionnelle linéaire.
Si la connaissance de X ne donne aucune indication sur les valeurs associées de Y alors il n'y a pas liaison, corrélation nulle.

Une approche globale intuitive de corrélation existante entre 2 variable peut être fournie par une représentation graphique de la distribution bivariée.


Forte corrélation positive



Forte corrélation négative



Liaison nulle

2 choses à ne pas confondre : lien statistique et lien causale.

Il y a un lien entre les phénomène quand :

a) L'observation de l'un est explicatif de l'autre, exemple : le levé du soleil est cause de la lumière du jour.

b) Observation de l'un fourni des informations sur l'autre, ex :
nombre de jours passé au sport d'hiver, combien payez-vous de loyer.

Les formules à appliquer sont sous la dépendance du type d'échelle sur lequel on va travailler.
ex : échelle nominale avec une variable nominale donc :

On pose 2 questions  (Q1 et Q2) à 80 sujets, la réponse attendue à chaque question est oui ou non (+ ou -).

C'est donc une variable nominale dichotomique (2 variables) :

Réponses possibles :

Q1 Q2
+ -
+ +
- -
- +
 

1 ) Tableau de contingence :


exemple :

Effectif de départ 80 personnes : N = 80.
55 personnes ont répondu oui à Q1 (question 1)
25 personnes ont répondu non à Q1
29 personnes ont répondu oui et oui (+ +) aux questions 1 et 2

(on obtient dans ce tableau les effectifs observés n)

2) Sens de la liaison :

Si la somme des cases accords est différente de la somme des cases désaccords alors il y a corrélation.

S Accord ¹ S Désaccord ==> il y a une corrélation

De plus, Accord < Désaccord donc la corrélation est négative. (la liaison est négative)

3) Force de la liaison (r) :

Sachant que  

n : correspondant aux effectifs observés
n' : effectif théorique

n' = ( L X C ) / N                  L : Ligne (avec couleur correspondante)          C : Colonne (avec couleur correspondante)

Calcul des effectifs théoriques :

(on obtient dans ce tableau les effectifs théoriques n')
exemple : ( 55 (L) X 48 (C) ) / 80 (N) = 33

Tableau à faire pour le calcul du :

n n' n-n' (n-n')2 (n-n')2 / n' S (n-n')2 / n'
29 33 - 4 16 16/33 = 0.48 Somme =
3.86
(c2)
26 22 4 16 16/22 = 0.72
19 15 4 16 16/15 = 1.06
6 10 - 4 16 16/10 = 1.60

Ayant le , on peut calculer la force de liaison (r) :

r = .21

Les types de liaison :

0-20 Très Faible
21-40 Faible
41-60 Moyenne
61-80 Forte
81-100 Très Forte

Donc ici, nous avons une faible liaison négative entre les 2 variables.
Une variable nominale renvoie au c2

Variable ordinale : 2 experts oenologues doivent classer une douzaine de grands crus (attribut de rangs)

  Pinard Pinot d
(différence)
d2
A 7 9 2 4
B 10 12 2 4
C 1 4 3 9
D 5 7 2 4
E 8 10 2 4
F 12 8 4 16
G 2 2 0 0
H 4 3 1 1
I 11 5 6 36
J 9 11 2 4
K 6 6 0 0
L 3 1 2 4

Pour trouver la force et le sens de la liaison, il faut appliquer une formule : le rhô de Spearman :


r = 1 - 0.30 = 0.70

r = .70

On constate ici l'existence d'une corrélation forte et de sens positif.
On peut supposer que les 2 experts ont été soumis au même critères pour évaluer les vins.

Si  r = 1-1.30 = -0.30  -> r = .30 faible corrélation négative.

Variable numérique :
Note de 8 sujets pour 2 exercices de mathématiques X et Y.

Sujet A  B C D E F G H
X 10 12 11 9 8 10 14 8
Y 12 10 13 14 7 9 8 7

rhô de Brarais-Pearson :











Somme =
x y x2 y2 xy
10 12 100 144 120
12 10 144 100 120
11 13 121 169 143
9 14 81 196 126
8 7 64 49 56
10 9 100 81 90
14 8 196 64 112
8 7 64 49 56
82 80 870 852 823
 

Je ne détaille pas le calcul  mais le résultat est :

r = .07


Très faible corrélation positive.
On ne peut rien affirmer dans la corrélation mathématique précédente.