Traitement des
données (Latchoumanin), TD n°3 :
Exercice 1 :
Voici emprunté à un questionnaire d'attitude à l'égard
de la statistique, un item sur le type de présentation préféré pour
l'enseignement de cette discipline :
Etes-vous d'accord avec la proposition ci-dessous ?
Choisissez la réponse qui vous convient le mieux :
"Je souhaite que l'on insiste davantage sur les principes
fondamentaux que sur les techniques immédiatement applicables"
a) Tout à fait d'accord
b) Largement d'accord
c) Plutôt d'accord
d) Plutôt en désaccord
e) Largement en désaccord
f) Totalement en désaccord
1. Etablir le protocole
2. Etablir la distribution sous forme de tableau et sous forme graphique
3. Calculer la fréquence de choix de chaque modalité de réponse
4. Calculer, si cela est possible, la médiane et la moyenne.
Voici ce qu'il faut faire :
1. ,2. et 3.
N = 100
M |
a |
b |
c |
d |
e |
f |
n |
8 |
12 |
20 |
13 |
17 |
30 |
f |
.08 |
.12 |
.20 |
.13 |
.17 |
.30 |
Répartition des effectifs en fonction de leur réponse
4. C'est une variable nominale, il n'y a donc pas de
moyenne ni médiane.
6 modalité existent et f est le plus grand mode, c'est
le plus choisi.
Exercice 2 :
L'animateur d'un stage de loisirs réunit les stagiaires
à leur arrivée le dimanche soir et leur demande d'inscrire sur un papier
l'activité que chacun d'eux veut pratiquer le lendemain matin. Il ont le
choix entre 4 activités : Tennis (T), Plongée (P), Voile (V) et Yoga
(Y).
n° sujet |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
Activité |
T |
P |
V |
V |
Y |
T |
T |
V |
Y |
Y |
T |
V |
n° sujet |
13 |
14 |
15 |
16 |
17 |
18 |
19 |
20 |
21 |
22 |
23 |
24 |
Activité |
V |
Y |
T |
V |
Y |
V |
V |
Y |
V |
T |
P |
P |
n° sujet |
25 |
26 |
27 |
28 |
29 |
30 |
31 |
32 |
33 |
34 |
35 |
36 |
Activité |
V |
T |
V |
V |
V |
Y |
T |
V |
V |
V |
V |
T |
n° sujet |
37 |
38 |
39 |
40 |
41 |
42 |
43 |
44 |
45 |
46 |
47 |
48 |
Activité |
T |
T |
V |
V |
V |
T |
P |
V |
T |
V |
V |
V |
n° sujet |
49 |
50 |
51 |
52 |
53 |
54 |
55 |
56 |
57 |
58 |
59 |
60 |
Activité |
Y |
V |
V |
T |
V |
P |
V |
Y |
P |
V |
V |
T |
A partir du protocole ci-dessus qui présente les données
recueillies, établir la distribution des sujets en fonction du type de
loisirs sous forme de tableau à simple entrée.
Calculer le fréquence de choix de chaque activité et représenter
graphiquement les résultats.
Voici ce qu'il faut faire :
Variable nominale à 4 modalités :
Pour calculer les fréquence
n'oublions pas que c'est nx/ntot
exemple ici : 15/ 60 = .25 ou 6/60 = .10
Modes |
T |
P |
V |
Y |
Total |
n |
15 |
6 |
30 |
9 |
60 |
f |
.25 |
.10 |
.50 |
.15 |
1 |
Exercice 3 :
A partir de la suite d'observations ci-dessous
1. Représenter la distribution d'effectifs sous forme de tableau, sans
groupement, et calculer la médiane.
2. Représenter la distribution d'effectifs sous forme de tableau en
prenant un intervalle i = 3. La représenter graphiquement
3. Calculer la moyenne et l'écart-type (2 décimales) de la distribution
sans groupement.
38 |
29 |
32 |
33 |
36 |
28 |
25 |
37 |
42 |
53 |
21 |
24 |
26 |
47 |
23 |
30 |
41 |
30 |
34 |
38 |
38 |
41 |
29 |
32 |
21 |
27 |
31 |
26 |
31 |
35 |
33 |
42 |
35 |
34 |
35 |
18 |
28 |
34 |
45 |
32 |
36 |
33 |
39 |
43 |
Voici ce qu'il faut faire :
1.
N = 44 (4 lignes * 11 colonnes de valeurs voir
ci-dessus)
x |
18 |
21 |
23 |
24 |
25 |
26 |
27 |
28 |
29 |
30 |
31 |
32 |
33 |
34 |
35 |
36 |
37 |
38 |
39 |
n |
1 |
2 |
1 |
1 |
1 |
2 |
1 |
2 |
2 |
2 |
2 |
3 |
3 |
3 |
3 |
2 |
1 |
3 |
1 |
nc |
1 |
3 |
4 |
5 |
6 |
8 |
9 |
11 |
13 |
15 |
17 |
20 |
23 |
26 |
29 |
31 |
32 |
35 |
36 |
nx |
18 |
42 |
23 |
24 |
25 |
52 |
27 |
56 |
58 |
60 |
62 |
96 |
99 |
102 |
105 |
72 |
37 |
114 |
39 |
x2 |
324 |
882 |
529 |
576 |
625 |
1352 |
729 |
1568 |
1682 |
1800 |
1922 |
3072 |
3267 |
3468 |
3675 |
2592 |
1369 |
4332 |
1521 |
x |
41 |
42 |
43 |
45 |
47 |
53 |
Sommes |
n |
2 |
2 |
1 |
1 |
1 |
1 |
nc |
38 |
40 |
41 |
42 |
43 |
44 |
nx |
82 |
84 |
43 |
45 |
47 |
53 |
Snx
= 1465 |
x2 |
3362 |
3528 |
1849 |
2025 |
2209 |
2809 |
Sx2
= 51067 |
Rappels :
- Pour la ligne des nc c'est l'effectif
cumulé, on l'obtient en additionnant au fur et à mesure les effectifs
(n).
- Pour la ligne des nx, on l'obtient en
multipliant la ligne des x par la ligne des n
:
nx = x X n.
- Pour la ligne des x2, on l'obtient en
multipliant la ligne des x par la ligne des x et des n : x2
= x * x * n
donc en résumé la ligne des x au carré multiplié par la ligne
des n
:
x2 = x 2 * n
Revenons à l'exercice :
Pour avoir la médiane, il faut déjà avoir le rang
médian :
Rang Médian = (N + 1) / 2 = (44+1)/2 = 22.5
Il n'y a pas de nc = 22.5 donc on prend celui juste au-dessus :
23, Rang Médian = 23.
Donc au nc = 23 (rang médian) sur la même colonne la valeur x
correspondante de la même colonne est 33
2. i = 3
x |
18 |
19 |
20 |
21 |
22 |
23 |
24 |
25 |
26 |
27 |
28 |
29 |
30 |
31 |
32 |
33 |
34 |
35 |
36 |
37 |
38 |
39 |
40 |
41 |
42 |
43 |
44 |
45 |
46 |
47 |
48 |
49 |
50 |
51 |
52 |
53 |
n |
1 |
0 |
0 |
2 |
0 |
1 |
1 |
1 |
2 |
1 |
2 |
2 |
2 |
2 |
3 |
3 |
3 |
3 |
2 |
1 |
3 |
1 |
0 |
2 |
2 |
1 |
0 |
1 |
0 |
1 |
0 |
0 |
0 |
0 |
0 |
1 |
Vc |
19 |
22 |
25 |
28 |
31 |
34 |
37 |
40 |
43 |
46 |
49 |
52 |
n |
1 |
3 |
4 |
5 |
7 |
9 |
6 |
3 |
3 |
2 |
0 |
1 |
Le truc est de mettre toutes les valeurs x sans
interruption dans l'ordre donc même celles qui n'était pas donnée dans
le premier tableau.
Ensuite on groupe les valeurs x par trois 18,19,20
- 21,22,23 - 24,25,26 - ... et on leur attribue leur effectifs n
correspondant pour les valeurs x qui n'étaient pas marqué dans le
premier tableau, leurs effectifs n = 0
(J'ai utilisé un code couleur dans le tableau pour plus de
compréhension)
Vc est la valeur centrale donc celle représentative avec
un intervalle i = 3, les premières valeurs sont 18,19,20
et la Vc est 19 car Vc = (Vextrêmes)/2, les valeurs extrêmes dans ce cas
étant 18 et 20.
Vc = (18+20)/2 = 19
(Vc représentante la moyenne des autres valeurs)
Donc pour les valeurs suivantes 21,22,23 : Vc = (21+23)/2 = 22.
On notera que l'intervalle est de 3 et donc la Vc
augmentera donc toujours de 3 à chaque fois : 19 - 22 - 25 - ...
Comme les valeurs sont regroupés dans les Vc (valeurs
centrales), on regroupe également leurs effectifs.
Il suffira alors d'additionner les effectifs correspondant aux valeurs de
la Vc
Dans le premier cas ici
Les valeurs sont 18,19,20 avec comme effectifs réciproques 1,0,0
Si on fait l'addition des effectifs réciproques 1 + 0 + 0 = 1.
Nous obtenons donc désormais l'effectif correspondant à la Vc pour Vc =
19, n = 1.
Pour le graphique, nous utiliserons maintenant les Vc avec
leur effectifs correspondants.
Le graphique sera d'autant plus facile à réaliser que l'intervalle sera
grand.
3.
Moyenne = Snx /
N
Snx = 1465
N = 44
Moy = 1465 / 44 = 33.29
Ecart-type :
Je ne détaille pas
Sx2 = 51067
Snx = 1465
N = 44
Je ne détaille pas même s'il faudrait le faire en 5
étapes minimum, prendre exemple avec le TD 2
Pour ne pas se tromper, il faut aussi penser que l'écart
type est inférieur à l'étendue.
|