Statistiques, STT2700, cours du 19/01: échantillonnage, TCL et LGN
By arthur charpentier on Monday, January 17 2011, 15:19 - statistique 10/11 STT2700 - Permalink
Mercredi matin, nous allons aborder l'échantillonnage.
Nous allons partir d'un échantillon
, supposé
indépendant et identiquement distribué. Le modèle sous-jacent est la
collection de n variables aléatoires
indépendantes et
identiquement distribuées. Dans un premier temps, on s'intéressera à la
moyenne de l'échantillon, correspondant à une réalisation de la
variable aléatoire
définie par

désigne la
variable aléatoire correspondant au fait d'avoir obtenu PILE au
ème tirage. On
remet des pièces à une centaine d'élèves (chaque élève correspond à une
couleur différente), et on regarde la moyenne du nombre de PILE obtenus
sur les
premiers lancers.
Et on regarde ce qui se passe quand n augmente. La loi de grands nombres
permet d'affirmer que



obtenue par un
élève. Un histogramme est représenté à droite.

) et réduire (ici
mulplier par
) la moyenne
empirique pour étudier une éventuelle convergence. On pose alors

tirages, par les
élèves, avec en rouge la densité de
la loi normale centrée réduire. Et là encore, l'expérience semble
valider la théorie...
M=read.table("http://freakonometrics.blog.free.fr/public/data/PILEFACE.txt")
nl=ncol(M)
nj=nrow(M)
M1=matrix(M=="PILE",nj,nl)
MS=M1
for(l in 2:nl){MS[,l]=
(apply(M1[,1:l],1,mean)-.5)/sqrt(.25/l)}
arret=100
COULEUR= rev(rainbow(nj))
HIST=hist(MS[,arret])
plot(1:nl,MS[1,],ylim=(c(-3,3)),col="white",
xlim=c(0,250),xlab="Nombre de lancers de pièces",
ylab="Nombre moyen de PILE, centré réduit")
for(j in 1:nj){
lines(1:arret,MS[j,1:arret],col=COULEUR[j])
}
abline(v=arret)






