La présentation, la lisibilité, l'orthographe, la qualité de la rédaction, la clarté et la précision des raisonnements entreront pour une part importante dans l'appréciation des copies. Les candidats sont invités à encadrer dans la mesure du possible les résultats de leurs calculs. Aucun document n'est autorisé. L'utilisation de toute calculatrice et de tout matériel électronique est interdite. Seule l'utilisation d'une règle graduée est autorisée. Si au cours de l'épreuve, un candidat repère ce qui lui semble être une erreur d'énoncé, il la signalera sur sa copie et poursuivra sa composition en expliquant les raisons des initiatives qu'il sera amené à prendre.
Le théorème limite central est l'un des théorèmes fondamentaux des probabilités : il occupe une place centrale aussi bien d'un point de vue théorique que des applications (notamment en statistique). Le but de ce problème est d'explorer diverses applications de ce théorème. La première partie étudie quelques propriétés, applications simples, et généralisation du théorème limite central. La deuxième partie se concentre sur l'utilisation de ce théorème en statistique, en particulier dans le cadre de sondages électoraux. La troisième partie s'attelle à démontrer le théorème limite central, via une adaptation de la méthode de Lindeberg.
Toutes les variables aléatoires intervenant dans le problème sont définies sur un espace probabilisé ( ). Pour une variable aléatoire , on notera son espérance et sa variance lorsqu'elles existent.
Pour tout le problème, on se donne une suite de variables aléatoires réelles indépendantes et de même loi. On supposera qu'elles admettent un moment d'ordre deux et on notera leur espérance commune et leur variance commune avec . Enfin, pour tout entier naturel , on définit les variables aléatoires
Première partie : Autour du théorème limite central
Soit une variable aléatoire de loi normale , c'est-à-dire que la loi de admet la densité définie par .
On note la fonction de répartition de définie par .
(a) Montrer que est continue sur .
(b) Montrer que la fonction est strictement croissante.
(c) Montrer que la fonction est une bijection de sur .
(d) Montrer que pour tout on a .
(a) Énoncer la loi faible des grands nombres pour la suite de variables aléatoires .
(b) Rappeler les hypothèses du théorème limite central et en déduire que pour tout réel on a
Donnons une première application du théorème central limite, pour un joueur de fléchettes. Au -ème lancer de fléchette, le score est une variable aléatoire qui prend ses valeurs dans . On suppose que les sont indépendantes et de même loi donnée par:
(a) Calculer .
(b) Calculer .
(c) Soit la fonction définie de la manière suivante :
i) Soit une variable aléatoire de loi uniforme sur . Montrer que a la même loi que .
ii) Compléter le programme Scilab suivant, qui permet de générer un nombre aléatoire de même loi que . On rappelle que la fonction rand() simule une variable aléatoire de loi uniforme sur [ 0,1 ].
function x = X()
U=rand()
...
endfunction
Après lancers de fléchettes, le score du joueur est .
(d) Exprimer en fonction de et de .
(e) Un joueur lance fléchettes. En utilisant le théorème limite central, montrer que la probabilité que le score du joueur soit inférieur ou égal à 500 est approximativement . Cette probabilité vaut environ .
4) Soit un entier naturel fixé supérieur ou égal à 1 . La fonction étant strictement croissante et bijective, pour , on peut définir le réel . On pose et , avec par convention et .
(a) Montrer qu'il existe un (qui dépend de ) tel que pour tout , on a
On divise l'ensemble des réels en intervalles pour , avec par convention et .
(b) Soit et un réel quelconque tel que . Soit .
i) Montrer que 1 'on a .
ii) En déduire que .
iii) De même, montrer que l'on a .
(c) En déduire que pour tout réel et tout on a .
(d) Soit une suite de majorants des fonctions définies pour par
c'est-à-dire tels que pour tout , pour tout entier . Montrer que l'on peut choisir la suite telle que
Notons que () est une version plus forte que (*).
5) Soit un réel fixé.
(a) Soit une suite de réels telle que
i) Montrer que .
ii) En appliquant le résultat () de la question 4) (d), montrer que .
iii) En conclure que l'on a .
(b)
i) Montrer que pour tout on a .
ii) En déduire que .
(c) Montrer que, pour tous réels qui vérifient , on a
Deuxième partie : Applications en statistique.
Dans toute cette partie, on suppose que les variables aléatoires sont indépendantes et de loi de Bernoulli de paramètre , où . On se servira de ces variables aléatoires pour modéliser une élection entre les candidats A et si la -ème personne vote pour le candidat A et si la -ème personne vote pour le candidat B . Le paramètre représente la proportion des voix qu'obtient le candidat .
Les sondages cherchent à estimer le paramètre inconnu pour anticiper le résultat de l'élection. On sélectionne personnes (dans la population totale) et on note comme précédemment , qui correspond à la proportion des personnes (parmi celles sélectionnées) qui votent pour le candidat .
6)
(a) Démontrer que et que .
(b) On notera dans la suite . Montrer que .
(c) Montrer que .
(d) Montrer que .
7) On peut construire un intervalle de confiance pour en appliquant le théorème limite central.
(a) Montrer que pour tout on a
(b) En déduire que
(c) Une table des valeurs de donne . En déduire que pour grand, le paramètre a approximativement de chances d'appartenir à l'intervalle . Un problème est que dépend de , donc l'intervalle ci-dessus dépend encore de , qui est inconnu.
(d) Montrer que pour grand, le paramètre a approximativement plus de de chances d'appartenir à l'intervalle .
Une autre solution est d'utiliser les observations de pour estimer .
8) On pose, pour . Soit .
(a) Montrer que .
(b) En déduire que .
(c) Montrer que .
(d) Montrer que pour assez grand .
(e) Conclure que pour tout on a .
9) On pose maintenant . On se fixe un réel .
(a) Soit .
i) Montrer que .
ii) Montrer que .
iii) Montrer que .
iv) En déduire qu'il existe un entier tel que pour tout on a .
(b) On admettra que, de manière symétrique, pour tout il existe un tel que pour tout on a . En conclure que l'on a .
10)
(a) Montrer que pour tout on a .
(b) Le candidat A remporte effectivement l'élection si on a . Une semaine avant l'élection, un sondage réalisé auprès de personnes donne pour la valeur 0,52 (et donc pour la valeur 0,2506 ). Montrer que la probabilité que le candidat A remporte l'élection est approximativement . On a et une table donne . Il a donc environ 1 chance sur 10 d'avoir , c'est-à-dire que le candidat remporte l'élection.
11) Lors des dernières élections, on s'est rendu compte que les électeurs pouvaient mentir lors du sondage (ou bien simplement changer d'avis entre le sondage et l'élection) : avec une probabilité déterminée, un électeur votera pour B alors qu'il avait déclaré qu'il voterait pour A .
La réponse enregistrée par l'institut de sondage est , où si la -ème personne change d'avis en faveur de B et sinon. On suppose que les variables aléatoires sont indépendantes de loi de Bernoulli de paramètre et qu'elles sont indépendantes des .
(a) Montrer que est une variable aléatoire de Bernoulli dont on déterminera le paramètre .
On définit , qui est la mesure effectuée par le sondage et on pose . De la même manière que dans la question 9), on admet qu'on a, pour tout
(b) Montrer que .
(c) On suppose que le sondage sur personnes a donné à la valeur , et donc pour la valeur . Montrer que la probabilité que le candidat A remporte effectivement l'élection, c'est-àdire que , vaut approximativement .
(d) Prenons les mêmes données que plus haut: le sondage de personnes donne . Si , montrer que la probabilité que le candidat A remporte effectivement l'élection n'est plus que de .
Troisième partie : Démonstration du théorème limite central.
Dans cette partie, on suppose que les admettent un moment d'ordre 3 , donc et existent. Sous cette condition, on va démontrer le théorème limite central, c'est-à-dire le résultat (*).
On supposera aussi pour simplifier que et , de sorte que . Soit un réel fixé pour toute la suite de cette partie.
On rappelle que désigne l'ensemble des fonctions de dans qui sont fois dérivables et de dérivée -ème continue sur . Pour une fonction bornée sur , on notera un majorant de , c'est-à-dire un réel tel que pour tout . (a) i) Montrer, grâce à des intégrations par parties successives, que .
ii) En déduire que .
On définit la fonction de la manière suivante : pour , on pose
(b) Montrer que est continue sur .
(c) Montrer que pour tout , on a .
On admettra que et sont aussi continues et bornées sur .
13) On pose et .
(a) i) Montrer que est continue sur et que pour tout on a .
On admettra que et sont aussi continues et bornées sur .
ii) Montrer que l'on peut choisir un majorant de tel que .
(b) i) Montrer que si et si .
Pour un événement , on définit la variable aléatoire par .
ii) Montrer que pour toute variable aléatoire on a .
(c) Montrer que l'on a .
Il suffit alors de montrer que l'on a
On va se concentrer sur la dernière égalité.
14) Soit une fonction de classe sur .
(a) Par des intégrations par parties successives, montrer que pour tout fixés, on a
(b) En déduire que pour tous réels, on a
où .
(c) Montrer que si est bornée alors pour tous réels on a .
15) Soient une suite de variables aléatoires de loi normale . On suppose les variables indépendantes entre elles et indépendantes des variables .
(a) Soit un entier naturel supérieur ou égal à 2 .
i) Justifier que la loi de est une loi normale.
ii) On pose . Déterminer la loi de .
(b) Pour , on pose , avec et .
i) Montrer que pour tout .
ii) En déduire que .
On va maintenant calculer l'espérance de chacun des termes de la somme.
(c) i) Montrer que .
ii) Montrer que .
iii) En déduire que .
(d) Montrer que l'on a .
(e) Conclure que 1'on a
(f) En déduire que l'on a .
16)
(a) Montrer que l'on a .
(b) En déduire que .
(c) Conclure que l'on a .