Lien de la note Hackmd

Feuille 3 Exercice 4

La variable aleatoire

X suit une loi de Pareto de parametre
α
.A l’aide du theoreme de Wilks, ecrire la zone de rejet du test
H0:α=2
contre
H1:α>2
.

Solution

Nous n'avons pas de valeur pour

H1, mais
α>2
. Nous allons donc le remplacer par l'EMV.

Pour la loi de Pareto de parametre

α>0 dont la densite est donnee par

f(x,α)=αxα1

pour

x>1.

Determinons l'EMV.

On a:

L(x,α)=αni=1nxiα1

d'ou

logL(x,α)=nlogα+i=1n(α1)log(xi)

et

logLα(x,α)=nαi=1nlog(xi)

Ainsi

logLα(x,α)=0

equivaut a

nαi=1nlog(xi)=0

Nous obtenons la solution

α^=ni=1nlog(xi)

Reste a verifier la condition du second ordre:

2logLα2=nα2<0

Par consequent,

α^=ni=1nlog(xi) est bien l'EMV

T=L(X1,,Xn,α^)L(X1,,Xn,2)=i=1n(nj=1nln(Xj))Xi(nΣln(Xi)+1)i=1n2Xi3=(n2Σln(Xj))ni=1nXinΣln(Xi)+2

Rn=2ln(T)=2nln(n2S)+i=1n(2nS)ln(Xi)\colorredS:=j=1nln(Xj)Rn=2nln(n2S)+(2nS)S=2nln(n2S)+2Sn

Asymptotiquement,

Rn suit asymptotiquement une loi de
χ2
a
n
degre de liberte.

La zone de rejet est:

{Rn>χ\colorred1α2}

ou

χ1α2 designe le quantile de niveau
1α

:::

Feuille 3 Exercice 6

Considerons

n variables aleatoires independantes de densite:

f(x,θ)=θ2xeθx𝟙R+(x)

ou le parametre

θ est strictement positif.

Nous disponsons de

n observations et voulons tester l'hypothese
H0:θ=θ0
contre l'hypothese
H1:θ=θ1
avec
θ0<θ1

  1. Justifier que
    f(x,θ)
    definit bien une densite pour tout
    θ>0
  2. Calculer
    E(X)
  3. Determiner la statistique de Neyman-Pearson que nous noterons
    Tn
  4. En admettant que
    θTn
    suit une loi
    Γ(2n,1)
    , determiner une expression de
    α
    et
    β
    en fonction du seuil du test
  5. Determiner les courbes COR associes a ce test.
Solution

On saute les 2 premieres questions car fait et refait

​​​​3.

​​​​$$
​​​​\begin{aligned}
​​​​T &= \frac{L(X_n,\dots,X_n,\theta_1)}{L(X_n,\dots,X_n,\theta_0)}\\
​​​​&= \frac{\prod_{i=1}^n\theta_1^2X_ie^{-\theta_1X_i}}{\prod_{i=1}^n\theta_0^2X_ie^{-\theta_0X_i}}\\
​​​​&= \biggr(\frac{\theta_1}{\theta_0}\biggr)^{2n}\times e^{\sum_{i=1}^n(\theta_0-\theta_1)}
​​​​\end{aligned}
​​​​$$

​​​​On passe au logarithme:

​​​​$$
​​​​\begin{aligned}
​​​​\ln T&= \underbrace{2n\log(\frac{\theta_1}{\theta_0})}_{\color{green}{a}}+\underbrace{(\theta_0-\theta_1)}_{\color{green}{b}}\sum_{i=1}^nX_i
​​​​\end{aligned}
​​​​$$

​​​​L'hypothese $H_0$ est rejetee lorsque:

​​​​$$
​​​​\begin{aligned}
​​​​T&\gt C_{\alpha}\\
​​​​\ln T&\gt\ln C_{\alpha}\\
​​​​a+b\sum_{i=1}^nX_i&\gt\ln (C_{\alpha})\\
​​​​\underbrace{\sum_{i=1}^n X_i}_{\color{red}{T_n}}&\lt \underbrace{\frac{\ln(C_{\alpha})-a}{b}}_{\color{red}{S_{\alpha}}}
​​​​\end{aligned}\\
​​​​\color{green}{\text{car } b = \theta_0-\theta_1\lt 0}
​​​​$$

​​​​Donc: 

​​​​$$
​​​​T_n\lt S_{\alpha}
​​​​$$

α=P(Rejeter H0|H0 vraie)=P(Tn<Sα|θ=θ0)

Sous

H0,
θ0Tn
suit une loi
Γ(2n,1)

α=P(θ0Tn<θ0Sα)=Fn(θ0Sα)

Ou

Fn designe la fonction de repartition de la loi
Γ(2n,1)
.

Exprimons

Sα en fonction de
α
:

Sα=Fn1(α)θ0

β=P(Rejeter H|H vraie)=P(TnSα|θ=θ1)=P(θ1Tnθ1Sα|θ=θ1)

Or sous

H1:
θTnΓ(2n,1)

Donc:

β=1Fn(θ,Sα)=1Fn(θθ0Fn1(α))

En python:

scipy.stats.gamma.cdf(2 * scipy.stats.gamma.ppf(0.05, 20, scale=1), 20, scale = 1)
0.9184...
scipy.stats.gamma.cdf(2 * scipy.stats.gamma.ppf(0.05, 50, scale=1), 50, scale = 1)
0.999702...
scipy.stats.gamma.cdf(2 * scipy.stats.gamma.ppf(0.01, 10, scale=1), 10, scale = 1)
0.316165...
scipy.stats.gamma.cdf(2 * scipy.stats.gamma.ppf(0.001, 100, scale=1), 100, scale = 1)
0.9999523...

On nome

Π la probabilite de detection:

Π=1βΠ=Fn(θ1θ0Fn1(α))

:::

Feuille 4 Exercice 4

Considerons

n variables aleatoires independantes
Xi
suivant la loi de densite:

f(x,θ)=3θx2ex3θ𝟙R+(x)

avec

θ>0 ou
𝟙R+
designe la fonction indicatrice de
R+

Nous souhaitons tester l'hypothese

H0:θ=θ0 contre
H1:θ=θ1
avec
θ0<θ1
a l'aide d'observations
xi
issues de l'echantillon precedent

    • (a) Justifier que, pour tout
      θ>0
      ,
      f(,θ)
      definit bien une densite sur
      R
    • (b) Determiner l'EMV
      θ^
  1. Determiner la statistique du test de Neyman-Pearson et indiquer la region critique associe a ce test.
  2. Verifier que la variable aleatoire
    Yi=2θXi3
    suit une loin
    χ2
    a deux degres de liberte
  3. En deduire le seuil du test de Neyman-Pearson en fonction du risque de premiere espece
    α
  4. Determiner la puissance du test en fonction du test et de
    θ1
  5. Determiner les courbes COR associees a ce test
    • (a) Application numerique
      1
      :
      α=5%,θ0=1,θ1=2
      et
      n=15
    • (b) Application numerique
      1
      :
      α=5%,θ0=1,θ1=5
      et
      n=30
    • © Application numerique
      1
      :
      α=5%,θ0=1,θ1=2
      et
      n=10
    • (d) Application numerique
      1
      :
      α=5%,θ0=1,θ1=5
      et
      n=30
Solution

On pose

ϕ(y)=2θy3.

Ainsi:

ϕ1(y)=θy23

Elle est derivable car elle est polynomiale et est bijective car elle est strictement croissante.

fY(y)=1(6θ(θy23)2)×f(θy23)=16θ(θy23)2×3θ(θy23)2×e((θy23)3θ)=12×ey2

On peut en deduire que

Y suit une loi
χ2(2)

\colorgreenT=i=1nXi3

\colorgreenYi=2θXi3X2(2)

2θTχ2(2n)

α=P(Rejeter H0|H0 vraie)=P(T>Sα|θ=θ0)=P(2θ0T>2θ0Sα|θ=θ0)

Sous

(H0),
\colorred2θ0Tχ2(2n)

\colorgreenFn est la fonction de repartition χ2(2n)

α=P(W>2θ0Sα)

α=1Fn(2θ0Sα)

\colorredDonc

1α=Fn(2θ0Sα)

Sα=θ02Fn1(1α)

\colorredβ=P(Rejeter H1|H1vraie)=P(TSα|θ=θ1)=P(2θ1T2θ1Sα|θ=θ1)

w1=2θ1Tχ2(2n)

β=Fn(2θ1Sα)

\colorgreenβ=Fn(θ0θ1Fn1(1α))

Passons aux applications numeriques:

scipy.stats.chi2.cdf(0.5 * scipy.stats.ppf(0.95, 30), 30)
0.14185880202947254
scipy.stats.chi2.cdf(0.2 * scipy.stats.ppf(0.95, 60), 60)
1.6239064341119149e-09
scipy.stats.chi2.cdf(0.5 * scipy.stats.ppf(0.99, 20), 20)
0.46403880816957155
scipy.stats.chi2.cdf(0.2 * scipy.stats.ppf(0.99, 20), 20)
1.87204631776198e-08
scipy.stats.chi2.cdf(1.0001 * scipy.stats.ppf(0.99, 20), 20)
0.9900104784496678

:::