Twierdzenie Cochrana

Twierdzenie Cochrana – twierdzenie matematyczne wykorzystywane w analizie wariancji. Jest ono twierdzeniem odwrotnym do twierdzenia Fishera.

Założenia

Załóżmy, że U 1 , U 2 , , U n {\displaystyle U_{1},U_{2},\dots ,U_{n}} niezależnymi zmiennymi losowymi o rozkładach normalnych. Rozważmy równość

i = 1 n   U i 2 = Q 1 + + Q k , {\displaystyle \sum _{i=1}^{n}~U_{i}^{2}=Q_{1}+\dots +Q_{k},}

gdzie Q i {\displaystyle Q_{i}} są sumami kwadratów kombinacji liniowych zmiennych U i , {\displaystyle U_{i},} takimi że

r i + + r k = n , {\displaystyle r_{i}+\dots +r_{k}=n,}

gdzie r i {\displaystyle r_{i}} są rzędami Q i . {\displaystyle Q_{i}.}

Teza

Zmienne Q i {\displaystyle Q_{i}} są zmiennymi niezależnymi i mają rozkład χ² z r i {\displaystyle r_{i}} stopniami swobody.

Przykład

Jeśli X 1 , , X n {\displaystyle X_{1},\dots ,X_{n}} niezależnymi zmiennymi losowymi o rozkładzie normalnym ze średnią μ {\displaystyle \mu } i odchyleniem standardowym σ , {\displaystyle \sigma ,} wtedy

U i = X i μ σ {\displaystyle U_{i}={\frac {X_{i}-\mu }{\sigma }}}

ma standardowy rozkład normalny dla każdego i . {\displaystyle i.}

Możemy zapisać:

i = 1 n   ( X i μ ) 2 = i = 1 n   ( X i + X ¯ X ¯ μ ) 2 = {\displaystyle \sum _{i=1}^{n}~(X_{i}-\mu )^{2}=\sum _{i=1}^{n}~(X_{i}+{\overline {X}}-{\overline {X}}-\mu )^{2}=}
= i = 1 n   ( X i X ¯ ) 2 + i = 1 n   ( X ¯ μ ) 2 + 2 i = 1 n   ( X i X ¯ ) ( X ¯ μ ) . {\displaystyle =\sum _{i=1}^{n}~(X_{i}-{\overline {X}})^{2}+\sum _{i=1}^{n}~({\overline {X}}-\mu )^{2}+2\sum _{i=1}^{n}~(X_{i}-{\overline {X}})({\overline {X}}-\mu ).}

Trzeci składnik wynosi zero, ponieważ jest równy iloczynowi stałej przez

i = 1 n   ( X i X ¯ ) , {\displaystyle \sum _{i=1}^{n}~(X_{i}-{\overline {X}}),}

natomiast drugi składnik jest sumą n {\displaystyle n} identycznych stałych.

Uwzględniając powyższe i dzieląc strony równości przez σ 2 , {\displaystyle \sigma ^{2},} otrzymujemy:

i = 1 n   ( X i μ σ ) 2 = i = 1 n   ( X i X ¯ σ ) 2 + n ( X ¯ μ σ ) 2 = Q 1 + Q 2 . {\displaystyle \sum _{i=1}^{n}~\left({\frac {X_{i}-\mu }{\sigma }}\right)^{2}=\sum _{i=1}^{n}~\left({\frac {X_{i}-{\overline {X}}}{\sigma }}\right)^{2}+n\left({\frac {{\overline {X}}-\mu }{\sigma }}\right)^{2}=Q_{1}+Q_{2}.}

Ranga Q 2 {\displaystyle Q_{2}} wynosi 1 {\displaystyle 1} (jest to kwadrat tylko jednej kombinacji liniowej zmiennych losowych o standardowym rozkładzie normalnym). Ranga Q 1 {\displaystyle Q_{1}} być z kolei obliczona jako n 1. {\displaystyle n-1.}

Spełnione są założenia twierdzenia Cochrana. Twierdzenie Cochrana mówi, że Q 1 {\displaystyle Q_{1}} i Q 2 {\displaystyle Q_{2}} są niezależnymi zmiennymi losowymi i mają rozkład χ 2 {\displaystyle \chi ^{2}} ze stopniami swobody odpowiednio n 1 {\displaystyle n-1} i 1. {\displaystyle 1.}

To pokazuje, że średnia z próby i wariancja z próby są niezależnymi zmiennymi losowymi, a także:

( X ¯ μ ) 2 σ 2 n χ 1 2 . {\displaystyle ({\overline {X}}-\mu )^{2}\sim {\frac {\sigma ^{2}}{n}}\chi _{1}^{2}.}

Jako estymatora wariancji σ 2 {\displaystyle \sigma ^{2}} używa się często:

σ 2 ^ = 1 n   ( X i X ¯ ) 2 . {\displaystyle {\hat {\sigma ^{2}}}={\frac {1}{n}}\sum ~\left(X_{i}-{\overline {X}}\right)^{2}.}

Twierdzenie Cochrana pokazuje, że:

σ 2 ^ σ 2 n χ n 1 2 , {\displaystyle {\hat {\sigma ^{2}}}\sim {\frac {\sigma ^{2}}{n}}\chi _{n-1}^{2},}

z czego wynika, że wartością oczekiwaną σ 2 ^ {\displaystyle {\hat {\sigma ^{2}}}} jest σ 2 n n 1 . {\displaystyle {\frac {\sigma ^{2}n}{n-1}}.}

Zobacz też

  • analiza wariancji
  • przegląd zagadnień z zakresu statystyki
  • twierdzenie Fishera