XLIII OM - I - Zadanie 10

Danych jest $ n $ liczb $ a_1\leq a_2 \leq \ldots \leq a_n $. Przyjmujemy

\[<br />
M_1 = \frac{1}{n} \sum_{i=1}^n a_i,\; M_2 = \frac{2}{n(n-1)} \sum_{1\leq i < j\leq n} a_ia_j, \;<br />
Q = \sqrt{M_1^2 - M_2}.<br />
\]

Udowodnić, że

\[<br />
a_1 \leq M_1 - Q \leq M + Q \leq a_n<br />
\]

Rozwiązanie

W określeniu wyrażenia $ Q $ różnica $ M_1^2 - M_2 $ znajduje się pod znakiem pierwiastka kwadratowego. Aby mieć pewność, że określenie $ Q $ jest poprawne, należałoby uzasadnić, że ta różnica jest nieujcmna. (Można też uznać, że skoro w treści zadania znajduje się napis ,,pierwiastek kwadratowy z pewnej liczby'', to nieujemność tej liczby jest automatycznie dana w założeniach.)

Wszelako nierówność $ M_1^2 - M_2 \geq 0 $ istotnie jest konsekwencją wcześniejszych założeń (tzn. określenia liczb $ M_1 $ i $ M_2 $). Jej uzasadnienie pojawi się w dalszej części rozwiązania.

Wprowadźmy do rozważań liczby

\[<br />
x_i = a_i - M_1 \quad \textrm{dla} \quad i \in 1, \ldots, n;<br />
\]

spełniają one nierówności $ x_1 \leq x_2 \leq \ldots \leq x_n $ oraz równość

\[<br />
(1) \qquad \sum_{i=1}^n x_i = \sum_{i=1}^n a_i - n M_1 =0.<br />
\]

Weźmy pod uwagę funkcję

\[<br />
(2) \qquad F(t) = \sum_{i<j} (t+x_i)(t+x_j)<br />
\]

(sumowanie po wszystkich parach $ (i,j) $ takich, że $ 1 \leq i < j \leq n $). Funkcja $ F(t) $ jest wielomianem drugiego stopnia (zmiennej $ t $); ma więc przedstawienie

\[<br />
F(t) = At^2 + Bt + C.<br />
\]

Współczynniki $ A $, $ B $, $ C $ wyznaczamy wymnażając różnice w nawiasach w wyrażeniu (2) i wykonując sumowanie:

\[<br />
F(t) = \sum_{i<j} t^2 + \sum_{i<j} (x_i+x_j)t + \sum_{i<j} x_i x_j,<br />
\]

skąd

\[<br />
A = \sum_{i<j} 1 = \frac{n(n-1)}{2} \quad \textrm{(tyle składników ma suma)}<br />
\]

oraz (wobec związku (1))

\[<br />
\begin{split}<br />
B & = \sum_{i<j} (x_i+x_j) = \frac{1}{2} \left( \sum_{i<j} (x_i+x_j) + \sum_{i>j} (x_i+x_j) \right) = \\<br />
& = \frac{1}{2} \sum_{i \ne j} (x_i+x_j) = \frac{1}{2} \sum_{i=1}^n \left( \sum_{j=1}^n(x_i+x_j) - 2x_i \right) = \\<br />
& = \frac{1}{2} \left( \sum_{i=1}^n \left(nx_i + \sum_{j=1}^n x_j \right) - 2 \sum_{i=1}^n x_i \right) = 0,<br />
\end{split}<br />
\]

zaś

\[<br />
C = \sum_{i<j} x_i x_j = \frac{1}{2} \left( \left( \sum_{i=1}^n x_i \right)^2 - \left( \sum_{i=1}^n x_i^2 \right) \right) = -\frac{1}{2} \sum_{i=1}^n x_i^2 \leq 0.<br />
\]

Tak więc

\[<br />
(3) \qquad F(t) = \frac{n(n-1)}{2} t^2 + C, \quad \textrm{gdzie}\ C \leq 0.<br />
\]

Z nierówności $ x_1 \leq \ldots \leq x_n $ wynika, że dla $ t = x_1 $ oraz dla $ t= x_n $ wszystkie składniki sumy (2) określającej $ F(t) $ są nieujemne; stąd

\[<br />
(4) \qquad F(x_1) \geq 0, \quad F(x_n) \geq 0.<br />
\]

Zapiszmy teraz liczbę $ M_2 $ w następujący sposób (korzystając z (3)):

\[<br />
\begin{split}<br />
M_2<br />
& = \frac{2}{n(n-1)} \sum_{i<j} (M_1+ x_i)(M_1+x_j) = \frac{2}{n(n-1)} F(M_1) =\\<br />
& = \frac{2}{n(n-1)} \left( \frac{n(n-1)}{2} M_1^2 + C \right) = M_1^2 + \frac{2C}{n(n-1)}.<br />
\end{split}<br />
\]

Ponieważ $ C \leq 0 $, widać stąd, że $ M_1^2 - M_2 \geq 0 $; a zatem liczba $ Q = \sqrt{M_1^2 - M_2} $ jest poprawnie określona, a stała $ C $ jest z nią związana zależnością

\[<br />
C=\frac{n(n-1)}{2} (M_2 - M_1^2) = - \frac{n(n-1)}{2} Q^2.<br />
\]

Podstawiając to do wzoru (3) otrzymujemy

\[<br />
F(t) = \frac{n(n-1)}{2} (t^2 - Q^2)<br />
\]

i z nierówności (4) wnosimy, że

\[<br />
(5) \qquad Q^2 \leq x_1^2, \quad Q^2 \leq x_n^2.<br />
\]

Suma liczb $ x_i $ równa się zeru (wzór (1)), wobec czego $ x_1 \leq 0 $, $ x_n \geq 0 $. Ze związków (5) wynikają więc nierówności

\[<br />
(6) \qquad Q \leq -x_1 = M_1 -a_1 \quad \textrm{oraz} \quad Q \leq x_n = a_n - M_1,<br />
\]

które stanowią tezę zadania.

Uwaga: Warto dać probabilistyczną interpretację udowodnionych nierówności. Weźmy pod uwagę zmienną losową $ X $ (na dowolnej przestrzeni probabilistycznej), przyjmującą wartości $ a_1,a_2,\ldots,a_n $ - każdą z nich z jednakowym prawdopodobieństwem, równym $ 1/n $. Jej wartość średnia oraz wariancja wyrażają się wzorami $ E(X) = (a_1 + a_2 + \ldots + a_n)/n $ oraz

\[<br />
\begin{split}<br />
D^2(X) & = E(X^2) - (E(X))^2 = \frac{1}{n} \sum_{i=1}^n a_i^2 - \frac{1}{n^2}\left( \sum_{i=1}^n a_i \right)^2 =\\<br />
& = \frac{1}{n} \left( \left( \sum_{i=1}^n a_i \right)^2 - 2 \sum_{i<j} a_i a_j \right) - \frac{1}{n^2} \left( \sum_{i=1}^n a_i \right)^2 = \\<br />
& = (n-1) \left( \frac{1}{n} \sum_{i=1}^n a_i \right)^2 - \frac{2}{n} \sum_{i<j} a_i a_j.<br />
\end{split}<br />
\]

(Określenie użytych pojęć oraz dowód równości $ D^2(X) = E(X^2) - (E(X))^2 $ można znaleźć na przykład w podręczniku: W. Szlenk, {\it Rachunek prawdopodobieństwa dla klasy IV liceum ogólnokształcącego i technikum}, PZWS, Warszawa 1970, rozdział 6.6, wzór (10).)

Używając danych w zadaniu oznaczeń $ M_1 $, $ M_2 $, $ Q $ mamy więc równości $ E(X)= M_1 $ oraz

\[<br />
(7) \qquad D^2(X) = (n-1)M_1^2-(n-1)M_2 = (n-1)Q^2.<br />
\]

Pierwiastek kwadratowy z wariancji, oznaczany symbolem $ D(X) $ (lub też $ \sigma_X $), nazywa się {\it odchyleniem standardowym} (zmiennej losowej $ X $ od wartości średniej $ E(X) $). Wzór (7) pokazuje, że rozważana w zadaniu wielkość $ Q $ równa się, z dokładnością do czynnika $ 1/ \sqrt{n- 1} $, odchyleniu standardowemu zmiennej $ X $:

\[<br />
Q = \frac{D(X)}{\sqrt{n-1}};<br />
\]

a każda z wykazanych nierówności (6) daje górne oszacowanie tego odchylenia:

\[<br />
D(X) \leq \sqrt{n-1} (E(X) - \min a_i),<br />
\]
\[<br />
D(X) \leq \sqrt{n-1} (\max a_i - E(X)).<br />
\]

Komentarze

Dodaj nową odpowiedź