Statystyka matematyczna/Pobieranie próby

Z testwiki
Wersja z dnia 10:04, 12 lip 2023 autorstwa imported>Persino
(różn.) ← poprzednia wersja | przejdź do aktualnej wersji (różn.) | następna wersja → (różn.)
Przejdź do nawigacji Przejdź do wyszukiwania

Szablon:SkomplikowanaStronaStart

Próbą nazywamy skończony zespół doświadczeń wykonanych w celu wyznaczenia kształtu poszukiwanego rozkładu.

Estymatory, wyznaczenie parametru λ w wyniku doświadczenia

Dla danej próby, aby estymować parametr λ (jakiś parametr, który możemy wyznaczyć przez doświadczenie) należy przeprowadzić nieskończoną liczbę pomiarów, wówczas wynik jest dokładny. Jednak liczba pomiarów może być jedynie skończona, wtedy pojawia się problem estymacji parametrów.

Zdefiniujmy estymator zależny od niezależnych parametrów uzyskanych w wyniku doświadczenia, tzn. xSzablon:Sub, xSzablon:Sub,..., xSzablon:Sub: Szablon:CentrujWzór Estymator nazywamy nieobciążonym, jeśli niezależnie od ilości przeprowadzonych doświadczeń, jej wartość oczekiwana jest równa estymowanemu parametrowi λ: Szablon:CentrujWzór Jeśli wariancja estymatora Szablon:LinkWzór znika dla dowolnie dużej próby, to estymator nazywamy zgodnym, co piszemy wzorem: Szablon:CentrujWzór

Związki pomiędzy wariancjami pojedynczego pomiaru a średniej arytmetycznej

Średnią arytmetyczną wszystkich pomiarów w danej próbie określamy wedle jej definicji Szablon:LinkWzór jako sumę n pomiarów w uzyskanych w tej próbie przez ich liczbę: Szablon:CentrujWzór Policzmy wartość oczekiwaną wartości średniej danej próby wykorzystując, że wartość oczekiwana sumy argumentów jest równa sumie ich wartości oczekiwanych wedle wzoru podanego w punkcie Szablon:LinkWzór, która jest napisana wedle obliczeń: Szablon:CentrujWzór Jako że rozkłady w poszczególnych pomiarów w danym doświadczeniu są jednakowe, wtedy wartość oczekiwana danego pomiaru w doświadczeniu jest równa: Szablon:CentrujWzór Zatem wartość oczekiwana wartości oczekiwanej Szablon:LinkWzór jest równa wartości oczekiwanej danego pomiaru w doświadczeniu, zatem jeśli mamy bardzo dużo prób, to wartość oczekiwana wartości średniej jak udowodnimy, dąży do wartości oczekiwanej średniej arytmetycznej danego pomiaru, czyli przestawiana jest według: Szablon:CentrujWzór Wyznaczmy błąd średniej arytmetycznej uzyskanych wyników w wyników doświadczenia Szablon:LinkWzór i sprawdzimy, czy to odchylenie standardowe wraz zwiększającą się ilością pomiarów w doświadczeniu powoduje malenie tejże wielkości, także dla nieskończenie dużej ilości doświadczeń, to odchylenie zaczyna dążyć do zera, co przedstawiamy: Szablon:CentrujWzór Z definicji wariacji jako wartości oczekiwanej z liczby Szablon:Formuła jako odchylenia wartości średniej Szablon:LinkWzór od wartości oczekiwanej podniesionej do kwadratu i z twierdzenia na wartościach oczekiwanych Szablon:LinkWzór możemy wyznaczyć, tą właśnie wielkość: Szablon:CentrujWzór We wzorze Szablon:LinkWzór w drugim członie w liczniku wykorzystany został fakt, że kowariancja dla dwóch różnych zmiennych niezależnych jest równa zero, zatem na podstawie tego warunku dostajemy fakt. Szablon:CentrujWzór A więc otrzymujemy bardzo ważną zależność z wyprowadzenia Szablon:LinkWzór, które przepiszemy dla przejrzystości wykładu i jak się przekonamy, że wariancja średniej arytmetycznej zapisanej jako kwadrat odchylenia tejże średniej od wartości oczekiwanej, jest ona odwrotnie proporcjonalna do ilości pomiarów w danym doświadczeniu: Szablon:CentrujWzór Gdy liczba pomiarów dąży do nieskończoności, wówczas odchylenie standardowe Szablon:Formuła przyjmuje wartość dążącą do zera według wzoru Szablon:LinkWzór, a korzystając z wiadomości o granicach, wnioskujemy, że Szablon:LinkWzór jest jednak prawdą. Obierzmy teraz estymator, który jest wartością średnią kwadratów odchyleń wartości uzyskanych w doświadczeniu xSzablon:Sub od wartości średniej wszystkich pomiarów w danym doświadczeniu: Szablon:CentrujWzór We wzorze wykorzystamy fakt na podstawie wartości średniej dla trzeciego wyrazy w sumie w mianowniku Szablon:LinkWzór: Szablon:CentrujWzór Na podstawie powyższego ostatniego faktu i definicji wariancji jako wartości oczekiwanej kwadratu odchylenia zmiennej losowej od wartości oczekiwanej dla wartości średniej n pomiarów wartość oczekiwana estymatora Szablon:LinkWzór (sSzablon:Sub)Szablon:Sup, korzystając przy tym ze wzoru na wariancję średniej arytmetyczne w zależności od wariancji pojedynczego pomiaru, przyjmuje postać: Szablon:CentrujWzór Na podstawie obliczeń przeprowadzonych w punkcje Szablon:LinkWzór przepisujemy końcowy wniosek, że wartość oczekiwana estymatora Szablon:LinkWzór jest: Szablon:CentrujWzór Czyli ten nasz estymator Szablon:LinkWzór jest estymatorem obciążonym. Określmy inny estymator, który będzie wynikał z poprzedniego i względem wyniku na wartość oczekiwaną starego estymatora Szablon:LinkWzór określmy nowy estymator zdefiniowany: Szablon:CentrujWzór Korzystając z definicji estymatora sSzablon:Sup Szablon:LinkWzór i wyniku Szablon:LinkWzór, możemy policzyć wartość oczekiwaną nowego estymatora sSzablon:Sup Szablon:LinkWzór wedle: Szablon:CentrujWzór Równość σSzablon:Sup(s)=E(sSzablon:Sup) wynika bezpośrednio z definicji nowego estymatora Szablon:LinkWzór i obliczeń Szablon:LinkWzór. Zachodzi równość σSzablon:Sup(s)=E(sSzablon:Sup)=sSzablon:Sup dla nieskończonej ilości pomiarów, co w praktyce dla dużej ilości pomiarów zachodzi z dobrym przybliżeniem, tzn. σSzablon:Sup(s)=E(sSzablon:Sup)≈ sSzablon:Sup. Doszliśmy do wniosku, że najlepiej jest wyliczać średni błąd pomiarowy bardzo dużej ilości danych doświadczalnych według: Szablon:CentrujWzór Odchylenie standardowe średniej arytmetycznej w zależności od odchyleń kwadratowych poszczególnych wyników, korzystając przy czym ze wzoru Szablon:LinkWzór, mówiącej o związku wariancji średniej arytmetycznej z wariancją pomiaru, i ze wzoru Szablon:LinkWzór mówiący coś od odchyleniu standardowym pojedynczego pomiaru, zatem to odchylenie tejże średniej arytmetycznej Szablon:LinkWzór jest napisane: Szablon:CentrujWzór

Pobieranie próby z rozkładów cząstkowych

Gdy doświadczenie składa się z prób - nie zawsze tak się dzieje, że wynik do wyznaczenia jakieś wielkości określamy względem tylko jednej próby. Czasem mamy pewną liczbę prób, a w każdej próbie jest też duża liczba doświadczeń.

Zwykle numer próby numerujemy jaki pierwszy wskaźnik przez x, a numer doświadczenia w próbie jako drugi wskaźnik zmiennej x, i w rezultacie dany pomiar w danej próbie oznaczamy xSzablon:Sub, zatem rozpisując kolejno pomiary dla m prób:

Próba 1: Szablon:Formuła
Próba 2: Szablon:Formuła
Próba m: Szablon:Formuła

Trzeba zaznaczyć, że dla ogólności: m≠ n i najlepiej, by liczba pomiarów w j-tej próbie była bardzo duża, tzn. musi zachodzić n>>1. Mając średnie arytmetyczne z uzyskiwanych prób oraz ich odchylenia standardowe, można wyznaczyć całkowitą wartość średnią i odchylenia standardowe średniej arytmetycznej dla całej serii prób.

Prawdopodobieństwo uzyskania wyniku przy n próbach

Całkowita gęstość prawdopodobieństwo uzyskania w n próbach danego wyniku x jest równe sumie po wszystkich próbach o numerach "k" względem wyrazów , które z definicji prawdopodobieństwa warunkowego są iloczynami gęstości prawdopodobieństwa uzyskania wyniku w próbie k, czyli fSzablon:Sub(x) przez prawdopodobieństwo danej próby pSzablon:Sub, która zależy od całkowitej liczby wszystkich pomiarów we wszystkich próbach i od ilości pomiarów w próbie o numerze "k": Szablon:CentrujWzór Należy pamiętać, że gęstości prawdopodobieństwa fSzablon:Sub(x) rządzące w danej próbie, dla różnych prób mogą być one różne, ale nie muszą być. Podobnie ilość doświadczeń w danej próbie może być różna, ale tym samym może być różne pSzablon:Sub, ale też nie musi być tak oczywiście.

Dystrybuanta w rozkładzie cząstkowym i w próbach

Rozważając tylko k-tą próbę, dystrybuantę dla jednej zmiennej gęstości prawdopodobieństwa można wyznaczyć (patrz definicja: Szablon:LinkWzór) jako całkę od nieskończoności do wartości x, gdy funkcją podcałkową jest gęstości prawdopodobieństwa, która jest całkowana względem zmiennej losowej t. Szablon:CentrujWzór Natomiast dla n-prób znając jakie jest prawdopodobieństwo pojedynczej próby o numerze k oraz z twierdzenia o prawdopodobieństwie warunkowych, że gęstość prawdopodobieństwa uzyskania wyników mniejszych niż x jest sumą iloczynu gęstości prawdopodobieństwa uzyskania danego wyniku z pewnego przedziału dla wartości mniejszych niż x pomnożonej przez prawdopodobieństwo opisujące daną próbę pSzablon:Sub: Szablon:CentrujWzór Przy wyprowadzeniu wzoru Szablon:LinkWzór, korzystaliśmy ze wzoru na całkowitą dystrybuantę Szablon:LinkWzór i wyznaczaliśmy ją dla n-prób w punkcie Szablon:LinkWzór oraz wiedząc, że całkowita gęstość prawdopodobieństwa rządzące n-próbami jest napisane wedle wzoru Szablon:LinkWzór.

Średnia arytmetyczna i wartość oczekiwana przy n próbach

Wartość oczekiwaną Szablon:LinkWzór z j-tej próby z uzyskanych wyników pomiarów obliczamy jako iloraz sumy wszystkich wyników pomiarów uzyskanych w tej próbie przez liczbę wszystkich pomiarów w tej samej próbie: Szablon:CentrujWzór

  • gdzie xSzablon:Sub jest to pomiar i-ty próbie dla pomiaru w tej próbie o numerze j.

Wiemy jednak, że pomiary mogą się powtarzać z prawdopodobieństwem pSzablon:Sub w próbie j-tej, zatem średnia ważona Szablon:LinkWzór (wartość oczekiwana w próbie) jest dla j-tej próby jest wyrażona jako suma prawdopodobieństwa uzyskania pomiaru xSzablon:Sub przez prawdopodobieństwo tego pomiaru wspomniane wcześniej i ta średnia ważona jest: Szablon:CentrujWzór Dla m prób wartość średnia wszystkich wyników uzyskanych we wszystkich próbach, w rezultacie można przedstawić tą wielkość podobnie dla wzoru Szablon:LinkWzór dla pomiaru w próbie, tylko w tym przypadku mamy do czynienia ze średnią arytmetyczną danej próby pomiarów uzyskanych z prawdopodobieństwem pSzablon:Sub, jest przedstawiona: Szablon:CentrujWzór We wzorze Szablon:LinkWzór skorzystaliśmy z faktu, że suma wszystkich prawdopodobieństw uzyskania z każdej z próby z osobna jest równa jeden, co udowodnimy we wzorze poniżej w punkcie Szablon:LinkWzór.

Prawdopodobieństwo k-tej próby jest określone jako iloraz ilości wyników pomiarów w danej próbie nSzablon:Sub w próbie o numerze k przez liczbę wszystkich pomiarów w n próbach. Szablon:CentrujWzór Oczywiste jest, że suma wszystkich pomiarów danych prób jest równa liczbie wszystkich pomiarów we wszystkich próbach: Szablon:CentrujWzór Ze wzoru Szablon:LinkWzór po podzieleniu go przez liczbę wszystkich pomiarów we wszystkich próbach n i korzystając z definicji prawdopodobieństwa k-tej próby Szablon:LinkWzór możemy napisać tożsamość, którą wcześniej z korzystaliśmy z niego. Szablon:CentrujWzór

Wzór przedstawiający wartość oczekiwaną pomiaru uzyskiwanej ze wszystkich prób zapisujemy jak dla wzoru Szablon:LinkWzór, które można zapisać jako sumę, ale za pomocą wartości oczekiwanych dla każdej próby z osobna: Szablon:CentrujWzór Średnia arytmetyczna dla funkcji złożonej H(x) jest napisana podobnie jak dla wzoru Szablon:LinkWzór, ale zamiast wartości oczekiwanej E(xSzablon:Sub) jest wartość oczekiwana E(H(xSzablon:Sub). Szablon:CentrujWzór Gdy dla poszczególnych prób występują zmienne losowe dyskretne, przy wykorzystaniu wzoru Szablon:LinkWzór na średnią arytmetyczną w próbie, wtedy średnia arytmetyczna wszystkich wyników we wszystkich próbach wyrażamy za pomocą prawdopodobieństwa uzyskania danej próby Szablon:LinkWzór i za pomocą prawdopodobieństwa uzyskania danego wyniku w próbie pSzablon:Sub wyniku xSzablon:Sub Szablon:CentrujWzór Gdy dla poszczególnych prób uzyskujemy zmienne losowe ciągłe, co jest w zupełności spełnione dla bardzo dużych ilości pomiarów, i przy tym wykorzystując wzór Szablon:LinkWzór na gęstość uzyskania wyniku we wszystkich próbach fSzablon:Sub(x) otrzymujemy ten sam wzór co Szablon:LinkWzór, ale na innej drodze wyprowadzenia. Szablon:CentrujWzór

Wariancja i kwadrat z odchylenia standardowego dla n prób

Policzmy, jaka jest wariancja pomiaru wyniku (nie średniej z pomiarów w i-tej próbie) dla n prób przeprowadzonych przez różne zespoły, znając rozkłady prawdopodobieństwa uzyskanych pomiarów we wszystkich próbach fSzablon:Sub(x) (ogólnie rozkłady dla różnych prób nie muszą być jednakowe), znając także prawdopodobieństwo k-tej próby pSzablon:Sub Szablon:LinkWzór, a także wartości oczekiwania uzyskanych wyników dla każdej próby z osobna E(xSzablon:Sub) i wartości oczekiwanej Szablon:Formuła dla wszystkich próby razem policzone na podstawie wzoru Szablon:LinkWzór. Zatem według ogólnej definicji wariancji Szablon:LinkWzór, jako drugiego momentu statystycznego można napisać wariancję pomiaru dla zmiennej typu ciągłego "x" wszystkich pomiarów we wszystkich próbach razem wziętych: Szablon:CentrujWzór

Ponieważ w ostatni składniku w nawiasie klamrowym wyraz w sumie Szablon:LinkWzór znika, ze względu na pierwszy moment statystyczny Szablon:LinkWzór, który jest zawsze równy zerowy dla pomiarów występujących dla k-tej próby. Szablon:CentrujWzór A więc po ważnym wyznaczeniu ostatniego składnika w sumie wewnątrz nawiasu klamrowego i jak udowodniliśmy, że jest on zawsze równy zero, zatem na podstawie tych wniosków wariancję pomiaru dla wszystkich prób napisanej wedle Szablon:LinkWzór możemy dokończyć obliczenia na tą wielkość idąc od obliczeń wspomnianych wcześniej: Szablon:CentrujWzór

gdzie:

Wyznaczmy wariancję wszystkich prób średniej arytmetycznej od wartości oczekiwanej Szablon:Formuła wykorzystując definicję wariancji, a także definicję wartości średniej uzyskanych pomiarów we wszystkich próbach Szablon:LinkWzór i prawdopodobieństwa, że dana próba jest z prawdopodobieństwem pSzablon:Sub: Szablon:CentrujWzór

Widzimy, że wzór na wariancję średniej arytmetycznej uzyskanych wyników pomiarów we wszystkich próbach jest sumą iloczynu kwadratu prawdopodobieństwa k-tej próby pSzablon:Sub Szablon:LinkWzór przez wariancję uzyskania średniej arytmetycznej Szablon:Formuła w próbie o numerze "k".

Szablon:SkomplikowanaStronaKoniec