Analizy statystyczne, a rozkłady prawdopodobieństwa - podstawy teoretyczne

Ponieważ wielkości poddawane badaniom wykazują zasadniczo naturę losową, przypadkowość uważa się za nieodłączny atrybut każdego badania statystycznego. Stąd też analizy statystyczne, w związku z niepewnością zjawisk które podlegają pomiarom, w znaczącym stopniu opierają się o zagadnienia z matematycznych teorii prawdopodobieństwa. Szczególny za udział ów teorii w analizach danych mają tzw. rozkłady prawdopodobieństwa.

 

Istota rozkładów prawdopodobieństwa

Analizowane zjawiska pochodzą na ogół z pewnego określonego zbioru/przestrzeni zdarzeń elementarnych - szansę ich wystąpienia określają pewne poziomy prawdopodobieństw, przy czym suma tych prawdopodobieństw wynosi zawsze 100 procent. Rozpisanie prawdopodobieństw poszczególnych zdarzeń elementarnych nazywamy rozkładem prawdopodobieństwa.

 

Rodzaje rozkładów prawdopodobieństwa

Rozkłady prawdopodobieństwa wykazywać mogą zróżnicowany charakter, a właściwy ich dobór stanowi o tym czy analiza statystyczna pozwoli na wypracowanie poprawnych wniosków z przeprowadzonego badania.

W medycznych badaniach klinicznych, czyli szeroko pojętej statystyce medycznej, relatywnie często stosuje się kilka ściśle określonych typów rozkładu. Oto krótka ich charakterystyka.

 

                A. Rozkład prostokątny

Ten typ rozkładu, zwany tez jednostajnym, obejmuje zmienne i zjawiska, których wystąpienie jest jednako prawdopodobne w wyznaczonym przedziale (nazwijmy go przedziałem ). Prawdopodobieństwo wystąpienia ów zdarzeń poza tym przedziałem jest zatem równe zero.

Co istotne, ponieważ gęstość prawdopodobieństwa w przedziale rozkładu prostokątnego jest stała - rozkład ten pełni istotną rolę przy analizie niepewności (błędów) statystycznych.

 

                B. Rozkład dwumianowy

Ten typ rozkładu, tzw. rozkład Bernoullie’go, uznaje się za podstawowy dla zmiennej losowej skokowej - a zatem w odniesieniu do doświadczeń, dających w efekcie jedno z dwóch możliwych losowych zdarzeń. Analogicznie suma prawdopodobieństw obydwu tych zdarzeń daje 100 procent.

 

                C. Rozkład Poissona

Szczególny typ wspomnianego wyżej rozkładu dwumianowego stanowi rozkład Poissona - jego specyfika wynika z faktu, że prawdopodobieństwo jednego z dwóch rozpatrywanych zdarzeń jest niezmiernie niskie, a przemnożone przez ilość zdarzeń (n) daje niewielką wartość stałą.

Uważa się, że rozkład Poissona optymalnie jest wykorzystywać, gdy liczba realizacji n w ramach naszej analizy statystycznej jest większa bądź równa 50 lub mniejsza bądź równa 5.

               

               D. Rozkład normalny

Ostatni z omówionych tu pokrótce typów rozkładu uznaje się za najważniejszy ciągły rozkład prawdopodobieństwa - aproksymuje on wiele innych rozkładów, a także opisuje rozkład prób badawczych. Jest to tzw. rozkład normalny, tj. rozkład Gaussa, przyjmujący charakterystyczny kształt dzwonu - jego najwyższy punkt odpowiada wartości średniej, a im dalej dany wynik oddala się od przeciętnej tym jest mniej reprezentatywny. Z tego powodu uważa się, ze rozkład normalny doskonale oddaje charakter obserwowanych sytuacji losowych i opisuje sytuację na świecie.

 

Zamiast podsumowania

Analizy statystyczne wykorzystuję wiele różnych teorii - teoria prawdopodobieństwa i rozkładów to jedne z nich. W dalszych opracowaniach zwrócimy Państwu uwagę na kolejne istotne zagadnienia, bez których sprawna analityka nie byłaby możliwa.