(klasická a podmíněná pravděpodobnost, distribuční funkce a rozdělení náhodných veličin, výpočet střední hodnoty, rozptylu a kovariance)
Pravděpodobnost náhodného jevu je číslo, které je mírou očekávatelnosti výskytu jevu. 1)
(Popisná) statistika je zpracování číselných dat o nějakém souboru objektů.
Matematická statistika je věda aplikovaná na problémy spojené se sběrem a pozorováním náhodných dat.
= množina všech možných výsledků, základní prostor. Prvky představují jednotlivé možné výsledky.
Jevové pole je systém podmnožin základního prostoru uzavřený na konečné průniky, spočetná sjednocení a množinové rozdíly. Jednotlivé množiny nazýváme náhodné jevy (vzhledem k ).
Základní pojmy
Pravděpodobnostní funkce je funkce na jevovém poli
Vlastnosti pravděpodobnostní funkce
Rozlišujeme dvě definice pravděpodobností: klasickou a geometrickou. Pokud klademe podmínky, bavíme se o tzv. podmíněné pravděpodobnosti.
Klasická pravděpodobnost je pravděpodobnostní prostor s pravděpodobnostní funkcí
.
Jednoduchý príklad
Zadanie: Hádžeme kockou. Aká je pravdepodobnosť, že hodíme číslo 6?
Riešenie:
- úspešný výsledok (hodená 6)
- všetky možné výsledky (1 až 6)
.
Zde je definice pravděpodobnosti založena na porovnání objemů, ploch či délek geometrických útvarů.
Příklad - jen nastínění řešení
Zadání: Romeo a Julie si smluvili schůzku mezi 12:00 a 13:00. Přijdou náhodně v tomto rozmezí a čekají na sebe 20 minut, nejdéle však do 13:00. Jaká je pravděpodobnost, že se setkají?
Nástin řešení: musíme si vytvořit funkci, která nám v pravděpodobnostním prostoru odděluje jev příznivý od nepříznivého. Potom spočítáme obsah části, která znázorňuje jev příznivý a dělíme obsahem celého prostoru.
Nechť H je jev s nenulovou pravděpodobností v jevovém poli v pravděpodobnostním prostoru . Podmíněná pravděpodobnost jevu vzhledem k hypotéze H je definována vztahem (napr. „jaká je pravděpodobnost, že při hodu dvěmi kostkami padly dvě pětky, je-li součet hodnot deset?“).
Pravděpodobnost průniku a sjednocení jevů
Je také vidět přímo z definice, hypotéza H a jev A jsou nezávislé tehdy a jen tehdy, je-li .
Přepsáním formule pro podmíněnou pravděpodobnost dostáváme
… závislé
… nezávislé
… závislé
… nezávislé
obecně:
Bayesův vzorec
Pro pravděpodobnost jevů A a B platí
Jednoduchý příklad
Zadání: Dva střelci vystřelí každý jednu ránu na terč. První má pravděpodobnost zásahu 80%, druhý 60%. V terči se našla jedna rána. Jaká je pravděpodobnost, že patří prvnímu střelci?
Řešení: ,
Jev A: rána patří prvnímu střelci
Pravděpodobnost toho, že se trefí první střelec = (pravděpodobnost, že se první trefí a druhý ne) / (pravděpodobnost, kdy je v terči 1 rána)
Pravděpodobnost, kdy je v terči 1 rána: (bud se prvni trefi a druhy ne a nebo naopak)
2).
Nahodná veličina –- zavádíme ji, protože chceme pracovat s intervaly – vyjádřit, jaká je pravděpod., že daná hodnota bude právě z tohoto intervalu.
Rozdělení pravděpodobnosti je pravidlo, které přiřazuje pravděpodobnosti událostem nebo tvrzením.
Existuje několik způsobů, jak vyjádřit rozdělení pravděpodobnosti. Nejobvyklejší je uvést hustotu rozdělení pravděpodobnosti; samotná pravděpodobnost jevu se pak získá integrací funkce hustoty.
Diskrétní rozdělení pravděpodobností (definováno na spočetné, diskrétní množině, jako je podmnožina celých čísel) - např. binomické, Poissonovo
Spojité rozdělení (existuje spojitá distribuční funkce, např. polynomická nebo exponenciální) - např. normální rozdělení, exponenciální rozdělení 3)
distribuční funkcí náhodné veličiny X je funkce definovaná pro všechny vztahem
Diskrétní náhodná veličina X
Spojité náhodné veličině odpovídá spojitá distribuční funkce.
, kde f(x) je funkce hustoty pravděpodobnosti.
Funkce hustoty pravděpodobnosti
.
Příklad s nastíněným řešením
Zadání: Pravděpodobnost narození chlapce je 0,515. Jaká je pravděpodobnost, že mezi deseti tisíci novorozenci bude stejně nebo více děvčat než chlapců?
Řešení: ,
Protože se vlastně nezávisle stále opakuje „pokus“ s výsledkem „kluk“ nebo „děvče“, použijeme Binomické rozdělení Bi(n,p), tedy Bi(10000; 0,515).
…dosadíme 10000 za n
dosadíme do vzorce
* R(a, b) -– hustota je konstantní na daném intervalu, jinde je 0
Příklad
U\V | 1 | 2 | 3 |
---|---|---|---|
1 | 0,1 | 0,2 | 0,3 |
2 | 0,2 | 0,1 | 0,1 |
Najděte marginální rozdělení obou náhodných veličin, jejich střední hodnoty, rozptyly a korelační koeficient.
Řešení:
Nejprve si jen pro kontrolu můžete spočítat součet všech hodnot v tabulce, pokud je roven 1, je zadání spravné.
Do tabulky si přidáme marginální hodnoty – jsou to laicky řečeno projekce řádků a sloupců
U\V | 1 | 2 | 3 | P(U) |
---|---|---|---|---|
1 | 0,1 | 0,2 | 0,3 | 0,6 |
2 | 0,2 | 0,1 | 0,1 | 0,4 |
P(V) | 0,3 | 0,3 | 0,4 | 1 |
Spočítáme si střední hodnoty E(V) a E(U) a hodnotu E(UV):
Spočítáme si rozptyl D(V) a D(U):
Spočítáme si kovarianci:
Spočítáme si korelační koeficient:
(přibližně)
Důsledek: mezi veličinami U,V je spíše nepřímá lineární závislost. 5)
http://www.fi.muni.cz/~xhalic1/statnice/vypracovaneIM.doc http://www.math.muni.cz/~xpupik/dokumenty/pst-prednasky.pdf http://cs.wikipedia.org/wiki/Kovariance http://cs.wikipedia.org/wiki/Rozdělení_pravděpodobnosti http://cs.wikipedia.org/wiki/Pravděpodobnost
Informace trochu zorganizovala, opravila a doplnila Jitka Pospíšilová.