====== AP12 Pravděpodobnost a statistika ======
(klasická a podmíněná pravděpodobnost, distribuční funkce a rozdělení náhodných veličin, výpočet střední hodnoty, rozptylu a kovariance)
**Pravděpodobnost** náhodného jevu je číslo, které je mírou očekávatelnosti výskytu jevu. ((převzato z http://cs.wikipedia.org/wiki/Pravděpodobnost))
(Popisná) **statistika** je zpracování číselných dat o nějakém souboru objektů.
**Matematická statistika** je věda aplikovaná na problémy spojené se sběrem a pozorováním náhodných dat.
===== Terminologie =====
= množina všech možných výsledků, **základní prostor**. Prvky představují jednotlivé možné výsledky.
**Jevové pole** je systém podmnožin základního prostoru uzavřený na //konečné průniky, spočetná sjednocení a množinové rozdíly//. Jednotlivé množiny nazýváme **náhodné jevy** (vzhledem k ).
* **jistý jev** je celý základní prostor
* **nemožný jev** je prázdná podmnožina
* **elementární jevy** jsou jednoprvkové podmnožiny
* **společné nastoupení jevů** je jejich průnik, tedy odpovídá jevu ,
* **nastoupení alespoň jednoho z jevů** je jejich sjednocením, odpovídá jevu
* **neslučitelné jevy** jsou jevy, pro které platí =
* **jev A má za důsledek jev B**, když
* **opačný jev k jevu A** je jev , píšeme
**Pravděpodobnostní funkce** je funkce na jevovém poli
* je **nezáporná**, tj. pro všechny jevy ,
* je **aditivní**, tj. , pro každý nejvýše spočetný systém po dvou neslučitelných jevů (//laicky: "dá se sčítat, když jsou jevy neslučitelné"//),
* pravděpodobnost jistého jevu je 1.
* **pravděpodobnost opačného jevu** je
=====Pravděpodobnosti=====
Rozlišujeme dvě definice pravděpodobností: **klasickou** a **geometrickou**. Pokud klademe podmínky, bavíme se o tzv. **podmíněné pravděpodobnosti**.
====Klasická pravděpodobnost====
Klasická pravděpodobnost je **pravděpodobnostní prostor **** s pravděpodobnostní funkcí ** \\
.
//Zadanie:// Hádžeme kockou. Aká je pravdepodobnosť, že hodíme číslo 6?
\\
//Riešenie://
- úspešný výsledok (hodená 6)
- všetky možné výsledky (1 až 6)
.
====Geometrická pravděpodobnost====
Zde je definice pravděpodobnosti založena na **porovnání objemů**, ploch či délek geometrických útvarů.
//Zadání:// Romeo a Julie si smluvili schůzku mezi 12:00 a 13:00. Přijdou náhodně v tomto rozmezí a čekají na sebe 20 minut, nejdéle však do 13:00. Jaká je pravděpodobnost, že se setkají?
\\
//Nástin řešení:// musíme si vytvořit funkci, která nám v pravděpodobnostním prostoru odděluje jev příznivý od nepříznivého. Potom spočítáme obsah části, která znázorňuje jev příznivý a dělíme obsahem celého prostoru.
====Podmíněná pravděpodobnost====
Nechť H je jev s nenulovou pravděpodobností v jevovém poli v pravděpodobnostním prostoru . Podmíněná pravděpodobnost jevu vzhledem k hypotéze H je definována vztahem (napr. //„jaká je pravděpodobnost, že při hodu dvěmi kostkami padly dvě pětky, je-li součet hodnot deset?“//).
Definice odpovídá požadavku, že jevy A a H nastanou zároveň, za předpokladu, že A nastal s pravděpodobností .
Je také vidět přímo z definice, hypotéza H a jev A jsou nezávislé tehdy a jen tehdy, je-li .
Přepsáním formule pro podmíněnou pravděpodobnost dostáváme
\\
... závislé
... nezávislé
... závislé
... nezávislé
obecně:
**Bayesův vzorec**
Pro pravděpodobnost jevů A a B platí
Využíváme jej, když známe podmíněnou pravděpodobnost P(B|A) a chceme zjistit P(A|B).
//Zadání:// Dva střelci vystřelí každý jednu ránu na terč. První má pravděpodobnost zásahu 80%, druhý 60%. V terči se našla jedna rána. Jaká je pravděpodobnost, že patří prvnímu střelci?
\\
//Řešení:// ,
Jev A: rána patří prvnímu střelci
Pravděpodobnost toho, že se trefí první střelec = (pravděpodobnost, že se první trefí a druhý ne) / (pravděpodobnost, kdy je v terči 1 rána)
Pravděpodobnost, kdy je v terči 1 rána: (//bud se prvni trefi a druhy ne a nebo naopak//)
((příklad pochází z cvičení z předmětu MB104)).
=====Distribuční funkce a rozdělení náhodných veličin =====
**Nahodná veličina** –- zavádíme ji, protože chceme pracovat s intervaly -- vyjádřit, jaká je pravděpod., že daná hodnota bude právě z tohoto intervalu.
**Rozdělení pravděpodobnosti** je pravidlo, které přiřazuje pravděpodobnosti událostem nebo tvrzením.
Existuje několik způsobů, jak vyjádřit rozdělení pravděpodobnosti. Nejobvyklejší je uvést **hustotu rozdělení pravděpodobnosti**; samotná pravděpodobnost jevu se pak získá **integrací funkce hustoty**.
**Diskrétní** rozdělení pravděpodobností (definováno na spočetné, diskrétní množině, jako je podmnožina celých čísel) - např. binomické, Poissonovo
**Spojité** rozdělení (existuje spojitá distribuční funkce, např. polynomická nebo exponenciální) - např. normální rozdělení, exponenciální rozdělení ((převzato z http://cs.wikipedia.org/wiki/Pravděpodobnost))
===== Distribuční funkce =====
distribuční funkcí náhodné veličiny X je funkce definovaná pro všechny vztahem
X na pravděpodobnostním prostoru nabývá jen konečně mnoha hodnot . Pak existuje tzv. pravděpodobnostní funkce f(x) taková, že
Evidentně a pro rozdělení pravděpodobnosti platí
a tedy zejména je distribuční funkce tvaru
Každá náhodná veličina definovaná pro klasickou pravděpodobnost je diskrétní.
Diskrétní veličinu si můžeme představit jako graf složený z bodů, které odpovídají pravděpodobnosti daného jevu (pro házení kostkou je to 1/6)
{{:home:inf:diskretni_velicina.png|}}
** Sečtení hodnot bodů ** musí dát **1**.
** Distribuční funkce** v bodě 3 se vlastně rovná součtu pravděpodobnostních hodnot do tohoto bodu, tedy
**Spojité náhodné veličině** odpovídá **spojitá distribuční funkce**.
, kde f(x) je funkce hustoty pravděpodobnosti.
Nechť X je náhodná veličina, F(x) je její distribuční funkce.
- F je zleva spojitá, a .
- Vždy platí .
- Je-li X diskrétní s hodnotami , pak je F(x) po částech konstantní, a kdykoliv .
- Je-li X spojitá, pak je F(x) diferencovatelná a její derivace se rovná hustotě pravděpodobnosti X, tj. platí
.
Spojitou veličinu si můžeme představit jako spojitý graf (když například zobrazujeme výšku lidí)
{{:home:inf:spojita_velicina.png|}}
** Plocha pod křivkou** musí mít obsah **1**.
** Distribuční funkce** se proto vyjadřuje jako integrál.
===== Rozdělení náhodných veličin=====
====Diskrétní====
* sem patří degenerované rozdělení, alternativní rozdělení, **binomické rozdělení**, **Poissonovo rozdělení**
===Degenerované rozdělení===
* -- konstantní hodnota
* distribuční funkce: pro ; 1 pro
* pravděpodobn. funkce: pro ; 0 jinak
===Alternativní rozdělení===
* A(p) -- popisuje pokus s pouze dvěma možnými výsledky (zdar nebo nezdar), pravděpodobnosti jsou p a (1-p):
* pro ; pro ; 1 pro
* pro ; pre ; 0 jinak
===Binomické rozdělení===
* -- odpovídá n–krát nezávisle opakovanému pokusu popsanému alternativním rozdělením, přičemž naše náhodná veličina měří počet zdarů.
* pro ; 0 jinak
* nejvíce výsledků bude blízko hodnoty np
//Zadání:// Pravděpodobnost narození chlapce je 0,515. Jaká je pravděpodobnost, že mezi deseti tisíci novorozenci bude stejně nebo více děvčat než chlapců?
\\
//Řešení:// ,
Protože se vlastně nezávisle stále opakuje "pokus" s výsledkem "kluk" nebo "děvče", použijeme Binomické rozdělení **Bi(n,p)**, tedy Bi(10000; 0,515).
...dosadíme 10000 za n
dosadíme do vzorce
===Poissonovo rozdělení===
* -- dobře aproximuje binomická rozložení pro konstantní a veliká n:
* pro ; 0 jinak
====Spojité====
* sem patří **rovnoměrné rozdělení**, **exponenciální rozdělení**, **normální rozdělení**
===Rovnoměrné rozdělení===
* R(a, b) -– hustota je konstantní na daném intervalu, jinde je 0
* pro ; pro ; 0 pro
* pro ; pro ; 1 pro ,
===Exponenciální rozdělení===
* pro ; 0 pro .
* pro ; 0 pro .
===Normální rozdělení===
* hustota Gaussova křivka -- rozdělení s touto hustotou se nazývá normální rozdělení N(0,1) (první parametr střední hodnota, druhý rozptyl)
* binomické B(n,p) pro velké n konverguje k normálnímu N(np, np(1 − p))
*
===== Výpočet střední hodnoty, rozptylu a kovariance =====
====Výpočet střední hodnoty====
* při rovnoměrném rozdělení je střední hodnotou aritmet. průměr
* pro diskrétní veličinu: - hodnotu vždy vynásobím hodnout její hustoty v daném bodě
* pro spojitou veličinu:
====Výpočet rozptylu====
* Rozptyl udává, jak jsou hodnoty "daleko" od střední hodnoty
* udává se v jednotkách na druhou, zavedla se také **výběrová směrodatná odchylka**, která se rovná a udává hodnotu v jednotkách
Aby se dal rozptyl lépe spočítat, můžete využít alternativní vzorec: , kde znamená, že do vzorce pro střední hodnotu všude místo dáme , je jen vypočítaná střední hodnota na druhou.
====Výpočet kovariance a korelačního koeficientu====
===Kovariance===
* kovariance měří **sílu lineární závislosti** (jen lineární, jiné závislosti ne)
*
===Korelační koeficient===
* Korelační koeficient udává **míru lineární závislosti**, označuje se a je to bezrozměrné číslo z intervalu
* Pro je mezi X,Y **přímá lineární závislost**. Pro je mezi X,Y **nepřímá lineární závislost**. Pro jsou veličiny X,Y **lineárně nezávislé**, a říkáme o nich, že jsou **nekorelované**. Nulová hodnota koeficientu korelace tedy **neznamená obecnou nezávislost** obou veličin X a Y, ale **pouze nezávislost lineární**.((převzato z http://cs.wikipedia.org/wiki/Kovariance))
* pro výpočet potřebuje kovarianci
*
//Zadání:// Nechť náhodné veličiny U,V mají diskrétní rozdělení určené následující tabulkou:
^ U\V ^ 1 ^ 2 ^ 3 ^
^ 1 | 0,1 | 0,2 | 0,3 |
^ 2 | 0,2 | 0,1 | 0,1 |
Najděte marginální rozdělení obou náhodných veličin, jejich střední hodnoty, rozptyly a korelační koeficient.
\\
//Řešení:// \\
Nejprve si jen pro kontrolu můžete spočítat součet všech hodnot v tabulce, pokud je roven 1, je zadání spravné.
Do tabulky si přidáme marginální hodnoty -- jsou to //laicky řečeno projekce řádků a sloupců//
^ U\V ^ 1 ^ 2 ^ 3 ^ P(U) ^
^ 1 | 0,1 | 0,2 | 0,3 | 0,6 |
^ 2 | 0,2 | 0,1 | 0,1 | 0,4 |
^ P(V) | 0,3 | 0,3 | 0,4 | 1 |
Spočítáme si střední hodnoty E(V) a E(U) a hodnotu E(UV):
\\
Spočítáme si rozptyl D(V) a D(U):
\\
Spočítáme si kovarianci:
\\
Spočítáme si korelační koeficient:
(přibližně)
\\
//Důsledek:// mezi veličinami U,V je spíše nepřímá lineární závislost. ((příklad převzat z domácích úkolů předmětu MB104))
===== Zdroj =====
[[http://www.fi.muni.cz/~xhalic1/statnice/vypracovaneIM.doc]]
[[http://www.math.muni.cz/~xpupik/dokumenty/pst-prednasky.pdf]]
[[http://cs.wikipedia.org/wiki/Kovariance]]
[[http://cs.wikipedia.org/wiki/Rozdělení_pravděpodobnosti]]
[[http://cs.wikipedia.org/wiki/Pravděpodobnost]]
Informace trochu zorganizovala, opravila a doplnila Jitka Pospíšilová.
~~DISCUSSION~~