Pravdepodobnost a statistika

Upozornění:

Poznámky jsou od Tomáše Slámy, kde jsou upravený do tohohle formátu pro tisk

Úvod

Definice (prostor jevů) je FP(Ω), pokud

Elementární jevy jsou nejjednodušší možné výsledky náhodného pokusu. Jde o výsledek, který nelze dále rozdělit na menší části.

Definice (Náhodný jev): AF se nazývá náhodný jev.

Definice (pravděpodobnost) je funkce P:F[0,1] se nazývá pravděpodobnost, pokud

Definice (pravděpodobnostní prostor) je trojice (Ω,F,P) taková, že

Příklad (pravděpodobností prostory):

Pasted image 20240831073338.png
Znázornění konečného prostoru s uniformní pravděpodobností. dvojice hodů kostkou jsou elementární jevy (Ω), vyznačené množiny jsou měřené jevy (F).

Lemma (základní vlastnosti): A,BF platí

Definice (podmíněná pravděpodobnost): pokud A,BF a P(B)>0, tak definujeme podmíněnou pravděpodobnost A při B jako

P(AB)=P(AB)P(B)

Věta (o úplně pravděpodobnosti): *Pokud A1,,AnF a P(A1A2An)>0, tak

P(A1A2An)=P(A1) P(A2A1) P(A3A2A1)

Definice (rozklad): spočetný systém množin BiF je rozklad Ω, pokud

Věta (rozbor všech možností): *Pokud B1,,BnF je rozklad Ω a AF, pak

P(A)=iP(ABi)P(Bi)

Věta (Bayesova): *pokud B1,B2, je rozklad Ω, AF a P(A),P(Bj)>0, tak

P(BjA)=P(Bj)P(ABj)P(A)=P(ABj)P(Bj)iP(ABi)P(Bi)

Věta řeší problém, kdy máme jev H (hypotézu), který chceme spočítat, když platí jev E (evidence). Použitím Bayesova vzorce dostáváme

P(HE)=P(EH)P(H)P(E)

což intuitivně dává smysl – při pravděpodobnosti HE musíme zohlednit pravděpodobnost E.

Pasted image 20240831073621.png

Poznámka

3b1b udělal o Bayesově větě pěkné video, ze kterého jsem vykradl obrázek výše.

Definice (nezávislost jevů): dva jevy jsou nezávislé, pokud P(AB)=P(A)P(B)

Diskrétní náhodné veličiny

Definice (diskrétní náhodná veličina): Pro pravděpodobnostní prostor Ω,F,P mějme funkci X:ΩR nazvene diskrétní náhodná veličina, pokud Im(X) (obor hodnot) je spočetná množina a pokud x platí

{ωΩ:X(ω)=x}F

Příklad (použití náhodných veličin):

Definice (pravděpodobnostní funkce) (pmf) diskrétní náhodné veličiny X je funkce pX:R[0,1] taková, že

pX(x)=P(X=x)=P({ωΩ:X(ω)=x})

Rozdělení

Bernoulli
Binomiální
Poissonovo
Geometrické

Střední hodnota

Definice (střední hodnota diskrétní n.v.) E(X) je definována jako

E(X)=xIm(X)xP(X=x)

pokud součet dává smysl.

Věta (LOTUS): *pokud X je n.v. a g reálná funkce, tak

E(g(X))=xIm(X)g(x)P(X=x)

Lemma (vlastnosti střední hodnoty): nechť X,Y jsou diskrétní n.v. a a,bR; pak

Definice (rozptyl/variance) n.v. nazveme

var(X)=E((XEX)2)

Definice (směrodatná odchylka) je

var(x)

Věta:

var(X)=E(X2)E(X)2

Přehled parametrů známých rozdělení:

Rozdělení E var
Bern(p) p p(1p)
Bin(n,p) np np(1p)
Geom(p) 1/p np(1pp2)
Pois(λ) λ λ

Sdružené rozdělení

Definice: pro diskrétní n.v. X,Y definujeme jejich sdruženou pravděpodobnostní funkci (joint pmf) pX,Y:R2[0,1] jako

pX,Y(x,y)=P({ωΩ:X(ω)=xY(ω)=y})

(👀): z pX,Y (sdruženého) jde pX,pY (marginální) zjistit, jednoduše, zpětně ne vždy.

Definice (nezávislé náhodné veličiny): veličiny X,Y jsou nezávislé, pokud x,yR platí

P(X=x,Y=y)=P(X=x)P(Y=y)

neboli

pX,Y(x,y)=pX(x)pY(y)

Věta (součin n.n.v.): *pro nezávislé diskrétní veličiny X,Y platí

E(XY)=E(X)E(Y)

Definice (podmíněné rozdělení): pro X,Y d.n.v. a AF definujeme

pXA(x)=P(X=xA)pXY(xy)=P(X=xY=y)

Příklad: Pro X,Z výsledky dvou nezávislých hodů šestihranou kostkou a Y=X+Z nás zajímá pXY(610) (jaká je šance, že na kostce padla hodnota 6, když součet na obou byl 10). Můžeme spočítat ze sdruženého:

pXY(xy)=P(X=x,Y=y)P(Y=y)=pX,Y(x,y)pY(y)=pX,Y(x,y)xIm(X)pX,Y(x,y)
pX,Y 10 11 12
1 0 0 0
2 0 0 0
3 0 0 0
4 136 0 0
5 136 136 0
6 136 136 136
pXY 10 11 12
1 0 0 0
2 0 0 0
3 0 0 0
4 13 0 0
5 13 12 0
6 13 12 1

Spojité náhodné veličiny

Definice (náhodná veličina) na (Ω,F,P) je zobrazení X:ΩR, které pro každé xR splňuje

{ωΩ:X(ω)x}F

(👀): diskrétní n.v. je náhodná veličina (pro tu platí rovnost, kterou posčítáme).

Definice (distribuční funkce) (DNF) n.v. je funkce

FX(x)=P(Xx)=P({ωΩ:X(ω)x})

(👀):

Definice (spojitá náhodná veličina): n.n.v. je spojitá, pokud existuje nezáporná reálná funkce fx (hustota) t.ž.

FX(x)=P(Xx)=tfX(t) dt

Rozdělení

Příklad (uniformní rozdělení): n.v. X má na [a,b] uniformní rozdělení, pokud má hustotní funkci

fX(x)={1bax[a,b]0jindy

Pasted image 20240831073718.png

Příklad (exponenciální rozdělení): n.v. X má exponenciální rozdělení, pokud má distribuční funkci

FX(x)={0x01eλxx0

Pasted image 20240831073729.png

Příklad (normální rozdělení): n.v. X má standardní normální rozdělení, pokud má hustotní funkci

fX(x)=12πex2/2

Pasted image 20240831073740.png

Definice (kvantilová funkce): pro distribuční funkci F definujeme kvantilovou funkci Q:[0,1]R jako

QX(p)=min{xR:pF(x)}

(👀): pokud je FX spojitá, pak QX=FX1

Definice (střední hodnota s.n.v.) je definována jako

E(X)=xfX(x) dx

pokud integrál dává smysl.

Poznámka: LOTUS, linearita, rozptyl fungují také (přesně tak, jak bychom čekali)

Definice (kovariance): pro n.v. X,Y je jejich kovariance definována jako

cov(X,Y)=E((XEX)(YEY))

Lemma:

Nerovnosti

Věta (Markovova nerovnost): *nechť náhodná veličina splňuje X0; pak

P(Xa)E(X)a

(👀): říká, že pravděpodobnost, že X je alespoň a je nejvýše E/a, což intuitivně dává smysl

Limitní věty

Věta (zákon velkých čísel): *nechť X1,,Xn jsou stejně rozdělené n.n.v. se stř. hodnotou μ a rozptylem σ2. Označme Sn=(X1++Xn)/n (tzv. výběrový průměr). Pak platí

limnSn=μ

skoro jistě (tj. s pravděpodobností 1).

Věta říká, že je smyslupné průměrovat n.n.v. (s větším n se přibližuje k μ).

Věta (centrální limitní věta): *nechť X1,,Xn jsou n.n.v. se střední hodnotou μ a rozptylem σ2. Označme Yn=((X1++Xn)nμ)/(nσ). Pak YndN(0,1). Neboli pokud Fn je distribuční funkce Yn, tak

limnFn(x)=Φ(x)xR

Tedy (vhodně přeškálovaný) součet n.n.v. Xi konverguje ke standardnímu normálnímu rozdělení.

Tahák

Ke zkoušce byla povolena A4 s libovolnými poznamkami, tady jsou moje (dostupné i v PDF).


![[tahak.pdf]]