Kłopot z definicją prawdopodobieństwa
Do XX wieku wszystkie definicje prawdopodobieństwa miały jakieś mankamenty.
- klasyczna (Laplace’a) – błąd logiczny w środku, działa tylko dla skończonych ilości możliwych rezultatów
- geometryczna – właściwie ten sam błąd logiczny, ogranicza do skończoności w pewnym sensie, różne dziwne paradoksy
- częstościowa (to już właściwie 1931 rok, jak ten czas leci…) – olbrzymie problemy w praktycznym zastosowaniu
Prawidłową i używaną powszechnie dzisiaj definicję podał w 1933 roku matematyk radziecki Andriej Kołmogorow i jej właśnie poświęcony będzie ten Wykład.
Definicja Kołmogorowa wymaga – niestety dla studentów – dużej ilości koncentracji i nie da się jej wytłumaczyć “w jednym zdaniu”. Mało kto tutaj wybiera drogę ZROZUMIENIA, większość wybiera łatwiejsze ścieżki WYKUCIA, albo nawet – co gorsza – ZIGNOROWANIA (żeby się nie wyrazić dosadniej).
A szkoda, bo po pierwsze, wiedzieć CO tak właściwie się robi to naprawdę fajne uczucie, a po drugie ta definicja jest wielkim skarbem i przynosi niewiarygodne korzyści. Okazuje się, że świat probabilistyki (prawdopodobieństwa) łączy się ze światem teorii mnogości, a nawet analizy matematycznej.
Czyli po przyjęciu tej definicji do rozwiązania problemów z teorii prawdopodobieństwa (a tych, jak się domyślasz, nie brakuje w świecie “rzeczywistym”) możesz stosować całą ciężką artylerię z innych dziedzin matematyki – działań na zbiorach, a nawet pochodnych i całek!
Definicja prawdopodobieństwa Kołmogorowa
Definicję tą znajdziesz w każdej książce z prawdopodobieństwa, Wikipedii i w ogóle wszędzie.
Prawdopodobieństwo jest to funkcja, spełniająca pewne warunki (tzw. aksjomaty, jakie to warunki – niżej), przyporządkowująca pewnym zbiorom (te zbiory muszą też spełniać pewne warunki, a jakie to warunki – niżej) zdarzeń elementarnych – liczby.
W skrócie: prawdopodobieństwo to funkcja przyporządkowująca zbiorom zdarzeń elementarnych liczby.
Teraz powolutku omówię dokładnie wszystkie elementy użyte w tej definicji, zaczynając zupełnie od podstaw i od początku. Jak się dobrze przyjrzeć, to mam tu trzy elementy do omówienia:
- co to są te “zdarzenia elementarne” (Ω)
- jakie warunki muszą spełniać zbiory tych zdarzeń ( F)
- jakie warunki musi spełniać ta funkcja (P)
Zdarzenia elementarne tworzą zbiór Ω, funkcja (oznaczyłem ją jako P) jest określona na zbiorach należących do rodziny podzbiorów zbioru Ω (oznaczyłem tą rodzinę jako F) . Zarówno rodzina podzbiorów, jak i funkcja, muszą spełniać pewne warunki. Całość tworzy tzw. “trójkę probabilistyczną” (Ω, F,P).
Jadę po kolei i błagam Cię, nie spinaj się na tym, to naprawdę proste 🙂
1. Zdarzenia elementarne Ω
Zdarzenia elementarne to najprostsze (tzn. nierozkładalne już na inne) możliwe wyniki zdarzenia losowego.
Na przykład jeśli zdarzenie elementarne polega na rzucie monetą, to zdarzeniami elementarnymi mogą być: ORZEŁ i RESZKA (jeśli nie ma możliwości spadnięcia na krawędź na przykład). Zdarzenia ORZEŁ nie da się już “rozłożyć” na jakieś inne zdarzenia i o to chodzi.
Jeśli zdarzenie polega na przykład na rzucie kostką, to zdarzeniem elementarnym może być np. WYPADŁY DWA OCZKA. Zdarzeniem elementarnym natomiast nie będzie WYPADŁA PARZYSTA ILOŚĆ OCZEK – bo da się je rozłożyć na kilka innych zdarzeń (WYPADŁY DWA OCZKA, albo WYPADŁY CZTERY OCZKA, albo WYPADŁO SZEŚĆ OCZEK).
No i tyle.
Zwróć uwagę, że to pojęcie jest nieco “płynne” (ktoś mógł by się upierać: “a czemu niby nie może w ogóle spaść na tą krawędź?”) i NIE jest to ścisła, matematyczna definicja.
I tak ma właśnie być, bo pojęcia: “zdarzenie elementarne”, “zdarzenie losowe”, to w teorii prawdopodobieństwa pojęcia pierwotne. Pojęcia pierwotne w matematyce to takie obiekty, elementy, których się nie definiuje – bo przyjmuje się, że są tak oczywiste.
Na przykład w geometrii pojęciem pierwotnym jest punkt. Punkt nie ma definicji. Nie zrozum mnie źle, mi nie chodzi o to, że nie da się powiedzieć, co to jest punkt. Co byśmy jednak o punkcie nie powiedzieli, jak byśmy go nie opisali, będą to tylko pewne słowne opisy, a nie ścisłe, matematyczne definicje.
Oczywiście, przyjęcie czegoś za pojęcie pierwotne jest sprawą dosyć umowną i prowadzi często do paradoksów. Wtedy konieczne jest często “doprecyzowanie” tego pojęcia i wprowadzenie ścisłej definicji, omijającej owe paradoksy. Jednak ona również opierać się będzie na innych pojęciach pierwotnych, bo tak już z definicjami po prostu musi być.
A dlaczego musi? No to już temat na zupełnie inną opowieść. Wracajmy do naszego prawdopodobieństwa.
Mam więc zdarzenia elementarne, czyli możliwe, najprostsze i nierozkładalne wyniki jakiegoś zdarzenia losowego. Wszystkie one razem tworzą jakiś zbiór (np. zbiór {WYPADŁO 1 OCZKO, WYPADŁY 2 OCZKA, WYPADŁY 3 OCZKA, WYPADŁY 4 OCZKA, WYPADŁO 5 OCZEK, WYPADŁO 6 OCZEK}).
Zbiór ten nazwę sobie np. grecką literką Ω.
Ten zbiór to pierwszy element definicji prawdopodobieństwa Kołmogorowa.
Drugi element definicji sprawia chyba studentom najwięcej kłopotów. Ale również nie jest trudny.
2. σ-ciało podzbiorów na zbiorze Ω
“Rodzina podzbiorów na jakimś zbiorze” składa się z jakiś jego podzbiorów.
Przykład
Zbiór A = \left\{ 1,2,3,4,5,6 \right\}
Jakaś przykładowa rodzina podzbiorów na tym zbiorze to: F=\left\{ \left\{ 1 \right\},\left\{ 2 \right\},\left\{ 1,2 \right\},\left\{ 3,4 \right\},\left\{ 1,2,3,4,5,6 \right\} \right\}(podzbiór złożony z elementu 1, podzbiór złożony z elementu 2, podzbiór złożony z elementów 1 i 2, podzbiór złożony z elementów 3 i 4, podzbiór będący całym zbiorem A).
Widać, że zbiór może mieć całkiem sporo swoich “rodzin podzbiorów’.
W definicji prawdopodobieństwa tym zbiorem, którego rodzinę podzbiorów wybieramy, jest zbiór wszystkich zdarzeń elementarnych Ω (patrz pierwsza część definicji). Rodzina jego podzbiorów nie może być jednak zupełnie dowolna, jaka nam tylko przyjdzie do głowy.
Musi ona spełniać pewne warunki, które spełniają podrodziny zwane σ-ciałami.
Dla zbioru Ω, rodzinę jego podzbiorów Fnazywa się σ-ciałem, gdy:
- \varnothing \in F– należy do niej zbiór pusty
- A\in F\Rightarrow {A}'\in F– dopełnienie każdego zbioru z rodziny także należy do rodziny (dopełnienie A to wszystkie elementy Ω, które nie należą do A)
- {{A}_{1}},{{A}_{2}},\ldots \in F\Rightarrow \bigcup\limits_{n=1}^{\infty }{{{A}_{n}}}\in F– sumy dowolnych zbiorów należących do rodziny także należą do rodziny
Przykład
Weźmy zbiór \Omega =\left\{ a,b,c \right\}
- Weźmy rodzinę jego podzbiorów F=\left\{ \varnothing ,\left\{ a \right\},\left\{ b \right\},\left\{ c \right\},\left\{ a,b \right\},\left\{ a,b,c \right\} \right\}. Należy do niej zbiór pusty (warunek 1 spełniony). Dopełnienie jednak zbioru \left\{ a \right\}, czyli zbiór wszystkich elementów, które NIE należą do \left\{ a \right\}i należą do Ω, to zbiór \left\{ b,c \right\}. Ten zbiór nie należy do rodziny podzbiorów F.
Zatem ta rodzina podzbiorów nie jest σ-ciałem (ponadto suma zbiorów \left\{ b \right\}i \left\{ c \right\}nie należy do podrodziny – czyli nie jest spełniony także trzeci warunek).- Weźmy rodzinę jego podzbiorów F=\left\{ \varnothing ,\left\{ a \right\},\left\{ b \right\},\left\{ c \right\},\left\{ a,b \right\},\left\{ b,c \right\},\left\{ a,c \right\}\left\{ a,b,c \right\} \right\}. Należy do niej zbiór pusty, dopełnienia wszystkich zbiorów i sumy wszystkich zbiorów ze sobą, Ta rodzina podzbiorów jest σ-ciałem.
Definicja σ-ciała podzbiorów zbioru Ω wygląda bardzo ciężko i matematycznie.
Jak się jednak zastanowić, łatwo ją przełożyć na “codzienność”.
Jesteśmy już bardzo blisko zdefiniowania prawdopodobieństwa, jako pewnej funkcji P. Funkcja ta przyporządkowywać będzie naszym podzbiorom z tego σ-ciała – liczby, oznaczające ich “prawdopodobieństwa”.
Było by więc trochę dziwne, gdybyśmy:
- nie mogli określić prawdopodobieństwo zdarzenia niemożliwego (czyli określić prawdopodobieństwa zbioru pustego – warunek 1)
- mogli określić prawdopodobieństwo tego, że coś się zdarzy, ale nie mogli określić prawdopodobieństwa, że się nie zdarzy (warunek 2)
- mogli określić prawdopodobieństwa kilku zdarzeń, ale nie mogli określić prawdopodobieństwa, że zdarzy się któreś z nich (warunek 3)
Wszystkie warunki, jakie musi więc rodzina podzbiorów Ω w definicji prawdopodobieństwa są naprawdę potrzebne i dobrze uzasadnione.
Naszą rodzinę podzbiorów nazywać będę F.
Uwaga 1
Aby określić rodzinę F, czyli drugi element definicji potrzebuję pierwszego elementu, czyli zbioru wszystkich zdarzeń elementarnych Ω.
Fskłada się z różnych podzbiorów Ω.
Uwaga 2
Fskłada się ze ZBIORÓW, a nie elementów. Czyli jej elementem jest na przykład: \left\{ a \right\}, a nie: a.
To naprawdę wielki bonus, bo pozwala nam to od tej pory działać na obiektach bardzo ściśle zdefiniowanych matematycznie – czyli zbiorach. Zbiory można dodawać, odejmować, liczyć część wspólną i matematyka w tym momencie “wchodzi do gry”, co było by niemożliwe, gdybyśmy tylko ograniczyli się do zdarzeń, czyli elementów Ω (próbowałeś kiedyś dodać orła do reszki? Jaki miałeś wynik? 🙂 )
Z trzecim elementem “trójki probabilistycznej” nie ma już na ogół kłopotów.
3. Funkcja P:F\to R
Czyli mamy tutaj po prostu funkcję, która przyporządkowuje podzbiorom z F(drugiemu elementowi “trójki probabilistycznej”) – liczby. To liczby te (czyli wartości funkcji P) nazywa się potocznie “prawdopodobieństwami”.
Oczywiście funkcja ta musi również spełniać pewne warunki (widziałeś kiedyś prawdopodobieństwo czegoś równe -7?). Zwane one są także aksjomatami (bo przyjmuje się je bez dowodów):
Funkcja P:F\to Rjest funkcją prawdopodobieństwa, gdy:
- P\left( A \right)\ge 0dla dowolnego A\in F
- P(Ω)=1
- {{A}_{1}}\cup {{A}_{2}}\cup {{A}_{3}}\cup \ldots =P\left( {{A}_{1}} \right)+P\left( {{A}_{2}} \right)+P\left( {{A}_{3}} \right)+\ldots – jeżeli zbiory {{A}_{1}},{{A}_{2}},{{A}_{3}},\ldots są parami rozłączne (tzn. nie mają części wspólnej, {{A}_{i}}\cap {{A}_{j}}=\varnothing dla i\ne j
Czyli liczby, które przyporządkowuje funkcja muszą być nieujemne (nie ma ujemnych prawdopodobieństw), prawdopodobieństwo tego, że wydarzy się jakieś zdarzenie z wszystkich możliwych równe jest 1 (zdarzenie pewne) i prawdopodobieństwa można sumować, jeśli zdarzenia/zbiory są rozłączne.
To wszystko, jeśli chodzi o prawdopodobieństwo
Wartości funkcji P możemy nazywać prawdopodobieństwami. Funkcja P przyporządkowuje je zbiorom z rodziny F. Zbiory z rodziny Fto podzbiory zdarzeń elementarnych ze zbioru Ω.
Całość tworzy trójkę probabilistyczną: (Ω, F,P). Zdefiniowanie prawdopodobieństwa z pominięciem któregoś z elementów trójki jest niestety niemożliwe (a ponoć próbowano).
Nie można przedstawić, czym jest P bez powiedzenia, czym jest F, a to jest niemożliwe, bez zdefiniowania Ω.
Niektóre definicje ze szkoły średniej przedstawiające P jako funkcję P:\Omega \to Rnie są poprawne, albo dotyczą starych definicji prawdopodobieństwa (tych z błędami logicznymi).
Obejrzyjmy więc naszą definicję w działaniu, na konkretnym przykładzie.
Przykład
Niech nasze zdarzenie polega na rzucie kostką sześciościenną. Przez ‘1’ rozumiem wyrzucenie jedynki itd.
- Nasza przestrzeń zdarzeń elementarnych to: \Omega =\left\{ 1,2,3,4,5,6 \right\}
- Nasze σ-ciało Fto rodzina wszystkich możliwych podzbiorów Ω
- Funkcja P określoną na Fniech przyjmuje wartość 0 dla \varnothing , wartość \frac{1}{6}dla każdego zbioru jedno-elementowego, \frac{2}{6}dla każdego zbioru dwu-elementowego,… itd. w końcu \frac{6}{6}=1dla każdego zbioru sześcio-elementowego (czyli całego zbioru Ω)
Całość tworzy jak najbardziej trójkę probabilistyczną, wszystkie warunki i aksjomaty są spełnione.
Mam nadzieję, że po uważnym przeczytaniu mojego Wykładu zrozumiałeś definicję prawdopodobieństwa Kołmogorowa – nie jest taka trudna, prawda? 🙂
Jeśli chciałbyś o coś się dopytać, albo coś nie jest dla Ciebie do końca jasne – bardzo zachęcam Cię do napisania komentarza pod tym Wykładem, na pewno pomoże to także innym.
Kliknij tutaj, aby powrócić na główną stronę z materiałami o prawdopodobieństwie
Czy są jakieś miejsca gdzie są wyjaśniane przykłady z zadań domowych ? Czasem sobie wrócę do filmiku ale niekiedy mam pustkę w głowie i nie wiem jak coś zrobić a sam wynik mi nic nie daje ;/
Pani Michalino, pomoc przy zadaniach domowych i odpowiedziach oferujemy na Forum Akademii dostępnym w ramach Abonamentu.
Pod każdą z lekcji podpięty jest wątek na Forum. Część zadań jest już nawet rozpisanych.
Więcej informacji na stronie:
https://etrapez.pl/produkt/abonament-forum/
Dostęp do Akademii eTrapez opłacany jest na zasadzie miesięcznego abonamentu w wysokości 149 zł (79 zł Abonamentu + 70 zł opłaty wstęp\nej jednorazowej). Są też opcje kwartalne za 249 zł (179 zł Abonamentu i 70 zł opłaty wstęp\nej) i półroczne na 369 zł (299 zł Abonamentu i 70 zł opłaty wstęp\nej).
Pozdrawiam 🙂
W trzecim aksjomacie dotyczącym funkcji prawdopodobieństwa chyba brakuje po lewej stronie oznaczenia, że jest to prawdopodobieństwo sumy tych zdarzeń. Bardzo mi się podoba jasność opisu przedstawionych pojęć, pozdrawiam.
Kurs jest fajnie prowadzony i nawet dla mnie zrozumiały 😛 natomiast mam małą sugestię, a mianowicie o zadanka które rozwiązujesz w kursie. Mógłbyś treść i rozwiązanie dołączyć w pdf tak jak to jest z zad. dom. , żeby nie trzeba było szukać konkretnego zadania w nagraniu.
Poza tym super ! Tak trzymać
Pozdrawiam
Dzięki za sugestię, to jest do zrobienia.
Witam,
Zastanawiam się dlaczego jest napisane, że:
“Funkcja P: F –> R jest funkcją prawdopodobieństwa, gdy:…”,
zamiast:
“Funkcja P: F –> [0,1] jest funkcją prawdopodobieństwa, gdy:…”
Skoro każde prawdopodobieństwo jest nieujemne, oraz prawdopodobieństwo ze wszystkich zdarzeń = 1, to (chyba?) należą do [0,1] a nie do całego R ? Chyba, że źle kombinuję 🙂
Tomek
Dzięki, zadałeś bardzo dobre pytanie!
Rzeczywiście, funkcja prawdopodobieństwa przyjmuje wartości z przedziału \leftlangle 0,1 \rightrangle . Nie jest to jednak założenie, ani aksjomat, to jest dopiero WNIOSEK z aksjomatów.
To, że funkcja przyjmuje wartości z przedziału \leftlangle 0,1 \rightrangle można uzasadnić (na podstawie aksjomatów) tak:
1. Należy pokazać, że wartości funkcji są większe lub równe od zera i jednocześnie mniejsze lub równe od jeden, czyli:
Pleft( A \right)ge 0i Pleft( A \right)le 1
2. To, że Pleft( A \right)ge 0wynika od razu z Aksjomatu 1.
3. Trzeba tylko wykazać, że z aksjomatów wynika, że Pleft( A \right)le 1.
Wiemy, że:
Omega =Acup {A}’
…czyli, że cały zbiór zdarzeń elementarnych to suma dowolnego zbioru A i jego dopełnienia. Czyli każde zdarzenie elementarne albo należy do A, albo nie należy do A (czyli należy do dopełniania A). Zatem:
P(Ω) =Pleft( Acup {A}’ \right)
4. Z Aksjomatu 2 wiem, że P(Ω)=1. Zdarzenia A i A’ są rozłączne (nie mają wspólnych elementów), czyli z Aksjomatu 3 wiem, że Pleft( Acup {A}’ \right)=Pleft( A \right)+Pleft( {{A}’} \right).
Mogę zapisać więc:
1=Pleft( A \right)+Pleft( {{A}’} \right)
5. Przekształcając mam:
Pleft( A \right)=1-Pleft( {{A}’} \right)
A z tego wniosek, że Pleft( A \right)jest zawsze mniejsze lub równe od 1, bo Pleft( {{A}’} \right)jest zawsze większe lub równe od 0 (z Aksjomatu 1, który oczywiście dotyczy prawdopodobieństwa każdego zdarzenia, niezależnie od użytej tam literki).
6. Czyli pokazałem, że prawdopodobieństwo dowolnego zdarzenia A NIE MOŻE być większe od 1 🙂
Z tej niewielkiej liczby aksjomatów wynika jeszcze kilka ciekawych własności (np. w aksjomatach i definicji nigdzie nie jest napisane, że prawdopodobieństwo zbioru pustego, czyli zdarzenia niemożliwego jest równe 0 – to również jest dopiero WNIOSEK z nich).