Jak wybrać zmienne do modelu, czyli metoda analizy współczynników korelacji (VIDEO)]
Joanna Grochowska
Kierownik Działu Nauczania eTrapez.
Absolwentka matematyki finansowej oraz informatyki i ekonometrii na Uniwersytecie w Białymstoku. Doświadczony korepetytor w zakresie przedmiotów matematycznych i ekonomicznych.
Mieszka w Białymstoku. Uwielbia podróżować i chodzić po górach. Wolny czas przeznacza na spotkania z rodziną i z przyjaciółmi. Lubi eksperymenty w kuchni oraz siatkówkę.
Chcąc wyjaśnić zachowanie pewnej zmiennej, możemy wymyślać wiele zmiennych ją objaśniających. Jednak nie zawsze warto, czy nawet wręcz nie powinno się, brać wszystkich do obliczeń. Model nie będzie zbyt dobrze „dopasowany” do całego zbioru możliwości.
Nie zawsze wszystko da się “ogarnąć” za jednym zamachem. Jak to mówią: Co za dużo to nie zdrowo. 🙂
Na początku procesu modelowania ekonometrycznego powinno dokonać się odpowiedniej selekcji, czyli konkretnego wyboru zbioru zmiennych objaśniających wśród tzw. „kandydatek”.
Pamiętasz może czasy “Randki w ciemno”? Tam dana osoba mogła wybrać tylko jedną jedyną z podanych kandydatek. W ekonometrii jest podobnie, wybierasz tyko te zmienne (na szczęście nie koniecznie jedną), które będą najważniejsze.
Metod wyboru jest wiele.
W swoim Kursie pokazałam bardzo dokładnie najbardziej popularną metodę, tzw. metodę Hellwiga. Jest ona ciekawa, ale do pewnego momentu. Jeżeli jest zbyt dużo „kandydatek” na zmienne objaśniające, to liczba obliczeń odpowiednich wskaźników może być ogromna!
Dlatego ratunkiem mogą być inne sposoby doboru zmiennych objaśniających do modelu.
Jednym z nich jest metoda analizy współczynników korelacji (przez niektórych nazywana metodą Bartosiewicz). Jak dokładnie działa, pokazałam w tym oto filmiku:
Jak widać znalezienie odpowiedniego zbioru zmiennych objaśniających do modelu zajęło mi kilkanaście minut. Gdybyśmy wykonywali to w przypadku metody Hellwiga, samych możliwych kombinacji byłoby ! Na dodatek dla każdej kombinacji jeszcze odpowiednie wskaźniki policzyć – o zgrozo! Dobranie odpowiedniego zbioru zmiennych chyba pół dnia by nam zajęło.
Mam więc nadzieję, że teraz widzisz, jak znajomość innych metod jest pomocna 🙂
KONIEC
Szukasz korepetycji z matematyki na poziomie studiów lub szkoły średniej? A może potrzebujesz kursu, który przygotuje Cię do matury?
Jesteśmy ekipą eTrapez. Uczymy matematyki w sposób jasny, prosty i bardzo dokładny - trafimy nawet do najbardziej opornego na wiedzę.
Stworzyliśmy tłumaczone zrozumiałym językiem Kursy video do pobrania na komputer, tablet czy telefon. Włączasz nagranie, oglądasz i słuchasz, jak na korepetycjach. O dowolnej porze dnia i nocy.
A czy nie należałoby powtarzać tego algorytmu do czasu wybrania lub odrzucenia wszystkich zmiennych? W tej sytuacji zmienna X6 i X8 wchodzą do modelu, bo nie zostały odrzucone, ale np. gdyby były ze sobą mocno skorelowane, to w modelu powinna zostać ta z nich, która jest mocniej skorelowana z Y.
Pozdrawiam
Bardzo pomocny i ciekawy wpis!