DODAJ SOBIE SKRZYDEŁ NA SESJI - ZGARNIJ DWUPAK REDBULLA!
Razem z każdym zakupem Kursów studenckich otrzymujesz kod na odbiór darmowych Red Bulli.

blog

Zmienne zero-jedynkowe, czyli jak wyrazić słowa liczbami

Joanna Grochowska

Słysząc „zmienne ekonomiczne”, z reguły mamy na myśli zmienne, które można łatwo wyrazić liczbowo, policzyć. Typu: ceny, wydatki, dochód, temperatura powietrza, ilość samochodów, liczba lekarzy etc.

Są to tzw. zmienne ilościowe.

Ale co jeśli w modelu potrzebujemy ująć zmienne o charakterze nieliczbowym, tzn. wyrażane bardziej poprzez słowa niż przez liczby?

Chodzi mi o: tak – nie, kobieta – mężczyzna, żonaty – kawaler, pracuje – nie pracuje,  wyznawana religia, wykształcenie (wyższe – średnie – podstawowe), pochodzenie (ze wsi – z miasta małego – z miasta dużego), itp. Mogą mieć z reguły dwa lub więcej wariantów odpowiedzi. One również mają wpływ na wartość wyjaśnianej cechy.

Jest to drugi typ zmiennych w modelu – zmienne jakościowe.

Przykład 1

Pani Grażynka przez cały rok zbierała dane dotyczące wydatków na karmę (w zł) dla jej dwóch kotów – Kici i Pirata. Chciałaby przeprowadzić analizę tych kosztów w zależności od kilku czynników, jej zdaniem najbardziej na to wpływających. Jako zmienne objaśniające wybrała: średnią cenę za 1 kilogram karmy, wysokość miesięcznych zarobków jej męża Janusza (w zł), ilość wizyt u weterynarza w miesiącu oraz kto jadł częściej z ich ulubionej miseczki – kot czy kotka.

Model ekonometryczny liniowy tłumaczący wybrane zależności jest następujący:

w y d a t k i space n a space k a r m ę space equals space alpha subscript 0 space plus space alpha subscript 1 times c e n a space plus space alpha subscript 2 times z a r o b k i space plus space alpha subscript 3 times w e t e r y n a r z space plus space alpha subscript 4 times p ł e ć space k o t a space plus space epsilonW poniższej tabeli znajdziesz wyniki zebrane przez Panią Grażynkę:

Powiedzmy, że wszystkie te zmienne są istotne, wchodzą do modelu. Potrzebuję teraz oszacować parametry strukturalne, czyli alfy. Ale, ale, przecież do obliczeń nie wykorzystam słowa „kot” albo „kotka” – liczenie to nie literki. My potrzebujemy konkretnych cyfr 🙂 Co więc zrobić ze zmienną „płeć kota”, skoro wyrażona jest ona tylko poprzez słowa? Odrzucić?

Jak większości problemów, zaradzono i temu. Wymyślono, by wartości zmiennych jakościowych, które mają dwa warianty odpowiedzi, zastąpić cyframi: „1” oraz „0”. Stąd dana cecha przyjmuje wartości:

X subscript i space equals open curly brackets table attributes columnalign left end attributes row cell 1 space end cell row 0 end table close

gdzie:

" 1 " – stawiamy, gdy zdarzenie wystąpi (obiekt ma daną cechę);

" 0 " – w przypadku przeciwnym, czyli gdy zdarzenie nie wystąpi (obiekt nie ma wybranej cechy)

Wystarczy teraz przypisać odpowiednią cyfrę do danego wariantu zmiennej. Pani Grażynka uznała, że Pirat będzie miał numer „1„, zaś Kicia numer „0„. Oczywiście mogła wziąć cyferki odwrotnie, żaden problem, zwłaszcza jeśli chodzi o rozróżnianie płci. Kotce mogła być przypisana cyfra jeden, a kot byłby zerem.

Mając już same liczby (takie jak podane w tabelce), na spokojnie możemy wykonać wszystkie obliczenia. Później wyniki odpowiednio zinterpretujemy. Tutaj będziesz musiał zwrócić uwagę na pewien aspekt – ale o tym za chwilę.

Tabela do obliczeń wygląda następująco:


Model oszacuję za pomocą Klasycznej Metody Najmniejszych Kwadratów stosowanej do liniowych modeli jednorównaniowych. Sposób w jaki estymuje się parametry strukturalne dokładnie pokazałam w moim Kursie. Oto wynik:

w y d a t stack k i space n with hat on top a space k a r m ę space equals 377 comma 605 space minus space 76 comma 095 times c e n a space plus space 0 comma 003 times z a r o b k i space minus space 0 comma 046 times w e t e r y n a r z space minus 2 comma 934 times p ł e ć space k o t a

Jak widać, sama metoda estymacji, mając zmienną złożona z samych zer i jedynek, nie ulega zmianie. Jak jednak zinterpretować współczynnik stojący przy zmiennej „płeć kota”?

Interpretacja parametrów przy cenie, zarobkach czy ilości wizyt u weterynarza jest typowa.

Wzrost zmiennej objaśniającej o 1 jednostkę pociąga za sobą zmianę (wzrost lub spadek) zmiennej objaśnianej, w tym przykładzie wydatków na karmę, o wartość oszacowanego parametru alpha subscript i, oczywiście przy niezmienionych wartościach pozostałych zmiennych (ceteris paribus). Jednakże nie możesz tak samo zinterpretować zmiennej płeć kota. To raczej bez sensu powiedzieć, że „wzrost płci, znaczy zmiana z kotki na kota (?) (inaczej przejście z cechy oznaczonej 0 na cechę z przypisaną 1) powoduje spadek wydatków na karmę o około 2,93 zł”. Dziwnie brzmi, prawda? 🙂

Zatem, gdybyśmy chcieli zinterpretować parametr stojący przy zmiennej jakościowej, wyrażonej poprzez zero-jedynki, jak mamy to zrobić?

Przypatrz się uważnie, czemu jest przypisana wartość 0 oraz 1.  W przykładzie mamy że 0 – kotka Kicia jadła częściej z ich ulubionej miseczki,  1 – kot Pirat jadł częściej z ich ulubionej miseczki. Zmienną objaśnianą Y jest wielkość wydatków na karmę dla kotów.

Interpretacja parametru a subscript 4 equals negative 2 comma 934Wielkość wydatków na karmę w przypadku, gdy z ulubionej miseczki jadł kot była mniejsza o około 2,93 zł w porównaniu gdy częściej z miseczki jadła kotka, przy takich samych wartościach pozostałych zmiennych.

Popatrz, nie jest to trudne. Można napisać taki ogólny schemat, jak się interpretuje zmienne zero-jedynkowe:

Wielkość ..(zmienna objaśniana Y).. dla/w przypadku ..(cecha z przypisaną jedynką)..różni się przeciętnie mniej więcej o (i tu ocena parametru – pamiętaj, uwzględnij znak! „jest większa/mniejsza o około”) w porównaniu z ..(cecha z przypisanym zerem).. przy takich samych wartościach pozostałych zmiennych (napisać ewentualnie jakich).

Inny przykład by poćwiczyć interpretację (bo pamiętaj, liczenie liczeniem, ale wnioski jakie z tego wyciągniesz – to się najbardziej liczy w ekonometrii!).

Przykład 2

Badamy np. osobiste miesięczne wydatki na jedzenie (w zł). Wśród zmiennych objaśniających jest zmienna przyjmująca wartości: zamężna/żonaty – 1 oraz panna/kawaler – 0 . Zatem w tabeli danych będziesz miał kolumnę złożoną z samych zer i jedynek, to już jest jasne. Po wykonaniu obliczeń otrzymano, że oszacowany parametr przy zmiennej „stan cywilny” wynosi a subscript 2 equals 191 comma 73. Jego interpretacja leci tak:

Wielkość wydatków na jedzenie osób zamężnych/żonatych jest większa o około 191,73 zł w porównaniu z osobami niezamężnymi/nieżonatymi przy takich samych wartościach pozostałych zmiennych (ceteris paribus). Inaczej byś powiedział, że osoby zamężne/żonate wydają miesięcznie więcej na jedzenie o około 191,73 zł od panien/kawalerów.

W sumie jedzonko na wikcie małżeńskim, gdy mąż lub żona gotuje, jest z reguły inne niż te za czasów kawalerskich 🙂

Widzisz jak działa ten schemat? Mam nadzieję, że jeśli teraz trafi Ci się model ze zmiennymi jakościowymi, to poradzisz również i z interpretacją takich zmiennych. Powodzenia 🙂

KONIEC

Jedna z wielu opinii o naszych Kursach...

Kurs z pewnością godny polecenia, po obejrzeniu kilku kursów stwierdzam, że zostanę z eTrapezem na dłużej! Wszystko wytłumaczone w sposób prosty, zadania domowe zoptymalizowane w taki sposób, że zaczynamy od zadań podstawowych a kończymy na tych trudniejszych.

Konrad

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *