Prawdziwe dane statystyczne, bez których nie zbudujesz modelu (+ VIDEO)

Picture of Joanna Grochowska-Angielczyk

Joanna Grochowska-Angielczyk

Ekonometria Wykład 4

Temat: Dane do modelu

 

Wiesz już dokładnie czym jest model ekonometryczny. Kluczową rolę odgrywają w nim zmienne – objaśniana oraz objaśniające. Zanim jednak zaczniesz cokolwiek budować, musisz mieć odpowiedni materiał. Tym materiałem są dane statystyczne. Na ich podstawie wykonywać będziesz wszelkie potrzebne obliczenia.

Zebranie danych statystycznych jest istotnym krokiem w modelowaniu ekonometrycznym.

 

Zanim przedstawię Ci sposoby prezentacji zebranych danych, zacznijmy od początku, czyli od źródła. Oto kilka moich podpowiedzi, skąd możesz pobrać dane statystyczne:

Które ze źródeł wybierzesz, zależy przede wszystkim od typu zmiennej, którą chcesz wykorzystać w modelu.

W poniższym filmiku pokazałam, jak możesz  łatwo, szybko i przyjemnie pobrać dane z największej bazy Głównego Urzędu Statystycznego, czyli z BDL:

 

 

Formy prezentacji danych

Gdy pobierzesz już dane statystyczne, trzeba je „ładnie” uporządkować. Mogą być one przedstawione w różnej formie. Oto trzy najczęstsze sposoby:

a)  Dane szeregów czasowych – liczby, odpowiadające wartościom, jakie przyjmowała zmienna w kolejnych, jednakowo odległych momentach lub przedziałach czasu (np. latach, kwartałach, miesiącach).

Są to najbardziej popularne zbiory danych. Takimi danymi są np. PKB, zatrudnienie, stopa inflacji, liczba ludności, ilość aptek, liczba lekarzy, powierzchnia pól uprawnych, itp. Zestawiane są jako dane roczne, kwartalne, miesięczne a nawet dzienne (jak np. wartość jednostek uczestnictwa funduszy inwestycyjnych), czy godzinowe (kursy walutowe, stopy zwrotu papierów wartościowych).

W tabelce możesz je zestawić na przykład tak:

 

b) Dane przekrojowe – dane wyrażające stan zjawiska w ustalonym okresie czasu.

Dane przekrojowe powstają jako obserwacje dokonywane w tym samym czasie na wielu zmiennych.

Przykładem mogą tu być np. obserwacje budżetów gospodarstw domowych. Co jakiś czas  przez Główny Urząd Statystyczny prowadzone są badania kilku tysięcy wybranych losowo gospodarstw domowych. Dzięki nim znane są informacje np. o dochodach i wydatkach badanych rodzin, o ich składzie demograficznym, o mieszkaniu i jego wyposażeniu w dobra trwałego użytku itd. Są to dane bardzo szczegółowe, obrazujące różnorodność badanych gospodarstw domowych.

Inny przykład powiązanych ze sobą zmiennych w przekroju roku:

 

c) Dane panelowe (połączone, longitudinalne) łączą cechy danych szeregów czasowych i danych przekrojowych. Oznacza to, że masz kilka zmiennych określonych na przestrzeni kilku kolejnych okresów.

Przykład 1

Na podstawie danych szeregów czasowych możemy ustalić jak zmienia się z czasem odsetek pracujących kobiet. Na podstawie danych przekrojowych powinniśmy sprawdzić, jak odsetek ten zależy od wieku kobiet, ich poziomu wykształcenia, czy fazy cyklu rozwojowego rodziny. Ale dopiero dane panelowe umożliwiają ustalenie jak zmienia się na przykład struktura pracujących kobiet: kiedy kobiety rozpoczynają, przerywają i wznawiają prace.

Przykładowo, tak wygląda zbiór innych danych panelowych:

 

 

 

Oprócz danych zebranych ze znanych Ci źródeł statystycznych, wyrażonych liczbowo, możesz użyć do modelu zmiennych „nieliczbowych”. Przykłady: wykształcenie, płeć, stan cywilny, ocena samopoczucia, itp. O tym, jak to dokładnie zrobić, możesz poczytać w moim Artykule:

Zmienne zero-jedynkowe, czyli jak wyrazić słowa liczbami

 

Należy pamiętać, że nie wszystkie dane statystyczne, jakie uda Ci się znaleźć, będą odpowiednie i poprawne. Ich niedoskonałość, mająca swoje różnorodne przyczyny, może mieć niekiedy decydujące znaczenie dla oszacowanego modelu. Możemy dopatrywać się przyczyny złego działania modelu w jego równaniu, gdy w rzeczywistości błąd tkwi w zebranych danych statystycznych. Albo możemy męczyć się z szukaniem odpowiednich zmiennych do modelu, nie mając pojęciach o niedbale wypełnionych ankietach.

 

KONIEC

 


Kliknij, aby powtórzyć sobie, po co w modelu uwzględniany jest składnik losowy (poprzedni Wykład) <–

Kliknij, aby sprawdzić, jak zmierzyć siłę wzajemnego powiązania zmiennych (następny Wykład) ->

Kliknij, aby powrócić na stronę z Wykładami do ekonometrii


 

konometria jest dosyć młodą dziedziną wypływającą z ekonomii i matematyki. W praktyce, dzięki modelom ekonometrycznym, możesz „zmierzyć gospodarkę”.Polega to konkretnie na zmierzeniu, jak zachowuje się jedna zmienna w zależności od innych. I na podstawie analizy tego, co było, możesz określać, co będzie się działo w przyszłości.

Wykorzystasz do tego przeróżne obliczenia, testy, schematy. Jedne będą bardzo proste, inne trudniejsze. Jednak najczęściej będzie się liczyło nie to, jak dojdziesz do wyniku, ale jak go zinterpretujesz, odczytasz i jakie wnioski wyciągniesz.

Poniższe Wykłady dotykają najważniejszych pojęć teoretycznych. Jestem przekonana, że pomogę Ci odkrywaniu tego, czym jest ekonometria. I przy okazji uda Ci się zaliczyć ten przedmiot na studiach.

5 Komentarzy

  1. W jaki sposób lub jakie dane najprościej wybrać np. 20 obserwacji i 3 zmienne, tak żeby dobrze się liczyło w Excelu ?  Chodzi mi o model liniowy

  2. Jeśli zmienna objaśniana w modelu to indeks (np. indeks dynamiki produkcji przemysłowej w ujęciu kwartalnym rok do roku) to zmienne objaśniające powinny być analogicznymi indeksami?

  3. Mam pytanie odnośnie układania, tworzenia zadań ekonometrycznych. Czy jest jakiś sposób na to, aby dane dobrać tak, żeby wyszedł mi model w postaci prostej, czyli np. Y=2X +1, Y=9x+4, itp?

    1. Dobrać dane, w sensie samemu „ręcznie” coś wymyśleć, aby wychodziły takie proste modele? Czy chodzi o wybranie danych rzeczywistych (np z GUSu)?

      Z rzeczywistymi danymi może być baaaaardzo ciężko.

      Dane takie z głowy, ręczne to już prościej. Można zrobić taki myk, że najpierw ustalić sobie postać modelu, np. Y=2X+1 i potem wymyślać kolejne wartości zmiennej X, natomiast Y wyliczać z wzoru.

      To jest dobra metoda, jeśli wybór takich danych jest potrzebny np. do celów edukacyjnych 🙂

    2. Mam pytanie odnośnie doboru zmiennych objaśniających do objaśnianej. Czy jeśli zmienną objaśnianą jest indeks dynamiki jakiegoś zjawiska (np. indeks produkcji przemysłowej w ujęciu kwartalnym rok do roku) to czy zmienne objaśniające powinny być również indeksami analogicznymi?

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *

Twój komentarz będzie dostępny publicznie na naszej stronie razem z powyższym podpisem. Komentarz możesz zmienić, lub usunąć w każdej chwili. Administratorem danych osobowych podanych w tym formularzu jest eTrapez Usługi Edukacyjne E-Learning Krystian Karczyński. Zasady przetwarzania danych oraz Twoje uprawnienia z tym związane opisane są w Polityce Prywatności.


Kategorie

Wirtualny nauczyciel AI działający w przeglądarce internetowej.