Přednáška 7 - Webhosting na VŠE

Transkript

Přednáška 7 - Webhosting na VŠE
5EN306
Aplikované kvantitativní metody I
Přednáška 6
Zuzana Dlouhá
Předmět a struktura kurzu
1. Úvod: struktura empirických výzkumů
2. Tvorba ekonomických modelů: teorie
3. Data: zdroje a typy dat, význam popisných charakteristik
4. Vicenásobná regrese v ekonomické analýze
5. Vicenásobná regrese: DUMMY proměnné a jejich interakce
6. Difference in differences estimator
7. First Differencing a Fixed Effects
8. Instrumentální proměnné, Panelová data
9. Testy robustnosti
10. Úvod do časových řad (zbyde-li čas)
•
témata se prolínají
2
Základy ekonometrie – funkční formy
•
•
•
kap. 6
k logaritmům – nepřesnost se zvyšuje s množstvím procent
výpočet přesné procentuální změny (když Δx = 1):
%∆𝑦 = 100(𝑒 𝛽 − 1)
Kvadratická závislost
•
•
•
první rok zkušeností (exper) zvyšuje mzdu o cca 0,30 USD, druhý rok
zvyšuje o 0,298 – 2*(0,0061)*1 = 0,029 USD atd.
maximální mzda:
znamená to, že po 24,4 roce klesají výnosy
ze zkušeností? (ne, záleží kolik dat leží vpravo
od 24,4, je to 28%, např. problém specifikace)
3
Základy ekonometrie – funkční formy
•
další př. – efekt znečištění na cenu domu
•
minimum funkce:
můžeme ignorovat
(pouze 1% z
celkového počtu)
•
nárůst místností z 5 na 6
•
nárůst místností ze 6 na 7
4
Základy ekonometrie – funkční formy
Kubická závislost
Interagující proměnné (interaction terms)
•
•
efekt počtu ložnic (bdrms) závisí na její rozloze (sqrft)
interakční efekt – důležité je vyhodnocení efektu jedné interagující
proměnné při zajímavých hodnotách druhé interagující proměnné
(např. průměr)
5
Základy ekonometrie – funkční formy + výběr regresorů
Reparametrizace modelu – interagujících proměnných
Výhody
•
•
•
efekt x2 za předpokladu průměrných hodnot všech
ostatních proměnných
jednoduchá interpretace všech parametrů
k dispozici standardní chyby parciálních efektů na průměrné hodnotě
v případě potřeby možný nápočet efektů na jiných hodnotách než na
průměru
6
Základy ekonometrie – funkční formy + výběr regresorů
Výběr regresorů
• pokud přidáme do modelu libovolnou další vysvětlující proměnnou,
koeficient determinace neklesne (obvykle se zvýší)
•
nemá smysl se bezhlavě snažit o zvyšování koeficientu determinace
•
nestrannost nijak nesouvisí s velikostí koeficientu determinace, záleží
na splnění G-M předpokladů
•
nízký koeficient determinace znamená, že SSR je vysoký v porovnání
s SST
•
pokud ale máme velký soubor, můžeme se i tak dostat k relativně
přesným odhadům koeficientů
•
adjustovaný (korigovaný) koeficient determinace při přidání proměnné
může i klesnout
7
Základy ekonometrie – výběr regresorů
Výběr regresorů - zahnízděné modely (nested models)
•
•
•
modely jsou zahnízděné, pokud je můžeme dostat ze vše zahrnujícího
modelu (tj. zahrnujícího všechny proměnné, které přicházejí v úvahu a
jejich mocniny - tzv. obecný model) lineárními omezeními parametrů
vždy se snažíme o co nejjednodušší model
u obecného modelu otestujeme F-testem (nebo LM testem) příslušná
lineární omezení parametrů a pokud můžeme, přejdeme k
jednoduššímu modelu
Výběr regresorů - nezahnízděné modely
•
vybírám model 2
8
Základy ekonometrie – výběr regresorů
Výběr regresorů – jiná forma závislé proměnné
•
tady výběr modelu na základě statistické významnosti a hodnot
koeficientů (vybírám druhý model)
9
Základy ekonometrie – výběr regresorů
Kontrola na příliš mnoho faktorů v regresní analýze
•
•
•
•
nemá cenu dávat zároveň proměnnou tax a beercons
pamatujte na ceteris paribus interpretaci
zvýšení daně zvýší cenu piva a tedy sníží spotřebu piva a to bude mít
efekt na nehody
když máme v modelu obě proměnné, koeficient u daně nám říká, jaký
je efekt daně na nehodovost při nezměněné spotřebě piva, a to moc
nedává smysl
10
Dummy proměnné a jejich interakce
•
•
•
•
kap. 7
kvalitativní informace – pohlaví, region, rasa, rating,…
jedním ze způsobů jak zahrnout kvalitativní proměnnou je její použití
jako dummy proměnnou
závislá i nezávislá
11
Dummy proměnné a jejich interakce
Dummy proměnná – trap (past)
•
•
perfektní kolinearita mezi male a female
vynechám buď male nebo female nebo odhadnu model bez konstanty:
•
– složitě testovat rozdíly mezi parametry
– koeficient determinace platný jenom u modelů s konstantou
příklad
12
Dummy proměnné a jejich interakce
•
příklad - je účinný grantový program pro školení při zaměstnání?
•
dummy proměnná v regresi s log(y)
13
Dummy proměnné a jejich interakce
Víc kategorií
• důležité – která kategorie bude vynechána – základní
• máme 4
•
vynechán – single man, vůči němu pak interpretuji koeficienty
Ordinální informace
•
vhodnější formulace
14
Dummy proměnné a jejich interakce
Interakce
•
•
•
?? muži a ?? ženy
hypotéza – výnosy ze vzdělání stejné pro muže i ženy:
hypotéza – celá rovnice stejná pro muže i ženy:
15
Dummy proměnné a jejich interakce
Chowův test
• testuje jestli je regresní funkce různá pro různé skupiny
• neomezený model (všechny interakce)
College grade point average
Standardized aptitude test score
High school rank percentile
Total hours spent
in college courses
•
omezený model
•
nulová hypotéza (všechny interakční efekty jsou nulové, tedy regresní
koeficienty jsou stejné pro muže i ženy)
16
Dummy proměnné a jejich interakce
Chowův test – pokračování
Testujeme-li
individuálně,
nemůžeme
odmítnout
hypotézu, že
jednotlivé
interakční efekty
jsou nulové.
•
testovací statistika – sdružený test
– zamítám hypotézu H0
17
Dummy proměnné a jejich interakce
•
•
Asensio, J.: The success story of Spanish suburban railways:
determinants of demand and policy implications, Transport Policy,
Volume 7 (4), 10/2000, pp. 295-302
k dispozici na stránkách https://webhosting.vse.cz/figlova/5en306/
18
Dummy proměnné a jejich interakce
•
•
Zietz et al. : Determinants of House Prices: A Quantile Regression
Approach: Department of Economics and Finance Working Paper
Series; Middle Tennessee State University, May 2007
k dispozici na stránkách https://webhosting.vse.cz/figlova/5en306/
19
Binární závislá proměnná
•
lineární pravděpodobnostní model
20
Binární závislá proměnná
•
příklad – zaměstnanost ženy
•
graf pro nwifeinc=50,
exper=5, age=30,
kindslt6=1, kidsge6=0
21
Binární závislá proměnná
•
náhodná složka nemá normální rozdělení (má binomické rozdělení),
čili důležité jsou asymptotické vlastnosti estimátorů
•
je zde heteroskedasticita, takže na standardní chyby odhadů se
nemůžeme moc spoléhat
•
predikovaná pravděpodobnost může být mimo přípustný interval
•
efekt vysvětlující proměnné na predikovanou pravděpodobnost je
lineární
•
většinou se chová dobře kolem průměrných hodnot vysvětlujících
proměnných
•
pro posouzení kvality modelu se zejména používá „procento správně
predikovaných hodnot“
•
logit a probit modely (přesahují rámec kurzu) také pracují s binární
závislou proměnnou a některé nedostatky LPM odstraňují
22
Heteroskedasticita - příčiny
•
•
•
•
•
•
kap. 8
chybná specifikace modelu
– vynechání podstatné vysvětlující proměnné
– nevhodná funkční forma modelu
odhad z prostorových dat se značnou variabilitou v jednom
náhodném výběru
– variabilita endogenní proměnné (a tedy i reziduí) může být
závislá na některé exogenní proměnné
chyby měření
– s rostoucí hodnotou endogenní proměnné dochází ke kumulaci
chyb měření – to zvyšuje rozptyl endogenní proměnné a tedy i
rozptyl reziduí
odhad z upravených dat
– odhad nikoliv na původních pozorováních, ale např. ze
skupinových průměrů získaných z tříděných dat
u lineárního pravděpodobnostního modelu vždy
23
Heteroskedasticita - důsledky
•
•
•
•
•
•
•
nemá vliv na nestrannost a konzistenci MNČ estimátoru
interpretace koeficientu determinace se nemění
odhady směrodatných chyb bodových odhadů (sbi) a rozptylu sigma
(s2) jsou vychýlené
 intervalové odhady nejsou směrodatné
 statistické testy (t-testy, F-test) ztrácejí na síle
byly vyvinuty asymptoticky platné vzorečky pro OLS standardní chyby
a související statistiky robustní vůči heteroskedasticitě neznámé formy
White-Eickerovy standardní chyby, gretl: HC0
obvyklý t-test je asymptoticky platný (použijeme-li robustní standardní
chyby)
obvyklá F-statistika při heteroskedasticitě platná není, ale většina
softwaru poskytuje verzi robustní vůči heteroskedasticitě
24
Heteroskedasticita – Whiteův test
•
nemá vliv na nestrannost a konzistenci MNČ estimátoru
•
parametrický test
25
Heteroskedasticita – WLS
•
•
vážené nejmenší čtverce
je známá funkční forma heteroskedasticity
•
příklad
26
Heteroskedasticita – WLS
•
transformovaný model je homoskedastický
•
WLS je vydatnější než OLS v původním modelu, protože pozorování s
velkým rozptylem a tedy méně informativní než ta s malým rozptylem
mají při odhadu menší váhu
• WLS je speciálním případem Metody zobecněných nejmenších čtverců
– GLS (generalized least squares)
Důležitý zvláštní případ heteroskedasticity
• pokud jsou pozorované údaje průměry (za město, oblast, zemi,
firmu...), měly by být váženy velikostí příslušné jednotky
• pokud nevíme, jestli jsou chyby na úrovni individuí homoskedastické,
můžeme při OLS na transformovaném modelu aplikovat robustní
chyby
27
Heteroskedasticita – FGLS
•
•
•
feasible generalized LS
použije se, když neznáme funkční formu heteroskedasticity
předpoklad exponenciální funkční formy (rozptyl nemůže být záporný)
•
•
inverzní hodnoty této odhadnuté funkce použijeme jako váhy při WLS
FGLS je konzistentní a asymptoticky vydatnější než OLS
28
Heteroskedasticita – FGLS – příklad
•
odhad MNČ
•
odhad FGLS
29
Heteroskedasticita – FGLS
•
•
•
•
pokud použijeme chybnou funkční formu heteroskedasticity, jsou
FGLS (WLS) estimátory konzistentní (za předpokladu, že jsou ostatní
G-M předpoklady splněny), ale měli bychom pracovat s robustními
standardními chybami
pokud se OLS a FGLS (WLS) odhady velmi liší, obvykle to indikuje, že
některý další G-M předpoklad není splněn, může indikovat také
chybnou specifikaci LRM
při silné heteroskedasticitě je často lepší použít chybnou funkční formu
heteroskedasticity než žádnou – zvýšíme tím vydatnost
použití exponenciální funkční formy ve FGLS je poměrně
sofistikované, můžeme ale vyjít i z mnohem jednodušší funkční formy,
historicky se využíval třeba Whiteův test
30
Heteroskedasticita – WLS v LPM
•
v LPM známe přesně funkční formu heteroskedasticity
•
WLS neproveditelné, pokud jsou LPM predikce menší než nula či větší
než jedna
pokud těchto případů není mnoho, můžeme takové predikce nahradit
třeba hodnotami 0,01 či 0,99 (resp. jinými ad-hoc zvolenými hodnotami
blízkými hranici intervalu 0-1)
•
Další možnosti řešení heteroskedasticity v LPM:
• lze
použít
FGLS
(ignorujeme
známou
funkční
formu
heteroskedasticity)
• lze vynechat všechna pozorování vedoucí k predikcím mimo interval 01 (nenáhodný výběr!)
• lze použít OLS s robustními standardními chybami (odhad není
vydatný)
31

Podobné dokumenty

Přednáška 12

Přednáška 12 5EN306 Aplikované kvantitativní metody I Přednáška 10

Více

Přednáška 11

Přednáška 11 5EN306 Aplikované kvantitativní metody I Přednáška 9

Více

American Memory (LoC)

American Memory (LoC) Kolekce lze rozdělit také podle časových úseků počínaje rokem 1400 až do dnešní doby. Dále je lze třídit podle typu záznamu, který obsahují, můžeme tak například získat seznam všech kolekcí obsahuj...

Více

www.ssoar.info Prostorová analýza českého stranického systému

www.ssoar.info Prostorová analýza českého stranického systému procesů na mikroúrovni (jako například nákazové nebo sousedské efekty). Totéž je ale často problematické na úrovni vyšších celků, jako jsou, v českém případě, okresy či kraje. Čím vyšší je úroveň a...

Více

Informace ke kurzu 5EN306 ZS2011

Informace ke kurzu 5EN306 ZS2011 *) Jedná se o jediný termín testu. Na test se studenti nepřihlašují. První půlka abecedy píše v první půlce přednášky (bude upřesneno na přednášce). V případě doložených zdravotních důvodů dle prav...

Více

Info5EN306 ZS2012_13

Info5EN306 ZS2012_13 Rozvrh přednášek a povinností: Týden Datum Téma

Více

Charakteristika Google Book Search

Charakteristika Google Book Search říjen 2005, Google chce rozšířit službu na další evropské jazyky (Francie, Itálie, Německo, Nizozemí, Rakousko, Švýcarsko, Belgie a Španělsko mají mít vlastní verzi) 18. listopad 2005, přejmenování...

Více

1. Slovenský systémový integrátor

1. Slovenský systémový integrátor 1. Současný přístup až 20 pracovníků ke stroji (IT, údržba, výroba, engineering) 2. Sofistikovaná práce s daty:

Více

cenovy predpis LP - podpis PM

cenovy predpis LP - podpis PM nebo distributorem zdarma, je základ 0 Kč. K částce vypočtené procentuální sazbou se připočte maximálně pevná část odpovídající pásmu dle výše základu (nápočet). V případě, že distributor distribuu...

Více