Přednáška 7 - Webhosting na VŠE

Transkript

5EN306
Aplikované kvantitativní metody I
Přednáška 6
Zuzana Dlouhá
Předmět a struktura kurzu
1. Úvod: struktura empirických výzkumů
2. Tvorba ekonomických modelů: teorie
3. Data: zdroje a typy dat, význam popisných charakteristik
4. Vicenásobná regrese v ekonomické analýze
5. Vicenásobná regrese: DUMMY proměnné a jejich interakce
6. Difference in differences estimator
7. First Differencing a Fixed Effects
8. Instrumentální proměnné, Panelová data
9. Testy robustnosti
10. Úvod do časových řad (zbyde-li čas)
•
témata se prolínají
2
Základy ekonometrie – funkční formy
•
•
•
kap. 6
k logaritmům – nepřesnost se zvyšuje s množstvím procent
výpočet přesné procentuální změny (když Δx = 1):
%∆𝑦 = 100(𝑒 𝛽 − 1)
Kvadratická závislost
•
•
•
první rok zkušeností (exper) zvyšuje mzdu o cca 0,30 USD, druhý rok
zvyšuje o 0,298 – 2*(0,0061)*1 = 0,029 USD atd.
maximální mzda:
znamená to, že po 24,4 roce klesají výnosy
ze zkušeností? (ne, záleží kolik dat leží vpravo
od 24,4, je to 28%, např. problém specifikace)
3
•
další př. – efekt znečištění na cenu domu
•
minimum funkce:
můžeme ignorovat
(pouze 1% z
celkového počtu)
•
nárůst místností z 5 na 6
•
nárůst místností ze 6 na 7
4
Kubická závislost
Interagující proměnné (interaction terms)
•
•
efekt počtu ložnic (bdrms) závisí na její rozloze (sqrft)
interakční efekt – důležité je vyhodnocení efektu jedné interagující
proměnné při zajímavých hodnotách druhé interagující proměnné
(např. průměr)
5
Základy ekonometrie – funkční formy + výběr regresorů
Reparametrizace modelu – interagujících proměnných
Výhody
•
•
•
efekt x2 za předpokladu průměrných hodnot všech
ostatních proměnných
jednoduchá interpretace všech parametrů
k dispozici standardní chyby parciálních efektů na průměrné hodnotě
v případě potřeby možný nápočet efektů na jiných hodnotách než na
průměru
6
Základy ekonometrie – funkční formy + výběr regresorů
Výběr regresorů
• pokud přidáme do modelu libovolnou další vysvětlující proměnnou,
koeficient determinace neklesne (obvykle se zvýší)
•
nemá smysl se bezhlavě snažit o zvyšování koeficientu determinace
•
nestrannost nijak nesouvisí s velikostí koeficientu determinace, záleží
na splnění G-M předpokladů
•
nízký koeficient determinace znamená, že SSR je vysoký v porovnání
s SST
•
pokud ale máme velký soubor, můžeme se i tak dostat k relativně
přesným odhadům koeficientů
•
adjustovaný (korigovaný) koeficient determinace při přidání proměnné
může i klesnout
7
Základy ekonometrie – výběr regresorů
Výběr regresorů - zahnízděné modely (nested models)
•
•
•
modely jsou zahnízděné, pokud je můžeme dostat ze vše zahrnujícího
modelu (tj. zahrnujícího všechny proměnné, které přicházejí v úvahu a
jejich mocniny - tzv. obecný model) lineárními omezeními parametrů
vždy se snažíme o co nejjednodušší model
u obecného modelu otestujeme F-testem (nebo LM testem) příslušná
lineární omezení parametrů a pokud můžeme, přejdeme k
jednoduššímu modelu
Výběr regresorů - nezahnízděné modely
•
vybírám model 2
8
Výběr regresorů – jiná forma závislé proměnné
•
tady výběr modelu na základě statistické významnosti a hodnot
koeficientů (vybírám druhý model)
9
Kontrola na příliš mnoho faktorů v regresní analýze
•
•
•
•
nemá cenu dávat zároveň proměnnou tax a beercons
pamatujte na ceteris paribus interpretaci
zvýšení daně zvýší cenu piva a tedy sníží spotřebu piva a to bude mít
efekt na nehody
když máme v modelu obě proměnné, koeficient u daně nám říká, jaký
je efekt daně na nehodovost při nezměněné spotřebě piva, a to moc
nedává smysl
10
Dummy proměnné a jejich interakce
•
•
•
•
kap. 7
kvalitativní informace – pohlaví, region, rasa, rating,…
jedním ze způsobů jak zahrnout kvalitativní proměnnou je její použití
jako dummy proměnnou
závislá i nezávislá
11
Dummy proměnná – trap (past)
•
•
perfektní kolinearita mezi male a female
vynechám buď male nebo female nebo odhadnu model bez konstanty:
•
– složitě testovat rozdíly mezi parametry
– koeficient determinace platný jenom u modelů s konstantou
příklad
12
•
příklad - je účinný grantový program pro školení při zaměstnání?
•
dummy proměnná v regresi s log(y)
13
Víc kategorií
• důležité – která kategorie bude vynechána – základní
• máme 4
•
vynechán – single man, vůči němu pak interpretuji koeficienty
Ordinální informace
•
vhodnější formulace
14
Interakce
•
•
•
?? muži a ?? ženy
hypotéza – výnosy ze vzdělání stejné pro muže i ženy:
hypotéza – celá rovnice stejná pro muže i ženy:
15
Chowův test
• testuje jestli je regresní funkce různá pro různé skupiny
• neomezený model (všechny interakce)
College grade point average
Standardized aptitude test score
High school rank percentile
Total hours spent
in college courses
•
omezený model
•
nulová hypotéza (všechny interakční efekty jsou nulové, tedy regresní
koeficienty jsou stejné pro muže i ženy)
16
Chowův test – pokračování
Testujeme-li
individuálně,
nemůžeme
odmítnout
hypotézu, že
jednotlivé
interakční efekty
jsou nulové.
•
testovací statistika – sdružený test
– zamítám hypotézu H0
17
•
•
Asensio, J.: The success story of Spanish suburban railways:
determinants of demand and policy implications, Transport Policy,
Volume 7 (4), 10/2000, pp. 295-302
k dispozici na stránkách https://webhosting.vse.cz/figlova/5en306/
18
•
•
Zietz et al. : Determinants of House Prices: A Quantile Regression
Approach: Department of Economics and Finance Working Paper
Series; Middle Tennessee State University, May 2007
k dispozici na stránkách https://webhosting.vse.cz/figlova/5en306/
19
Binární závislá proměnná
•
lineární pravděpodobnostní model
20
•
příklad – zaměstnanost ženy
•
graf pro nwifeinc=50,
exper=5, age=30,
kindslt6=1, kidsge6=0
21
•
náhodná složka nemá normální rozdělení (má binomické rozdělení),
čili důležité jsou asymptotické vlastnosti estimátorů
•
je zde heteroskedasticita, takže na standardní chyby odhadů se
nemůžeme moc spoléhat
•
predikovaná pravděpodobnost může být mimo přípustný interval
•
efekt vysvětlující proměnné na predikovanou pravděpodobnost je
lineární
•
většinou se chová dobře kolem průměrných hodnot vysvětlujících
proměnných
•
pro posouzení kvality modelu se zejména používá „procento správně
predikovaných hodnot“
•
logit a probit modely (přesahují rámec kurzu) také pracují s binární
závislou proměnnou a některé nedostatky LPM odstraňují
22
Heteroskedasticita - příčiny
•
•
•
•
•
•
kap. 8
chybná specifikace modelu
– vynechání podstatné vysvětlující proměnné
– nevhodná funkční forma modelu
odhad z prostorových dat se značnou variabilitou v jednom
náhodném výběru
– variabilita endogenní proměnné (a tedy i reziduí) může být
závislá na některé exogenní proměnné
chyby měření
– s rostoucí hodnotou endogenní proměnné dochází ke kumulaci
chyb měření – to zvyšuje rozptyl endogenní proměnné a tedy i
rozptyl reziduí
odhad z upravených dat
– odhad nikoliv na původních pozorováních, ale např. ze
skupinových průměrů získaných z tříděných dat
u lineárního pravděpodobnostního modelu vždy
23
Heteroskedasticita - důsledky
•
•
•
•
•
•
•
nemá vliv na nestrannost a konzistenci MNČ estimátoru
interpretace koeficientu determinace se nemění
odhady směrodatných chyb bodových odhadů (sbi) a rozptylu sigma
(s2) jsou vychýlené
 intervalové odhady nejsou směrodatné
 statistické testy (t-testy, F-test) ztrácejí na síle
byly vyvinuty asymptoticky platné vzorečky pro OLS standardní chyby
a související statistiky robustní vůči heteroskedasticitě neznámé formy
White-Eickerovy standardní chyby, gretl: HC0
obvyklý t-test je asymptoticky platný (použijeme-li robustní standardní
chyby)
obvyklá F-statistika při heteroskedasticitě platná není, ale většina
softwaru poskytuje verzi robustní vůči heteroskedasticitě
24
Heteroskedasticita – Whiteův test
•
nemá vliv na nestrannost a konzistenci MNČ estimátoru
•
parametrický test
25
Heteroskedasticita – WLS
•
•
vážené nejmenší čtverce
je známá funkční forma heteroskedasticity
•
příklad
26
Heteroskedasticita – WLS
•
transformovaný model je homoskedastický
•
WLS je vydatnější než OLS v původním modelu, protože pozorování s
velkým rozptylem a tedy méně informativní než ta s malým rozptylem
mají při odhadu menší váhu
• WLS je speciálním případem Metody zobecněných nejmenších čtverců
– GLS (generalized least squares)
Důležitý zvláštní případ heteroskedasticity
• pokud jsou pozorované údaje průměry (za město, oblast, zemi,
firmu...), měly by být váženy velikostí příslušné jednotky
• pokud nevíme, jestli jsou chyby na úrovni individuí homoskedastické,
můžeme při OLS na transformovaném modelu aplikovat robustní
chyby
27
Heteroskedasticita – FGLS
•
•
•
feasible generalized LS
použije se, když neznáme funkční formu heteroskedasticity
předpoklad exponenciální funkční formy (rozptyl nemůže být záporný)
•
•
inverzní hodnoty této odhadnuté funkce použijeme jako váhy při WLS
FGLS je konzistentní a asymptoticky vydatnější než OLS
28
Heteroskedasticita – FGLS – příklad
•
odhad MNČ
•
odhad FGLS
29
Heteroskedasticita – FGLS
•
•
•
•
pokud použijeme chybnou funkční formu heteroskedasticity, jsou
FGLS (WLS) estimátory konzistentní (za předpokladu, že jsou ostatní
G-M předpoklady splněny), ale měli bychom pracovat s robustními
standardními chybami
pokud se OLS a FGLS (WLS) odhady velmi liší, obvykle to indikuje, že
některý další G-M předpoklad není splněn, může indikovat také
chybnou specifikaci LRM
při silné heteroskedasticitě je často lepší použít chybnou funkční formu
heteroskedasticity než žádnou – zvýšíme tím vydatnost
použití exponenciální funkční formy ve FGLS je poměrně
sofistikované, můžeme ale vyjít i z mnohem jednodušší funkční formy,
historicky se využíval třeba Whiteův test
30
Heteroskedasticita – WLS v LPM
•
v LPM známe přesně funkční formu heteroskedasticity
•
WLS neproveditelné, pokud jsou LPM predikce menší než nula či větší
než jedna
pokud těchto případů není mnoho, můžeme takové predikce nahradit
třeba hodnotami 0,01 či 0,99 (resp. jinými ad-hoc zvolenými hodnotami
blízkými hranici intervalu 0-1)
•
Další možnosti řešení heteroskedasticity v LPM:
• lze
použít
FGLS
(ignorujeme
známou
funkční
formu
heteroskedasticity)
• lze vynechat všechna pozorování vedoucí k predikcím mimo interval 01 (nenáhodný výběr!)
• lze použít OLS s robustními standardními chybami (odhad není
vydatný)
31

Přednáška 7 - Webhosting na VŠE

Transkript

Podobné dokumenty

Přednáška 12

Přednáška 11

American Memory (LoC)

www.ssoar.info Prostorová analýza českého stranického systému

Informace ke kurzu 5EN306 ZS2011

Info5EN306 ZS2012_13

Charakteristika Google Book Search

1. Slovenský systémový integrátor

cenovy predpis LP - podpis PM

Popis systému - OmniPCX 4400

CV - DYME