PDF - Slovenská štatistická a demografická spoločnosť
Transkript
4/2007 FORUM STATISTICUM SLOVACUM I SSN 1336 - 7420 74 9 771336 742001 Slovenská štatistická a demografická spoločnosť Miletičova 3, 824 67 Bratislava www.ssds.sk Naše najbližšie akcie: (pozri tiež www.ssds.sk, blok Poriadané akcie) 16. Medzinárodný seminár VÝPOČTOVÁ ŠTATISTIKA, 6. – 7. 12. 2007, Bratislava Prehliadka prác mladých štatistikov a demografov 6. 12. 2007, Bratislava SLÁVNOSTNÁ KONFERENCIA 40 ROKOV SŠDS, 27. 3. 2008, Bratislava KONFERENCIA POHĽADY NA EKONOMIKU SLOVENSKA 2008, tematické zameranie: Vývoj HDP a vývoj dlhodobej nezamestnanosti 15. 4. 2008, Bratislava, hotel Bôrik EKOMSTAT 2008, 22. škola štatistiky Tematické zameranie: Štatistické metódy v praxi 1. – 6. 6. 2008, Trenčianske Teplice FernStat 2008 V. medzinárodná konferencia aplikovanej štatistiky (Financie, Ekonomika, Riadenie, Názory) tematické zameranie: Aplikovaná, demografická, matematická štatistika, štatistické riadenie kvality. rok 2008, hotel Lesák, Tajov pri Banskej Bystrici 14. SLOVENSKÁ ŠTATISTICKÁ KONFERENCIA, tematické zameranie: Regionálna štatistika rok 2008, Žilinský kraj 12. SLOVENSKÁ DEMOGRAFICKÁ KONFERENCIA, tematické zameranie: Využitie GIS v demografii rok 2009, Trenčiansky kraj ÚVOD Vážené kolegyne, vážení kolegovia, štvrté číslo tretieho ročníka vedeckého časopisu, ktorý vydáva Slovenská štatistická a demografická spoločnosť (SŠDS) je zostavené z príspevkov, ktoré autori pripravili pre IV. ročník Medzinárodnej konferencie aplikovanej štatistiky FernStat 2007. Táto konferencia sa uskutočila v dňoch 4. a 5. októbra v hoteli Lesák v Tajove. Tradičné tematické okruhy konferencie sú: Aplikovaná štatistika, Demografická štatistika, Matematická štatistika, Štatistické riadenie kvality. Akciu, z poverenia Výboru SŠDS, zorganizoval Organizačný a programový výbor: Ing. Vladimír Úradníček, PhD. – predseda, Ing. Mária Kanderová, PhD. tajomník, Doc. Ing. Jozef Chajdiak, CSc., Doc. RNDr. Bohdan Linda, CSc., RNDr. Ján Luha, CSc., Ing. Rudolf Gavliak. Pri príprave konferencie významne prispel Štatistický úrad SR. Výbor SŠDS ďakuje predsedníčke ŠÚ SR PhDr. Ľudmile Benkovičovej, CSc. za aktívnu podporu pri zabezpečení úspešného priebehu podujatia. Na príprave a zostavení tohoto čísla participovali: Ing. Vladimír Úradníček, PhD.,Doc. Ing. Jozef Chajdiak, CSc., RNDr. Ján Luha, CSc., Ing. Mária Kanderová, PhD., Ing. Rudolf Gavliak. Recenziu príspevkov zabezpečili: Doc. Ing. Jozef Chajdiak, CSc., Doc. RNDr. Bohdan Linda, CSc., RNDr. Ján Luha, CSc., Ing. Vladimír Úradníček, PhD., Ing. Mária Kanderová, PhD. Výbor SŠDS FORUM STATISTICUM SLOVACUM vedecký časopis Slovenskej štatistickej a demografickej spoločnosti Vydavateľ Slovenská štatistická a demografická spoločnosť Miletičova 3 824 67 Bratislava 24 Slovenská republika Redakcia Miletičova 3 824 67 Bratislava 24 Slovenská republika Fax 02/63812565 e-mail [email protected] [email protected] Registráciu vykonalo Ministerstvo kultúry Slovenskej republiky Registračné číslo 3416/2005 Tematická skupina B1 Dátum registrácie 22. 7. 2005 Objednávky Slovenská štatistická a demografická spoločnosť Miletičova 3, 824 67 Bratislava 24 Slovenská republika IČO: 178764 Číslo účtu: 0011469672/0900 ISSN 1336-7420 Redakčná rada RNDr. Peter Mach – predseda Doc. Ing. Jozef Chajdiak, CSc. – šéfredaktor RNDr. Ján Luha, CSc. – tajomník členovia: Ing. Mikuláš Cár, CSc. Ing. Ján Cuper Ing. Pavel Fľak, DrSc. Ing. Edita Holičková Doc. RNDr. Ivan Janiga, CSc. Ing. Anna Janusová RNDr. PaedDr. Stanislav Katina, PhD. Prof. RNDr. Jozef Komorník, DrSc. RNDr. Samuel Koróny Doc. Ing. Milan Kovačka, CSc. Doc. RNDr. Bohdan Linda, CSc. Prof. RNDr. Jozef Mládek, DrSc. Doc. RNDr. Oľga Nánásiová, CSc. Doc. RNDr. Karol Pastor, CSc. Prof. RNDr. Rastislav Potocký, CSc. Doc. RNDr. Viliam Páleník, PhD. Ing. Iveta Stankovičová, PhD. Doc. RNDr. Beata Stehlíková, CSc. Prof. RNDr. Michal Tkáč, CSc. Ing. Vladimír Úradníček, PhD. Ing. Boris Vaňo Doc. MUDr Anna Volná, CSc., MBA. Ing. Mária Vojtková, PhD. Prof. RNDr. Gejza Wimmer, DrSc. Mgr. Milan Žirko Ročník III. Číslo 4/2007 Cena výtlačku 500 SKK / 20 EUR Ročné predplatné 1500 SKK / 60 EUR OBSAH Jitka Bartošová: Mzdy v ČR, SR a Rakousku .............................................................................. 2 Zuzana Berčačinová: Hodnotenie ekonomickej efektívnosti v leasingových spoločnostiach expertným hodnotením .................................................................................................................... 8 Martin Boďa: Miera rizika v kontexte Bazilejskej kapitálovej dohody z roku 1988 .................. 10 Hana Boháčová: Odhad variančních komponent v lineárním regresním modelu neúplného měření vektorového parametru...................................................................................................... 17 Rastislav Čief: Nové demografické trendy vo svete v roku 2006 podľa štatistík OSN............... 23 Anton Dubčák: Aktuálny stav Informačného systému registra obyvateľov SR ......................... 28 Rudolf Gavliak – Vladimír Úradníček: Vybrané jednofaktorové modely krátkodobej úrokovej sadzby ............................................................................................................................................ 34 Jozef Chajdiak: Aditívne rozklady pridanej hodnoty ................................................................. 39 Karel Hrach: Vývoj souhrnného ukazatele nezaměstnanosti v Ústeckém a Libereckém kraji .. 41 Ivan Janiga – Ivan Garaj: Štatistický tolerančný interval – nástroj riadenia kvality................. 46 Mária Kanderová: Vplyv determinantov kapitálovej štruktúry na zadlženosť slovenských podnikov ........................................................................................................................................ 58 Alena Kaščáková – Gabriela Nedelová: Zahraničná migrácia na Slovensku v rokoch 1996 - 2006................................................................................................................................... 64 Samuel Koróny: Dvojkroková zhluková analýza stavebných podnikov ..................................... 68 Pavol Kráľ – Rudolf Gavliak – Vladimír Hiadlovský: Použitie faktorovej analýzy pri predikcii finančnej situácie podnikov v SR s využitím SPSS ...................................................................... 74 Jana Kubanová – Bohdan Linda: Přesnost odhadu v autoregresních modelech...................... 81 Jana Kubanová – Bohdan Linda – Pavel Semerák: Přesnost odhadu v autoregresních modelech při použití metody klouzavých bloků ........................................................................... 89 Ján Luha: Dva pohľady na reprezentatívnosť ............................................................................. 94 159 Jiří Neubauer: Analýza civilní a vojenské inflace pomocí kointegrace...................................... 98 Jakub Odehnal – Jaroslav Michálek: Hodnocení míry regulace prostřednictvím statistických klasifikačních metod ................................................................................................................... 104 Zuzana Poláková: Komparácia krajov slovenskej republiky z hľadiska prirodzeného prírastku obyvateľstva ................................................................................................................................ 109 Jitka Poměnková – Lenka Němcová: Využití vícerozměrné regresní analýzy při identifikaci faktorů ovlivňujících klesající porodnost v České republice ...................................................... 116 Rastislav Potocký: Modelovanie nárokov v neživotnom poistení ............................................ 122 Marek Sedlačík: Využití a význam plochy pod ROC křivkou.................................................. 127 Beáta Stehlíková: Zdravie a ekonomický rast .......................................................................... 133 Katarína Šebejová: Porovnanie vybraných metód pre ranking podnikov v odvetví ................ 137 Jana Šimsová: Wavelety a časové řady ..................................................................................... 143 Božena Viktorínová: Prognóza cien jatočných ošípaných spektrálnou analýzou a nákupnej ceny mlieka nelineárnym regresným modelom .................................................................................. 149 Mária Vojtková: Vplyv úpravy charakteru premenných na metódy viackriteriálneho hodnotenia ................................................................................................................................... 153 160 Mzdy v ČR, SR a v Rakousku Jitka Bartošová 1 Abstract: Wage contributes to determination of equilibrium in the internal market, it is a strong stimulus leading to limitation of unemployment and also it forms one of the basic conditions of satisfaction of an employed individual. Identification of wage level and comparison with other countries is therefore in the focus of economists and politicians in all developed countries. This contribution deals with comparison of wage situations in the Czech Republic, Slovakia and Austria. Key words:, Sampling survey, Wage level, Wage variability. 1. Úvod Mzdou rozumíme odměnu za práci, přeměněnou formu hodnoty pracovní síly vyjádřenou v penězích. Zaměstnanci se mzda jeví jako cena vykonané práce, z hlediska produktu je mzda peněžním vyjádřením části výrobních nákladů spojených s vynaložením lidské práce. Mzda má několik funkcí. Především má funkci stimulační, neboť ovlivňuje materiální a duchovní podmínky pracujících. Má ale rovněž funkci sociální, která souvisí s uspokojováním potřeb pracujících a funkci regulační, která spolupůsobí při utváření rovnováhy na vnitřním trhu. Znalost úrovně a variability mezd a možnost jejich porovnávání z různých sociálněekonomických a časově-prostorových hledisek přispívá k posouzení životní úrovně obyvatelstva. Zjišťování úrovně mezd a srovnávání s dalšími státy je proto v popředí zájmů ekonomů i politiků všech vyspělých zemí. Aktuálním stavem a vývojem mezd v ČR se ve svých článcích zabývali Např. MAREK, L., VRABEC, M. 2007 (1), (2). 2. Výběrové šetření úrovně mezd v jednotlivých zemích Česká republika Úroveň mezd v České republice monitoruje průběžně Český statistický úřad. Úroveň se zjišťuje na základě průměrných hodinových výdělků, vyplacené mzdy a odpracované doby jednotlivých zaměstnanců za sledované období. Šetření provádí v ČR pracoviště státní statistické služby Ministerstva práce a sociálních věcí. Jeho průběh řídí komise složená ze zástupců Ministerstva práce a sociálních věcí, Ministerstva financí, Českého statistického úřadu, České národní banky, CERGE-EI, VŠE v Praze, Českomoravské konfederace odborových svazů, Svazu průmyslu a dopravy ČR. Zpracovatelem Informačního systému o průměrném výdělku (ISPV), který je zdrojem dat pro tento příspěvek je Trexima, spol. s.r.o. Zlín (viz ISPV, Informační systém o průměrném výdělku, Úvod, str. 7). Hrubá měsíční mzda je vypočítávána i z dalších přímo zjišťovaných mzdových položek a nemzdových plnění. Hrubá mzda je v příručce k ISPV definována jako součet mzdy za práci, náhrad mzdy a odměn za pracovní pohotovost. Přesný vzorec pro její výpočet je: MZDAi + POHOTOVi + NAHRADYi , (1) HMM i = MES _ PLACi kde HMMi je hrubá měsíční mzda i-tého zaměstnance, MZDAi je mzda za práci i-tého zaměstnance v kumulaci za sledované období, 1 Jitka Bartošová, Vysoká škola ekonomická Praha, Fakulta managementu 2 POHOTOVi je odměna za pohotovost i-tého zaměstnance v kumulaci za sledované období, NAHRADYi jsou náhrady mzdy i-tého zaměstnance v kumulaci za sledované období, MES_PLACi je počet placených měsíců i-tého zaměstnance. Roční zjišťování hrubých mezd a odpracované doby v ISPV tvoří základ pro strukturální šetření výsledků ČSÚ a pro šetření „Structure of Earnings Survey“, prováděné Eurostatem. Nejdůležitější kriterium pro šetření výsledků ISPV je, zda šetřený ekonomický subjekt přísluší k podnikatelské nebo nepodnikatelské sféře. Do podnikatelské sféry ISPV jsou zahrnuty subjekty odměňující podle zákona č. 1/1992 Sb. o mzdě, odměně za pracovní pohotovost a o průměrném výdělku. V nepodnikatelské sféře šetření ISPV se nacházejí ekonomické subjekty odměňující podle zákona č. 143/1992 Sb. o platu a odměně za pracovní pohotovost v rozpočtových a v některých dalších organizacích a orgánech (viz ISPV, Informační systém o průměrném výdělku, Úvod, str. 7). Informační systém o nepodnikatelské sféře pokrývá celý nepodnikatelský sektor a údaje jsou předávány jako plošné šetření, zatímco šetření v podnikatelské sféře je výběrové. Vzhledem k tomu, že výsledky z podnikatelského sektoru obecně více vypovídají o úrovni ekonomiky státu, zaměříme se zde pouze na šetření mezd v podnikatelském sektoru. Vybraný vzorek podnikatelských subjektů kopíruje strukturu podnikatelské sféry národního hospodářství ČR. Do analýzy jsou zahrnuty podniky s deseti a více zaměstnanci. Pro podnikatelské jednotky s 10 až 249 zaměstnanci je šetření výběrové, pro jednotky s 250 a více zaměstnanci je šetření vyčerpávající. Statistické šetření zahrnuje celkem 3153 ekonomických subjektů, které dohromady mají asi 1 240 000 zaměstnanců. Z hlediska územního členění bylo prošetřeno 504 (tj. 15,98%) ekonomických subjektů z hlavního města Prahy, 327 (tj. 10,37%) subjektů ze Středočeského kraje, 194 (tj. 6,15%) z Jihočeského kraje, 138 (tj. 4,38%) z Plzeňského kraje, 99 (tj. 3,14%) z Karlovarského kraje, 188 (tj. 5,96%) z Ústeckého kraje, 138 (tj. 4,38%) z Libereckého kraje, 168 (tj. 5,33%) z Královéhoradeckého kraje, 148 (tj. 4,69%) z Pardubického kraje, 229 (tj. 7,26%) z kraje Vysočina, 342 (tj. 10,85%) z Jihomoravského kraje, 180 (tj. 5,71%) z Olomouckého kraje, 189 (tj. 5,99%) ze Zlínského a 309 (tj. 9,8%) z Moravskoslezského kraje. Výběrovou oporu pro výběr organizací tvořil Registr ekonomických subjektů, který je detailně popsán na stránkách Českého statistického úřadu. Výběrový soubor byl pořízen prostřednictvím jednostupňového stratifikovaného výběru, při němž byl základní soubor rozdělen do oblastí (strat) podle odvětvových skupin, regionů a velikostních skupin. V jednotlivých oblastech základního souboru byl vybrán předem stanovený podíl ekonomických subjektů. Subjekty s 1000 a více zaměstnanci byly do šetření zahrnuty všechny, u ekonomických subjektů s 250 až 999 zaměstnanci se výběrový podíl postupně navyšoval tak, aby v roce 2007 dosáhl 100%. Menší ekonomické subjekty byly vybírány systematickým náhodným výběrem bez vracení s nestejnými pravděpodobnostmi. Výběrový soubor je obměňován metodou rotujícího panelu s periodou rotace 9 let. K úplné obměně tedy dojde za 9 let (viz ISPV-PS, Technický popis šetření, str. 63). Do šetření jsou zahrnuti pouze zaměstnanci zaměstnaní na plný pracovní úvazek, jejichž pracovní doba je alespoň 30 hodin týdně. Informační systém o průměrném výdělku obsahuje hodinové výdělky a tedy i průměrné měsíční mzdy roztříděné podle - zaměstnání, - hlavních tříd KZAM-R (Rozšířená klasifikace zaměstnání), - kategorizace zaměstnání na manuální / nemanuální, - tarifních stupňů, 3 - věkových kategorií, vzdělání, pohlaví, kategorie odvětví OKEČ (Odvětvová klasifikace ekonomických činností), krajů. Slovenská republika Ve Slovenské republice prováděl Slovenský štatistický úrad v průběhu roku 2006 šetření o struktuře mezd za rok 2005. Navázal tím na obdobná šetření, která probíhala v letech 1996 - 2003. Šetření pro rok 2005 bylo prováděno v rámci projektu PHARE a konzultováno s experty INSEE Paříž. Šetření metodicky vycházelo z doporučení Statistického úřadu Evropské unie (Eurostat) a přímo navazovalo na nařízení Rady (ES) č. 530/1999 o strukturální statistice příjmů a nákladů práce, nařízení Komise (ES) č. 1738/2005, které obsahuje definici a přenos informací o struktuře příjmů a na nařízení Komise (ES) č. 72/2002, týkající se hodnocení kvality strukturální statistiky příjmů. Provedené šetření zároveň respektovalo usnesení vlády SR č. 43 ze dne 14. ledna 1997 k návrhu realizačního projektu Koncepce ceny práce, vypracovanému Ministerstvem práce, sociálních věcí a rodiny SR. Hlavními cíli tohoto šetření bylo získání informací o struktuře a diferenciaci mezd osob podle - zaměstnání, - pohlaví, - věku, - vzdělání, - odvětví, - krajů a dalších klasifikací. Výsledky zjišťování mají za úkol zabezpečit vnitrostátní potřebu informací za současného respektování požadavků Eurostatu, jsou tedy uzpůsobeny tak, aby je bylo možné porovnat s ostatními státy EU. To umožňuje zejména správná definice primárních a sekundárních proměnných a jednotná klasifikace vysokoškolského vzdělání. Jako novinku musela SR zahrnout do šetření rovněž podniky s méně než 10 zaměstnanci. Zdrojem pro výběr organizací, které byly do analýzy zahrnuty, byl Registr organizací a Registr podniků. Pro vytvoření výběrového souboru byla použita metoda náhodného výběru v rámci stratifikovaných skupin, respektující odhad počtu neaktivních jednotek. Vygenerovaný statistický soubor k 1.1.2005 obsahoval 55 917 právnických statistických jednotek. Výběrový soubor pro rok 2005 zahrnoval 3 037 jednotek ze zjišťování za rok 2004 (1. podsoubor), 520 jednotek vybraných podle stratifikačních kritérií OKEČ (2. podsoubor) a 383 jednotek vybraných vyčerpávajícím způsobem. Pro vytvoření výběrového souboru byla použita metoda definování výběrového poměru pro každou oblast – POWER METHOD: CP1h ⋅ CA ⋅ 1 − CAh , (2) CS= 1h CS1 ⋅ ∑ CP1h ⋅ CAh ⋅ 1 − CAh k kde CS1 h CP1h k CAh CS1 CP1 je počet organizací ve výběrovém souboru z h-té oblasti, je počet organizací v opoře výběru h-té oblasti, je počet oblastí (strat), je poměr aktivních a neaktivních jednotek v h-té oblasti, je počet organizací v celém výběrovém souboru, je celkový počet organizací v opoře výběru. Sběr údajů zabezpečovala organizace Trexima. Organizace zahrnuté do analýzy zaměstnávaly celkem 670 305 zaměstnanců, což představuje 32,3 % celkové zaměstnanosti v 4 ekonomice SR. Z hlediska územního členění bylo 21,13 % vzorků z Bratislavského kraje, 12,7 % z Prešovského kraje, 12,5 % ze Žilinského kraje, 12,2 % z Banskobystrického kraje, 11 % z Nitranského kraje, 10,7 % z Trenčínského a Košického kraje a 8,9 % z Trnavského kraje. Všechny kraje Slovenské republiky mají tedy v analýze přibližně stejné zastoupení. Rakousko Z výše uvedeného popisu je vidět, že šetření za ČR a SR jsou si velmi podobná a zveřejněné výstupy obsahují aktuální informace. Šetření rakouského statistického úřadu probíhá s poměrně velkým časovým zpožděním. Na internetových stránkách rakouského statistického úřadu se v současnosti nachází výzva, aby lidé odpovídali na dotazníky týkající se šetření z roku 2005. Nejčerstvější údaje, které jsou na těchto internetových stránkách k dispozici, jsou z roku 2003. Také co se týká obsáhlosti, nemohou tyto informace konkurovat uveřejňovaným údajům z šetření prováděném v ČR nebo SR. Je zde uvedeno pouze několik málo základních údajů. Přesto se domnívám, že srovnání rakouských údajů s údaji za ČR a SR bude zajímavé, neboť např. na serveru www.novinky.cz (viz http://www.novinky.cz/ ekonomika/prumerna-mzda-vzrostla-o-1220-korun-20-211-kc_110958_2fuop.html) je uveřejněno, že „Rakušané stále mají až čtyřikrát větší mzdu než Češi“. Podobně jako se v ČR a SR používá klasifikace pracovních činností KZAM, v Rakousku se používá systém klasifikace ÖNACE. Ze stránek rakouského statistického úřadu vyplývá, že ÖNACE 2003 je hospodářská statistika v rakouské verzi evropské klasifikace pracovních činností (NACE, ref. 1.1), která se závazně používá ve všech členských státech EU od 1.1.2003, dle nařízení č. 29/2002 Evropské komise ze dne 19.12.2001. NACE znamená Nomenclature générale des activités économiques dans les communautés européennes, což je doslovně přeloženo Klasifikace hlavních ekonomických aktivit evropského společenství. ÖNACE 2003 je následná verze ÖNACE 1995, se kterou se v Rakousku s touto koncepcí začínalo. ÖNACE se označuje jako rozdělení podle odvětví. Obsahuje všechny pracovní činnosti a má celkem 6 rozdělovacích rovin: oddíly, pododdíly, oddělení, skupiny, třídy a podtřídy. Oddíly jsou označeny písmeny A - Q, pododdíly písmeny AA - QA, oddělení jsou označovány čísly 01 - 99, skupin je 224, tříd 514 a podtříd 722. Klasifikační pravidla pro popis pracovních činností, všeobecná pravidla, speciální pravidla a pravidla pro speciální obory, jako jsou například velkoobchod, maloobchod, zprostředkovatelské činnosti apod., jsou na stránkách rakouského statistického úřadu rozsáhle rozpracovány. Systém šetření úrovně mezd v Rakousku se podobá šetření v ČR a SR, pouze místo velmi rozsáhlé Rozšířené klasifikace KZAM-R se používá klasifikace ÖNACE. Zveřejněné údaje obsahují pouze část této klasifikace, podrobnější informace lze získat z publikace, kterou je možné si objednat na internetových stánkách Statistik Austria (viz htttp://www. statistik.at/). 3. Srovnání mzdové situace v ČR, SR a Rakousku K tomu, abychom mohli porovnat úroveň a variabilitu mezd v různých státech, je nezbytné použít jednotnou měnovou jednotku. Proto byly hodnoty uvedené v SKK a EURO přepočítány na hodnoty v Kč. Tento převod byl proveden podle měnového kurzu ČNB ze dne 8.4.2007, dostupného na adrese http://www.cnb.cz/www.cnb.cz/cz/financni_trhy/devizovy_ trh/kurzy_devizoveho_trhu/denni_kurz.jsp (viz Tabulka 1.). Tabulka 1. Kurzovní přepočet 100 SKK 83,578 Kč 1 EURO 27,905 Kč 5 Tabulka 2. Srovnání úrovně a variability mezd v ČR, SR a Rakousku (AU) Charakteristika SR ČR AU AU – ČR ČR – SR AU/ ČR ČR/ SR x (Kč) 15 465 21 815 73 659 51 844 6 350 3,38 1,41 ~ (Kč) x50 12 399 18 140 58 677 40 537 5 741 3,23 1,46 ~ x 25 (Kč) 9 054 13 737 35 688 21 951 4 683 2,60 1,52 ~ x75 (Kč) 17 180 24 219 87 221 63 002 7 039 3,60 1,41 ~ x10 (Kč) 6 934 10 561 18 671 8 110 3 627 1,77 1,52 ~ x90 (Kč) 24 690 33 811 130 247 96 436 9 121 3,85 1,37 ~ x − x50 (Kč) 3 066 3 675 14 982 11 307 609 4,08 1,20 ~ ~ x75 − x 25 (Kč) 8 126 10 482 51 533 41 051 2 356 4,92 1,29 ~ ~ x90 − x10 (Kč) 17 756 23 250 111 576 88 326 5 494 4,80 1,31 x (%) ~ x50 125 120 126 1,04 0,96 5 -4 ~ x75 (%) ~ x 25 190 176 244 1,39 0,93 68 - 13 ~ x90 (%) ~ x10 356 320 698 2,18 0,90 377 - 36 ~ ~ x75 − x 25 (%) ~ x75 + ~ x 25 31 28 42 14 -3 1,52 0,89 Úroveň hrubých mezd v ČR, SR a Rakousku 140000 AU Hodnota mzdy (Kč) 120000 100000 AU SR 80000 ČR 60000 AU 40000 20000 0 AU AU AU ČR SR x10 ČR SR ČR SR x25 x50 ČR SR x75 ČR SR x90 Kvantil Graf 1. Srovnání úrovně mezd v Čechách na Slovensku a v Rakousku Výsledky porovnávání mzdové situace v Čechách, na Slovensku a v Rakousku jsou zachyceny v Tabulce 2. a zobrazeny v Grafu1. Pro charakterizaci úrovně je v tabulce je uvedena průměrná hrubá měsíční mzda x , prostřední (mediánová) hrubá měsíční mzda ~ x50 , 6 mzda, která je pro maximální čtvrtinu obyvatelstva (dolní kvartil ~ x 25 ) a pro tři čtvrtiny obyvatelstva (horní kvartil ~ x75 ), dále pak horní hranici pro 10% jedinců s nejnižší mzdou ~ (první decil x10 ) a dolní hranici pro 10% pracovníků dosahujících nejvyššího ohodnocení (poslední decil ~ x90 ). K vystižení absolutní variability mezd je zde použito kvartilové rozpětí ~ ~ x75 − x 25 . Navíc jsou zkonstruovány další statistiky, které umožňují ukázat, jaký je rozdíl mezi hrubou mzdou „horních 10%“ a „dolních 10%“ ( ~ x90 − ~ x10 ) a jak se odlišuje průměrná mzda od mediánové, což souvisí se zešikmením mzdového rozdělení. Relativní variabilita je ~ x75 − ~ x 25 a pro upřesnění představy o relativní variabilitě vyjádřena kvartilovou odchylkou ~ ~ x75 + x 25 ~ x x x ~ a zešikmení mzdového rozdělení slouží další podílové charakteristiky ( ~ , ~75 a ~90 ). x10 x50 x 25 4. Závěr Z výsledků porovnání vyplývá, že úroveň mezd v Čechách a na Slovensku je téměř stejná, v ČR je nepatrně vyšší (např. průměrná hrubá mzda je v ČR 1,41 mzdy v SR, mediánová je 1,46 krát vyšší). Srovnání českých a rakouských hrubých mezd.potvrzuje tvrzení, že v Rakousku jsou mzdy téměř čtyřnásobné (průměrná mzda je vyšší 3,38 krát, mediánová 3,32 krát a „horních 10%“ má v Rakousku dokonce 3,85 krát více než v Čechách). Za zmínku stojí rovněž vysoká diferenciace rakouských mezd – rozdíl mezi prvním a posledním decilem činí přes 100 tisíc Kč. České mzdy naopak vykazují nejnižší relativní variabilitu vyjádřenou relativní kvartilovou odchylkou (28%); na Slovensku je to 31% a v Rakousku dokonce 42%. 5. Literatura MAREK, L., VRABEC, M. 2007 (1). Mzdová rozdělení v ČR dle pohlaví a věku. Brno 08.03.2007 – 09.03.2007. In: FIRMA A KONKURENČNÍ PROSTŘEDÍ 2007. Brno : MSD, s. 84–90. ISBN 978-80-86633-86-2. MAREK, L., VRABEC, M. 2007 (2). Vývoj mezd v krajích ČR podle věku a pohlaví. Olomouc 23.05.2007 – 24.05.2007. In: REGIONÁLNÍ DEMOGRAFIE [CD-ROM]. Praha : DemoArt pro Českou demografickou společnost, s. 197–206. ISBN 80-86746-04-6. ISPV, Informační systém o průměrném výdělku, Čtvrtletní výběrové statistické zjišťování, 2005, IV. čtvrtletí Podnikatelská sféra. http://www.novinky.cz/ekonomika/prumerna-mzda-vzrostla-o-1220-korun-20-211-c_110958 _2fuop.html htttp://www.statistik.at/ http://www.cnb.cz/www.cnb.cz/cz/financni_trhy/devizovy_trh/kurzy_devizoveho_trhu/denni _kurz.jsp Adresa autora: Jitka Bartošová, RNDr., PhD. Jarošovská 1117/II 377 01 Jindřichův Hradec [email protected] 7 Hodnotenie ekonomickej efektívnosti v leasingových spoločnostiach expertným hodnotením Zuzana Berčačinová 1 Abstract: The paper consists the analysis of economical efficiency of leasing firms. Keywords: profitability, productivity of labor, rentability, Excel, leasing firms. K hodnoteniu ekonomickej efektívnosti organizácie, resp. súboru organizácii sa môže použiť aj expertné hodnotenie. V mojej práci k špecifikácii ekonomickej efektívnosti leasingovej spoločnosti používame šesť čiastkových ukazovateľov: - ziskovosť, - rentabilita vlastného imania, - produktivita celkového kapitálu, - finančná produktivita práce, - podiel pridanej hodnoty na výnosoch, - úrokové krytie. Experti na bodovej stupnici od –2 (veľmi zlá hodnota) po +2 (veľmi dobrá hodnota) ohodnotia dosiahnuté hodnoty príslušných ukazovateľov. Tieto ocenenia sa agregujú buď priemerom alebo úhrnom do agregovaného ocenenia dosiahnutej ekonomickej efektívnosti hodnotenej organizácie. Vo svojej práci pracujem z dvomi súbormi hodnotiteľov: - sedem členný tím vysokokvalifikovaných expertov, - a súbor hodnotiteľov pozostávajúcich zo všetkých zamestnancov hodnotenej organizácie. K zisteniu hodnotení ukazovateľov jednotlivými expertmi a súborom hodnotiteľov som použila nasledujúci dotazník: Hodnotenie ekonomickej efektívnosti leasingovej spoločnosti B.O.F. a slovenského leasingového trhu v rokoch 2005 a 2006 Hodnotiteľ:..................................................................... Pohlavie: 1. muž 2. žena Vek: 1. 20 – 29 rokov 2. 30 – 39 rokov 3. 40 – 49 rokov 4. 50 – viac rokov Vzdelanie: 1. stredoškolské 2. vysokoškolské I. stupňa 3. vysokoškolské II. stupňa 4. vedecký titul Odbornosť: 1. ekonomická 1 Ing. Zuzana Berčačinová, Patria, a.s. 8 2. iná Kompetentnosť hodnotiteľa: 1. žiadna kompetentnosť hodnotiť dané ukazovatele 2. mierna kompetentnosť hodnotiť dané ukazovatele 3. stredná kompetentnosť hodnotiť dané ukazovatele 4. vysoká kompetentnosť hodnotiť dané ukazovatele Hodnotenie ukazovateľov efektívnosti: Na hodnotenie daného stavu jednotlivých ukazovateľov použite prosím bodovú stupnicu od –2 (veľmi zlá hodnota) po +2 (veľmi dobrá hodnota) s krokom po pol bode (-2; -1,5; -1; -0,5; 0; +0,5; +1; +1,5; +2). -2 -1 veľmi zlá hodnota Ukazovateľ Výpočet ukazovateľa ziskovosť 100*(zisk/výnosy) rentabilita 100*(zisk/vlastné vlastného imanie) imania produktivita výnosy/celkový kapitál celkového kapitálu finančná pridaná hodnota/osobné produktivita náklady práce podiel pridanej 100*(priadaná hodnoty na hodnota/výnosy) výnosoch (nákladové úrokové krytie úroky+zisk)/nákladové úroky 0 Hodnota ukazovateľa leazingového trhu 2005 1 Hodnotenie 2 veľmi dobrá hodnota Hodnota ukazovateľa Hodnotenie BOF 2005 Hodnota ukazovateľa BOF 2006 1,84 21,18 18,45 -15,26 13,09 11,37 0,99 0,15 0,13 22,50 4,99 5,27 25,00 62,81 66,45 1,93 2,28 1,86 Hodnotenie Výsledky hodnotiteľov z dotazníka sú predmetom ďalšieho spracovania a analýzy v mojej spracovávanej doktorandskej práce. Literatúra: Chajdiak, J.: Štatistické úlohy a ich riešenie v Exceli, Bratislava, STATIS, 2005, ISBN: 8085659- 39-5 Chajdiak, J.: Ekonomická analýza stavu a vývoja firmy, Bratislava, STATIS, 2004, ISBN: 8085659-32-8 Berčačinová, Z.: Kvantitatívna analýza ekonomických výsledkov lízingových spoločností. In: Štatistické metódy vo vedecko-výskumnej práci 2003, Bratislava, SŠDS, 2003, ISBN: 8088946-32-8, s.67-69 Adresa autora: [email protected] 9 Miera rizika v kontexte Bazilejskej kapitálovej dohody z roku 1988 Martin Boďa 1 Abstract: 1988 Basel Capital Accord represents a considerable milestone in the measuring of risk for the regulatory purpose. Even though the accord has been subject to evolutionary changes and its original concept has been surpassed in terms of complexity, at the time the accord established a comprehensive benchmark measure of credit risk at the international level. The paper acknowledges its significance and summarizes its flaws. Key words: Basel Capital Accord, capital requirements, regulatory capital, economic capital, credit risk, credit transfer risk, risk-weighted assets, Cooke ratio. 1. Úvod Reguláciou finančnej sféry sa vo verejnom záujme sleduje zachovanie integrity finančného systému a zabezpečenie jeho dôveryhodnosti cez ochranu investorov pred nadmernými rizikami (stratami). Jedným z nástrojov, ktorými sú regulované depozitné finančné inštitúcie (banky) aj nedepozitné finančné inštitúcie (poisťovne, zaisťovne, správcovské spoločnosti a obchodníci s cennými papiermi), sú pravidlá kapitálovej primeranosti. Konkrétne formy a rozsah regulácie činnosti finančných inštitúcií sú v jednotlivých krajinách diferencované, avšak od druhej polovice 80. rokov 20. storočia dominuje medzi regulátormi snaha o harmonizáciu pravidiel pre činnosť regulovaných inštitúcií. Nositeľom internacionalizačných tendencií a advokátom myšlienky jednotného globálneho rámca regulácie je v súčasnosti Bazilejský výbor pre bankový dohľad 2, ktorý určuje rámec pre činnosť národných regulačných orgánov a presadzuje jednotný globálny systém stanovovania kapitálových požiadaviek. Prvým hmatateľným výstupom činnosti výboru boli v roku 1988 minimálne kapitálové požiadavky pre banky, ktoré sa stali známe ako Bazilejská kapitálová dohoda (alebo Bazilej I). Napriek tomu, že prístup kapitálových požiadaviek obsiahnutý v bazilejskej dohode je v súčasnosti vnímaný ako rudimentárny a je prekonaný ďalšími riešeniami bazilejského výboru (Nová Bazilejská kapitálová dohoda / Bazilej II), predstavuje významný medzník, ktorým sa meranie rizika povýšilo na úroveň medzinárodnej regulácie a zhmotnilo sa do podoby. V článku je prezentovaná bazilejská metóda na meranie rizika v kontexte prvej Bazilejskej kapitálovej dohody. 2. Kapitálová primeranosť Pravidlá kapitálovej primeranosti stanovujú finančným inštitúciám povinnosť periodicky (denne) vyhodnocovať svoje finančné riziko vo všetkých formách a v tomu primeranej výške udržiavať vlastné zdroje, ktoré by v prípade realizácie identifikovaného rizika absorbovali stratu v plnej výške. Výška vlastných zdrojov sa predpisuje prostredníctvom výšky kapitálových požiadaviek (capital charges / capital requirements). Cieľom tohto postupu je ochrana klientov finančnej inštitúcie tým, že potenciálny prepad na Martin Boďa, Univerzita Mateja Bela v Banskej Bystrici, Ekonomická fakulta. Bazilejský výbor pre bankový dohľad (Basel Committee on Banking Supervision, BCBS) bol zriadený koncom roku 1974 (pod záštitou bazilejskej Banky pre medzinárodné platby. Zakladajúcimi štátmi boli krajiny G-10 (tzn. Belgicko, Francúzsko, Holandsko, Japonsko, Kanada, Nemecko, Spojené štáty americké, Švajčiarsko, Švédsko, Taliansko a Veľká Británia) a v súčasnosti je tvorený reprezentantmi centrálnych bánk a regulačných orgánov zakladajúcich krajín G-10 a Luxemburska. Bazilejský výbor presadzuje bezpečnosť a spoľahlivosť globálneho finančného systému a vytvára systém rovnakých pravidiel pre globálne finančné inštitúcie. Napriek tomu, že jeho poslanie bolo dizajnované na úrovni koordinačného a iniciatívneho orgánu, v priebehu svojej činnosti sa z neho vyvinul tvorca štandardov pre aspekty bankového dohľadu. 1 2 10 strane aktív exponovaných finančnému riziku má byť primárne krytý vlastnými zdrojmi (kapitálom) finančnej inštitúcie, a teda jej vlastníkmi. Ústrednou kategóriou pri stanovovaní kapitálových požiadaviek je pojem kapitálu. Kapitál sa regulačne nevymedzuje v súlade s účtovným ponímaním ako reziduálna suma majetku (tzn. časť aktív subjektu nezaťažená jeho záväzkami, resp. čisté aktíva), ale uplatňuje sa jeho širšie chápanie a okrem vlastných zdrojov sa doňho zahrňujú aj niektoré druhy záväzkov. Položky kapitálu sa tiež nechápu rovnocenné, ale sú kvalitatívne diferencované podľa spôsobilosti kryť stratu finančnej inštitúcie. Od účtovnej definície pojmu kapitálu je možné rozlíšiť odchodné pojmy, ktoré vystupujú v terminológii koncepcie kapitálovej primeranosti: regulačný (regulatívny) kapitál a ekonomický kapitál. • Regulačný (regulatívny) kapitál (podľa Svitek, 2006, s. 10) „predstavujú fondy (pasíva v bilancii finančnej inštitúcie), ktorými prispeli akcionári a špecifickí veritelia“. Položky, ktoré sa doňho zahŕňajú, majú byť regulačným orgánom definované tak, aby v prípade straty finančnej inštitúcie neboli ohrozené nároky ostatných veriteľov (klientov finančnej inštitúcie). Začlenenie, resp. nezačlenenie jednotlivých položiek do regulačného (regulatívneho) kapitálu môže byť pre regulačný orgán v princípe voliteľné, ale musí byť pritom rešpektovaná jeho spôsobilosť zachovávať nároky klientov finančnej inštitúcie. • Ekonomický kapitál zodpovedá takému objemu vlastných zdrojov, ktorý v prípade realizácie straty dovoľuje finančnej inštitúcii pokračovať kontinuálne v činnosti. Je určený minimálnou výškou fondov, ktorými musia prispieť akcionári, aby strata z činnosti bola kapitálom finančnej inštitúcie plne absorbovaná a finančná inštitúcia nebola predlžená (čo by teoreticky malo znamenať, že existencia finančnej inštitúcie by bola zachovaná). Žiada sa zdôrazniť, že pokiaľ je regulačný (regulatívny) kapitál vymedzený konkrétnym taxatívnym výpočtom položiek pasív v bilancii, ekonomický kapitál je abstraktnou kategóriou (tzn. nie je reprezentovaný konkrétnymi položkami) a je vymedzený iba výškou (objemom). 3. Medzinárodný rámec pre reguláciu finančného rizika - bazilejské kapitálové dohody Bazilejské kapitálové dohody (Basel Capital Accords) sú uverejňované ako dokument pod názvom Medzinárodná konvergencia merania kapitálu a kapitálových štandardov (International Convergence of Capital Measurement and Capital Standards). Nemajú charakter medzinárodných multilaterálnych dojednaní, ale sú nadnárodnými iniciatívami bazilejského výboru a vznikajú ako výsledok stretnutí reprezentantov regulačných orgánov dvanástich štátov zastúpených vo výbore. Pojem „dohoda“ má symbolizovať kompromisný dohovor na úrovni výboru, ktorý je syntézou objektívneho úsilia o reguláciu bankového sektora, názorov odborníkov z praxe a politického vplyvu záujmových skupín. Z formálneho hľadiska predstavujú štúdie (reports) bazilejského výboru a z vecného hľadiska zavádzajú minimálne štandardy pre meranie rizika bankového podnikania a uvádzajú odporúčanie pre stanovovanie kapitálových požiadaviek. I keď pôvodne boli koncipované ako odporúčania pre regulačné orgány štátov participujúcich v bazilejskom výbore, stupeň ich prepracovanosti a ich univerzálnosť vplyv na ich akceptáciu prakticky na celom svete. V súčasnosti sú jednotlivé návody a riešenia prezentované bazilejskými kapitálovými dohodami viac alebo menej transponované do právneho poriadku vyspelých štátov. Bazilejský koncept kapitálovej primeranosti bol predstavený v roku 1988 prvou kapitálovou dohodou a odvtedy prešiel evolučnými zmenami. Stručný prehľad a harmonogram zmien bazilejského konceptu kapitálovej primeranosť približuje schéma č. 1. Schéma vývoj bazilejských dohôd zjednodušuje, nakoľko nezobrazuje priebežné aktualizácie bazilejských dokumentov ani sprievodnú dokumentáciu. 11 1988 BAZILEJSKÁ KAPITÁLOVÁ DOHODA Z ROKU 1988 (BAZILEJ I) *) 1996 DODATOK KU KAPITÁLOVEJ DOHODE O PREVZATÍ TRHOVÝCH RIZÍK **) implementácia do (konca) roku 1992 implementácia do (konca) roku1997 1999 2001 2003 2004 VÝZVY NA PREDKLADANIE KOMENTÁROV K NOVEJ KAPITÁLOVEJ DOHODE PRVÝ KONZULTAČNÝ BALÍK DRUHÝ KONZULTAČNÝ BALÍK TRETÍ KONZULTAČNÝ BALÍK NOVÁ BAZILEJSKÁ KAPITÁLOVÁ DOHODA (BAZILEJ II) ***) implementácia od roku 2007 *) Publikované v júli 1998 ako dokument bazilejského výboru International Convergence of Capital Measurement and Capital Standards. **) Publikované v januári 1996 ako dokument bazilejského výboru Amendment to the Capital Accord to incorporate market risks. ***) Publikované v júni 2004 v dokumente International Convergence of Capital Measurement and Capital Standards. A Revised Framework. Schéma č. 1 Vývoj bazilejských kapitálových dohôd (od roku 1988 po rok 2004) Zdroj: Vlastné spracovanie. 4. Bazilejská kapitálová dohoda z roku 1988 Bazilejská kapitálová dohoda z roku 1988 (1988 Basel Capital Accord), označovaná tiež ako Bazilej I (Basel I), bola prijatá na úrovni bazilejského výboru 15. júla 1988. Jej význam sa odvodzuje od skutočnosti, že predstavuje prvý dokument na medzinárodnej úrovni, ktorý formuloval požiadavky na kapitál banky. Dohoda uvádzala do praxe bankovej regulácie mechanizmus pre stanovovanie minimálneho objemu kapitálu, ktorý by komerčným bankám aktívnym na medzinárodnej úrovni zabezpečil pokrytie finančných rizík. Od dohody sa očakávala postupná medzinárodná konvergencia (zjednotenie) regulátorských štandardov kapitálovej primeranosti v krajinách G-10, čo vysvetľuje názov dokumentu International Convergence of Capital Measurement and Capital Standards. Cieľom bazilejských štandardov kapitálovej primeranosti (síce na minimálnej úrovni) bolo vytvorením všeobecných a rovnakých podmienok pre komerčné banky posilniť zdravie a stabilitu medzinárodného bankového systému a odstrániť (konkurenčné) distorzie medzi medzinárodne aktívnymi bankami. Spomedzi rôznych druhov finančných rizík prvá bazilejská dohoda zohľadňovala iba úverové riziko (credit risk) a jeho osobitnú formu riziko prenosu rizika zo zahraničia (country transfer risk). Úverové riziko bolo definované ako riziko platobného zlyhania protistrany (bez ohľadu na to, či sa týkalo bilančných pohľadávok, alebo sa vzťahovalo k mimobilančným pozíciám). Požiadavky na kapitál sa zavádzali prostredníctvom pomeru kapitálu k rizikovo váženým aktívam (tzv. Cookovho pomeru 3): požadoval sa minimálne taký objem regulačného kapitálu, ktorý by zodpovedal aspoň 8 % rizikovo vážených aktív. Na plnenie kapitálovej primeranosti musela byť teda splnená nerovnosť • • regulačný kapitál ≥ 0.08 . rizikovo vážené aktíva Týmto pomerom bola zavedená všeobecná a akceptovaná miera solventnosti: i napriek tomu, že sa vzťahuje iba na úverové riziko. Označenie Cookov pomer pre ukazovateľ kapitálovej primeranosti sa odvodzuje od predstaviteľa bazilejského výboru v čase uvedenia Bazilejskej kapitálovej dohody Petra Cooka. 3 12 Regulačný kapitál (eligible capital), stotožňovaný tiež s kapitálovou základňou (capital base), bol bazilejskou dohodou vymedzený v dvoch úrovniach (tiers): • Kapitál prvého poradia, resp. jadrový kapitál (tier 1 / core capital) zahŕňal položky vlastného imania a predstavoval podstatu bankového kapitálu. Do kapitálu prvého poradia patrili (a) splatené základné imanie (obsahujúce splatené kmeňové akcie a večné nekumulatívne akcie) a (b) zverejnené fondy vlastného imania (obsahujúce emisné ážio, rezervné fondy, kapitálové fondy, fondy tvorené zo zisku, výsledok hospodárenia minulých rokov a bežný výsledok hospodárenia). 4 Do tejto vrstvy kapitálu sa nezahrňujú fondy z precenenia ani časť základného imania tvorené kumulatívnymi prioritnými akciami. • Kapitál druhého poradia, resp. doplnkový kapitál (tier 2 / supplementary capital) zahŕňal (a) nezverejnené fondy vlastného imania 5, (b) fondy z precenenia majetku na reálnu hodnotu, (c) rezervy, (d) hybridné kapitálové nástroje 6 a (e) podriadené záväzky. 7 Súbežne boli stanovené kvantitatívne obmedzenia pre zahrnutie oboch úrovní kapitálov v plnej výške; napríklad suma položiek kapitálu druhého poradia nesmie presahovať sumu položiek kapitálu prvého poradia. Uplatňovali sa odpočty od kapitálovej základne: • Kapitál prvej úrovne sa znížil o sumu goodwillu. • Celkový kapitál bol znížený o podiely na vlastnom imaní nekonsolidovaných dcérskych bánk a iných dcérskych finančných podnikov (v prípade konsolidovaného subjektu) a o podiely na vlastnom imaní iných bánk a finančných inštitúcií (v rozsahu stanovenom národným regulačným orgánom). Vrstvenie kapitálu v uvedených súvislostiach prehľadne ilustruje schéma č.2. ZLOŽENIE REGULAČNÉHO KAPITÁLU PODĽA BAZILEJA I KAPITÁL PRVÉHO PORADIA ZÁKLADNÝ KAPITÁL splatené základné imanie zverejnené fondy vlastného imania KAPITÁL DRUHÉHO PORADIA DOPLNKOVÝ KAPITÁL nezverejnené fondy vlastného imania fondy z precenenia majetku rezervy hybridné kapitálové nástroje podriadené záväzky ODPOČTY OD KAPITÁLU OD ZÁKLADNÉHO KAPITÁLU – goodwill OD CELKOVÉHO KAPITÁLU – podiely na nekonsolidovaných dcérskych bankách a iných dcérskych finančných podnikoch – podiely na iných bankách a finančných inštitúciách Schéma č. 2 Zloženie regulačného kapitálu (kapitálovej bázy) podľa Bazilejskej kapitálovej dohody z roku 1988 Zdroj: Vlastné spracovanie. 4 V prípade konsolidovaných subjektov sa do kapitálu prvého poradia taktiež zahrňujú menšinové podiely na základnom imaní dcérskych podnikov. 5 Obchodnoprávna úprava povoľuje bankám v niektorých krajinách vytvoriť fond z disponibilného výsledku hospodárenia a nevykázať ho v oficiálnej (publikovanej) bilancii. 6 Hybridné kapitálové nástroje majú akciovo-dlhový charakter a kombinujú v sebe charakteristiku vlastného imania a záväzku. Aby boli zahrnuté do kapitálu druhého poradia, mali by spĺňať požiadavky: (1.) Sú nezabezpečené, podriadené a plne splatené. (2.) Nie sú splatné z iniciatívy držiteľa alebo bez predchádzajúceho súhlasu regulačného orgánu. (3.) Sú k dispozícii na pokrytie strát bez toho, že by banka musela ukončiť svoju činnosť. (4.) Mal by umožňovať odklad splatnosti záväzku. Príkladom tejto kategórie sú dlhodobé prioritné akcie v Kanade, prioritné akcie v Spojenom kráľovstve, povinne konvertibilné dlhopisy v Spojených štátoch amerických. 7 Podriadené záväzky zahŕňajú nezabezpečené podriadené dlhové nástroje s pôvodnou dobou splatnosti aspoň 5 rokov, ako aj prioritné akcie so stanovenou (konečnou) splatnosťou. (Počas posledných piatich rokov pred splatnosťou sa použije ročný diskontný faktor 20 % p. a., aby sa v znižujúcej hodnote týchto nástrojov zohľadnil pokles ich spôsobilosti kryť stratu.) 13 Bazilejský výbor odporučil regulačný kapitál pomerovať k rizikovo váženým aktívam, ktoré boli ohodnotené podľa rizikovosti váhami 0 %, 10 %, 20 %, 50 % alebo 100 %. Váženie aktív podľa miery ich rizika odôvodnil tým, že oproti jednoduchej sumácii položiek • poskytuje spoľahlivejšiu základňu pre medzinárodné porovnávanie bankových systémov s odlišnou štruktúrou, • dovoľuje zahrnúť do rizikového pomeru i začlenenie mimobilančných položiek a • neodradzuje banky držať vysokolikvidné aktíva (s ktorými sa spája nízke riziko). Rizikovo vážené aktíva zohľadňovali i mimobilanciu banky a definovali sa vzťahom = rizikovo vážené aktívačtovná hodnota aktíva ú × riziková váha , ∑ bilancia i mimobilancia kde v prípade bilančnej položky za účtovnú hodnotu sa brala čistá účtovná hodnota aktíva (teda účtovná hodnota aktíva znížená o sumu vytvorených opravných položiek) a v prípade mimobilančnej položky sa bral úverový ekvivalent danej položky. Riziková váha vo vzťahu vyjadrovala príspevok aktíva k riziku. Nižšia riziková váha odrážala nižšiu rizikovosť aktíva a prakticky to znamenalo, že na účely výpočtu kapitálovej primeranosti do rizikovo váženej bilančnej sumy vstupovala s nižšou váhou. Rizikovú váhu 0 % mali pridelené položky aktív, ktoré sú (teoreticky) bezrizikové. Pridelenie váh položkám aktív je priblížené v schéme č. 3. POLOŽKA RIZIKOVÁ VÁHA 0% 0 %, 10 %, 20 % alebo 50 % **) 20 % 50 % 100 % Poznámky a odkazy a) peňažné prostriedky (a v rozsahu stanovenom národným regulačným orgánom aj zlaté ingoty) b) pohľadávky voči štátu a centrálnej banke denominované a poskytované v národnej mene c) ostatné pohľadávky voči štátom a centrálnym bankám krajín OECD *) d) pohľadávky kryté cennými papiermi štátov OECD alebo garantované štátmi OECD pohľadávky voči tuzemským subjektom verejného sektoru (s výnimkou štátu) a poskytnuté úvery garantované týmito subjektmi (s výnimkou štátu) a) pohľadávky voči nadnárodným rozvojovým bankám (IBRD, IADB, AsDB, AfDB, EIB) a pohľadávky garantované týmito bankami alebo kryté ich cennými papiermi b) pohľadávky voči bankám v krajinách OECD a poskytnuté úvery garantované týmito bankami c) pohľadávky voči bankám mimo krajín OECD so zostatkovou dobou splatnosti do jedného roka a poskytnuté úvery so zostatkovou dobou splatnosti do jedného roku garantované týmito bankami d) pohľadávky voči cudzozemským subjektom verejného sektoru krajín OECD (s výnimkou štátu) a a poskytnuté úvery garantované týmito subjektmi (s výnimkou štátu) e) peňažné prostriedky a ekvivalenty peňažných prostriedkov na ceste poskytnuté úvery v plnej hodnote zabezpečené hypotékou na tuzemské nehnuteľnosti, v ktorom dlžník býva alebo bude bývať, alebo na tuzemské nehnuteľnosti, ktoré sú v prenájme a) pohľadávky voči súkromnému sektoru b) pohľadávky voči bankám mimo krajín OECD so zostatkovou dobou splatnosťou nad jeden rok c) pohľadávky voči štátom mimo OECD (ak nie sú denominované a poskytované v národnej mene) d) pohľadávky voči súkromným spoločnostiam vlastnenými verejným sektorom e) stavby, zariadenia a iné fixné aktíva f) nehnuteľnosti a iné investície (okrem nekonsolidovaných podielov na vlastnom imaní iných spoločností) g) kapitálové nástroje vydávané inými bankami (ak nie sú predmetom odpočtu od kapitálu) h) všetky ostatné aktíva *) Za krajiny OECD sa považujú plní členovia OECD alebo krajiny, ktoré majú s Medzinárodným menovým fondom dojednanú osobitnú úverovú linku a čerpajú z prostriedkov Fund’s General Arrangements to Borrow. **) Stanovené národným regulačným orgánom. Schéma č. 3 Rizikové váhy položiek bilancie banky podľa Bazilejskej kapitálovej dohody z roku 1988 Zdroj: Vlastné spracovanie podľa Bazilejskej kapitálovej dohody z roku 1988. Mimobilančné položky sa v rizikovo vážených aktívach zohľadňovali konverziou na úverové ekvivalenty. Pre každú mimobilančnú položku bol stanovený konverzný faktor, ktorým sa reflektovala miera vystavenia položky úverovému riziku. Prenásobením účtovnej hodnoty každej mimobilančnej položky prideleným konverzným faktorom sa získal úverový ekvivalent, s ktorým sa ďalej pracovalo ako s bežnou bilančnou položkou (tzn., že mu bola pridelená riziková váha a bol ňou rizikovo vážený). Prideľovali sa štyri úverové konverzné faktory 0 %, 20 %, 50 %, 100 %. Nízke (resp. žiadne očakávané) riziko sa vyjadrovalo konverzným faktorom 0 % a plné riziko bolo zohľadnené konverzným faktorom 100 %. Po 14 získaní úverových ekvivalentov sa podľa charakteru protistrany (resp. podkladového obchodu) pridelila riziková váha v konzistencii so spôsobom uvedeným v schéme č. 3. Rizikovými váhami zo schémy č. 3 boli vyjadrené oba typy rizika, ktoré boli zohľadnené v prvej bazilejskej dohode: • rizikové váhy boli odstupňované podľa druhu aktíva, čím sa popisovalo úverové riziko protistrany, a zároveň • sa pri vyjadrení rizika prenosu zo zahraničia rozlišovali pohľadávky voči subjektom v krajinách OECD a pohľadávky voči krajinám mimo priestoru OECD. Bazilejská kapitálová dohoda z roku 1988 postupom času zastarala, boli voči nej vznesené viaceré výhrady, ktoré v januári 1996 viedli k prijatiu Dodatku ku kapitálovej dohode o prevzatí trhových rizík. Pred januárom 1996 bol text kapitálovej dohody mierne pozmenený celkom trikrát: v novembri 1991 (kedy sa upravilo zahrnutie rezerv do regulačného kapitálu), v júli 1994 (kedy bola zúžená definícia krajín OECD) a v apríli 1995 (kedy sa upravilo zahrnutie niektorých mimobilančných položiek a pohľadávok zabezpečených cennými papiermi vydanými neštátnymi subjektmi verejného sektora mimo krajín OECD). Implementáciou prvej bazilejskej dohody vystúpili do popredia jej nedostatky. Hlavné výhrady voči prvej kapitálovej dohode možno vymedziť v štyroch okruhoch. • Trhové riziko nebolo prvou bazilejskou dohodou regulované. Výpočet kapitálových požiadaviek sa zakladal na účtovnej hodnote a abstrahovalo sa od trhovej hodnoty. Trhová hodnota aktív finančných inštitúcií nezriedka prevyšovala ich ocenenie v účtovníctve a kapitálové požiadavky odvodené od účtovného ocenenia podceňovali skutočné riziko, ktorému boli aktíva vystavené. • Započítanie nebolo povolené. Riziková expozícia rizika voči konkrétnemu obchodnému partnerovi je vyjadrená rozdielom medzi pohľadávkami a záväzkami voči nemu. Ak obchodný partner nesplní voči finančnej inštitúcii svoje záväzky, môže si finančná inštitúcia uplatniť kompenzáciu vo zodpovedajúcej výške na strane záväzkov. Prvá bazilejská dohoda nepripúšťala započítanie vzájomných pohľadávok a záväzkov a skutočné riziko nadhodnocovala. Dôsledkom bolo, že pohľadávky zabezpečené v plnej výške kolaterálom alebo kvalitnou garanciou vstupovali do procesu výpočtu kapitálových požiadaviek v plnej výške. Ďalším špecifikom boli swapové transakcie, pri ktorých bola finančná inštitúcia vystavená riziku nie vo výške dohodnutej nocionálnej hodnoty, ale iba vo výške čistých úrokových platieb, pričom podľa prvej bazilejskej dohody bola základňa pre stanovenie kapitálových požiadaviek odvodená od nocionálnej hodnoty swapu. • Neboli zohľadnené efekty diverzifikácie. Kapitálové požiadavky boli stanovované jednoduchým súčtom úverových rizík jednotlivých položiek aktív. Neprihliadalo sa na korelačnú štruktúru jednotlivých pozícií a zanedbával sa pozitívny vplyv diverzifikácie z odvetvového i regionálneho hľadiska. V skutočnosti tým, že banky poskytovali úvery do rôznych regiónov a subjektom v rôznych odvetviach, diverzifikovali svoje riziko. • Rozlíšenie rizikových kategórií nebolo adekvátne. Rizikové váhy nerozlišovali rating dlžníkov finančných inštitúcií. Rovnaké váhy boli pridelené pohľadávkam voči emitentom s najvyšším investičným stupňom (AAA / Aaa) aj pohľadávkam voči emitentom so špekulatívnym stupňom (D). Stanovovanie kapitálových požiadaviek podľa rámca Bazilejskej kapitálovej dohody z roku 1988 deformovalo správanie bánk. Banky usmerňovali svoju úverovú činnosť smerom k väčšiemu riziku, aby dostali svoj ekonomický kapitál na úroveň regulačného kapitálu. Poskytovali menej kvalitné úvery vo väčšom objeme, čím rástla ich potreba ekonomického kapitálu (keďže na rastúce riziko na strane aktív muselo byť pokryté zodpovedajúcimi zdrojmi – ekonomickým kapitálom). Nebolo ich záujmom držať vysoký objem ekonomického kapitálu, ale iba v takej výške, ktorá by zodpovedala regulačnému kapitálu. 15 Ďalším prejavom bola snaha bánk transformovať poskytnuté úvery v ich bilancii do obchodovateľných cenných papierov, ktorým bola pridelená nižšia riziková váha. Pretože toto bolo možné najmä v prípade kvalitných dlžníkov, kvalitné úvery z bilancií bánk vymizli a boli nahradené obchodovateľnými cennými papiermi. Čo z úverových pohľadávok zostalo v bilancii bánk, boli menej kvalitné úvery poskytnuté subjektom s nižším ratingom. 5. Záver Riešenia Bazilejského výboru pre bankový dohľad zohrali v praxi regulačného merania rizika významnú úlohu. Prvý výstup práce bazilejského výboru v podobe Bazilejskej kapitálovej dohody z roku 1988 predurčil vývoj v oblasti kapitálovej primeranosti a stanovil hrubú mieru úverového rizika s aplikáciou pre výpočet kapitálových požiadaviek. Čím boli vyššie kapitálové požiadavky, ktoré musela finančná inštitúcia v zmysle bazilejskej dohody z roku 1988 tvoriť, tým bolo vyššie jej úverové riziko. Hoci v súčasnosti je bazilejský koncept v originálnej podobe z roku 1988 vnímaný ako obsolétny a je prekonaný komplexnejším prístupom, predstavuje aj dnes tento koncept štandardizovaný prístup k stanovovaniu kapitálových požiadaviek (a implicitnému meraniu úverového rizika bankového portfólia). Článok poukázal na obsah bazilejskej dohody z roku 1988 a prezentoval spôsob, akým bolo ohodnocované úverové riziko v čase efektívneho využívanie dohody v regulátorskej praxi. Súčasne boli uvedené dôvody, pre ktoré bolo nutné prejsť k ďalšiemu-rozvinutejšiemu konceptu reprezentovaného úpravami a doplnkami originálnej bazilejskej dohody. 6. Literatúra BEŇOVÁ, Elena et al. 2005. Financie a mena. Bratislava: Iura Edition 2005. 380 s. ISBN 978-80-8078-142-2. GALATTI, Reto 2003. Risk Management and Capital Adequacy. New York. McGraw-Hill 2003. 555 s. ISBN 0-07-140763-4. HOLTON, Glyn A 2002. History of Value-at-Risk: 1922 – 1998. In: EconWPA / Methods and History of Economic Thought. 2002, č. 0207001. 27 s. International convergence of capital measurement and capital standard. Bazilej: Bazilejský výbor pre bankový dohľad júl 1988. 30 s. JÍLEK, Josef 2000. Finanční rizika. Praha: Grada Publishing 2000. 635 s. ISBN 80-7169-579-3. JORION, Philippe 2003. Financial Risk Manager Handbook. Druhé vydanie. New Jersey [USA]: Wiley 2003. 708 s. ISBN 0-471-43003-X. KAŠPAROVSKÁ, Vlasta et al. 2006. Řízení obchodních bank: vybrané kapitoly. Praha: C. H. Beck 2006. 339 s. ISBN 80-7179-381-7. POLOUČEK, Stanislav 2003: Peníze, banky a finanční trhy. Tretie upravené vydanie. Karviná: Slezská univerzita v Opavě, Obchodně podnikatelská fakulta v Karviné 2003. 244 s. ISBN 80-7248-074-X. SVITEK, Martin 2006. Kapitálové vybavenie komerčných bánk. Bratislava: Eurounion 2006. 171 s. ISBN 80-888984-88-2. Adresa autora Ing. et Bc. Martin Boďa Univerzita Mateja Bela v Banskej Bystrici Ekonomická fakulta Katedra kvantitatívnych metód a informatiky Tajovského 10 975 90 Banská Bystrica [email protected] 16 Odhad variančních komponent v lineárním regresním modelu neúplného měření vektorového parametru Hana Boháčová 1 Abstract: The article deals with the variance components estimation in linear regression model with constraints. The maximum likelihood estimators for fixed effects parameters and variance components are derived and applied in the numerical study of uniformly accelerated movement. Key words: Linear regression model with constraints, Variance components, Maximum likelihood method, Uniformly accelerated movement 1.Úvod V praxi se často setkáváme se situacemi, kdy je potřeba určit hodnotu veličiny, kterou není možné přímo měřit, lze ji však dopočítat pomocí jiných veličin, které měřit lze. Pro ilustraci uveďme například určování zrychlení při rovnoměrně zrychleném přímočarém pohybu, kdy zrychlení určujeme pomocí naměřených hodnot dráhy a času. Tyto situace popisuje lineární regresní model neúplného nepřímého (respektive přímého) měření vektorového parametru (lineární regresní model s podmínkami typu II): (1) Y ~ N n ( Xβ1 , Σ θ ) (2) B1 β1 + B2 β 2 + b = 0 V praxi často k tomuto modelu dospějeme pomocí linearizace původně nelineárního modelu, viz též dále uvedený numerický příklad. Parametr β1 je nepřímo měřitelný, parametr β 2 určujeme po odhadnutí β1 z podmínky (2). Předpokládáme, že matice X je plné hodnosti ve sloupcích, matice B1 je typu (q, k1 ) , matice B2 je typu (q, k 2 ) a předpokládáme r (B1 , B2 ) = q , r (B2 ) = k 2 , k 2 < q < k1 + k 2 . Předpokládáme model s r variančními komponentami θ1 ,..., θ r , tedy r var Y = Σ θ = ∑ θ iVi , (3) i =1 kde V1 ,..., Vr jsou známé symetrické matice, přičemž musí platit, že Σ θ je alespoň pozitivně semidefinitní. Naším cílem je najít odhady β1 , β 2 ,θ1 ,...,θ r metodou maximální věrohodnosti. 2. Odvození odhadů ′ V modelu (1) bez podmínek jsou věrohodnostní rovnice pro β1 a θ = (θ1 ,..., θ r ) tvaru: ( ) ( X ' Σ θ−1 X ) β1 = X ' Σ θ−1Y (4) (5) tr Σ θ−1Vi = Y ' (M X Σ θ M X ) Vi (M X Σ θ M X ) Y , i = 1,..., r , (viz [Rao - Kleffe,1988]) kde M A je matice ortogonální projekce na vektorový prostor kolmý k vektorovému prostoru generovanému sloupci matice A. Provedeme transformaci modelu s podmínkou (1),(2) na model bez podmínky (použitá transformace viz. [Kubáček - Kubáčková, 2000]). Najdeme 1 + + Hana Boháčová, Fakulta ekonomicko-správní, Univerzita Pardubice 17 matice K 1 typu (k1 , k1 + k 2 − q ) a K 2 typu (k 2 , k1 + k 2 − q ) , pro které platí: K1 = 0 K2 (B1 , B2 ) Vyjádříme-li nyní (6) β1 β1(0 ) K 1 = (0 ) + γ , β2 β2 K2 (7) β (0 ) kde 1(0 ) je libovolný vektor vyhovující podmínce B1 β1(0 ) + B2 β 2(0 ) + b = 0 a γ ∈ R k1 + k 2 − q , β2 můžeme model (1),(2) převést na model typu (1) bez podmínky: (8) Y − Xβ1(0 ) ~ N n ( XK 1γ , Σ θ ) . Podle (4) a (5) dostaneme věrohodnostní rovnice pro γ a θ . Označme odhady parametrů β1 , β a θ z modelu (1),(2) po řadě β̂ˆ , β̂ˆ a θˆ , odhad parametru β z modelu (1) β̂ a odhad 2 1 1 2 parametru γ z modelu (8) γˆ . Pak ze (7) vyplývá: βˆ1 β1(0 ) K 1 = + γ βˆ β (0 ) K ˆ 2 2 2 Po úpravě dostaneme konečné vztahy pro odhady: −1 −1 βˆ1 = βˆ1 − X ' Σ θ−1 X B1 '[ M B2 B1 X ' Σ θ−1 X B 1 ' M B2 ] + (b + B1 βˆ1 ) βˆ = (B ' B )−1 B ' B βˆ + b ( ) 2 ( ( )( 2 2 2 ) ( 1 1 ) ( ) )( 1 Y − Xβ 1(0 ) ' M XK Σ θ M XK V1 M XK Σ θ M XK Y − Xβ 1(0 ) 1 1 1 1 θˆ = S (−M1 Σ M )+ ... XK1 θ XK1 + + (0 ) (0 ) Y − Xβ 1 ' M XK1 Σ θ M XK1 Vr M XK1 Σ θ M XK1 Y − Xβ1 Kde A + značí Moore-Penroseovu pseudoinverzi matice A a + + , i, j = 1,..., r. S (M Σ M )+ = tr Vi M XK1 Σ θ M XK1 V j M XK1 Σ θ M XK1 )( ( { XK1 θ XK1 } i, j + + ) ( [ ( ) ( )( )] (9) (10) ) ) (11) (12) (13) Při výpočtech se postupuje iteračně s vhodně zvolenými počátečními hodnotami. 3. Numerická studie Zaměřme se nyní na zkoumání situace, kdy nás zajímá čas potřebný ke zrychlení automobilu z 0 na 100 km/h. Pro zjednodušení předpokládejme, že zrychlení je po celou dobu rozjezdu konstantní, tedy že se jedná o rovnoměrně zrychlený přímočarý pohyb. Měření proběhla ve čtyřech bodech rozjezdové dráhy – měřila se jednak vzdálenost místa od startovní čáry a jednak čas potřebný k projetí dráhy od startu po daný bod. Celý postup byl desetkrát opakován. Naměřená data jsou v Tabulce 1. Data jsou získána simulací z normálního rozdělení pro s1 = 30m , s 2 = 60m , s3 = 90m , s 4 = 120m se směrodatnou odchylkou σ s = 5 ⋅ 10 −4 m a podobně pro časy t1 = 4,16 s , t 2 = 5,89 s , t 3 = 7,21s , t 4 = 8,33s se směrodatnou odchylkou σ t = 5 ⋅ 10 −2 s . 18 Tabulka 1. Vstupní data – 1. pokus Vzdálenost od startovní čáry [m] Měření s1 s2 s4 s3 1 30,0001 60,0010 89,9997 119,9997 2 30,0003 60,0004 89,9999 120,0004 3 30,0000 60,0006 89,9995 120,0007 4 29,9997 60,0004 89,9995 119,9995 5 30,0002 60,0006 90,0005 120,0004 6 30,0000 60,0003 89,9998 119,9995 7 30,0009 60,0003 90,0010 120,0006 8 30,0000 59,9995 90,0005 119,9998 9 30,0000 60,0009 90,0001 120,0005 10 29,9992 60,0002 90,0002 119,9999 Čas [s] t1 t2 4,15 5,91 4,18 5,87 4,18 5,90 4,18 5,83 4,16 5,93 4,20 5,86 4,15 5,87 4,16 5,87 4,28 5,84 4,27 5,94 t4 8,27 8,33 8,34 8,30 8,30 8,33 8,38 8,32 8,38 8,35 t3 7,14 7,10 7,21 7,16 7,27 7,13 7,14 7,23 7,17 7,15 Cílem je určit odhad zrychlení automobilu při rozjezdu a odhady disperzí měření vzdálenosti a času. Zrychlení budeme odhadovat na základě vztahu pro výpočet dráhy rovnoměrného 1 zrychleného pohybu s = at 2 , tedy 2 (14) 2 si − at i2 = 0 , i = 1,...,4 . V regresním modelu tedy v roli přímo měřitelných parametrů β1 vystupují s1 ,..., s 4 a t1 ,...,t 4 , parametru β 2 odpovídá a a varianční komponenty jsou disperze při měření vzdálenosti σ s2 a disperze při měření času σ t2 . Regresní model pak vypadá takto: s1 1 s2 0 s 0 3 s4 0 Y = + ε , var Y = σ s2 t1 0 t2 0 t3 0 t 0 4 0 0 0 0 (15) 0 0 0 1 2 s (0 ) − a (0 ) t (0 ) 2 − t (0 ) 2 2 0 0 0 − 2a (0 )t1(0 ) 0 0 0 1 1 1 2s 2(0 ) − a (0 )t 2(0 ) 2 − t 2(0 ) 2 0 0 0 − 2a (0 )t 2(0 ) 0 2 0 0 =0 δβ1 + (0 ) 2 δβ 2 + (0 ) 0 0 2 0 (0 ) (0 ) (0 ) (0 ) 2 0 0 2 0 − a t 2 − − t s a t 3 3 3 3 (0 ) (0 ) 0 0 0 2 2 s (0 ) − a (0 ) t (0 ) 2 − t (0 ) 2 0 0 0 2 − a t 4 4 4 4 (16) Kde podmínka (16) vznikla linearizací vztahu (14) a horní index (0) značí počáteční hodnoty. Počáteční hodnoty pro výpočet odhadů byly voleny takto: s1(0 ) = 30m , s 2(0 ) = 60m , s3(0 ) = 90m , s 4(0 ) = 120m , a (0 ) = 3,46m ⋅ s −2 (tato hodnota přibližně odpovídá zrychlení z 0 na 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 + σ t2 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 100km ⋅ h −1 za 8s , jak udává výrobce automobilu), t1(0 ) = 4,16 s , t 2(0 ) = 5,89 s , t 3(0 ) = 7,21s , t 4(0 ) = 8,33s (dopočítáno dle vztahu t i(0 ) = 2 si(0 ) , i = 1,...,4 pro rovnoměrně zrychlený a (0 ) 19 přímočarý pohyb), σ s(0 ) = 2 ⋅ 10 −7 , σ t(0 ) = 2 ⋅ 10 −3 (aritmetický průměr výběrových rozptylů prvních, resp. druhých čtyř sloupců Tabulky 1.) Výsledné odhady jsou pro jednotlivé replikace uvedeny v Tabulce 2 a Tabulce 3. 2 2 Tabulka 2. Odhady parametrů β1 a β 2 pro jednotlivé replikace měření – 1. pokus β̂ˆ β̂ˆ 1 2 Měření ŝˆ1 ŝˆ2 ŝˆ3 ŝˆ4 1 2 3 4 5 6 7 8 9 10 30,0001 30,0003 30,0000 29,9997 30,0001 30,0000 30,0009 30,0000 30,0000 29,9992 60,0010 60,0004 60,0006 60,0004 60,0006 60,0003 60,0003 59,9994 60,0009 60,0002 89,9997 89,9999 89,9994 89,9994 90,0005 89,9998 90,0010 90,0005 90,0001 90,0002 119,9997 120,0004 120,0007 119,9995 120,0004 119,9995 120,0006 119,9998 120,0005 119,9999 tˆ1 4,14 4,14 4,17 4,14 4,17 4,15 4,16 4,16 4,17 4,17 tˆ2 5,86 5,86 5,90 5,86 5,90 5,87 5,88 5,89 5,90 5,90 tˆ3 7,17 7,18 7,22 7,17 7,23 7,18 7,20 7,21 7,23 7,23 tˆ4 8,28 8,29 8,34 8,28 8,35 8,30 8,31 8,33 8,34 8,35 ∠3,42 3,426 3,47 3,422 3,475 3,433 3,446 3,458 3,473 3,478 Tabulka 3. Odhady variančních komponent – 1. pokus Měření σˆ s2 σˆ t2 1 2,26 ⋅ 10 −7 2,81 ⋅ 10 −3 2 7,69 ⋅ 10 −7 3,36 ⋅ 10 −3 3 3,69 ⋅ 10 −8 1,03 ⋅ 10 −4 4 2,75 ⋅ 10 −7 6,98 ⋅ 10 −4 5 2,73 ⋅ 10 −7 1,47 ⋅ 10 −3 6 6,39 ⋅ 10 −7 2,11 ⋅ 10 −3 7 4,28 ⋅ 10 −7 2,69 ⋅ 10 −3 8 5,02 ⋅ 10 −8 2,20 ⋅ 10 −4 9 2,76 ⋅ 10 −6 6,68 ⋅ 10 −3 10 2,07 ⋅ 10 −6 5,50 ⋅ 10 −3 Je patrné, že zatímco odhady parametrů β1 a β 2 jsou poměrně stabilní, odhady variančních komponent se pro jednotlivé replikace výrazně liší. Protože metoda maximální věrohodnosti vykazuje asymptoticky dobré vlastnosti, lze očekávat, že při větším počtu měření se budou výsledky lišit méně (Vlastnosti maximálně věrohodných odhadů při rostoucí dimenzi vektoru Y viz [Rao - Kleffe, 1988]). V dalším pokusu byl zvýšen počet bodů, v nichž se měřilo, na 12, v každém bodě byl opět změřen čas potřebný k projetí dráhy od startu po daný bod a vzdálenost bodu od startovní čáry. Celý postup měření byl pětkrát opakován. Naměřená data jsou v Tabulce 4. Jsou opět simulovaná z normálního rozdělení, si , i = 1,...,12 se směrodatnou odchylkou σ s = 5 ⋅ 10 −4 m a t i , i = 1,...,12 se směrodatnou odchylkou σ t = 5 ⋅ 10 −2 s . 20 Tabulka 4. Vstupní data – 2. pokus Měření 1 2 3 9,9998 9,9994 10,0001 s1 20,0001 20,0009 20,0008 s2 30,0000 29,9999 30,0007 s3 4 10,0006 20,0001 29,9998 5 10,0006 19,9996 30,0004 s4 s5 40,0005 50,0002 40,0001 50,0005 40,0005 50,0000 40,0004 49,9997 39,9998 50,0004 s6 59,9994 60,0006 60,0014 60,0007 59,9997 s7 70,0006 69,9999 69,9998 70,0002 70,0002 s8 80,0006 80,0001 79,9999 80,0005 80,0001 s9 89,9989 90,0005 89,9999 90,0000 89,9999 s10 100,0005 100,0005 100,0003 100,0003 100,0005 s11 s12 t1 t2 t3 109,9996 119,9998 2,39 3,39 4,08 109,9998 119,9989 2,37 3,47 4,11 110,0002 120,0001 2,39 3,34 4,15 109,9992 119,9999 2,31 3,30 4,19 109,9994 120,0006 2,38 3,36 4,18 t4 t5 4,85 5,39 4,87 5,37 4,82 5,36 4,81 5,37 4,78 5,29 t6 5,83 5,86 5,91 5,92 5,99 t7 6,33 6,36 6,35 6,29 6,40 t8 6,83 6,81 6,81 6,76 6,76 t9 7,21 7,21 7,19 7,21 7,13 t10 7,55 7,58 7,54 7,68 7,49 t11 t12 8,03 8,33 8,05 8,38 7,97 8,31 8,05 8,29 8,05 8,38 Použitý regresní model je analogický modelu (15), (16), samozřejmě s odpovídající dimenzí. Výsledné odhady variančních komponent jsou v Tabulce 5. Tabulka 5. Odhady variančních komponent – 2. pokus Měření σˆ s2 σˆ t2 1 2,52 ⋅ 10 −7 1,79 ⋅ 10 −3 2 5,56 ⋅ 10 −7 4,80 ⋅ 10 −4 3 6,83 ⋅ 10 −8 6,31 ⋅ 10 −4 4 1,54 ⋅ 10 −7 1,06 ⋅ 10 −4 5 5,65 ⋅ 10 −7 5,92 ⋅ 10 −4 21 4. Závěr Přestože i odhady variančních komponent ve 2. pokusu se na první pohled významně liší, při jejich porovnání s druhými mocninami směrodatných odchylek σ s a σ t , které byly použity pro simulaci hodnot si a t i , i = 1,...,12 (respektive i = 1,...,4 v prvním pokuse), se zjistilo, že odhady σˆ s a σˆ t nevybočily z očekávaného intervalu. Přesnost jejich určení charakterizovaná jejich kovarianční maticí 2 S (−M1 Σ M )+ však v tomto experimentu není příliš vysoká. XK1 θ XK1 5. Literatura KUBÁČEK, L. – KUBÁČKOVÁ, L. 2000 Statistika a metrologie. Olomouc: Univerzita Palackého v Olomouci – vydavatelství, 2000. RAO, C.R. – KLEFFE, J. 1988 Estimation of Variance Components and Applications. Amsterdam – New York – Oxford – Tokyo: North-Holland, 1988. Adresa autora: Hana Boháčová, Mgr. Fakulta ekonomicko-správní Univerzita Pardubice Studentská 84 532 10 Pardubice [email protected] 22 Nové demografické trendy vo svete v roku 2006 podľa štatistík OSN. Rastislav Čief Abstract We can notice several interesting trends based on the newest World Population Prospects The 2006 Revision. The significant part of the survey consists of questions which are related to population ageing and its comparison of progress in developed and developing countries. All indexes like fertility, median age as well as old age population ratio reflect worldwide population aging. Following this comparison, developing countries are getting oncoming to the progress of developed countries at a rapid growth rate (they tail away approx. 50 years). As there is assumption that oncoming globalization forces this advancing, we can expect that the middle variant OSN (which was used in all fertility indexes) will be revised: in developing countries will be lower fertility, higher age median and higher ratio of post-productive population. Also possible increase in fertility is little feasible in developed countries. Generally we can expect acceleration of worldwide population ageing process. Key words: population, fertility, median age, ageing, projection Úvod V najnovšom World Population Prospects The 2006 Revision si možno všimnúť niekoľko zaujímavých faktov. Zameriava sa na otázky súvisiace s prirodzeným aj mechanickým pohybom, kde porovnáva vývoj v rozvinutých a v rozvíjajúcich (v minulosti sa používal termín rozvojových) krajín. Z ukazovateľov som vybral tie ktoré, sa týkali starnutia obyvateľstva: fertilita, vekový medián a podiel poproduktívneho obyvateľstva. Zaujímalo ma akým tempom rozvíjajúce sa krajiny napodobňujú trendy v rozvinutých krajinách. Nové demografické trendy vo svete v roku 2006 podľa štatistík OSN V júli 2007 bolo vo svete 6,7 miliardy ľudí čo je o 547 miliónov viac ako v roku 2000. Prognózy Počtu obyvateľov sveta v roku 2050 počítajú v strednom variante s 9,2 milardami v nízkom s 7,8 miliardami a vo vysokom variante s 10,8 milardami obyvateľov. Budúci populační rast je veľmi závislý na budúcej fertilite. V strednom variante fertilita sveta klesá z 2,55 na 2,02. Ak fertilita zostane skoro nezmenená bude v roku 2050 mať svetová populácia 10,8 miliardy. Nízky variant počíta zo zrýchľovaním poklesu fertility. Nízka a znižujúca sa intenzita populačného rastu v rozvinutých krajinách ako celku spôsobí podľa stredného variantu, že sa populácia 1,2 miliardy v rokoch 2007-2050 nezmení. Naopak populácia 50 najmenej rozvinutých krajín zrastie v rokoch 2007 až 23 2050 dvojnásobne z 0,8 miliardy na 1,7 milardy. Rast zaznamená aj zvyšok rozvojových krajín aj keď nie taký výrazný z 4,8 milardy v roku 2007 vzrastie na 6,2 milardy v roku 2050. Klesajúci populačný rast spôsobený poklesom fertility, vedie k starnutiu populácie tak, že produkuje populáciu, kde podiel ľudí v poproduktívnom veku rastie a klesá podiel mladých ľudí. V najviac rozvinutých regiónoch 20% populácie je starších ako 60 rokov ale podľa prognózy v roku 2050 to bude až 33%. V rozvinutých krajinách ako celku počet ľudí v poproduktívnom veku (nad 60 rokov) už prevýšil počet ľudí v predproduktívnom veku do 15 rokov a v roku 2050 počet ľudí v poproduktívnom veku bude dvojnásobný oproti obyvateľstvu v predproduktívnom veku. Populačné starnutie je menej pokročilé v rozvíjajucich sa krajinách. Napriek tomu populácia väčšiny z nich vstupuje do obdobia rýchleho populačného starnutia. V rozvíjajucich sa krajinách je 8% populácie v poproduktívnom veku nad 60 rokov, ale v roku 2050 to bude až 20%. Celkove počet ľudí v predproduktívnom veku vzrastie trojnásobne z 673 miliónov v roku 2005 na 2 miliardy v roku 2050. V tomto období podiel vzrastie rozvíjajucich sa krajín na poproduktívnom obyvateľstve z 64% v roku 2005 na 80% v roku 2050. Charakteristickou črtou starnutia populácie je, že počet starších osôb rastie rýchlejšie ako zvažované vekové rozpätie. Takže kým počet osôb nad 60 rokov vzrastie trojnásobne, počet osôb nad 80 rokov vrastie takmer päťnásobne z 88 miliónov v roku 2005 na 402 milónov v roku 2050. Dnes tvorí podiel rozvíjajucich sa krajín na obyvateľstve nad 80 rokov 50% v roku 2050 to bude 71%. Hoci u populácií všetkých krajín sa očakáva starnutie, populácie krajín kde je fertilita stále vysoká zostanú relatívne mladé a rýchlo rastúce. Vysoký populačný rast prevažuje v najmenej rozvinutých rozvíjajúcich sa krajinách. v rokoch 2005 až 2050 sa populácie Afganistanu, Burundi, Dem.rep. Kongo, Guinea –Bissau, Nigeru, Východneho Timoru a Ugandy strojnásobia. V ostrom protiklade, populácie 46 krajín vrátane Nemecka, Talianska, Japonska, Korei, väčšiny štátov vzniknutých zo Sovietského Zväzu a niektorých malých ostrovných štátov budú v roku 2050 menšie oproti roku 2005. Populačný rast ostáva koncentrovaný do ľudnatých krajín. V období 2005 až 2050 prírastok 8 krajín bude predstavovať polovicu celosvetového rastu ( India, Nigéria, Pakistan, Dem.rep. Kongo, Etiópia, USA, Bangladéš a Čína. Vekový medián, je vek, ktorý rozdeľuje populáciu na dve rovnako veľké polovice a je ukazovateľom starnutia populácie. Vekový medián vo svete vzrastie za obdobie 20052050 z 28 na 38 rokov a v Európe z 39 na 47 rokov. 12. Vekový medián je vyšší v krajinách s nízkou fertilitou počas dlhšieho obdobia. v roku 2005 malo 13 rozvinutých krajín vyšší vekový medián ako 40 rokov. Prenikanie populačného starnutia odráža fakt, že 93 krajín bude mať v roku 2050 vekový medián vyšší ako 40 rokov, pričom 48 z nich sú rozvíjajúce sa krajiny. Krajiny, kde fertilita zostáva vysoká a a klesá iba mierne bude priebeh starnutia populácie najpomalší. Do roku 2050, skora každá piata krajina bude mať vekový medián nižší ako 30 rokov. Najmenej rozvinuté krajiny budú mať najmladšiu populáciu, z nich 8 bude mať vekový medián nižší ako 24 rokov: Afganistan, Angola, Burundi, Dem.rep. Kongo, Guinea-Bissau, Libéria, Niger a Uganda. 24 Ako je známe znižovanie fertility je hlavnou príčinou starnutia populácie. Fertilita sveta je odhadovaná na 2,55 deti na 1 ženu, čo je o polovicu menej oproti obdobiu 1950-55, keď pripadalo 5 deti na 1 ženu. V strednom variante svetovej fertility je projektovaný pokles na 2,02. Priemer sveta odráža úplne odlišné trendy. V rozvinutých krajinách, fertilita je 1,60 a je projektovaná na 1,79 v rokoch 2045-2050. V najmenej rozvíjajúcich sa krajinách fertilita je 4,63 a predpokladá sa prepad na 2,50 v rokoch 2045-2050. V ostatných rozvíjajúcich sa krajinách je fertilita už mierne nízka 2,45 a predpokladá sa pokles na 1,91 v strede storočia. V rokoch 2005-2010 fertilita ostáva nad 5 v 27 krajinách a týchto 27 krajín tvorí 9% svetovej populácie. Väčšina krajín s veľmi vysokou fertilitou je chudobná a patrí do skupiny najmenej rozvijajúcich sa krajín. Naopak fertilitu pod úrovňou reprodukcie dosiahlo 28 rozvíjajucich sa krajín, ktoré tvoria 25% svetovej populácie. Táto skupina obsahuje Čínu, ktorej priemerná fertilita v období 2005-2010 sa odhaduje na 1,73. Fertilita je tiež pod úrovňou reprodukcie v 45 krajinách, ktoré tvoria 19% svetovej populácie. V 27 z nich vrátane Japonska a väčšiny krajín južnej a východnej Európy je fertilita pod 1,5. Od obdobia 1990-1995 pokles fertility bol pravidlom u veľkej väčšiny rozvinutých krajín a viedol k rýchlemu starnutiu populácie. Tab.č.1.:10 krajín s najvyššou a najnižšou fertilitou v rokoch 1970-75 a 2005-2010 1970-75 2005-2010 poradie krajina fertilita poradie krajina fertilita A.najvyššia fertilita 1 Jemen 8,7 1 Niger 7,19 2 Rwanda 8,29 2 Guinea-Bissau 7,07 3 Niger 8,12 3 Afganistan 7,07 4 Keňa 8 4 Burundi 6,8 5 Jorddánsko 7,79 5 Libéria 6,77 6 Burkina Faso 7,75 6 Dem.rep. Kongo 6,7 7 Palestína 7,73 7 Timor východný 6,53 8 Afganistan 7,7 8 Mali 6,52 9 Líbya 7,59 9 Sierra Leone 6,47 10 Mali 7,56 10 Uganda 6,46 B.najnižšia fertilita 1 Fínsko 1,62 1 Macao 0,91 2 Nemecko 1,64 2 Hong Kong 0,97 3 Luxemburgsko 1,72 3 Bielorusko 1,2 4 Švajčiarsko 1,82 4 Kórea 1,21 5 Normanské ostrovy 1,86 5 Ukrajina 1,22 6 Švédsko 1,89 6 Poľsko 1,23 7 Chorvátsko 1,96 7 Bosna a Hercegovina 1,23 8 Dánsko 1,97 8 Česko 1,24 9 Kanada 1,98 9 Slovensko 1,25 10 Lotyšsko 2 10 Singapur 1,26 Zdroj:World Population Prospects The 2006 Revision. United Nations, New York 2007. 25 Tab.č.2.:Dvanásť krajín s najväčšou a najmenšou zmenou fertility v r. 19702010 fertilita zmena poradie krajina 1970-1975 2005-2010 rozdiel v percentách A.najvyššie zmeny fertility 1 Mongolsko 7,33 1,87 -5,46 74,48840382 2 Korea 4,28 1,21 -3,07 71,72897196 3 Macao 3,2 0,91 -2,29 71,5625 4 Tunisko 6,21 1,93 -4,28 68,92109501 5 Kuvajt 6,9 2,18 -4,72 68,4057971 6 Irán 6,4 2,04 -4,36 68,125 7 Vietnam 6,7 2,14 -4,56 68,05970149 8 Alžírsko 7,38 2,38 -5 67,75067751 9 Bhután 6,67 2,19 -4,48 67,16641679 10 Hong Kong 2,89 0,97 -1,92 66,43598616 11 Mexiko 6,5 2,21 -4,29 66 12 Maroko 6,89 2,38 -4,51 65,45718433 B.najnižšie zmeny fertility 1 Afganistan 7,7 7,07 -0,63 8,181818182 2 Čad 6,6 6,2 -0,4 6,060606061 3 Rovníková Guinea 5,68 5,36 -0,32 5,633802817 4 Švédsko 1,89 1,8 -0,09 4,761904762 5 Luxemburgsko 1,72 1,66 -0,06 3,488372093 6 Libéria 6,9 6,77 -0,13 1,884057971 7 Guinea-Bissau 7,1 7,07 -0,03 0,422535211 8 Sierra Leone 6,5 6,47 -0,03 0,461538462 9 Burundi 6,8 6,8 0 0 10 USA 2,02 2,05 0,03 -1,48514851 11 Dem.rep. Kongo 6,45 6,7 0,25 -3,87596899 12 Timor východný 6,15 6,53 0,38 -6,17886179 Zdroj:World Population Prospects The 2006 Revision. United Nations, New York, 2007. Záver Z porovnania vývoja rozvinutých a rozvíjajucich krajín vyplýva, že rozvíjajuce sa krajiny sa rýchlym tempom začínaju približovať k vývoju v rozvinutých krajinách (pričom zaostávajú cca 50 rokov). Je však predpoklad, že postupujúca globalizácia zrýchli toto približovanie a preto je predpoklad, že tento stredný variant OSN, (ktorý som použil pri všetkých ukazovateľoch) bude revidovaný : v rozvíjajucich sa krajinách 26 bude nižšia fertilita, vyšší vekový medián a vyšší podiel poproduktívneho obyvateľstva. Podobne aj predpokladané zvýšenie fertility v rozvinutých krajinách je málo pravdepodobné. Celkovo možno predpokladať zrýchlenie procesu starnutia svetovej populácie. Literatúra World Population Prospects The 2006 Revision. United Nations. New York, 2007. Adresa autora: PaedDr.Rastislav Čief Dobrianského 45 066 01 Humenné [email protected] 27 Aktuálny stav Informačného systému registra obyvateľov SR Anton Dubčák Abstract: The implementation of e-government in Slovakia necessitates cooperation of core databases of public administration. The Registry of Citizens is new centralised database with the content stipulated by law. The projects for on-line connection of decisive entries to this database are already prepared. However, from legal and technological point of view the data provision from this registry to other key national registries, public administration bodies, business organisations and citizens hasn’t been resolved yet. Author describes the Interior Ministry’s objectives for registry for the forthcoming years. Key words: registry of citizens, personality protection, data provision 1. Východiská z oblasti informatizácie a legislatívy Vládna úroveň informatizácie spoločnosti a elektronizácie verejnej správy bola v nedávnej minulosti riadená viacerými strategickými dokumentami. Všetky vychádzajú z nevyhnutnosti širokého a integrovaného elektronického využívania kľúčových centrálnych registrov, ktorými sú Register obyvateľov, Obchodný register, Živnostenský register, Register územných jednotiek a Kataster nehnuteľností. Legislatívne je problematika registra obyvateľov pokrytá osobitným zákonom č.253/1998 Z.z. o hlásení pobytu občanov Slovenskej republiky a registri obyvateľov Slovenskej republiky (ďalej len zákon o registri obyvateľov) a nadväzujúcimi zákonmi. Zákon o registri obyvateľov pokrýva solídne oblasť vstupov a oblasť obsahu registra. Nedostatočne presne je ošetrená oblasť poskytovania údajov z registra tak štátnym orgánom ako právnickým osobám, fyzickým osobám, subjektom mimo Slovenskú republiku, v krajinách Európskej únie a mimo ňu. Novelu tohto zákona pripravuje Ministerstvo vnútra SR na 1.štvrťrok 2008. 2. Súčasný stav informačného systému registra obyvateľov 2.1. Obsah registra Obsah registra vymedzený zákonom plne vyhovuje požiadavkám verejnej správy po stránke určenia (výberu) zaznamenávaných položiek. Horšie je to s aktuálnym stavom údaja zaznamenaného v registri a súladom so skutočnosťou, s právnym stavom vecí. Je to dané najmä technikou a technológiou súčasného zabezpečenia vstupov – pretrváva stav keď obec (samospráva) zaznamená novú skutočnosť (len) do svojich evidencií a vykonáva príslušný správny akt, ale pre záznam do registra je nutné spravidla ručne vypísať príslušný formulár, 28 ten s časovým sklzom (napr. poštou) doručiť na „miestne príslušné“ okresné oddelenie Policajného zboru, kde ho s ďalším časovým sklzom zaznamenajú do siete prevádzkovanej (spravovanej) ďalším (iným) útvarom rezortu vnútra a sieťou sú prenesené do centrálneho výpočtového strediska. Okrem časových sklzov prináša tento proces vyššie možnosti vzniku chýb a slabší prehľad zodpovednosti za správnosť v registri zaznamenaného údaja. Ďalším problémom je potom úloha odstrániť chybu – je nutné hľadať a nájsť miesto kde vznikla a uskutočniť opravu na všetkých následných úložiskách, resp. riešiť následky použitia chybného údaja niekedy žalovateľné Problém môže odstrániť iba zabezpečenie online vstupov z rozhodujúcich obcí priamo do centrálneho registra a vypustenie zbytočného spomaľujúceho medzičlánku, s možnosťou zavedenia chýb, ktorým sú v súčasnosti okresné riaditeľstvá policajného zboru. Na strane výstupov nemá register legislatívne dostatočne zabezpečenú špecifikáciu výstupov pre štátne orgány, orgány samosprávy, pre právnické osoby a fyzické osoby. Podľa zákona o registri obyvateľov obsahuje register o občanoch s trvalým pobytom na území Slovenskej republiky tieto skupiny údajov: osobné údaje, ktorými sú: meno, priezvisko, akademický titul, rodné priezvisko, rodné číslo, dátum narodenia, miesto narodenia, okres narodenia, štát narodenia, pohlavie, rodinný stav, národnosť, dátum a miesto úmrtia, údaj o pobyte, ktorými sú pre trvalý aj prechodný pobyt najmä presná adresa pobytu a dátumy prihlásenia a skončenia pobytu, údaje o vzťahoch k blízkym osobám (rodičia, deti), administratívne údaje (čísla dokladov, rozhodnutia súdov). 2.2. Vstupy do registra Rozhodujúcimi údajmi po stránke kvalitatívnej (osobné údaje, údaje o pobyte, údaje o vzťahoch k blízkym osobám, administratívne údaje) aj kvantitatívnej – 42 zo 49 položiek uvádzaných v zákone sú vstupy z obcí, 5 (fakultatívnych) položiek sú rozhodnutia súdov zaznamenávané tiež cestou obcí a iba 2 položky sa týkajú osobných dokladov, ktorých vydávanie majú podľa platných zákonov zabezpečovať Obvodné úrady, ale do registra vstupuje jedna (číslo pasu) on line z Národného personalizačného centra a druhá (číslo starého občianskeho preukazu) z okresného riaditeľstva Policajného zboru. Technologicky je oblasť vstupov napriek zámerom a projektom z predchádzajúcich období zabezpečená veľmi slabo. Z obcí, ktorých je v súčasnosti 2891 je na centrálny register obyvateľov pripojených iba 14 mestských častí v Bratislave. Postupné etapovité online pripájanie obcí implicitne odstráni väčšinu jestvujúcich chýb v údajovej základni registra a obmedzí ich vznik. V prvej etape boli pripojené mestské časti v Bratislave (14), v druhej etape boli pripojené krajské mestá a vybrané mestské časti v Košiciach (10), v tretej etape sa má pripojiť väčšina miest v ktorých sú pôrodnice (62) a vo štvrtej etape zostávajúce mestá a mestské časti Košíc (96). 29 2.3. Výstupy z registra Nový informačný systém registra obyvateľov je budovaný ako centrálny register s priamymi vstupmi z obcí a na strane výstupov ako informačné služby. Centrálny register má vybudovaný systém používateľských rolí, ktorý umožňuje poskytovať používateľom z rezortu vnútra rôzne (hierarchicky usporiadané) prístupové práva. Rozšíriť systém aj na používateľov mimo rezort, resp. pre kľúčové celoštátne registre si vyžiada dobudovanie a modifikáciu systémových práv a rolí, rozšírenie bezpečnostných a komunikačných systémov, organizačné a legislatívne opatrenia. V zákone o registri obyvateľov sú výstupy z registra obyvateľov formulované len všeobecne, sú ponechané na formulovanie osobitných dohôd medzi ministerstvom vnútra, ústrednými orgánmi štátnej správy, obcami a vybranými právnickými osobami. Bol uskutočnený prieskum všeobecne záväzných právnych predpisov, ktoré oprávňujú subjekty na poskytovanie údajov z registra obyvateľov - okrem zákonov upravujúcich štátne štatistické zisťovania sa v právnom systéme Slovenskej republiky žiadne iné nevyskytujú. V krajinách Európskej únie s porovnateľným právnym poriadkom aký má Slovenská republika (napr. Česká republika) sú väčšinou definované konkrétne položky, termíny, periodicita a zodpovednosť za prevzaté údaje na konkrétny subjekt priamo zákonom. 3. Postavenie informačného systému registra obyvateľov v informačnom systéme verejnej správy, ako referenčného registra Referenčnosť registra obyvateľov ako základného registra informačných systémov verejnej správy, spočinie v tom, že bude dostupný ako služba orgánom a inštitúciám verejnej správy, občanom a iným oprávneným právnickým osobám. Platná legislatíva Slovenskej republiky, stav legislatívy aplikovanej vstupom Slovenskej republiky do Európskej únie, súčasné aj nové požiadavky rezortov, ale aj nárast legislatívne oprávnených požiadaviek na údaje o obyvateľoch z iných krajín Európskej únie a nadnárodných európskych inštitútov (Eurostat) vymedzuje register obyvateľov ako referenčný register, pre ktorý sú vstupmi údaje o obyvateľoch, ktoré títo poskytujú prakticky výlučne samospráve (obciam) a ktoré samotné resp. ich agregáty sú prístupné s ohľadom na ochranu osobných údajov prakticky každému. Riešenie „referenčnosti“ registra na „vládnej úrovni“, rezortom vnútra bola v rokoch 2003-2005 ovplyvňovaná riešením (čiastočným rozpracovaním) týchto úloh (aj s medzirezortným charakterom) : Návrh legislatívneho zámeru zákona o základných registroch verejnej správy Integrácia kľúčových celoštátnych registrov. Vytvorenie rozhrania kľúčových registrov na externé systémy. Vytvorenie systému elektronickej výmeny dát medzi registrami Definovanie štandardov pre informačné systémy verejnej správy. Elektronizácia úradných výpisov z matriky. Ústredný portál verejnej správy – vstupný bod 30 4. Cieľový stav registra Register obyvateľov Slovenskej republiky má byť masívnym, bezpečným a spoľahlivým zdrojom údajov odrážajúcich aktuálny právny stav spolu s históriou jednotlivých údajov: pre ostatné kľúčové celoštátne registre (government to government - G2G) pre štátne orgány a orgány samosprávy (government to government - G2G) pre právnické osoby (government to business - G2B) pre verejnosť (government to citizens - G2C). Poskytovanie údajov z registra má byť štrukturované, čo do hierarchie prístupov k údajom aj k technológii ich poskytovania. Pre úroveň kľúčových celoštátnych registrov má byť zabezpečená aktívna funkcia registra, to znamená, že zmeny údajov v registri obyvateľov budú v reálnom čase poskytnuté ostatným kľúčovým celoštátnym registrom. Obsahovo (dátovo) bude komunikácia registra s ostatnými kľúčovými celoštátnymi registrami aj s externými systémami, či s portálom verejnej správy a s verejnosťou prakticky jednosmerná. Okrem tzv. „zdrojových agend“ (údaje z obcí) pre register obyvateľov, niet vo verejnej správe takých informačných systémov, ktoré by mohli oprávnene zapísať alebo modifikovať údaj v registri obyvateľov. Ostatné kľúčové celoštátne registre budú však zmeny registra obyvateľov v príslušnom rozsahu vyžadovať a na ich základe meniť svoje údaje. 4.1. Požiadavky na vstupy Na centrálny register obyvateľov bude nevyhnutné priamo napojiť takmer tisíc pracovných staníc z obcí, z ohlasovní pobytu a matričných úradov. Každá obec by si mala môcť vybrať z viacerých spôsobov pripojenia na centrálny register. Kvantifikácia pripojenia obcí je vecou (najmä ekonomických) úvah a prepočtov vychádzajúcich najmä z veľkostnej štruktúry obcí na Slovensku. Pripojenie všetkých obcí, ktoré majú štatút mesta (až na jeden prípad ide o sídla s počtom obyvateľov vyšším než 1500) pokryje 56 % obyvateľstva. Ak pripojíme všetky obce s počtom obyvateľov vyšším ako 1000, ktorých je 945, pokryjeme už 86 % obyvateľstva. Toto číslo takmer korešponduje s počtom matričných obvodov, ktorých je v súčasnosti 974 a pokrývajú celú Slovenskú republiku. Zvýšiť percento pokrytia iba o ďalších 10 % by si vyžiadalo pripojiť ďalších 775 obcí (s počtom obyvateľov od 500 do 999). Tieto prepočty vychádzajú zo štatistík počtov obyvateľov a z počtov rozhodujúcich matričných udalostí, ktoré navzájom vykazujú vysoký stupeň korelácie. 31 VEREJNOSŤ PORTÁL VS ROZHRANIA REGISTROV NA IS INTEGRÁCIA KĽÚČ. REGISTROV G2C G2C G2B G2G VÝSTUPY KĽÚČOVÉ CELOŠTÁTNE REGISTRE Obchodný, Živnostenský, Ostatných ekonomických subjektov, Územných jednotiek, Kataster nehnuteľností REGISTER OBYVATEĽOV VSTUPY Z obcí: Matričná agenda: narodenie, sobáš, úmrtie matričné udalosti zo zahraničia Agenda hlásenia pobytu: prihlásenie k pobytu, odhlásenie Metadáta: ulice a čísla stavieb, identifikácia byt. priestorov Zo súdov (cez obce, ObÚ): rozvod, spôsobilosť, zákaz pobytu Z MV SR, z ObÚ štátne občianstvo Z Národ. personifikač. centra: čísla pasov, obč. preukazov Z Úradu hranič. a cudzin. polície: údaje o cudzincoch 4.2. Požiadavky na výstupy V súčasnosti platná legislatíva umožňuje poskytovať údaje z registra štátnym orgánom, obciam a iným právnickým osobám, ktoré plnia úlohy štátu alebo vykonávajú zdravotné poistenie a nemocenské poistenie a dôchodkové zabezpečenie, alebo plnia úlohy štátu na úseku zamestnanosti. Register obyvateľov nie je a z pochopiteľných dôvodov ani nemá byť voľne prístupným registrom. Poskytovanie údajov z registra bude riešené rôznymi stupňami prístupových práv definovaných pre jednotlivé subjekty, alebo pre skupiny subjektov. Základom riešenia problému výstupov z registra sú odpovede na otázky čo (ktorý údaj, skupina údajov, agregácia údajov), komu (fyzická osoba, právnická osoba, trieda fyzických či právnických osôb, úrad štátnej správy, úrad samosprávy a pod.) a kedy poskytnúť. Úlohou registra bude poskytovať aj ďalšie funkcie, napríklad obsah (časť obsahu) celoštátnych číselníkov. Bude nutné vybudovať správu metadát a zabezpečiť archiváciu, zálohovanie a využívanie archivovaných údajov. Čítanie údajov z registra bude umožnené nepretržite v ktoromkoľvek čase napríklad orgánom polície, bez väčších obmedzení budú poskytované súdom, prokuratúre a štátnym orgánom, ktoré ich potrebujú pre svoju činnosť zo zákona. Týka sa to aj obcí, najmä v oblasti matričných agend a v oblasti hlásenia pobytu občanov. Bez 32 relevantných a aktuálnych údajov je výkon týchto agend prakticky nemožný. Register je a bude dobrým administratívnym zdrojom údajov pre účely demografie a štatistiky. Súčasne s legislatívou alebo následne po jej prijatí je vhodné určiť a realizovať spôsob (techniku a technológiu) poskytovania údajov. Príspevok musí obsahovať zoznam použitej literatúry. Vzor bibliografického odkazu na knižnú publikáciu, aj článok sú uvedené v tejto šablóne. Na záver prosíme o uvedenie mena autora a adresy vrátane elektronickej podľa uvedeného vzoru. Prosíme autorov o dodržiavanie pokynov na úpravu príspevkov. V prípade nedodržania pokynov na úpravu príspevkov si vydavateľ vyhradzuje právo neuverejniť takýto príspevok. 4.3. Požiadavky na dobudovanie okolia informačného systému registra Okolie budúceho registra obyvateľov sa bude pre rok 2008 s výhľadom do roku 2010 projekčne a výhľadovo riešiť najmä projektmi pre tieto oblasti : Integrácia kľúčových celoštátnych registrov Integrácia obsahu registrov a osobných dokladov Centrálny register adries Register obcí a ich častí Register inštitúcií verejnej správy Elektronizácia úradných výpisov z matriky Prepojenie „negrafických“ databáz verejnej správy na geografické informačné systémy Administratívne zdroje pre Štatistický úrad Slovenskej republiky Poskytnutie vlastných „svojich“ údajov občanovi (o ňom samom), pre verifikáciu, ako je napríklad v súčasnosti osvedčenie o rodnom čísle a poskytnutie výpisu celej vety o občanovi do legislatívy. 5. Literatúra Aktualizácia koncepcie registra obyvateľov v prostredí e-Government MV SR december 2005. Národná stratégia trvalo udržateľného rozvoja – schválená uznesením vlády SR č. 978/2001 a Akčný plán trvalo udržateľného rozvoja v SR na roky 2005-2010 –uznesenie vlády SR č. 574/2005. Stratégia rozvoja konkurencieschopnosti Slovenska do roku 2010 – uznesenie vlády SR č. 140/2005. Stratégia konkurencieschopnosti Slovenskej republiky do roku 2010 - Akčné plány – uznesenie vlády SR č. 557/2005. Národný strategický referenčný rámec Slovenskej republiky na roky 2007-2013 – uznesenie vlády SR č. 457/2006. Adresa autora: Anton Dubčák Ing. Holíčska 8 851 05 Bratislava [email protected] 33 Vybrané jednofaktorové modely krátkodobej úrokovej sadzby Rudolf Gavliak 1 – Vladimír Úradníček 2 Abstract: The paper deals with the selected approaches to short-term interest rate (short rate) models. We focused in the paper to one-factor equilibrium models, where the interest rate process involves only one source of uncertainty. According to this model all interest rates move the same direction over short-time interval, but not all move by the same amount. So the short rate depends on the value of maturity. We simulate the short rate path by the discrete version of one-factor Cox, Ingersoll and Ross model and by one-factor Hull-White no arbitrage model and finally compare the results. Key words: short rate models, one-factor equilibrium models, the CIR model, no-arbitrage models, Hull and White Model. 1. Úvod Príspevok sa zaoberá vybranými modelmi krátkodobej úrokovej sadzby (short rate models), ktoré sú na trhu úrokových sadzieb veľmi populárne. Časová štruktúra úrokových sadzieb (term structure) charakterizuje priebeh závislosti výnosu default-free cenného papieru. Medzi tradičné prístupy modelovania časovej štruktúry patria tzv. jednofaktorové modely – napr. Merton, Vasicek, Dothan, Cox-Ingersoll-Ross (CIR), Ho-Lee, Hull-White, Black-Karasinsky a viacfaktorové modely – napr. modifikovaný Cox-Ingersoll-Ross, Longstaff – Schwartz a i. Simuláciu vývoja úrokových sadzieb ilustrujeme v tomto príspevku pomocou diskrétnej verzie CIR jednofaktorového rovnovážneho modelu a HullWhiteovho jednofaktorového bezarbitrážneho modelu. 2. Teoretické východiská V prípade úrokových sadzieb môžeme v dlhších časových úsekoch pozorovať tendenciu návratu k dlhodobým rovnovážnym sadzbám – ide o tzv. reverzné procesy (mean reverting). V týchto modeloch je spravidla zastúpený parameter pre dlhodobú rovnováhu a parameter pre rýchlosť približovania úrokových sadzieb k dlhodobej rovnováhe. Vo všeobecnosti patria uvedené procesy do všeobecnej kategórie Itôovho procesu a teda obsahujú aj Wienerov proces (bližšie pozri [5]). Brownov pohyb { X ( t ) , t ≥ 0} je t- parametrický systém náhodných premenných, pričom i) všetky prírastky X(t + ∆) – X(t) majú normálne rozdelenie so strednou hodnotou µ∆ a disperziou σ2∆, ii) pre každé delenie 0 < t1 < t2 < t3 < ... < tn sú prírastky X(t2) – X(t1), X(t3) – X(t2), .... X(tn) – X(tn-1) nezávislé náhodné premenné s parametrami podľa bodu i), iii) X(0) = 0 a vzorky ciest X(t) sú spojité v premennej t ≥ 0. Brownov pohyb s parametrami – strednou hodnotou µ = 0 a disperziou σ2 = 1 nazývame Wienerov proces. Z uvedeného všeobecného definovania Brownovho procesu vyplýva, že ak {w ( t ) , t ≥ 0} je Wienerov proces, tak pre jeho štatistické parametre strednej hodnoty a disperzie platí: E [ w(t ) ] = 0 a D [ w(t ) ] = t . 1 2 Rudolf Gavliak – Katedra kvantitatívnych metód a informatiky, Ekonomická fakulta, UMB, Banská Bystrica Vladimír Úradníček – Katedra kvantitatívnych metód a informatiky, EF, UMB, Banská Bystrica 34 Okrem toho sa dá ukázať, že pre distribučnú funkciu rozdelenia pravdepodobnosti Wienerovho procesu platí: x 2 1 P( w(t ) < x) = ∫ e −ξ / 2t dξ . 2π t −∞ Na základe definície Wienerovho procesu sú jeho prírastky dw(t) navzájom nekorelované a pre ich základné charakteristiky platí: E [ dw(t ) ] = 0 a D [ dw(t ) ] = dt . Prírastky dw môžeme zapísať v tvare: dw = Z dt , kde Z je náhodná premenná s N(0,1)- rozdelením. Brownov pohyb { X ( t ) , t ≥ 0} s parametrami µ a σ môžeme analyzovať aj z hľadiska jeho prírastkov dX(t) = X(t + dt) – X(t). Pre ich strednú hodnotu a rozptyl musí podľa i) platiť: t ) ] σ= dt σ D [ dw(t ) ] . To znamená, že Brownov pohyb môžeme E [ dX (t ) ] = µ dt a D [ dX (= charakterizovať jeho deterministickou a fluktuačnou zložkou a prírastky dX(t) písať v tvare: dX = (t ) µ dt + σ dw(t ) , kde {w ( t ) , t ≥ 0} (1) je Wienerov proces. Vzťah (1) nazývame stochastická diferenciálna rovnica. Ak { X ( t ) , t ≥ 0} je Brownov pohyb s parametrami µ a σ a y0 ∈ , tak systém náhodných premenných {Y ( t ) , t ≥ 0} = Y (t ) y0 e X (t ) , t ≥ 0 nazývame geometrický Brownov pohyb. Geometrický Brownov pohyb je opäť Markovov proces a na základe znalosti rozdelenia pravdepodobnosti Wienerovho procesu sa dajú odvodiť jeho základné štatistické parametre E [Y (t ) ] = y0 e µt + σ 2t , D [Y (t ) ] y02 e 2 µ t +σ t (eσ t − 1) . Bližšie pozri [4]. = 2 2 2 Nami analyzované jednofaktorové modely úrokových sadzieb môžeme formálne zapísať v tvare: rt = rt-1 + drt , kde rt je úroková sadzba v čase t; Jednofaktorové modely Jednofaktorové modely vychádzajú z predpokladu, že časová štruktúra úrokovej sadzby je určená len jedným faktorom, ktorým je krátkodobá úroková miera rt, pričom proces rt krátkodobej úrokovej sadzby sa v rizikovo neutrálnom svete riadi stochastickou diferenciálnou rovnicou: μt a σ t sú FtW - adaptované procesy. V nami analyzovaných modeloch budeme predpokladať, že rt je Markovovský proces (nezávisí od minulosti, len od súčasného stavu) s deterministickou zložkou (driftom) μ ( rt ,t ) a volatilitou σ ( rt ,t ) : 35 drt = μ (rt ,t )dt + σ (rt ,t )dW t , (2) kde μ ( x,t ) a σ ( x,t ) sú deterministické funkcie. Vzťah (2) môžeme zjednodušene zapísať v tvare: (3) drt = m ( r ) dt + s ( r ) dWt , ktorý využijeme pri formalizácii používaných modelov. Potom vývoj úrokovej sadzby rt môžeme modelovať podľa všeobecného vzťahu: (4) rt = rt-1 + drt . Jednofaktorové rovnovážne modely 1. Mertonov model (1973) m(r) = μrt a s ( r ) σ= , (5) kde µ je stredná hodnota výnosu úrokových sadzieb, σ je smerodajná odchýlka výnosu úrokových sadzieb. Vychádza z predpokladu, že úroková sadzba sa riadi normálnym rozdelením, čo vyvoláva problém s možnosťou výskytu záporných hodnôt. 2. Vasickov model (1977) m(r) = a ( b - rt ) a s ( r ) σ= , (6) ktorý predpokladá, že okamžitá úroková sadzba sleduje Ornstein-Uhlenbeckov proces s konštantnými koeficientami. Vasickov model tak rešpektuje empiricky zistenú vlastnosť návratu úrokových sadzieb k dlhodobej rovnováhe – reprezentovanú parametrom b, pričom parameter a charakterizuje rýchlosť približovania k dlhodobej rovnováhe. Rovnako ako Mertonov model, aj tento Vasickov model nezabraňuje možnosti záporných hodnôt úrokovej sadzby. Neskôr skonštruoval Vasicek svoj tzv. exponenciálny Vasickov model, ktorého základný predpoklad bol, že logaritmus okamžitej úrokovej sadzby sleduje Ornstein-Uhlenbeckov proces s kladnými konštantami a a b. Problém možnosti „vymodelovania“ záporných hodnôt úrokových sadzieb podmienil vznik Dothanovho modelu. 3. Dothanov model (1978) = t. (7) m(r) = μrt a s ( r ) σr Dothanov model je podobný štandardnému modelu Brownovho geometrického pohybu. Ide o lognormálny model pre úrokovú sadzbu, v ktorom úroková sadzba sleduje Brownov pohyb s konštantným driftom. Výsledkom je lognormálne rozdelenie budúcich krátkodobých úrokových sadzieb, ktoré je na reálnych dátach často nereálne (bližšie pozri [5]). Určitou modifikáciou tohto modelu bol neskôr Rendleman – Bartterov model (1980). 4. Cox-Ingersoll-Rossov model (CIR model) (1985) (8) m(r) = a ( b - rt ) a s ( r ) σ= r t . Tento model sleduje mean-reverting proces s časovo konštantnými koeficientami, v ktorom okamžitá úroková sadzba nenadobúda záporné hodnoty (bližšie pozri [2]). 36 Jednofaktorové bezarbitrážne modely Príkladom bezarbitrážnych jednofaktorových modelov sú: 1. Model Ho-Leea (1986) drt =θ (t )dt + σdW t , (9) kde funkcia (10) θ ( t ) = Ft ( 0,t ) + σ 2t má za úlohu zabezpečiť, aby výsledná krivka budúcich výnosov zodpovedala bežnej časovej štruktúre úrokových sadzieb bezkupónových dlhopisov, t.j. aby dobre fitovala počiatočnú časovú štruktúru (bližšie pozri [2]). 2. Model Hull-Whita (HW model) (1990) drt =θ t ( -)a t ( r) t dt + σ t ( dW ) t. (11) Ide o rozšírenie CIR modelu a Vasickovho modelu, pričom závislosť parametrov modelu od času (treba poznamenať, že nie všetky parametre musia byť nutne od času závislé) umožní zhodu so súčasnou časovou štruktúrou. 3. Simulácia vývoja úrokových sadzieb pomocou CIR a HW modelu V nasledujúcej časti uskutočníme simuláciu náhodného vývoja krátkodobej úrokovej sadzby pomocou dvoch reverzných procesov. Z množiny jednofaktorových rovnovážnych modelov bol zvolený CIR – model a jednofaktorové bezarbitrážne modely zastupuje model Hull-Whita.Výsledok simulácie je znázornený na Obrázku 1. Na vygenerovanie náhodných čísel z N(0,1) rozdelenia sme použili softvérový produkt SPSS. Ďalej sme pri simuláciách využili MS Excel. Modely úrokových sadzieb - simulácia 12.00% 10.00% 8.00% HW 6.00% CIR 4.00% 2.00% 0.00% 0 10 20 30 40 Obrázok 1 – HW a CIR model simulácie vývoja úrokových sadzieb 37 4. Záver Z Obrázku 1 vyplýva, že úrokové sadzby sa u oboch použitých modeloch približujú k dlhodobej rovnováhe vo výške 5 – 6 %. V súčasnosti sú jednofaktorové modely vystavené relatívne silnej kritike. Vytýka sa im skutočnosť, že predpoklad perfektnej korelovanosti výnosov dlhopisov s ich maturitami je vlastnosťou nekonzistentnou s realitou, ako aj fakt, že jednofaktorové modely nedokážu dokonale postihnúť meniaci sa tvar krivky časovej štruktúry úrokových sadzieb. Napriek tomu patrí skúmanie jednofaktorových modelov (aj s ohľadom na relatívne jednoduchú formu) medzi vhodné východiská pre ďalšie skúmanie viacfaktorových modelov časovej štruktúry, ktoré aj naším ďalším objektom záujmu v blízkej budúcnosti. 5. Literatúra [1] Brigo, D. – Mercurio, F. 2001. On deterministic-shift extensions of short-rate models. 25 s. [2] Čintalová, Z. 2007. Spriemerňovanie časových štruktúr výnosových kriviek a ich kalibrácia. Diplomová práca. Bratislava : FMFI, 2007. 43 s. [3] Hull, J. 2004. Options, futures et autres actifs dérivés. Paris : Pearson Education France. 5e édition. 2004. 806 s. ISBN 2-7440-7018-1. [4] Melicherčík, I. – Olšarová, L. – Úradníček, V. 2005. Kapitoly z finančnej matematiky. Bratislava : Epos, 2005. 242 s. ISBN 80-8057-651-3. [5] Zmeškal, Z. a kol. 2004. Finanční modely. Praha : Ekopress, s.r.o., 2004. 236 s. ISBN 80-86119-87-4. www.damianobrigo.it/detshiftrep.pdf. [dostupné na internete 03.09.2007], Príspevok vznikol v rámci riešenia vedeckého projektu č. 1/4634/07 financovaného grantovou agentúrou VEGA – Variantné metódy predikovania finančného vývoja malých a stredných podnikov po zavedení spoločnej európskej meny v Slovenskej republike. Adresa autorov: Ing. Rudolf Gavliak Katedra kvantitatívnych metód a informatiky Ekonomická fakulta UMB Tajovského 10 975 90 Banská Bystrica [email protected] Ing. Vladimír Úradníček, Ph.D. Katedra kvantitatívnych metód a informatiky Ekonomická fakulta UMB Tajovského 10 975 90 Banská Bystrica [email protected] 38 ADITÍVNE ROZKLADY PRIDANEJ HODNOTY Jozef Chajdiak Abstract: The paper consists analyse of the structure of the added value. Key words: added value, structure, additive decomposition Pre ukazovatele typu pridanej hodnoty (PH) platí jednoduchý modelový vzťah: PH = (MAT + ODP + ON + ZISK) – (MAT) = Q – MAT = ODP + ON + ZISK kde (MAT + ODP + ON + ZISK) je súčat, ktorý charkterizuje celkový objem produkcie Q a MAT predstavuje objem medzispotreby. Predstavuje jeden z ukazovateľov efektívnosti charakterizujúci uroveň efektívnosti vo „verejnom záujme“. Môžeme ho vypočítať dvoma spôsobmi ako je naznačené vo vyššie uvedenom vzťahu. Klasický spsôob výpočtu predstavuje zníženie objemu ukazovateľa typu celkovej produkcie o medzispotrebu (MAT). Druhý spôsob výpočtu predstavuje priamy výpočet ukazovateľa typu pridanej hodnoty ako súčet položiek odpisov (ODP), osobných nákladov (ON) a zisku (ZISK). Ukazovatele typu pridanej hodnoty predstavujú len vlastný prínos ekonomického procesu za analyzované obdobie. V ďalšom opíšeme nasledujúce konkrétne ukazovatele typu pridanej hodnoty: Pridaná hodnota (PH) – predstavuje jeden z ukazovateľov efektívnosti. Môžeme ho vypočítať dvoma spôsobmi. Prvý predstavuje priame zistenie jeho hodnoty v r.11 1 Výkazu ziskov a strát, druhý predstavuje jeho klasický výpočet ako súčet obchodnej marže (r.03) a výroby (r.04) znížený o výrobnú spotrebu (r.08): r.11 = r.03 + r.04 – r.08 PH = Obchodná marža + Výroba – Výrobná spotreba Pridaná hodnoty sa tak prakticky počíta len pre hospodársku činnosť v ekonomickom procese (obchodná marža (r.03) ako rozdiel tržieb za predaný tovar (r.01) a nákladov na obstaranie predaného tovaru (r.02) predstavuje vlastný prínos obchodného procesu a rozdiel výroby (r.04) a výrobnej spotreby (r.08) predstavuje vlastný prínos výrobnej činnosti). Priamy výpočet a tým aj aditívny rozklad pridanej hodnoty môžeme realizovať podľa schémy: PH = ODP + ON + (OM + Zvyr) + OSTPH r.11 = (r.18 + r.20) + r.12 + (r.03 + (r.25 – r.03)) + OSTPH t.j. súčet odpisov (ODP), osobných nákladov (ON), obchodnej marže (OM), výsledku hospodárenia z bezprostrednej výrobnej činnosti (Zvyr) a reziduálnej položky OSTPH (OSTPH = PH – ODP – ON – (OM + Zvyr)). Oficiálny výpočet pridanej hodnoty v r.11 Výkazu ziskov a strát postihuje objem pridanej hodnoty neúplne. Výsledok hospodárenia pred zdanením je súčasťou pridanej hodnoty v celej výške, t. j. aj Výsledok hospodárenia z finančnej činnosti (r.45) a aj Výsledok hospodárenia z mimoriadnej činnosti (r.50 – r.51). Ďalšou nespochybniteľnou časťou pridanej 1 Symbol r.xx znamená riadok xx Výkazu ziskov a strát verzie 2007. 39 hodnoty sú Nákladové úroky (r.38), ktoré predstavujú odmenu za pôsobenie cudzieho kapitálu v ekonomickom procese. Autor do pridanej hodnoty radí aj položku Dane a poplatky (r.17). Špecifické miesto v našej ekonomickej teórii a praxi má Daň z pridanej hodnoty (DPH). Podľa autora je jednoznačne súčasťou hodnoty (vyjadrenej cenou). Pri plátcoch DPH sa ale účtujú jednotlivé položky v cene bez DPH a DPH sa účtuje na účte 343 zvlášť (samostatne). Výstupy účtovníctva sú v cenách bez DPH a Výkaz ziskov a strát je takisto v cenách bez DPH (pri účtovných jednotkách – plátcoch DPH). Pri plátcoch DPH tak analyzujeme prakticky o pätinu menšie čísla. Saldo DPH (nákladových a výnosových položiek) je takisto súčasťou pridanej hodnoty. Pridaná hodnota 1 – predstavuje rozšírenú verziu pridanej hodnoty na celý ekonomický proces. Počíta sa priamym výpočtom ako súčet: + odpisy (r.18 + r.20) + osobné náklady (r.12) + dane a poplatky (r. 17) + nákladové úroky (r.38 podľa verzie 2007 Výkazu ziskov a strát) + výsledok hospodárenie z hospodárskej činnosti (r.25 podľa verzie 2007Výkazu ziskov a strát) + výsledok hospodárenie z finančnej činnosti (r.45 podľa verzie 2007 Výkazu ziskov a strát) + výsledok hospodárenie z mimoriadnej činnosti (mimoriadne výnosy r.50 – mimoriadne náklady r.51 podľa verzie 2007 Výkazu ziskov a strát) + saldo dane z pridanej hodnoty (Daňové priznanie Daň z pridanej hodnoty: daň celkom (r.13) – odpočítanie dane celkom (r.22)) PH1 = ODP + ON + (DaP + NU + Z + ΔDPH) Verzia Pridaná hodnota 1 meria prínos celkového ekonomického procesu. K výpočtu sú potrebné údaje za dva rozličné výkazy. Nie je problém postaviť sa za tribúnu a hlásať potrebu zvyšovať podiel výroby v odvetviach s vyššou pridanou hodnotou. Zdá sa však, že je problém povedať čo pridaná hodnota je. Literatúra: Chajdiak, J. 2008: Metódy finančno-ekonomických analýz. Bratislava: Statis (v tlači) Ficzová, I., Sedláček, J., Úradníček, V. 2002: Finančno-ekonomická analýza podniku – časť I. Banská Bystrica : OZ Financ, 208 s. ISBN 80-968702-1-1 Kanderová, M. Zhodnotenie vplyvu determinantov kapitálovej štruktúry na vzorke podnikov SR. In: Ekonomie a management. Liberec : Hospodářska fakulta TU, č. 3/2003. Adresa autora: Jozef Chajdiak, Doc., Ing., CSc. Bratislava [email protected] 40 Vývoj souhrnného ukazatele nezaměstnanosti v Ústeckém a Libereckém kraji Karel Hrach 1 Abstract: Composite indicators allow generally to express multidimensional problem with unique value, which is useful either for simple comparing of distinct regions, or for modelling the time development. This contribution presents an application of the composite indicator to the unemployment data in the Czech regions Ústecký kraj and Liberecký kraj through the years 2002-2007. Key words: Unemployment, composite indicator, cluster analysis, Liberec region, Ústí nad Labem region. 1. Úvod Vývoj nezaměstnanosti je problematika komplexní, dlouhodobě sledovaná a zpracovávaná. Cílem tohoto příspěvku je předvést možnost aplikace metod, umožňujících snížení dimenze původních dat, a pomocí výsledného jednoduchého ukazatele porovnat sledované oblasti, tedy okresy sousedních krajů Ústeckého a Libereckého v časovém rozpětí let 2002-2007. Použitými metodami jsou shluková analýza a výpočet průměrného ukazatele. Jako vstupní hodnoty jsou použity čtyři proměnné označené zde jako V1 až V4. Jde o ukazatele vykazované měsíčně (V1, V2), resp. čtvrtletně (V3, V4) Českým statistickým úřadem, přičemž V4 bylo poprvé uvedeno pro I. čtvrtletí roku 2002. Data jsou proto zpracována po čtvrtletích, počínaje právě I. čtvrtletím 2002 a konče aktuálně II. čtvrtletím 2007, celkem tedy 22 období. Graf 1. Vývoj ukazatelů nezaměstnanosti V1-V4 v okresech dvou krajů ČR po čtvrtletích 1 Karel Hrach, Fakulta sociálně ekonomická Univerzity J.E.Purkyně v Ústí nad Labem 41 V1 ... V2... V3... V4... Jedná se konkrétně o tyto ukazatele: míra registrované nezaměstnanosti v procentech; počet uchazečů o zaměstnání připadajících na jedno volné pracovní místo; podíl uchazečů o zaměstnání s délkou evidence na úřadu práce nad 6 měsíců; průměrná délka nezaměstnanosti ve dnech. Vývoj těchto ukazatelů je pro všech 11 okresů obou krajů a pro průměr za celou ČR znázorněn na grafu 1. Zkratky popisující jednotlivé okresy jsou tyto: a) pro okresy Ústeckého kraje LO... Louny DC... Děčín MO... Most CH... Chomutov TP... Teplice LT... Litoměřice UL... Ústí n.L. b) pro okresy Libereckého kraje CL... Česká Lípa LB... Liberec JN... Jablonec n.N. SE... Semily • • • • Souhrnně lze při pohledu na graf 1 konstatovat následující: U ukazatelů V1 a V2 dochází dlouhodobě k poklesu jejich hodnoty. (Počet volných pracovních míst letos v ČR dokonce dosáhl rekordní hodnoty od počátku sledování nezaměstnanosti, tj. od roku 1991.) Podíl V3 dlouhodobě evidovaných uchazečů (s délkou evidence nad 6 měsíců) je ve sledovaných okresech za sledovaná čtvrtletí víceméně stabilní, ovšem s periodickými výkyvy. U ukazatele V4 průměrná délka nezaměstnanosti dochází dlouhodobě k nárůstu, a to ve všech okresech zhruba s lineárním trendem. Všechny čtyři okresy Libereckého kraje jsou ve všech čtyřech ukazatelích na úrovni celorepublikového průměru nebo těsně pod ní, zatímco všechny okresy kraje Ústeckého jsou (až na řídké výjimky) nad celorepublikovým průměrem, leckdy velmi výrazně (zejména to platí pro okresy Chomutov, Teplice a především Most). Před aplikací jak metody shlukové analýzy, tak metody výpočtu průměrného ukazatele byly všechny čtyři proměnné V1 až V4 pro všech 11 okresů v každém čtvrtletí zvlášť standardizovány odečtením průměru a následně vydělením směrodatnou odchylkou, takto transformované veličiny byly označeny popořadě S1 až S4. Je evidentní, že pro hodnoty Si (i=1,...,4) platí: Kladná (záporná) hodnota Si indikuje fakt, že v daném čtvrtletí byla hodnota Vi u příslušného okresu nadprůměrná (podprůměrná). 2. Aplikace shlukové analýzy V každém ze 22 sledovaných čtvtletí zvlášť bylo všech 11 okresů tříděno do dvou shluků, a to na základě proměnných S1-S4. K výpočtům byl použit modul SW STATISTICA. Všechny čtyři okresy Libereckého kraje tvořily pokaždé společný shluk, přičemž většinou se k nim připojil ještě okres Litoměřice (stalo se tak celkem 16-krát). Spolu s Litoměřickem byl pak (to už spíš výjimečně) zařazen do téhož shluku ještě okres Ústí n.L., a to jednou pouze sám, dvakrát spolu s okresem Louny a jednou spolu s okresy Louny a Děčín. Okresy Chomutov, Most a Teplice zůstaly pokaždé ve shluku druhém, jinak řečeno, ve všech použitých ukazatelích nezaměstnanosti byly trvale nepodobné okresům Liberecka. 42 Uvedené výsledky jsou v souladu se stručnou analýzou provedenou již na základě jednotlivých vstupních ukazatelů V1-V4, konkrétně v tom smyslu, že všechny čtyři okresy Libereckého kraje jsou si vzájemně velmi podobné a že naopak nejvzdálenější jsou jim právě okresy Chomutov, Teplice a zejména Most. 3. Aplikace metody výpočtu průměrného ukazatele Souhrnný ukazatel lze ze vstupních numerických ukazatelů (charakteristik) určit také jako jejich průměrnou hodnotu. Problém případně velmi různorodých hodnot na vstupu lze odstranit tak, že průměrovány budou hodnoty standardizované, v našem případě tedy S1-S4. Průměr bude určován technikou prostého výpočtu, kdy jednotlivé vstupní ukazatele mají vlastně stejnou váhu: S p = (S1+S2+S3+S4)/4, (1) nebo metodou váženého výpočtu: S v = w 1 S1+w 2 S2+w 3 S3+w 4 S4, (2) přičemž pro váhy w 1 ,...w 4 musí platit: w 1 + w 2 + w 3 +w 4 = 1. (3) Vzorce (1) až (3) lze samozřejmě zobecnit pro jiný počet vstupních ukazatelů, než jsou čtyři. Poznamenejme též, že vztah (1) je speciálním případem vztahu (2) při volbě rovnoměrných vah, tj. při volbě w1=...=w4=1/4. V rámci tohoto příspěvku je aplikována volba vah, někdy nazývaná „váhy určené samotnými daty“ (viz např. Hrach-Mihola 2006). Je tím míněno to, že nejvyšší váha je přiřazena ukazateli s nejvyšší hodnotou, atd. V případě čtyř ukazatelů byly zvoleny hodnoty vah w 1 =5/14, w 2 =4/14, w 3 =3/14 , w 4 =2/14. (4) Tabulky 1 a 2 obsahují výsledné hodnoty ukazatele jakožto prostého průměru dle vztahu (1). Výpočet byl proveden v MS Excelu. Velmi podobných výsledků (zde proto ani tabulkově, ani graficky neuváděny) bylo dosaženo i podle vzorce (2) s volbou vah (4). Graf 2 znázorňuje vývoj hodnot z tabulek 1 a 2 v čase. Tabulka 1. Prostý průměrný ukazatel pro jednotlivé okresy za čtvrtletí let 2002-2004 rok 2002 2003 2004 čtvrtletí I II III IV I II III IV I II III DC 0,07 0,16 0,02 -0,01 -0,01 0,04 -0,04 -0,02 0,15 0,22 0,26 CH 0,60 0,83 0,90 0,76 0,70 0,81 0,96 0,69 0,96 0,78 0,82 LT -0,02 -0,10 -0,09 -0,24 -0,20 -0,03 0,01 0,28 -0,44 -0,22 -0,41 LO 0,49 0,64 0,48 0,43 0,48 0,43 0,31 0,11 0,19 0,26 0,32 MO 1,95 1,73 1,68 1,72 1,71 1,80 1,60 1,61 1,91 2,05 2,01 TP 0,79 0,92 1,14 1,25 1,27 1,10 1,13 0,92 1,05 1,00 1,03 UL 0,46 0,35 0,31 0,34 0,36 0,27 0,40 0,29 0,31 0,19 0,17 CL -1,23 -1,22 -1,20 -1,17 -1,15 -1,17 -1,16 -1,09 -1,08 -1,10 -1,04 JN -1,16 -1,24 -1,16 -1,07 -1,12 -1,08 -1,07 -1,01 -1,13 -1,15 -1,11 LB -0,87 -0,94 -0,90 -0,85 -0,91 -0,95 -0,98 -0,78 -0,85 -0,91 -0,88 SE -1,08 -1,12 -1,17 -1,17 -1,13 -1,21 -1,17 -1,01 -1,08 -1,12 -1,18 43 IV 0,28 0,47 -0,04 0,22 2,10 0,77 0,00 -0,98 -0,95 -0,82 -1,05 Tabulka 2. Prostý průměrný ukazatel pro jednotlivé okresy za čtvrtletí let 2005-2007 rok 2005 2006 2007 čtvrtletí I II III IV I II III IV I II III* DC 0,32 0,45 0,49 0,46 0,46 0,56 0,56 0,40 0,56 0,68 CH 0,59 0,76 0,93 0,69 0,59 0,69 0,59 0,58 0,45 0,33 LT 0,17 -0,31 -0,37 -0,55 -0,27 -0,37 -0,34 -0,38 -0,30 -0,11 LO 0,09 0,40 0,14 0,13 0,23 0,34 0,27 0,21 0,14 0,13 MO 1,88 1,97 2,05 2,19 2,08 1,92 1,99 2,00 2,01 1,81 TP 0,92 1,03 0,89 0,85 0,90 0,90 0,94 1,06 0,91 0,94 UL -0,09 -0,03 0,06 0,21 0,25 0,30 0,24 0,24 0,38 0,45 CL -1,01 -1,07 -1,06 -1,03 -1,19 -1,04 -0,94 -0,99 -0,95 -0,96 JN -0,98 -1,08 -1,10 -1,03 -1,11 -1,30 -1,21 -1,16 -1,16 -1,25 LB -0,80 -0,93 -0,88 -0,83 -0,90 -0,97 -0,92 -0,84 -0,88 -0,90 SE 0,32 0,45 0,49 0,46 0,46 0,56 0,56 0,40 0,56 0,68 * dosud nezjišťované období IV* Na vývoji souhrnného ukazatele vypočítaného jako průměr standardizovaných charakteristik S1-S4 je především zajímavé to, že různorodé trendy vstupních charakteristik V1-V4 se vzájemně vyrušily, takže celkově byla v letech 2002-2007 situace v nezaměstnanosti v jednotlivých okresech víceméně stabilní, viz graf 2. Výraznější výkyvy se objevily pouze u okresu Litoměřice, způsobeno je to především velkými výkyvy proměnné V2 u tohoto okresu. Opět se jako trojice okresů s nejhorší situací jeví okresy Chomutov, Teplice a především pak Most, dosahující v každém ze 22 sledovaných čtvrtletí zhruba dvojnásobku průměrné hodnoty (kteréžto odpovídá úroveň 0). A opět se naopak jako okresy s nejlepší situací jeví všechny čtyři okresy Libereckého kraje. 4. Závěr Výhodou aplikace shlukové analýzy je to, že původně vícerozměrná charakteristika každé statistické jednotky je redukována na údaj jednorozměrný a snadno interpretovatelný (příslušnost do jednoho ze shluků). Za nevýhodu však lze označit to, že výsledný údaj má pouze kategoriální charakter (v našem případě třídění do dvou shluků pouze binární) a je tak prakticky nemožné vhodně komentovat jeho časový vývoj. Graf 2. Průměrný ukazatel nezaměstnanosti v okresech dvou krajů ČR (čtvrtletí 1-22) 44 Naopak u průměrných ukazatelů je výhodou možnost srovnání časového vývoje, nevýhodou je však jejich obtížná, ne-li nemožná interpretace. Řešením je proto, tak jako v tomto příspěvku, kombinace obou metod – shlukové analýzy pro snazší interpretaci jejích výsledků a techniky průměrných souhrnných ukazatelů v případě, kdy potřebujeme zachytit vývoj sledovaného problému v čase. Poznámka závěrem: Tento příspěvek volně navazuje na problematiku řešenou v rámci grantu GAČR 402/04/0263 s názvem „Statistické metody a nezaměstnanost“, jehož výsledky byly popsány zejména v publikacích autorů Hrach a Šimsová 2005-2006, a dále na problematiku souhrnných indikátorů z publikací Hrach-Mihola 2006 nebo diplomové práce Matouš 2007. 5. Literatura HRACH, K. 2005. Statistické metody a data o nezaměstnanosti. Ústí n.L.: Acta Universitatis Purkynianae, 2005. 42 s. ISBN: 80-7044-754-0. HRACH, K. 2005. Výsledky aplikace analýzy přežití na reálná data o nezaměstnanosti. In: Forum statisticum Slovacum, č. 1, 2005, s. 50-55. ISSN 1336-7420. HRACH, K. 2006. Analýza přežití pro porovnání nezaměstnanosti v rámci Ústeckého kraje. In: E+M Ekonomie+Management, č. IX/1, 2006, s.6-12. ISSN: 1212-3609. HRACH, K.- MIHOLA, J. 2006. Metodické přístupy ke konstrukci souhrnných ukazatelů. In: Statistika, č. 5, 2006, s. 398-418. ISSN: 0322-788x. MATOUŠ, J. 2007. Souhrnný indikátor struktury nezaměstnanosti v regionu. Ústí n.L.: FSE UJEP, 2007. 62 s. Diplomová práce. ŠIMSOVÁ, J. 2005. Časový vývoj nezaměstnanosti v rámci Ústeckého kraje. Ústí n.L.: Acta Universitatis Purkynianae, 2005. 49 s. ISBN: 80-7044-753-2. ŠIMSOVÁ, J. 2005. Analýza časových řad míry nezaměstnanosti dvou regionů Ústeckého kraje. In: Forum statisticum Slovacum, č. 2, 2005, s. 119-124. ISSN 1336-7420. ŠIMSOVÁ, J. 2006. Analýza časové řady míry nezaměstnanosti v regionu Teplice. In: E+M Ekonomie+Management, č. IX/1, 2006, s.13-19. ISSN: 1212-3609. Adresa autora: Karel Hrach, RNDr., Ph.D. Moskevská 54 400 96 Ústí nad Labem [email protected] 45 Štatistický tolerančný interval – nástroj riadenia kvality Ivan Janiga1, Ivan Garaj2 Abstract: The paper deals with using statistical tolerance intervals in quality control. There are presented many examples of their utilization. Key words: statistical tolerance interval, quality control 1. Úvod Odhady stredných hodnôt a rozptylov základných súborov alebo parametrov distribučných funkcií nevyčerpávajú všetky odhady, ktoré sú užitočné v praxi. Napríklad pri hromadnej výrobe je výrobný proces nastavený. Výrobca potrebuje zistiť medze, v ktorých kolíše nejaký dôležitý znak kvality výrobku. Odhad strednej hodnoty a rozptylu v tomto prípade nestačí, ale je potrebné poznať medze, ktoré pokryjú podstatnú časť základného súboru t. j. „skoro celý“ základný súbor. Iný podobný príklad je situácia, pri ktorej má výrobca dodávať vopred určitý dohodnutý podiel (napr. 40 %) svojho výrobku na špeciálny účel. Na tento účel je potrebné udržovať hodnoty znaku kvality na čo najvyššej úrovni. Aby sa výrobca presvedčil, ako môže uspokojiť budúce nároky, odhadne medze, ktoré takmer isto pokrývajú 40 % najväščích hodnôt základného súboru. Tak zistí, o aké hodnoty ide, aby vedel, akú kvality môže ponúknuť na špeciálny účel. Stanoviť z náhodného výberu medze, ktoré pokryjú vopred danú časť základného súboru náhodnej premennej, je úloha stanovenia štatistických tolerančných medzí. V tomto článku predpokladáme normálne rozdelenie znaku kvality. 2. Štatistické tolerančné medze pre normálny základný súbor Predpokladajme, že náhodná premenná (meraný znak kvality) X má normálne rozdelenie so strednou hodnotou µ a rozptylom σ 2 , t. j. X ~ N ( µ , σ 2 ) . 2.1 Stredná hodnota µ a rozptyl σ 2 sú známe Rozdelenie skúmaného znaku kvality je určené jednoznačne, ak stredná hodnota µ a rozptyl σ 2 základného súboru s normálnym rozdelením sú známe. V tomto prípade sa dajú so stopercentnou spoľahlivosťou určiť medze, ktoré pokrývajú podiel p hodnôt základného súboru: napravo od x L = µ − u p σ (jednostranný interval), naľavo od xU = µ + u p σ (jednostranný interval), medzi x L = µ − u (1+ p ) / 2 σ a xU = µ + u (1+ p ) / 2 σ (dvojstranný interval). kde u p je p- kvantil normovaného normálneho rozdelenia. 46 V praxi sa však častejšie vyskytujú prípady, keď je jeden z parametrov µ a σ 2 neznámy (obvykle µ ) alebo obidva parametre sú neznáme. Majme hodnoty náhodného výberu x1 , x 2 , , x n z rozdelenia N ( µ , σ 2 ) . Z nich vypočítame hodnoty odhadov 1 x= n s2 = n ∑ xi ─ parametra µ a i =1 n ∑ 1 ( xi − x ) 2 ─ parametra σ 2 n − 1 i =1 (1) Budeme hľadať intervaly, ktoré so spoľahlivosťou 1 − α pokrývajú aspoň podiel p hodnôt z rozdelenia N ( µ , σ 2 ) . 2.2 Stredná hodnota µ je neznáma a rozptyl σ 2 je známy Nech parameter µ je neznámy a parameter σ 2 je známy. Jednostranný štatistický tolerančný interval pre neznáme µ a známe σ 2 má tvar (− ∞, x − k1σ] alebo [x + k1σ, ∞ ) (2) pričom pre tolerančný činiteľ platí k1 (n; p; 1 − α) = u p + u1−α (3) n kde u p a u1−α sú kvantily rozdelenia N (0, 1) . Dvojstranný štatistický tolerančný interval pre neznáme µ a známe σ 2 je interval [x − k 2 σ, x + k 2 σ] (4) v ktorom tolerančný činiteľ k 2 (n; p; 1 − α) je riešením rovnice u u Φ k 2 + 1−α / 2 + Φ k 2 − 1−α / 2 = 1 + p n n (5) 2.3 Stredná hodnota µ a rozptyl σ 2 sú neznáme Nech parametre µ a σ 2 sú neznáme. Jednostranný štatistický tolerančný interval má tvar (− ∞, x − k 3 σ] alebo [x + k 3 σ, ∞ ) (6) pričom exaktný vzťah pre tolerančný činiteľ je k 3 (n; p; 1 − α) = ( t1−α n − 1,u p n ) (7) n kde v čitateli je 100(1 − α) % kvantil necentrálneho t-rozdelenia so stupňami voľnosti n − 1 s parametrom necentrality u p n . 47 Dvojstranný štatistický tolerančný interval pre jeden súbor meraní má tvar [x − k 4 σ, x + k 4 σ] (8) Treba vypočítať hodnotu neznámeho tolerančného činiteľa k 4 (n; p; 1 − α) tak, aby príslušný interval s pravdepodobnosťou 1 − α pokryl aspoň podiel p hodnôt z rozdelenia N ( µ , σ 2 ) . Na výpočet použijeme exaktný vzťah (12). Dvojstranné tolerančné intervaly pre viac nezávislých súborov meraní Majme m náhodných premenných X i s normálnym rozdelením, s rôznymi strednými hodnotami µ i a rovnakým rozptylom σ 2 t. j. Xi ~ N (µi , σ 2 ) , pričom parametre µ i (i = 1, 2, ..., m) a spoločný rozptyl σ 2 sú neznáme. Nech ( xi1 , xi 2 , , xin ) sú nezávislé merania veličiny X i (i = 1, 2, ..., m) . Dostaneme tak m súborov, ktoré obsahujú rovnaký počet n nezávislých meraní. Budeme hľadať intervaly, ktoré so spoľahlivosťou 1 − α ( 0 < α < 1 ) obsahujú aspoň podiel p ( 0 < p < 1 ) hodnôt z rozdelení N (µi , σ 2 ) . V tomto prípade môžeme vypočítať m dvojstranných tolerančných intervalov. (xi. − k sP , xi. + k sP ) (9) kde xi. = sP2 = 1 n n xij ∑ j =1 je hodnota odhadu parametra µ i , m n 1 ∑∑ ( xij − xi. ) 2 je združený odhad spoločného rozptylu σ 2 . m(n − 1) i =1 j =1 (10) (11) Rovnako ako v predchádzajúcom prípade potrebujeme vypočítať hodnotu tolerančného činiteľa k 4 m (n; p; 1 − α) tak, aby príslušný interval s pravdepodobnosťou 1 − α pokryl aspoň podiel p hodnôt z rozdelenia N (µi , σ 2 ) . Výpočet dvojstranných tolerančných činiteľov k 4 (n; p; 1 − α) a k 4 m (n; p; 1 − α) Vo väčšine štatistických tabuliek sú uvedené hodnoty dvostranného tolerančného činiteľa vypočítané použitím nejakej aproximačnej metódy. Jednotlivé aproximačné metódy mali menší alebo väčší význam vtedy, keď výpočtová technika bola iba v začiatočnej fáze. Dnes už tieto aproximácie nevyhovujú. Preto pri revízii medzinárodnej normy ISO 16269-6: 2005 (Statistical interpretation of data. Part 6: Detarmination of statistical tolerance intervals) o tolerančných intervaloch sa pristúpilo k výpočtu tolerančných činiteľov k = k (n, ν, p,1 − α ) pomocou exakného vzťahu, ktorý odvodili nezávisle viacerí autory [5], [6], [7], [8], [9]. Exaktné vzťahy majú tvar integrálnej rovnice n 2π ∞ ∫ F ( x, k ) e − nx 2 2 dx −1+α = 0 (12) −∞ kde 48 ∞ F ( x, k ) = ∫2 ν t2 −1 − e t 2 ν dt ν R ( x) 2 2 Γ ν k2 2 a R (x) je riešenie rovnice Φ ( x + R) − Φ ( x − R) − p = 0 . Hodnotu tolerančného činiteľa k = k (n, ν, p,1 − α ) pre rôzne n, ν, p, 1 − α dostaneme ako výsledok riešenia integrálnej rovnice (12). Pri riešení bolo potrebné použiť numerické metódy. sa tolerančné činitele jedného súboru meraní x1 , x 2 , , x n k 4 = k 4 (n, ν, p,1 − α ) vypočítajú z rovnice (12) tak, že zvolíme ν = n − 1 . Každej hodnote n teda zodpovedá jediná hodnota ν . Keď máme viac nezávislých súborov meraní ( xi1 , xi 2 , , xin ) , kde (i = 1, 2, ..., m) , V prípade tolerančné činitele k 4 m = k 4 m (n, ν, p,1 − α ) sa tiež vypočítajú z rovnice (12) tak, že volíme ν ≠ n −1 . V tomto prípade každej hodnote n zodpovedajú všetky hodnoty ν , ktoré sú rôzne od n −1 . 3. Štatistické tabuľky tolerančných činiteľov pre normálny základný súbor Či už je niektorý z parametrov µ a σ 2 známy alebo nie, v literatúre môžeme nájsť tabuľky tolerančných činiteľov pre najčastejšie používané hodnoty p , 1 − α a rozsahy výberov n . Pre kombinácie parametrov µ neznáme, σ 2 známe a µ neznáme, σ 2 neznáme je vydaná medzinárodná norma ISO 16269-6: 2005 (Statistical interpretation of data. Part 6: Detarmination of statistical tolerance intervals), kde sú hodnoty k uvedené na 3 desatinné miesta pre p = 0,50 ; 0,75; 0,90; 0,95; 0,99; 0,999, 1 − α = 0,5 ; 0,75; 0,90; 0,95; 0,99; 0,999 a n = 2 (1)20(2)30(5)50(10)100(50)300(100)500. 1000, ∞ V štatistických tabuľkách, ktoré publikoval Odeh [8] sú činitele k vypočítané na 3 desatinné miesta v prípade dvojstranných štatistických tolerančných medzí pre p = 0,75; 0,90; 0,95; 0,975; 0,99; 0,995; 0,999, 1 − α = 0,5 ; 0,75; 0,90; 0,95; 0,975; 0,99; 0,995 a n = 2(1)100(2)180(5)300(10)400(25)650(50)1000; 1500; 2000; 3000; 5000; 10000, ∞, jednostranných štatistických tolerančných medzí pre p = 0,75; 0,90; 0,95; 0,975; 0,99; 0,999; 0,9999, 1 − α = 0,005; 0,01; 0,025; 0,05; 0,10; 0,25; 0,50; 0,75; 0,90; 0,95; 0,975; 0,99; 0,995 a n = 2(1)100(2)180(5)300(10)400(25)650(50) 1000; 1500; 2000; 3000; 5000; 10000, ∞. 49 Likeš [23] v štatistických tabuľkách uvádza hodnoty tolerančných činiteľov k na 4 desatinné miesta v prípade jednostranných štatistických tolerančných medzí, keď µ a σ 2 sú neznáme, pre p = 0,50 ; 0,75; 0,90; 0,95; 0,99; 0,999, 1 − α = 0,5 ; 0,75; 0,90; 0,95; 0,99; 0,999 a n = 2 (1)20(2)30(5)50(10)100(50)300. dvojstranných štatistických tolerančných medzí, keď µ a σ 2 sú neznáme resp. µ je neznáme a σ 2 známe, pre rovnaké hodnoty p , 1 − α ako pri jednostranných medziach a pre n = 2 (1)20(2)30(5)50(10)100(50)300(50)500(100)1000. Garaj a Janiga uvádzajú v publikáciách [10], [11], [12] hodnoty tolerančných činiteľov k na 4 desatinné miesta iba pre prípad µ a σ 2 sú neznáme. Pre jednostranné štatistické tolerančné medze [12] p = 0,525; 0,55(0,05) 0,70; 0,725; 0,75(0,05) 0,90; 0,91(0,01) 0,97; 0,975; 0,98; 0,99; 0,991(0,001) 0,999; 0,9999, 1 − α = 0,001; 0,005; 0,01; 0,025; 0,05; 0,10; 0,25; 0,50; 0,75; 0,90; 0,95; 0,975; 0,99; 0,995; 0,999; 0,9999, n = 2(1)200(5)300(10) 400(25) 1000; 1500; 2000(1000) 5000; 10000. V poslednom riadku (∞) sú hodnoty kvantilov u p normovaného normálneho rozdelenia. Pre dvostranné štatistické tolerančné medze rozdelenia jedného súboru [10] p = 0,50(0,05) 0,90; 0,91(0,01) 0,99; 0,991(0,001) 0,999, 0,9991(0,0001) 0,9999 1 − α = 0,50; 0,75; 0,90; 0,95; 0,975; 0,99; 0,995; 0,999, n = n = 2(1) 200; 220(20) 500; 550(50) 1000; 1500(500) 10000; 20000(10000) 100000. 1+ p normovaného normálneho V poslednom riadku (∞) sú hodnoty kvantilov rádu 2 rozdelenia. Špeciálny prípad tvoria štatistické tolerančné medze rozdelení viacej súborov, ktoré majú spoločný rozptyl [12]. Tabuľky 1 až 25 z tabuľkovej časti obsahujú hodnoty tolerančných činiteľov k s presnosťou na štyri desatinné miesta pre všetky kombinácie koeficientov spoľahlivosti 1 − α = 0,90; 0,95; 0,99; 0,995; 0,999 s hodnotami p = 0,90; 0,95; 0,99; 0,995; 0,999. V každej z tabuliek 1 až 25 sú hodnoty k vypočítané pre n = 2(1) 40; 45(5) 100; 200(100) 1000; 5000; 10000, ∞ ν = 1(1) 60(5) 100(100) 1000; 5000; 10000, ∞. V poslednom riadku ∞) ( boli hodnoty tolerančných činiteľov k vypočítané pre n = 10 6 a v poslednom stĺpci (∞) pre ν = 10 6. 5 Príklady Dáta pre príklady 1 až 4 Merali sa zaťaženia bavlnenej priadze pri pretrhnutí. Počet pozorovaní n = 12 , ktorý v týchto príkladoch uvažujeme, je podstatne nižší než odporúčaný počet podľa normy ISO 2602. Číselné údaje a výpočty v rôznych príkladoch sa uvádzajú v centinewtonoch. Namerané hodnoty sú: 50 228,6 232,7 238,8 317,2 315,8 275,1 222,2 236,7 224,7 251,2 210,4 270,7 Tieto merania sa získali z dávky 12 000 cievok, vyrobených počas jednej výrobnej zmeny, zabalených v 120 škatuliach, v každej z nich bolo 100 cievok. Z dávky sa náhodne vybralo 12 škatúľ a z každej z týchto škatúľ sa náhodne vybrala jedna cievka. Z priadze na týchto cievkach sa odstrihli skúšobné kusy s dĺžkou 50 cm, pričom boli vo vzdialenosti približne 5 m od voľného konca. Samotné testy sa vykonali na stredných častiach týchto skúšobných kúskov. Predchádzajúce informácie oprávňujú k predpokladu, že zaťaženie pri pretrhnutí má v týchto podmienkach prakticky normálne rozdelenie. W-kritériom [26] bolo potvrdené, že údaje neodporujú predpokladu o normálnom rozdelení. Z nameraných dát sme získali tieto výsledky: x = 3024,1 / 12 = 252,01 n∑ x 2 − (∑ x ) 2 s= n(n − 1) = 166772,27 = 1263,4263 = 35,545 12 × 11 Príklad 1: Jednostranný štatistický tolerančný interval, známy rozptyl Predpokladajme, že predchádzajúce merania preukázali, že rozptyl medzi jednotlivými dávkami od toho istého dodávateľa je konštantný a reprezentuje ho smerodajná odchýlka σ = 33,150 , pričom stredná hodnota nie je známa. Požaduje sa, aby dolná medza x L bola taká, že pri úrovni spoľahlivosti 1 − α = 0,95 (95 %) sa dá zaistiť, že najmenej 0,95 (95%) zaťažení pri roztrhnutí jednotiek z dávky (meraných za rovnakých podmienok) bude nad hodnotou x L . V norme ISO 16269-6 nájdeme hodnotu príslušného tolerančného činiteľa k1 (12; 0,95; 0,95) = 2,120 odkiaľ x L = x − k1 (n; p; 1 − α) × σ = 252,01 − 2,120 × 33,150 = 181,732 Ak by sa požadoval väčší podiel základného súboru (napríklad p = 0,99 ) a (alebo) vyššia úroveň spoľahlivosti (napríklad 1 − α = 0,99 ), získala by sa nižšia hodnota dolnej medze x L . Príklad 2: Dvojstranný štatistický tolerančný interval, známy rozptyl Za tých istých podmienok ako v príklade 1 predpokladajme, že sa požadujú také medze x L a xU , že pri úrovni spoľahlivosti 1 − α = 0,95 sa dá zaistiť, že aspoň podiel p = 0,90 (90 %) namáhania pri roztrhnutí padne medzi x L a xU . V norme ISO 16269-6 nájdeme hodnotu príslušného tolerančného činiteľa k 2 (12; 0,90; 0,95) = 1,889 (v Likeš-Laga je k 2 (12; 0,90; 0,95) = 1,8886 ) odkiaľ x L = x − k 2 (n; p; 1 − α) × σ = 252,01 − 1,889 × 33,150 = 189,390 xU = x + k 2 (n; p; 1 − α) × σ = 252,01 + 1,889 × 33,150 = 314,630 51 Porovnaním s príkladom 1 by malo byť jasné, že zaistenie toho, aby aspoň 90% základného súboru ležalo medzi medzami x L a xU , nie je to isté ako zaistenie, že nie viac ako 5% leží za každou z medzí. Príklad 3: Jednostranný štatistický tolerančný interval, neznámy rozptyl Tu sa predpokladá, že smerodajná odchýlka základného súboru nie je známa a treba ju odhadnúť z výberu. Predpokladajú sa také isté požiadavky ako v príklade so známou smerodajnou odchýlkou (Príklad 1), teda p = 0,95 a 1 − α = 0,95 . V norme ISO 16269-6 nájdeme hodnotu príslušného tolerančného činiteľa k 3 (12; 0,95; 0,95) = 2,737 (v Likeš-Laga aj v Garaj-Janiga je k 3 (12; 0,95; 0,95) = 2,7364 ) odkiaľ x L = x − k 3 (n; p; 1 − α) × s = 252,01 − 2,737 × 35,545 = 154,723 Príklad 4: Dvojstranný štatistický tolerančný interval, neznámy rozptyl Pri takých istých podmienkach ako v príklade 2 predpokladajme, že treba vypočítať medze x L a xU tak, aby sa pri úrovni spoľahlivosti 1 − α = 0,95 dalo zaistiť, že v časti dávky, ktorá sa rovná najmenej p = 0,90 (90 %), bude hodnota zaťaženia pri roztrhnutí medzi x L a xU . V norme ISO 16269-6 nájdeme hodnotu príslušného tolerančného činiteľa k 4 (12; 0,90; 0,95) = 2,671 (Likeš-Laga: k 4 (12; 0,95; 0,95) = 2,6550 ; Garaj-Janiga: k 4 (12; 0,95; 0,95) = 2,6703 ) odkiaľ x L = x − k 4 (n; p; 1 − α) × s = 252,01 − 2,671 × 35,545 = 157,069 xU = x + k 4 (n; p; 1 − α) × s = 252,01 + 2,671 × 35,545 = 346,951 Treba si všimnúť, že hodnota x L je menšia a hodnota xU je väčšia ako v príklade 2 (známy rozptyl), pretože použitie s namiesto σ si vyžaduje väčšiu hodnotu tolerančného činiteľa, aby sa pripustila dodatočná neistota. Treba platiť určitú daň za to, že nie je známa smerodajná odchýlka základného súboru σ a rozšírenie štatistického tolerančného intervalu toto berie do úvahy. Samozrejme, nie je úplne isté, že je správna hodnota σ = 33,150, použitá v príkladoch 1 a 2. Je preto rozumnejšie použiť odhad s spolu s príslušnými hodnotami tolerančných činiteľov. Príklad 5. Dvojstranné štatistické tolerančné intervaly, neznámy spoločný rozptyl Na troch strojoch sa vyrábajú súčiastky rovnakého druhu. Namerané hodnoty meranej veličiny na 17-tich súčiastkach od každého stroja sú uvedené v nasledovnej tabuľke. Chceme vypočítať 99 %-ný dvojstranný tolerančný interval pre meranú veličinu na prvom, druhom a treťom stroji so spoľahlivosťou 1 − α = 0,95 . W-kritériom [26] bola potvrdená dobrá zhoda s normálnym rozdelením s neznámymi parametrami µ a σ 2 (pre prvý stroj je P hodnota 0,076, pre druhý 0,870 a pre tretí 0,979). Bartletovým testom bola zistená homogenita rozptylov ( H 0 : σ 12 = σ 22 = σ 32 nezamietame, pričom P hodnota je 0,907), preto na odhad spoločného rozptylu môžeme použiť všetkých 52 52 nameraných hodnôt ( s P2 = 2,1498 a s P = 1,4662 ). Stredné hodnoty sú rôzne ( H 0 : µ1 = µ 2 = µ 3 zamietame). Na odhad stredných hodnôt môžeme použiť iba 17 meraní z produkcie príslušných strojov. V [11] nájdeme pre n = 17 a ν = 3(17 − 1) = 48 hodnotu k 43 = 3,2077 . Potom 99 %-ný dvojstranný tolerančný interval so spoľahlivosťou 0,95 je pre 1. stroj: 48,8294 ± 3,2077 ⋅ 2,1498 , t. j. (44,13; 53,53), 2. stroj: 54,0000 ± 3,2077 ⋅ 2,1498 , t. j. (49,30; 58,70), 3. stroj: 59,6706 ± 3,2077 ⋅ 2,1498 , t. j. (54,97; 64,37). Namerané hodnoty znaku kvality pre tri stroje i j 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 1. stroj 2. stroj 3. stroj 50,5 49,9 48,4 46,1 50,1 50,2 49,1 48,1 50,3 46,6 49,2 46,5 48,0 49,1 49,6 49,6 48,8 56,2 57,3 54,5 53,6 51,7 55,5 54,1 53,0 52,1 51,3 54,6 55,1 53,2 53,8 53,9 54,1 54,0 59,0 59,7 58,2 56,7 59,6 60,2 61,5 62,5 61,3 58,5 60,6 61,3 57,7 59,5 59,6 59,5 59,0 17 ∑x 830,1000 918,0000 xi . 48,8294 54,0000 59,6706 si2 1,8947 2,3662 2,1885 j =1 ij 1014,4000 Príklad 6 Štatistická prebierka meraním Pri štatistickej prebierke meraním je obyčajne normou daná dolná tolerančná hranica LSL (Lower Specification Limit), alebo horná tolerančná hranica USL (Upper Specification 53 Limit). Predpokladáme, že merania kvantitatívneho štatistického znaku kvality ( x1 , x 2 , , x n ) sú realizácie normálneho rozdelenia N ( μ, σ 2 ) , kde neznáme parametre μ a σ 2 odhadneme pomocou vzťahov (1). V prípade hornej tolerančnej medze USL, dodávku výrobkov prijímame, ak výberovou kontrolou zistíme, že x + k s ≤ USL . V prípade dolnej tolerančnej medze LSL, dodávku výrobkov prijímame, ak výberovou kontrolou zistíme, že x − k s ≥ LSL . V oboch prípadoch je k tabelový jednostranný tolerančný činiteľ. Voľba koeficientu spoľahlivosti 1 − α závisí od toho, ako je preberací plán výhodný pre výrobcu, ale aj pre odberateľa. Odberateľ napríklad zvolí 1 − α = 0,05 a p = 0,90 . Pre n = 10 nájdeme v [12] hodnotu štatistického tolerančného činiteľa k = 0,7116. V prípade hornej tolerančnej medze USL dodávku výrobkov prijímame, ak x + 0,7116 s ≤ USL a zamietame, ak x + 0,7116 s > USL Ak táto dodávka obsahuje podiel 100 p % = 90 % meraní pravdepodobnosť, že bude prijatá je 1 − (1 − α ) = 0,95. V prípade dolnej tolerančnej medze LSL dodávku výrobkov prijímame, ak pod hranicou USL, nad hranicou LSL, x − 0,7116 s ≥ LSL a zamietame, ak x − 0,7116 s < LSL. Ak táto dodávka obsahuje podiel 100 p % = 90 % pravdepodobnosť že bude prijatá je 1 − (1 − α ) = 0,95. meraní Príklad 7 (Prebierka dodávky polyesteru 104) Znak kvality polyesteru 104 je viskozita, meraná v mPa ⋅ s (mili Pascal ּ◌sekunda) pri teplote 25 °C [25]. Požiadavka normy je, aby horná medza viskozity bola USL = 1 000 cP . Polyester 104 sa dodáva konštantným počtom sudov, ktorých obsah predstavuje jednu výrobnú dávku (operáciu). Výsledky analýz prakticky nie sú zaťažené chybami. Náhodný výber poskytol n = 10 náhodných meraní: 939 945 947 945 948 941 943 944 946 940 W-kritériom [26] bola potvrdená dobrá zhoda s normálnym rozdelením (P hodnota je 0,7385). Rovnako ako v príklade 6 zvoľme 1 − α = 0,05 a p = 0,90 . 54 V [12] nájdeme pre n = 10 hodnotu k 3 (10; 0,90; 0,05) = 0,7116. Z nameraných dát podľa vzťahov (1) vypočítame x = 943,8 a s = 3,0111. Pretože x + k s = 943,8 + 0,7116 ⋅ 3,0111 = 945,94 < 1 000 nie je dôvod dodávku polyesteru 104 zamietnuť. Ak táto dodávka obsahuje podiel 100 p % = 90 % meraní pod hranicou USL = 1 000 cP , potom bude prijatá s pravdepodobnosťou 1 − (1 − α) = 1 − 0,05 = 0,95. Príklad 8 (Jednostranný štatistický tolerančný interval pro polyester 104) Pre dáta z príkladu 2 treba vypočítať pravostranný tolerančný interval (− ∞, x + k s ) so spoľahlivosťou 1 − α = 0,90 tak, aby pokryl podiel p = 0,95 hodnôt z rozdelenia N ( μ, σ 2 ) . V [12] nájdeme pre n = 10 hodnotu k 3 (10; 0,95; 0,90) = 2,5684. Potom x + k s = 943,8 + 2,5684 ⋅ 3,0111 = 951,53 , t. j. interval (− ∞, 951,53) s pravdepodobnosťou 0,90 pokryje aspoň podiel 100 p % = 95 % hodnôt z uvedenej výrobnej dávky. Na základe 10 hodnôt z príkladu 2 možno s pravdepodobnosťou 0,90 očakávať, že aspoň podiel 95 % meraní z dodávky polyesteru 104 bude mať viskozitu menšiu ako 951,53 mPa ⋅ s . Záver Ukázali sme si, že štatistické tolerančné intervaly sa dajú použiť v riadení kvality, preto uvádzame niekoľko významných publikácií publikovaných u nás [27], [28], [29]. Literatúra [1] WALD, A., WOLFOWITZ, J. Tolerance Limits for a Normal Distribution, In Annals of Mathematical Statistics, 1946, vol. 17, p. 208-215. [2] OWEN, D.B. Handbook of Statistical Tables. Reading, MA., Addison-Wesley Publishing Comp., 1962. [3] TAGUTI, G. Tables of tolerance coefficients for normal populations. In Reports of Statistical Application Research, JUSE, 1958, vol. 5, p. 73-118. [4] HOWE, W. G. Two-sided tolerance limits for normal populations. In Journal of the American Statistical Associantion, 1969, vol. 64, p. 610-620. [5] JÍLEK, M. Statistické toleranční meze. Praha, SNTL, 1988, 275 s. 55 [6] EBERHARDT, K.R., MEE, R.W., REEVE, C.P. Computing factors for exact two-sided tolerance limits for a normal distribution. In Communications in Statistics, 1989, Part B, vol. 18, p. 397-413. [7] FUJINO, T. Exact two-sided tolerance limits for a normal distribution. In Japanese Journal of Applied Statistics, 1989, vol. 18, p. 29-36. [8] ODEH, R.E., OWEN, D.B. Tables for Normal Tolerance Limits, Sampling Plans, and Screening. New York, Marcel Dekker, 1980. 316 p. ISBN 0-8247-6944-9. [9] JANIGA, I., MIKLÓŠ, R. Statistical Tolerance Intervals for a Normal Distribution. In Measurement Science Review. ISSN 13, 2001, vol. 1, no. 1, p. 29-32. [10] GARAJ, I., JANIGA I. Dvojstranné tolerančné medze pre neznámu strednú hodnotu a rozptyl normálneho rozdelenia. Bratislava: Vydavateľstvo STU, 2002. 147 s. ISBN 80-227-1779-7. [11] GARAJ, I., JANIGA I. Dvojstranné tolerančné medze normálnych rozdelení s neznámymi strednými hodnotami a s neznámym spoločným rozptylom. Two sided tolerance limits of normal distributions with uknown means and uknown common variability. Bratislava,Vydavateľstvo STU, 2004, 218 s. ISBN 80-227-2019-4. [12] GARAJ, I., JANIGA I. Jednostranné tolerančné medze normálneho rozdelenia s neznámou strednou hodnotou a rozptylom. Ono sided tolerance limits of normal distributions with uknown means and uknown common variability. Bratislava,Vydavateľstvo STU, 2004, 214 s. ISBN 80-227-2218-9. [13] JOHNSON, N. L., WELCH, B. L. Applications of the non-central t-distribution. In Biometrika 1940, Vol. 31, p. 362-389. [14] HOGBEN, D., PINKHAM, R. S., WILK, B. B. The moments of the non-central tdistributions. In Biometrika 1961, Vol. 48, p. 465-468. [15] BAGUI, S. C. CRC Handbook of Percentiles of Non-Central t-Distributions. CRC Press, Boca Raton, Florida, 1993, 400 p. ISBN 0-8493-8669-1. [16] WOLFRAM, S. The Mathematica Book. 3rd ed. Wolfram Media/Cambridge University Press, 1996. 1403 p. ISBN 0-521-58889-8. [17] SAHAI, H., OJEDA, M. M. A comparison of approximations to percentiles of the noncental t-distribution. In Revista Investigacion Operacional, 2000, Vol. 21, No. 2, p.121-144. [18] EEDEN, van C. Some approximations to the percentage points of the non-central t-distribution. In Revue de l´ Institut International de Statistique 29, 1961, p. 4-31. [19] WALLIS, W. A. Use of Variables in Acceptance Inspection for Percent Defective. Selected Techniques of Statistical Analysis (EISENHART, C., HASTAY, M. W., WALLIS, W. A. eds.). New York, 1947, McGraw Hill Bokk Company, p. 7-93. [20] JENNETT, W. T., WELCH, B. L. The control of proportion defective as judged by a single quality characteristic varying on a continuous scale. In Journal of the Royal Statistical Society, B 6, 1939, p. 80-88. [21] CORNISH, E. A., FISHER, R. A. Moments and cumulants in the specification of distributions. In Revue de l´ Institut International de Statistique, 5, 1937, p. 307-320. 56 [22] AKAHIRA, M. A higher order aproximation to a percentage point of the non-central t-distribution. In Communications in Statistics, Part B: Simulcition and Computation, 1995, 24(3), p. 595-605. [23] LIKEŠ, J., LAGA, J. Základní statistické tabulky. Praha, SNTL, 1978, 488 s. [24] ODEH, R.E., OWEN, D.B. Tables for Normal Tolerance Limits, Sampling Plans, and Screening. New York, Marcel Dekker, 1980, 316 p. ISBN 0-8247-6944-9. [25] GARAJ, I. Preberací plán meraním pri daných jednostranných tolerančných medziach. In Statistika, 10, 1992, s. 431-437. [26] GARAJ, I. W-kritérium a jeho spracovanie na počítači. In 9. medzinárodný seminár Výpočtová štatistika. ISBN 80-88946-09-3, SŠDS 2000, s. 30-32. [27] TEREK, M., HRNČIAROVÁ, Ľ. Štatistické riadenie kvality. Vydavateľstvo IURA EDITION, 2004, 234 s. ISBN 80-89047-97-1. [28] TEREK, M., HRNČIAROVÁ, Ľ. Analýza spôsobilosti procesu. Vydavateľstvo EKONÓM, Ekonomická univerzita v Bratislave, 2001. 205 s. ISBN 80-225-1443-8. Tento článok vznikol s podporou grantového projektu VEGA štatistické techniky a rozhodovanie v procese zlepšovania kvality,. č. 1/1247/04 Progresívne Doc. RNDr. Ivan Janiga, PhD., Katedra matematiky SjF STU, Nám. slobody 17, 812 31 Bratislava; Katedra aplikovanej matematiky, FPV UCM, Nám. J. Herdu 2, 917 01 Trnava, e-mail: [email protected] RNDr. Ivan Garaj, PhD., Ústav informatizácie, automatizácie a matematiky, FCHPT STU, Radlinského 9, 812 37 Bratislava, tel.: +421-2-59325 297, e-mail: [email protected] 57 Vplyv determinantov kapitálovej štruktúry na zadlženosť slovenských podnikov. 1 Mária Kanderová 2 Abstract: The scope of the following paper is to identify, analyse and to summarise the basic capital structure determinants influencing the companies indebtness based on actual scientific theoretical and empirical studies in the conditions of Slovak economy.In the first part various determinants of capital structure as explained in theory are presented. In the second part we are testing the influence of these determinants on the debt instrumnets in Slovak corporations. The study uses technique, which is known as linear structural modeling. Key words: capital structure, determinant, sort-term debt, long-term debt, latent variables, proxy variables, linear structural model 1. Úvod Problematika vplyvu determinantov kapitálovej štruktúry na zadlženie podnikov predstavuje dlhotrvajúci, neuzatvorený a diskutabilný problém vo finančnej teórii. Empirické výskumy, ktoré buď dokazujú, alebo vyvracajú jednotlivé teoretické koncepty kapitálovej štruktúry, boli aplikované predovšetkým na podmienky amerických podnikov, aj keď ich testovanie sa uskutočnilo aj na skupinách európskych a ázijských podnikov. Cieľom článku je identifikovať, analyzovať a zhodnotiť základné determinanty kapitálovej štruktúry vplývajúce na zadlženosť na základe doterajších vedeckých teoretických a empirických štúdii v podmienkach slovenskej ekonomiky. Teoretické a empirické štúdie zaoberajúce sa problematikou finančného rozhodovania kapitálovej štruktúry predstavujú široké spektrum determinantov vplývajúcich na zadlženie. Poznanie týchto determinantov, a tým aj nákladov kapitálu, je základným predpokladom kvalifikovaného finančného rozhodnutia ovplyvňujúceho hodnotu podniku v pozitívnom smere. 2. Determinanty zadlženia Na teoretickej a empirickej úrovni boli identifikované desiatky determinantov, ktoré určujú a poskytujú návod na praktické finančné rozhodovanie, ale otvárajú aj priestor pre nový výskum. V článku sú prezentované determinanty kapitálovej štruktúry, tak ako sú vysvetľované v jednotlivých teóriach. Medzi uvedené determinanty patria: podnikateľské riziko, veľkosť podniku, ziskovosť, štruktúra aktív, nedlhový daňový štít, rastové príležitosti, jedinečnosť. Riziko Pod podnikateľským (hospodárskym, prevádzkovým, operačným) rizikom sa rozumie neistota a variabilita očakávaných budúcich tokov prevádzkového zisku. Vyplýva z podnikateľského prostredia podniku a prejavuje sa vo variabilite nákladov, výnosov a zisku. Vyššie podnikateľské riziko implikuje vyššiu pravdepodobnosť finančných ťažkostí a vyššie náklady bankrotu. Firmy s vysokým podnikateľským rizikom by mali mať nižšie zadlženie. 1 2 Tento príspevok bol spracovaný v rámci riešenia grantovej úlohy KEGA3/5214/07 Ing. Mária Kanderová, PhD., Ekonomická fakulta, UMB Banská Bystrica 58 Veľkosť podniku Mnoho autorov tvrdí, že zadlženie môže byť okrem iného ovplyvnené aj veľkosťou firmy. Zvyčajne sa predpokladá, že väčšie firmy majú tendenciu byť viacej diverzifikované z čoho vyplýva nižšie nebezpečenstvo bankrotu. Uvedené argumenty vedú k tvrdeniu, že zadlženie je rastúcou funkciou veľkosti firmy. Ziskovosť a disponibilný cash flow. Na základe teoretických a empirických štúdií, nebola dokázaná jednoznačná súvislosť medzi zadlžením a ziskovosťou. Podľa teórie poradia preferencií firmy, ziskové firmy pasívne akumulujú zadržaný zisk a stávajú menej zadlženými. Naopak, neziskové firmy akumulujú dlh, stávajú sa viacej zadlženými. Signalizačná teória chápe zadlženie ako pozitívny signál k vonkajším investorom. Vysoké zadlženie si môžu dovoliť len vysoko prosperujúce firmy. Podľa signalizačnej teórie zadlženie je v pozitívnom vzťahu k ziskovosti. Štruktúra aktív Veľkosť pôžičky, ktorá môže byť zabezpečená kolaterálom, je funkciou štruktúry aktív a náklady finančnej tiesne sú podľa všetkého nižšie u zabezpečených pôžičiek. Neobežné aktíva sú najvýznamnejšou kategóriou, ktorá sa používa ako kolaterál. Dá sa očakávať, že firmy, ktoré majú aktíva, ktoré môžu byť použité ako kolaterál, budú emitovať viac dlhu. Nedlhové daňové štíty Odpisy (ako odpočítateľná daňová položka ) a investičný daňový úver predstavujú substitúty daňovej výhody dlhového financovania. Z toho vyplýva, že firmy s vysokým nedlhovým daňovým štítom v pomere k očakávanému cash flow budú mať nižší podiel dlhu vo svojej kapitálovej štruktúre. Rastové príležitosti Stulz a Jensen poukazujú na to, že dlh znižuje voľný cash flow a tým limituje množstvo prostriedkov, ktoré sa môžu použiť na projekty s kladnou súčasnou hodnotou. Tento argument vedie k záveru, že firmy s rastovými príležitosťami by mali mať nižšie zadlženie. Rastové príležitosti predstavujú kapitálové aktíva, ktoré nemôžu byť použité ako kolaterál. Z toho dôvodu sa tiež očakáva, že rastové príležitosti budú v negatívnej korelácií so zadlžením. Jedinečnosť Firmám, ktoré sú typické tým, že ich činnosť je zameraná na produkciu jedinečných výrobkov zodpovedá aj špecifická štruktúra aktív. Špecifickosť aktív neumožňuje, aby boli použité ako kolaterál pre zabezpečenie dlhu. Tento argument predikuje, že jedinečnosť je v inverznom vzťahu k zadlženiu. Odvetvie Ak uvažujeme o vplyve odvetvia, ktorý bol použitý v empirických štúdiách o kapitálovej štruktúre, odvetvie sa nepovažuje za determinant, ale za indikátor súčasne pre niekoľko determinantov. To čo determinuje odvetvovú klasifikáciu nie je klasifikácia založená na charakteristikách firmy, ale na skutočnosti, že firma operuje na tom istom trhu tovarov. Keďže žiadna z týchto premenných sa neukázala ako štatistiky významná takmer vo všetkých štúdiách, v ďalších analýzach sa nepoužíva. 59 3. Dáta Do modelu boli zaradené podniky podľa právnej formy podnikania – akciové spoločnosti. Ďalším faktorom pre zaradenie bol predmet podnikania. Do vzorky boli zaradené podniky, ktorých hlavným predmetom podnikania je v zmysle platnej Odvetvovej klasifikácie ekonomických činností priemyselná výroba (kategória D, OKEČ začínajúce dvojčíslom 15 až 37). Väčšina akciových spoločností podniká práve v odvetví priemyselnej výroby a toto odvetvie je kľúčové pre rozvoj slovenskej ekonomiky. Údajovú základňu tvorili účtovné závierky firiem za roky 2000-2005. Z týchto firiem boli vylúčené tie akciové spoločnosti, v ktorých boli k dispozícii údaje za menej ako 4 roky. Tým sa výber zúžil na 418 firiem. V modeli boli sledované vyššie uvedené determinanty. V zátvorke je uvedený symbol pre príslušný determinant odvodený z jeho anglického názvu. Pre determinant veľkosť podniku boli zvolené dva indikátory: prirodzený logaritmus priemerných celkových tržieb (LnS) a prirodzený logaritmus priemerných celkových aktív (LnTA). Jedinečnosť podniku bola charakterizovaná jedným indikátorom- ziskovosťou meranou prevádzkovým ziskom (OI). Determinant riziko bol zastúpený troma indikátormi: variačný koeficient celkových tržieb(VKS), podielom priemernej hodnoty neobežných aktív na priemernej hodnote celkových aktív (FA/TA) a smerodajnou odchýlkou, vypočítanou z podielu priemernej hodnoty zisku pred zdanením a odpismi na priemernej hodnote celkových aktív (SIGMA). Štruktúra aktív bola meraná pomocou ukazovateľa podiel priemernej hodnoty nehmotných aktív na priemernej hodnote celkových aktív (INT/TA) a podielom priemernej hodnoty hmotných aktív na priemernej hodnote celkových aktív (TNG/TA). Nedlhový daňový štít je v modeli meraný podielom priemernej výšky odpisov na priemernej hodnote celkových aktív. Rastové príležitosti sú vyjadrené cez ukazovateľ priemerná percentuálna zmena celkových aktív (PERCTA) a priemernou hodnotou ročného nárastu zisku pred zdanením a odpismi (EBIDT). Posledný determinant ziskovosť zastupujú ukazovatele priemerná hodnota prevádzkového zisku na priemernej hodnote tržieb (OI/S) a ukazovateľom priemerná hodnota prevádzkového zisku na priemernej hodnote celkových aktív. Miera zadlženia je v tomto modeli meraná dvoma ukazovateľmi: Účtovná hodnota krátkodobých záväzkov k účtovnej hodnote vlastného imania (ST/BVE) a účtovná hodnota dlhodobých záväzkov k účtovnej hodnote vlastného imania (LT/BVE). Rôzne merné jednotky ukazovateľov sťažujú interpretáciu dosiahnutých výsledkov. Z tohto dôvodu sú v modeli použité ich štandardizované hodnoty, čím sa odstránil vplyv merných jednotiek . V tabuľke 1 sú vyjadrené teoretické hypotézy o determinantoch a ich vzťahu k zadlženiu. V prvom stĺpci sú zobrazené determinanty zadlženia, v druhom stĺpci ich indikátory a v poslednom stĺpci očakávaný vplyv determinantov na zadlženie podľa teoretických hypotéz a dosiahnutých výsledkov empirických štúdií. Model, ktorý bol v použitý pre meranie vplyvu determinantov na zadlženie pozostáva z dvoch častí, z meracieho modelu a štrukturálneho modelu. Tieto modely sú odhadované simultánne. Merací model umožňuje kvantifikovať nemerateľné premenné – determinanty (latentné premenné) pomocou merateľných premenných – indikátorov (manifest variable), v našom prípade cez účtovné dáta. 60 Tabuľka 1. Teoretické hypotézy Determinant Indikátory LnS Veľkosť LnTA Jedinečnost OI VKS Riziko FA/TA SIGMA INT/TA Štruktúra aktív NGT/TA Nedlhový daňový štít D/TA PERCTA Rastové príležitosti EBIDT OI/S Ziskovost OI/TA Zdroj: vlastné spracovanie Predpokladaný vzťah k zadlženiu Pozitívny Negatívny Negatívny Pozitívny Negatívny Negatívny Pozitívny (negatívny) V štrukturálnom modeli dlhové pomery vypočítané z účtovných dát sú definované ako funkcie determinantov, ktoré sú definované a kvantifikované v meracom modeli. Model je odhadovaný pre dve rovnice: účtovná hodnota krátkodobých záväzkov k účtovnej hodnote vlastného imania (ST/BVE) a účtovná hodnota dohodových záväzkov k účtovnej hodnote vlastného imania (LT/BVE). 5. Výsledky modelu Výsledky meracieho modelu potvrdzujú správny výber jednotlivých indikátorov ako miery príslušných determinantov, o čom svedčia vysoké hodnoty t- štatistiky. Indikátor precentuálna zmena celkových aktív (%TA) , ktorý meral determinant rastové príležitosti bol štatisticky nevýznamný. Výsledkom štrukturálneho modelu sú odhadnuté regresné koeficienty jednotlivých determinantov, ktoré sú v tabuľke 2. Tieto koeficienty špecifikujú predpokladaný vplyv determinantov na jednotlivé pomery zadlženia. V modeli nás predovšetkým zaujíma znamienko príslušného koeficienta a jeho veľkosť vzhľadom k ostatným koeficientom, čo umožňuje porovnať východiskové teoretické hypotézy s dosiahnutými výsledkami. Tabuľka 2. Štrukturálny model – odhadnuté regresné koeficienty ST/BVE Size unique Risk assets ndt Coeficient 0,72 -0,122 -0,312 -0,108 0,25 t-statistic 10,52 -2,74 -4,884 -0,922 3,112 LT/BVE Size unique Coeficient 0,691 -0,134 t-statistic 10,258 -2,932 Zdroj:Vlastné spracovanie Risk -0,3626 -4,902 assets -0,116 -1,493 ndt 0,223 2,846 growth 0,042 0,215 Profitability 0,526 10,12 growth 0,015 0,088 Profitability 0,618 8,236 Znamienko regresného koeficienta pri exogénnej premennej veľkosť (size) je aj pre krátkodobé zadlženie aj pre dlhodobé zadlženie rovnaké. Kladné znamienko potvrdzuje hypotézu, že menšie firmy sú zadlžené menej ako väčšie firmy, čo môže byť výsledkom toho, že malé firmy majú vyššie transakčné náklady spojené s emisiou dlhu ako väčšie firmy. 61 Väčšie podniku majú tendenciu viac diverzifikovať svoju hospodársku činnosť ako menšie podniky, čím sa v nich znižuje pravdepodobnosť, že sa dostanú do finančných ťažkostí. Jedinečnosť bola meraná prevádzkovým ziskom. Podľa teórie, jedinečnosť firmy by mala byť v inverznom vzťahu k zadlženiu. Dosiahnuté výsledky potvrdzujú tento záver, regresný koeficient má záporné znamienko. V predchádzajúcich empirických štúdiách, na meranie jedinečnosti boli použité údaje o výdavkoch na vedu a výskum a/alebo náklady na predaj. Vzhľadom k nedostupnosti údajov o výdavkoch na vedu a výskum a nákladov na predaj tieto premenné nemohli byť použité na meranie jedinečnosti aj keď sa javia ako vhodnejšie. Vplyv rizika na zadlženie sa preukázal ako štatisticky významný. Záporná hodnota regresného koeficienta implikuje záver, že rizikovejšie firmy, ktoré majú vysokú volatilitu zisku sú menej zadlžené. Ako už bolo spomenuté, v niektorých empirických štúdiách sa preukázal negatívny vplyv rizikovosti na zadlženie, v niektorých pozitívny vplyv, čo mohlo byť spôsobené výberom indikátorov pre tento determinant. Štruktúra aktív patrí medzi kľúčové determinanty kapitálovej štruktúry s pozitívnym vplyvom na zadlženie. Záporne znamienko regresného koeficienta však túto hypotézu na vzorke vybraných slovenských podnikov nepotvrdzuje. Dá sa to zdôvodniť tým, že aj keď neobežné aktíva slúžia ako kolaterál na zabezpečenie veriteľov proti úverovému riziku, mnoho položiek neobežných aktív je v prípade potreby veľmi ťažko speňažiť, pretože pre podnikové aktíva neexistujú efektívne fungujúce sekundárne trhy. Veritelia preto často nie sú ochotní akceptovať určité aktíva ako kolaterál a kladú omnoho väčší dôraz na likvidné obežné aktíva podniku. Kladné znamienko regresného koeficienta pri determinante nedlhový daňový štít sa nezhoduje s hypotézou, že firmy s vysokým nedlhovým daňovým štítom majú nižší podiel dlhu vo svojej kapitálovej štruktúre. Výsledok dosiahnutý v tomto modeli môže byť ovplyvnený tým, že ako indikátory nedlhového daňového štítu nebolo možné použiť investičný daňový úver a daňový štít z odloženej daňovej povinnosti. Determinant ziskovosť podľa výsledkov tejto analýzy má na mieru zadlženia pozitívny efekt – regresný koeficient pri tomto determinante má kladnú hodnotu. Toto tvrdenie nie je v súlade s teóriou poradia preferencií, podľa ktorej firmy preferujú interné financovanie pred externým financovaním. Podľa signalizačnej teórie je ziskovosť v pozitívnom vzťahu k zadlženosti, pretože vysoké zadlženie si môžu dovoliť len vysoko prosperujúce firmy. Podľa teoretických hypotéz, rastové príležitosti sú v inverznom vzťahu k zadlženiu firmy. Hodnota regresného koeficienta pri tomto determinante je kladná, ale štatisticky nevýznamná. Štatistická nevýznamnosť tohto koefcienta implikuje, že determinant rastové príležitosti málo resp. vôbec neovplyvňuje (v slovenských podnikoch) mieru zadlženosti. Dosiahnuté výsledky do určitej miery potvrdzujú hypotetické vzťahy medzi rozhodnutiami o kapitálovej štruktúre a determinantmi, ktoré ju ovplyvňujú resp. ktoré by ju mali ovplyvňovať (tabuľka 3). Tabuľka3. Porovnanie hypotetických predpokladov a záverov modelu Determinant Teoretický predpoklad Závery modelu Veľkosť Pozitívny Pozitívny Jedinečnost Negatívny Pozitívny Riziko Negatívny Negatívny Štruktúra aktív Pozitívny Negatívny nedlhový daňový štít Negatívny Pozitívny Rastové príležitosti Negatívny Pozitívny Ziskovost Pozitívny (negatívny) Pozitívny Zdroj: Vlastné spracovanie 62 5. Záver V podmienkach slovenskej ekonomiky sa nepreukázal zhodný smer pôsobenia uvažovaných determinantov na zadlženie s teoretickými a empirickými závermi. Tento fakt je do značnej miery spôsobený podmienkami, v ktorých systém finančného riadenia a slovenské podniky vôbec pôsobia. Situácia v získavaní finančných zdrojov v slovenských podnikoch je podstatne zložitejšia ako vo vyspelom svete. Finančné rozhodovanie v našich podnikoch je ovplyvnené niekoľkými faktormi. Prvým z nich je, že veľká časť podnikov hospodári so stratou a preto sa nemôže opierať o kľúčový zdroj financovania – financovanie zo zisku. Druhým faktorom, stále ešte v rámci interných zdrojov sú podcenené odpisy a to hlavne nízke odpisové sadzby a dlhá doba odpisovania. V oblasti externých zdrojov faktorom, ktorý ovplyvňuje finančné rozhodovanie je problematická dostupnosť bankových úverov, ktoré v našich podmienkach tvoria kľúčový cudzí externý zdroj financovania. Ďalším faktorom je zle fungujúci kapitálový trh, nedôvera investorov, ťažká uplatniteľnosť akcií a obligácií. Z toho vyplývajú súčasné problémy slovenských podnikov s financovaním a s nedostatkom finančných prostriedkov. 6. Literatúra BREALEY, R.A., MYERS, C.S. 1999. Teórie a praxe firemních financí. Praha : Victoria Publishing, 1999. ISBN 80-85605-24-4. DAMODARAN, A. 1997. Corporate Finance. Theory and Practice. New York : John Wiley and Sons, 1997. ISBN 0-471-07680-5. MODIGLIANI, F., MILLER, M. 1958. The Cost of Capital, Corporation Finance and theTheory of Investment. In: American Economic Review, vol. 48, 1958. MYERS, S.C. 1977. Determinants of Corporate Borrowing. In: Journal of Financial Economics,vol. 5,1977, s. 147-175. STULZ, R. 1990. Managerial Discretion and Optimal Financing Policies. In: Journal of Financial Economics, vol. 26, 1990, s. 3-27. TITMAN, S., WESSELS, R. 1988. The Determinants of Capital Structure Choice. In: Journal of Finance, vol. 43, 1988, s. 1-19. WARNER, J. B. 1977. Bankruptcy Costs; Some Evidence.In: Journal of Finance, vol. 32, May 1977, s. 337 – 347. Ing. Mária Kanderová, PhD. Univerzita Mateja Bela Fakulta financií Katedra kvantitatívnych metód Banská Bystrica [email protected] 63 Zahraničná migrácia na Slovensku v rokoch 1996 - 2006 Alena Kaščáková, Gabriela Nedelová Abstract: The level of migration in Slovakia have been changing in the last ten years. The peper deals with the factors affecting the net migration in Slovakia between 1996 and 2006. The intensive migration between the Czech Republic and Slovakia has led to constructing migration models and searching for significant factors of migration. Key words: migration, net migration, reasons of migration, linear regression migration factors model, 1. Úvod V posledných desaťročiach dochádza k významným zmenám v mobilite obyvateľstva na celom svete. Súvisí to s globalizáciou, rozvojom dopravných možností, poklesom vzájomných väzieb medzi občanom a štátom a s prudkým rastom informatizácie. Tým sa migrácia stáva zložkou pohybu obyvateľstva, ktorý nadobúda stále väčší význam. Zahraničná migrácia je v súčasnosti prejavom globalizačných procesov, chápaná ako prirodzený proces, zväčša pozitívny, s ekonomickými, sociálnymi, kultúrnymi, demografickými, politickými bezpečnostnými, a ďalšími dopadmi. 2. Zahraničná migrácia v SR V sledovanom období rokov 1996 – 2006 sa zahraničná migrácia vyvíjala v prospech Slovenska a jej tempo rastu sa postupne zvyšovalo. Do deväťdesiatych rokov bola zahraničná migrácia pomerne mierna, jej úroveň začala rásť so zapájaním sa Slovenska do geopolitických štruktúr. Vývoj objemu zahraničného sťahovania v rokoch 1996 -2006 je uvedený v tabuľke 1. Tabuľka 1. Vývoj objemu zahraničného sťahovania na Slovensku v rokoch 1996 -2006 (v osobách) rok objem zahraničného sťahovania 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2699 2875 2798 2690 3085 3034 3723 3797 6046 7149 7324 Zdroj: www.statistics.sk V závislosti od veľkosti imigrácie a emigrácie sa vyvíjalo aj migračné saldo ako rozdiel počtu imigrantov a emigrantov (na grafe 1 znázornený plochou medzi hornou a dolnou krivkou). 64 Graf 1: Veľkosť imigrácie, emigrácie a migračného salda na Slovensku v rokoch 1996 - 2006 Zdroj: www.statistics.sk Dôvody zahraničnej migrácie sú rôzne. Prevažujú ekonomické dôvody (diferencie v mzdových úrovniach jednotlivých krajín, teda rozdiely v mzdách medzi Slovenskom a zahraničím, rozdiely v životnej úrovni, širšia ponuka dostupnej práce, voľný pohyb osôb, a pod.), ale tiež sociálne dôvody (nasledovanie rodinného príslušníka, štúdium v zahraničí, sťahovanie sa do krajiny pôvodu) alebo politické (ochrana pred politickým, etnickým, náboženským a iným prenasledovaním, dočasné útočisko). Pre modelovanie vývoja veľkosti migračného salda (MS) na Slovensku v rokoch 1996 – 2006 sme vybrali premenné, charakterizujúce vplyv ekonomických činiteľov na Slovensku a to veľkosť miery nezamestnanosti z výberového zisťovania pracovných síl (MNez), HDP v stálych cenách roku 1996 (HDPsc) a veľkosť priemernej nominálnej mzdy na prepočítanej na stále ceny roku 1996 (MZDAsc). Použili sme lineárny regresný model a na výpočet programový balík SPSS. Tabuľka 2. Model migračného salda na Slovensku v rokoch 1996 - 2006 MS = T – value: F – Value: R – squared: 2176,51 (0,678) 10,656 0,906 – 184,93 MNez (0,032) + 30,8 HDPsc (0,013) -2,231 MZDAsc (0,098) Zvláštnu úlohu v prípade migrácie na Slovensku zohráva Česká republika, ktorá bola dlhé obdobie spolu so Slovenskom súčasťou spoločného štátu. Veľkosť emigrácie aj imigrácie s touto krajinou má na celkovej migrácii Slovenska najvyššiu váhu. V prípade emigrácie sú tieto údaje znázornené na grafe 2. 65 Graf 2: Veľkosť emigrácie do ČR v rokoch 1996 - 2006 Vysťahovaní zo Slovenska v rokoch 1996 - 2006 2000 1800 1600 1400 1200 ostatné krajiny 1000 800 ČR 600 400 200 0 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 Zdroj: www.statistics.sk Pri modelovaní veľkosti emigrácie (Emig) do ČR sme použili rovnaký typ modelu aj vysvetľujúce premenné. Priemerná nominálna mzda sa ukázala ako štatisticky nevýznamná premenná, preto sme ju z modelu vylúčili. Pri ponechaní zvyšných dvoch premenných v modeli sa model ako celok aj jeho parametre sa ukázali ako štatisticky významné. Tabuľka 3. Model emigrácie do ČR v rokoch 1996 - 2006 Emig = T – value: F – Value: R – squared: -2474,05 (-10,2) 70,85 0,947 + 27,612 MNez (4,68) + 3,412 HDPsc (10,89) Podobný model sme konštruovali aj pre imigráciu z ČR, ale ani jedna z premenných sa neukázala ako štatisticky významná. 3. Záver Z výsledkov, ktoré sme získali modelovaním je možné usúdiť, že na veľkosť migračného salda na Slovensku v rokoch 1996 – 2006 vplývali ukazovatele makroekonomického vývoja, ktoré na jednej strane pôsobili ako „push“ efekt pre vysťahovanie do zahraničia a na strane druhej a „pull“ efekt pre imigráciu. Podrobnejší pohľad na cieľovú krajinu s najväčším migračným tokom – s Českou republikou - dáva podobné výsledky len v prípade emigrácie zo Slovenska. Úroveň miery nezamestnanosti 66 a objem HDP sa ukazujú ako podstatné faktory ovplyvňujúce až 95 % zmien vo veľkosti emigrácie zo Slovenska do Českej republiky. V prípade imigrácie sa tieto charakteristiky ukazujú nevýznamné a pre modelovanie veľkosti imigrácie z Českej republiky na Slovensko by bolo potrebné skúmať pôsobenie iných ako ekonomických efektov. 4. Literatúra GAVLIAK, R. – KANDEROVÁ, M. 2004. Využitie stavovej reprezentácie časového radu na modelovanie devízového kurzu EUR/SKK. In: FORUM METRICUM SLOVACUM. TOM VIII. Zborník vedeckých príspevkov. Bratislava : SŠDS, 2004, s. 105 – 110. ISBN 80-8894623-9. Príspevok vznikol v rámci riešenia vedeckého projektu č. 1/4634/07 financovaného grantovou agentúrou VEGA a projektu č. 3/5214/07 financovaného grantovou agentúrou KEGA. Adresa autorov: Alena Kaščáková, Ing., PhD. KKMI EF UMB Tajovského 10 975 90 Banská Bystrica [email protected] Gabriela Nedelová, RNDr., PhD. KKMI EF UMB Tajovského 10 975 90 Banská Bystrica [email protected] 67 Dvojkroková zhluková analýza stavebných podnikov Samuel Koróny1 Abstract: The paper deals with two-step clustering results of absolute economic production indicators of Slovak construction joint stock and ltd. companies from the year 2001 (value added, sum of assets and average number of employees) including graphical presentation in scatter plots. The cluster method clearly finds out three distinctive clusters. Keywords: Cluster analysis, Statistical analysis, Construction sector. 1. Úvod Príspevok uvádza vybrané výsledky aplikovania dvojkrokovej zhlukovej analýzy na reálne údaje slovenských stavených podnikov. Voľne nadväzuje na predošlé autorove príspevky v tejto oblasti hlavne tohoročný EKOMSTAT 2007 (Koróny 2007). 2. Dáta Pre účel zhlukovej analýzy boli vybrané absolútne produkčné ukazovatele - pridaná hodnota (v mil. Sk), priemerný evidenčný počet zamestnancov vo fyzických osobách a celkový kapitál (v mil. Sk) anonymných súkromných slovenských stavebných podnikov právnej formy a. s. a s. r. o. Údaje sú z výkazu ŠÚ SR Prod 3-04 za rok 2001. Zhluková analýza dát bola urobená v štatistickom systéme SPSS verzia 13. 3. Stručný opis dvojkrokovej zhlukovej analýzy Dvojkroková zhluková analýza patrí medzi metódy používajúce postupy data minigu. Používa CF (cluster feature) štatistiku, ktorá je základom algoritmu BIRCH (Balanced Iterative Reducing and Clustering using Hierarchies, (viď Zhang 1996). CF štatistika obsahuje tri údaje: počet objektov, súčet hodnôt príslušnej premennej a súčet hodnôt druhých mocnín premennej. Metóda BIRCH je použitá aj v prípade dvojkrokovej zhlukovej analýzy, ktorá vie pracovať so spojitými aj kategorickými premennými (Chiu 2001). Vyžaduje len jeden výpočtový prechod cez dáta. Má dva stupne: najprv je predbežné zhlukovanie objektov do mnohých malých predbežných zhlukov, charakterizovaných CF, potom nasleduje štandardné 1 Samuel Koróny, Ústav vedy a výskumu UMB, Banská Bystrica 68 hierarchické spojenie predbežných zhlukov centroidovou metódou do požadovaného počtu zhlukov. Je možné ňou aj nájsť optimálny počet zhlukov. Je súčasťou systému SPSS od verzie 11.5. Podrobnejšie je uvedená (vrátane potrebných vzťahov) v už spomenutom autorovom príspevku (Koróny 2007) a tiež (Hebák 2005). 4. Výsledky aplikovania dvojkrokovej zhlukovej analýzy Metóda umožňuje spracovať spojité a kategorické premenné spolu, preto sme ako dáta použili údaje za obidve právne formy stavebných podnikov spolu, a. s. aj s. r. o. Pre celkový prehľad sú najprv uvedené základné štatistické charakteristiky súboru. Pri spojitých premenných (počet zamestnancov, celkový kapitál a pridaná hodnota) je to počet pozorovaní, minimum, maximum, aritmetický priemer a smerodajná odchýlka (tab.1). Tiež je uvedená frekvenčná tabuľka kategorickej premennej právna forma (tab. 2). Tab. 1 Opisná štatistika spojitých premenných Descriptive Statistics N ZAM 466 Minimum 5 Maximum 780 Mean 62.97 Std. Deviation 79.649 CK 466 .21 632.79 40.4696 71.50113 PH 466 .30 255.15 18.0475 26.16317 Valid N (listwise) 466 Tab. 2 Frekvenčná tabuľka kategorickej premennej právna forma FORMA Valid Frequency 105 Percent 22.5 Valid Percent 22.5 Cumulative Percent 22.5 s.r.o. 361 77.5 77.5 100.0 Total 466 100.0 100.0 a.s. Výstup dvojkrokovej zhlukovej analýzy začína časťou auto-clustering, ktorá obsahuje hodnoty zvoleného kritéria na automatické nájdenie počtu zhlukov (tab.3). Pri určení počtu zhlukov sa za optimálny považuje prípad, keď hodnota v pravom stĺpci nadobúda maximum pri použití informačného kritéria BIC. Kritérium AIC dá rovnaké výsledky, preto ho tu neuvádzame. Ide o podiel mier vzdialeností po sebe idúcich zhlukových konfigurácií. Pomer 69 vzdialeností pre 3 zhlukov a 2 zhluky je 3,626 a preto hľadaný optimálny počet zhlukov podľa daného kritéria je 3. Tab. 3 Štatistiky pre automatické nájdenie počtu zhlukov Auto-Clustering Number of Clusters 1 Schwarz's Bayesian Criterion (BIC) BIC Change(a) Ratio of BIC Changes(b) Ratio of Distance Measures(c ) 1507.808 2 662.058 -845.750 1.000 3.825 3 472.709 -189.349 .224 3.626 4 451.637 -21.071 .025 1.053 5 433.772 -17.865 .021 2.427 6 451.703 17.931 -.021 1.043 7 470.658 18.956 -.022 1.087 8 491.536 20.878 -.025 1.652 9 521.150 29.614 -.035 1.245 10 553.404 32.253 -.038 1.006 11 585.719 32.315 -.038 1.606 12 622.071 36.352 -.043 1.021 13 658.561 36.491 -.043 1.007 14 695.099 36.537 -.043 1.024 15 731.790 36.691 -.043 1.226 a The changes are from the previous number of clusters in the table. b The ratios of changes are relative to the change for the two cluster solution. c The ratios of distance measures are based on the current number of clusters against the previous number of clusters. Vo vstupných údajoch je aj kategorická premenná „právna forma“ a preto je užitočné najprv zistiť, či a ako je rozdelená. Základný prehľad riešenia je v tabuľke 4. Celý súbor podnikov právnej formy s. r. o. ostal v jednom zhluku, ale podniky formy a. s. sú rozdelené do dvoch zhlukov. To je netriviálna informácia. Tab. 4 Počet objektov v nájdených zlukoch podľa kategorickej premennej právna forma FORMA a.s. Cluster s.r.o. 1 Frequency 21 Percent 20.0% 2 84 80.0% 0 .0% 3 0 .0% 361 100.0% 105 100.0% 361 100.0% Combined Frequency 0 70 Percent .0% V tab. 5 sú uvedené základné štatistické charakteristiky premenných podľa nájdených zhlukov. Ak je súbor dobre rozdelený, tak daná tabuľka by mala stačiť na interpretáciu zhlukov. V zhluku 3 sú podniky s najmenšími hodnotami ukazovateľov a sú to všetko podniky právnej formy s. r. o. Zhluk 2 je tvorený podnikmi formy a. s. so stredne veľkými hodnotami ukazovateľov. Zhluk 1 obsahuje najväčšie podniky právnej formy a. s. Tab. 5 Základné štatistické charakteristiky spojitých premenných po zhlukoch Centroids ZAM Cluster CK PH 1 Mean 320.71 Std. Deviation 207.507 Mean 298.2990 Std. Deviation 151.99229 Mean 102.9864 Std. Deviation 66.28619 2 85.38 56.678 58.1250 41.24432 22.3160 14.57603 3 42.76 25.683 21.3631 24.72520 12.1133 11.43050 Combined 62.97 79.649 40.4696 71.50113 18.0475 26.16317 Pre lepšiu orientáciu systém SPSS ponúka výsledky dvojkrokovej zhlukovej analýzy aj prostredníctvom grafov. Grafy 1, 2 a 3 ponúkajú jednoznačnú interpretáciu zhlukov na základe simultánnych konfidenčných intervalov aritmetických priemerov spojitých premenných: počet zamestnancov, celkový kapitál a pridaná hodnota. Simultaneous 95% Confidence Intervals for Means 400 ZAM 300 200 100 0 1 2 3 Cluster Graf 1 Simultánne 95 % konfidenčné intervaly premennej počet zamestnancov 71 Simultaneous 95% Confidence Intervals for Means 400 CK 300 200 100 0 1 2 3 Cluster Graf 2 Simultánne 95 % konfidenčné intervaly premennej celkový kapitál Simultaneous 95% Confidence Intervals for Means 150 120 PH 90 60 30 0 1 2 3 Cluster Graf 2 Simultánne 95 % konfidenčné intervaly premennej pridaná hodnota 5. Interpretácia zhlukov Na základe tabuliek a grafov je možné interpretovať jednotlivé zhluky: 1. zhluk charakterizujú stavebné podniky právnej formy a. s. s relatívne najväčšími hodnotami všetkých troch analyzovaných spojitých premenných (pridaná hodnota, celkový kapitál a počet zamestnancov), 2. zhluk tiež obsahuje stavebné podniky právnej formy a. s., ale s menšími hodnotami vo všetkých troch spojitých premenných, 3. zhluk obsahuje všetky stavebné podniky právnej formy s. r. o., ktorých sledované ukazovatele sú relatívne najmenšie. 72 6. Záver Dvojkroková zhluková analýza poskytuje cenné informácie o štruktúre dát. Bola testovaná na veľkom množstve simulovaných aj reálnych údajov a dáva vcelku spoľahlivé výsledky. Okrem toho, že dokáže nájsť optimálny počet zhlukov, je výhodná hlavne pre jej schopnosť zhlukovania veľkých súborov. Bolo by užitočné ju odskúšať na slovenských dátach. Podstatné je, aby nájdené zhluky boli jasne interpretovateľné, čo spĺňa náš prípad. 7. Literatúra SPSS 13.0 USER’S GUIDE. Chicago : SPSS Inc., 2004. ISBN 0-13-185723-1 HEBÁK, P. A KOL. 2005. Vícerozměrné statistické metody (3). Praha : Informatorium, 2005. ISBN 80-7333-039-3 KORÓNY, S. 2006. Zhluková analýza produkčných ukazovateľov stavebných podnikov právnej formy s. r. o. In: Forum Statisticum Slovacum. Roč.2, č.1, 2006, s. 56-60. ISSN 13367420 CHIU, T. ET AL. 2001. A Robust and Scalable Clustering Algorithm for Mixed Type Attributes in Large Databases Environment. Proceedings of the ACM SIGKDD Conference on knowledge discovery and data mining, p. 263-268, Montreal ZHANG, T. ET AL. 1996. BIRCH: An Efficient Data Clustering Metod for Very Large Databases. In: Proceedings of the ACM SIGMOD Conference on Management of Data, p. 103-114, Montreal KORÓNY, S. 2007. Dvojkroková zhluková analýza – automatické zistenie počtu zhlukov. In: Forum Statisticum Slovacum. Roč.3, č.1, 2007, s. 55-66. ISSN 1336-7420 Adresa autora: RNDr. Samuel Koróny Ústav vedy a výskumu UMB Cesta na amfiteáter 1 974 01 Banská Bystrica Email: [email protected] 73 Použitie faktorovej analýzy pri predikcii finančnej situácie podnikov v SR s využitím SPSS Pavol Kráľ 1, Vladimír Hiadlovský 2, Rudolf Gavliak 3 Abstract: The aim of this paper is to discuss substantial problems connected to prediction of bankruptcy in the case of the Slovak companies. We focus our attention on the application of factor analysis and discriminant analysis statistical procedures in the classification process. We are using the SPSS software package to research this issue. Key words: factor analysis, financial ratios, ex ante financial analysis, financial distress, discriminant analysis. 1. Úvod Možnosťami predikovania možných finančných problémov podnikov prostredníctvom klasických štatistických metód sa prvýkrát seriózne zaoberal vo svojich článkoch E. I. Altman, pričom svoju pozornosť zameral najmä na klasickú diskriminačnú analýzu. Hlavným dôvodom bola pomerne malá výpočtová zložitosť, jasne vymedzené predpoklady tejto metódy a pomerne jednoduchá a jednoznačná interpretácia získaných výsledkov. Výsledkom jeho vedeckej práce bola veľmi dobre známa tzv. Altmanova rovnica: Z = 0,012 X 1 + 0,014 X 2 + 0,033 X 3 + 0,006 X 4 + 0,999 X 5 (1) kde X 1 je miera pracovného kapitálu (pracovný kapitál/majetok), X 2 je podiel nevyplateného výsledku hospodárenia na majetku, X 3 je podiel EBITU na majetku (prevádzková rentabilita majetku), X 4 je podiel trhovej hodnoty vlastného imania (netto hodnota podniku) k účtovnej hodnote záväzkov, X 5 je obrátka majetku (tržby/majetok). V pôvodnej štúdii z roku 1968 sa E. I. Altmanovi podarilo na základe Z-skóre určeného na základe rovnice (1) klasifikovať úspešne 94 % krachujúcich podnikov a 97 % nekrachujúcich amerických výrobných akciových spoločností s ročným predstihom. Za deliacu hranicu bola vybraná hodnota Z = 2,675. Za zmienku stojí, že pôvodná rovnica bola vypočítaná na základe výberu 66 spoločností, v ktorých bolo 50 % krachujúcich podnikov a uvažovaných bolo 22 finančných ukazovateľov. Pri pokuse o predikciu na dva roky dopredu bola úspešnosť predikcie bankrotu stále 72 % až 94 %. Zároveň ukázal, že tento model nie je možné použiť na predikciu na obdobie dlhšie ako 5 rokov. Okrem týchto modelov E. I. Altman vytvoril model aj pre nevýrobné podniky. Neskôr v dôsledku ďalšieho vývoja navrhol zmenu deliacej hodnoty Z-skóre na Z = 1,81. Pavol Kráľ, Mgr., PhD., Katedra kvantitatívnych metód a informatiky, Ekonomická fakulta UMB v Banskej Bystrici, Tajovského 10, 975 90, [email protected]. 2 Vladimír Hiadlovský, Ing., Katedra ekonomiky a manažmentu podniku, Ekonomická fakulta UMB v Banskej Bystrici, Tajovského 10, 975 90, [email protected]. 3 Rudolf Gavliak, Ing., Katedra kvantitatívnych metód a informatiky, Ekonomická fakulta UMB v Banskej Bystrici, Tajovského 10, 975 90, [email protected]. Príspevok bol spracovaný v rámci projektu VEGA 1/4634/07 a fakultných projektov FG 67 a FG 75. 1 74 Je prirodzené, že dobrá schopnosť predikcie bankrotu v krátkodobom horizonte pôvodného Altmanovho modelu viedla a vedie k snahám vytvoriť analogické modely aj pre podniky iných ekonomík. Tieto snahy sú často nekritickým preberaním pôvodného Altmanovho modelu bez hlbšej analýzy osobitných podmienok konkrétnej krajiny. Pričom sa zabúda na niekoľko veľmi podstatných skutočností. Prvou je fakt, že pôvodný model E. I. Altmana bol vytvorený iba pre výrobné akciové spoločnosti. Pri tvorbe modelu sa vychádzalo z databázy, z ktorej boli vyradené extrémy, čo sa týka veľkosti podniku, t.j. príliš malé a príliš veľké podniky. Pri tvorbe analogického modelu musíme ďalej venovať obzvlášť veľkú pozornosť príprave vhodnej databázy s dostatočným zastúpením krachujúcich podnikov. Pokiaľ to okolnosti dovoľujú (dostatočný počet údajov), musíme vyradiť (podľa vzoru pôvodnej Altmanovej analýzy) príliš malé a príliš veľké podniky, pretože ich vývoj ja atypický z hľadiska predikcie ich finančnej situácie. V prípade veľmi veľkej spoločnosti je pravdepodobnosť krachu veľmi nízka, napríklad preto, že jej krach by mal dopad na jej okolie (zamestnanosť) a preto sú štátne autority naklonené k pomoci takejto spoločnosti (too big to fall). Vytvoriť vhodnú databázu je preto v prípade slovenských podnikov najťažšie splniteľná podmienka práve pre nízky počet krachujúcich podnikov, napríklad z dôvodu súčasnej rastovej fázy slovenskej ekonomiky. V dôsledku tohto a ďalších faktorov obsahuje databáza zvyčajne výrazne poddimenzovaný počet krachujúcich podnikov. Ďalšou nemenej dôležitou skutočnosťou je časová obmedzenosť predikčnej schopnosti získanej rovnice. Je možné predpokladať, že v dynamických podmienkach prebiehajúcej konvergencie slovenskej ekonomiky bude horizont platnosti získaného klasifikačného modelu kratší ako v prípade pôvodného Altmanovho modelu. Jednou z možností ako sa vyrovnať s touto skutočnosťou je neuvažovať krachujúce podniky, ale ich nadmnožinu, podniky neprosperujúce (bližšie pozri [2]). Medzi neprosperujúce podniky môžu byť zahrnuté napríklad podniky s nesplatenými záväzkami voči Sociálnej poisťovni a zdravotným poisťovniam. To znamená, že akákoľvek analógia Altmanovej rovnice musí byť v pravidelných časových intervaloch upravená vzhľadom na konkrétny vývoj a nemala by sa používať na predikciu na obdobie dlhšie ako dva roky. Okrem spomínaných skutočností musíme zobrať do úvahy aj špecifiká amerického trhu v porovnaní s európskym, čo môže viesť k inej diskriminačnej schopnosti finančných kritérií a teda aj k použitiu iných finančných ukazovateľov vo výslednej rovnici. S tým súvisí otázka, z akej množiny finančných ukazovateľov máme pri našej analýze vychádzať. My preferujeme zobrať za základ kompletnú dostupnú databázu finančných ukazovateľov, v ktorej sa nachádza 40 finančných ukazovateľov. Tento prístup je ale spojený s problémom možného nesplnenia vstupných predpokladov použitých metód. Okrem toho, že pri malom počte podnikov v databáze môže dôjsť k porušeniu empirického pravidla o pomere počtu sledovaných premenných a štatistických jednotiek, oveľa závažnejším problémom sa javí výskyt multikolinearity medzi sledovanými finančnými ukazovateľmi. Keďže jedným z našich cieľov je vytvoriť uspokojivo fungujúcu analógiu Altmanovho modelu pre slovenské podmienky s použitím klasickej diskriminačnej analýzy, musíme problému výskytu multikolinearity a veľkého počtu vstupných finančných ukazovateľov venovať osobitnú pozornosť. Za vhodnú možnosť ako sa vysporiadať s uvedenými problémami v rámci použitia klasických štatistických metód je faktorová analýza. Pomocou nej dosiahneme na jednej strane výrazné zníženie počtu premenných vstupujúcich do diskriminačnej analýzy a na druhej strane faktory, ktoré dostaneme z pôvodných premenných sú pri zvolení vhodnej metódy vzájomne nekorelované, čo eliminuje problém s multikolinearitou. Takto získané faktory spolu s ukazovateľmi, ktoré sa ukážu byť nevhodné pre faktorovú analýzu použijeme ako vstup pre klasickú diskriminačnú analýzu a pre logistickú regresiu. Zameriavame sa práve na tieto klasické štatistické metódy, pretože sú dnes štandardne zabudované v komerčných štatistických softvéroch (STATISTICA, S-PLUS, SPSS), čo umožňuje pomerne rýchlo transformovať získané modely na nové podmienky reprezentované aktuálnejšou databázou 75 a podrobiť úspešnosť získaných modelov aj z hľadiska času. Teoretickým východiskám použitých metód sa v článku nebudeme podrobnejšie venovať. V prípade potreby sa s nimi môže čitateľ oboznámiť v dostupnej literatúre (napríklad [3,4,6]). 2. Údajová základňa Východiskovú maticu objektov a ich charakteristík v našom prípade predstavovalo 190 podnikov pôsobiacich v rôznych odvetviach ekonomických činností OKEČ 151 – 365. Individuálne pomerové ukazovatele za roky 2002-2004 vybraného súboru podnikov poskytla spoločnosť INFIN, spol. s r.o., Bratislava. Charakteristikami každého analyzovaného podniku bolo 36 pomerových finančných ukazovateľov. Použité ukazovatele sú uvedené v tabuľke 1. Tabuľka 1. Použité ukazovatele BUCZ CFT CZA DOZ Bankové úvery/Celkové dlhy Podiel cash flow z tržieb Celková zadlženosť aktív Doba obratu zásob Doba splatnosti krátkodobých pohľadávok z DSKPzOS obchodného styku Doba splatnosti krátkodobých záväzkov z DSKZzOS obchodného styku DSP1 Doba splatnosti pohľadávok DSZ1 Doba splatnosti záväzkov DZA Dlhodobá zadlženosť aktív EBIT/Celkový kapitál ~ prevádzková EBITCK rentabilita majetku EBITDAT Podiel EBITDA v tržbách KKZOM KZMC LCF L1 Obežný majetok/Krátkodobé záväzky Krátkodobé záväzky/Celkový majetok Likvidita z CF Likvidita 1. stupňa L2 Likvidita 2. stupňa FP RT2 FP1 HROA HRT HVBKZ KCZBCF Finančná páka Finančná páka - modifikácia Hrubá rentabilita aktív Zisk pred zdanením/tržby ~ hrubá rentabilita tržieb Zisk pred zdanením/Krátkodobé záväzky Cash flow /Cudzie zdroje KCZOM L3 Likvidita 3. stupňa OA Obrat aktív (obrátka majetku) PNVHvT Podiel novovytvorenej hodnoty v tržbách PPHvT Podiel pridanej hodnoty v tržbách PRT Prevádzková rentabilita tržieb ROE STZ TZ Rentabilita vlastného imania Zisk po zdanení / tržby ~ čistá rentabilita tržieb Celkový majetok / Cudzie zdroje Tokové zadlženie UK Úrokové krytie UZA VIA Úverová zadlženosť aktív Koeficient samofinancovania Vlastný kapitál / Dlhodobý majetok ~ krytie dlhodobého majetku vlastným imaním VIOM Obežný majetok/Cudzí kapitál Pre potreby posúdenia schopnosti diskriminácie nami použitých metód sme databázu objektov rozdelili na dve skupiny analýzou ich vykázaných charakteristík, resp. existencie záväzkov po lehote splatnosti voči Sociálnej poisťovni a zdravotným poisťovniam. Cieľom príspevku je posúdenie vhodnosti aplikácie jednotlivých metód z hľadiska matematickoštatistického (splnenie relevantných predpokladov). Databázu podnikov sme rozdelili na dve skupiny podľa pomerne jednoduchého ekonomického kritéria, na podniky bankrotujúce (so záporným vlastným imaním, v konkurze, alebo vyrovnaní), resp. podniky so neuhradenými záväzkami zo sociálneho a zdravotného poistenia a podniky fungujúce (s nezáporným vlastným imaním, bez záväzkov voči poisťovniam). Na takto vytvorených dvoch skupinách podnikov sme testovali možnosť aplikácie diskriminačnej analýzy. 76 3. Faktorová analýza Problémom je veľký počet ukazovateľov (diskriminujúcich faktorov), pričom tento počet sa pokúsime zredukovať pomocou faktorovej analýzy. Základné predpoklady pre použitie faktorovej analýzy môžeme veľmi stručne zhrnúť do nasledujúcich bodov: 1. pozitívne semidefinitná korelačná matica, 2. pomer medzi počtom sledovaných podnikov a premenných približne 5:1, 3. korelačná matica sledovaných premenných (finančných ukazovateľov) musí obsahovať aspoň dva korelačné koeficienty presahujúce hodnotu 0,3, 4. rozsah sledovaného súboru musí byť väčší ako 50. Rozhodli sme sa pre použitie faktorovej analýzy založenej na metóde hlavných komponentov a rotáciu faktorov metódou VARIMAX, pretože výsledkom tohto postupu sú nekorelované faktory. Z faktorovej analýzy sme vyradili premennú KZ_MC, pretože jej zaradenie do analýzy viedlo ku korelačnej matici, ktorá nebola pozitívne semidefinitná. Kaiser-Meyer-Olkinova miera adekvátnosti výberu a Bartlettov test sféricity (tabuľka 2) ukazujú, že môžeme na zostávajúce premenné aplikovať faktorovú analýzu. Na základe miery adekvátnosti výberu a výšky komunalít sme postupne z faktorovej analýzy vyradili nasledujúce premenné: bankové úvery na celkových dlhoch (BUCZ), dlhodobá zadlženosť aktív (DZA), prevádzková rentabilita majetku (EBITCK), hrubá rentabilita aktív (HROA), PLN1, úrokové krytie (UK), tokové zadlženie (TZ), úverová zadlženosť aktív (UZA), krytie dlhodobého majetku vlastným imaním (VIOM), krytie krátkodobých záväzkov ziskom pred zdanením (HVBKZ), obrátka aktív (OA). Tabuľka 2. KMO a Bartlettov test a Kaiser-Meyer-Olkin Measure of Sampling Adequacy. Bartlett's Test of Sphericity Approx. Chi-Square d. f. Sig. ,783 23709,081 325 ,000 a Only cases for which rok = 0 are used in the analysis phase. Na základe hodnoty eigenvalue a takisto aj na základe posúdenia tvaru sutinového grafu (screeplot, graf 1) je zrejmé, zostávajúce ukazovatele vytvorili štyri faktory, ktoré vysvetľujú 92,44 % variability pôvodných ukazovateľov vstupujúcich do faktorovej analýzy. Pozri tabuľku č. 2 graf č.1. Prvý faktor je tvorený podielom cash flow v tržbách (CFT), dobou splatnosti pohľadávok z obchodného styku (DSKPzOS), podielom EBITDA v tržbách, (EBITDAT), hrubou rentabilitou tržieb (HRT), podielom novovytvorenej hodnoty v tržbách (PNVHvT), prevádzkovou rentabilitou tržieb (PRT) a čistou rentabilitou tržieb (RT2). Tento faktor je možné vnímať ako rentabilitu, resp. podiel výstupu podniku k tržbám. Nazvime tento faktor „rentabilitou tržieb“. Druhý faktor je tvorený podielom cash flow na cudzích zdrojoch (KCZBCF), podielom obežného majetku na cudzom kapitáli (KCZOM), podielom obežného majetku na krátkodobých záväzkoch (KKZOM) a ukazovateľmi likvidity (LCF, L1, L2, L3). Ukazovatele zahrnuté do tohto faktora hovoria o krytí krátkodobých záväzkov. Tento faktor nazveme „likviditou a solventnosťou“. Tretí faktor je tvorený oboma modifikáciami ukazovateľa finančná páka (FP, FP1) ukazovateľom rentability vlastného imania (ROE) a podielom základného imania na vlastnom imaní. Ukazovatele zahrnuté do tohto faktora hovoria súvisia s vlastným imaním. Tento faktor preto nazveme „vlastným financovaním“. Štvrtý faktor je tvorený celkovou zadlženosťou aktív (CZA) a koeficientom samofinancovania (VIA). Tieto dva ukazovatele hovoria o štruktúre kapitálu, preto tento faktor nazveme „kapitálovou štruktúrou“. 77 Tabuľka 3. Faktory vysvetľujúce rozptyl vstupných finančných ukazovateľova Component Total 10,007 7,090 3,685 1,404 ,690 1 2 3 4 5 Initial Eigenvalues % of Variance Cumulative % 41,695 41,695 29,544 71,238 15,356 86,594 5,849 92,443 2,875 95,318 Extraction Sums of Squared Loadings Total % of Variance Cumulative % 10,007 41,695 41,695 7,090 29,544 71,238 3,685 15,356 86,594 1,404 5,849 92,443 Extraction Method: Principal Component Analysis. a Only cases for which Rok = 2002 are used in the analysis phase. 12 10 Eigenvalue 8 6 4 2 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 Component Number Graf 1. Sutinový graf Získané faktory sme spolu s premennými, ktoré neboli zaradené do faktorovej analýzy použili ako vstup pre diskriminačnú analýzu pôvodnej databázy podnikov. Pre použitie diskriminačnej analýzy sme sa rozhodli napriek tomu, že v článku [5] je vhodnosť diskriminačnej analýzy na predikciu hodnotená ako nepresvedčivá. Domnievame sa, že nás k tomu oprávňuje kvalitnejšia databáza, ktorá má pomerne vysoké zastúpenie podnikov obidvoch skupín (prosperujúce a neprosperujúce), čím sme eliminovali problém s poddimenzovaním množiny podnikov, ktoré sú objektom nášho skúmania. Bez podobného zásahu použitie diskriminačnej analýzy vedie k nepresvedčivým výsledkom. Podobný problém by sme museli riešiť aj prípade snahy o použitie logistickej regresie. Aplikovaním diskriminačnej analýzy dostávame nasledujúcu ukážku schopnosti diskriminovať slovenské podniky s použitím faktorovej analýzy a diskriminačnej analýzy. 4. Diskriminačná analýza Pred použitím diskriminačnej analýzy je samozrejme nevyhnutné skontrolovať splnenie vstupných predpokladov. Vieme, že aby diskriminačná analýza vykazovala uspokojivé výsledky, napríklad aby odhad, ktorý ňou získame bol konzistentný, musí spĺňať predpoklad normality jednotlivých premenných a kovariačné matice jednotlivých skupín, do ktorých diskriminujeme, by sa nemali výrazne odlišovať. Na nie príliš výrazné odchýlky od normality, najmä, ak majú nesplnenie normality na svedomí outliery (odľahlé hodnoty), býva diskriminačná analýza ešte dostatočne robustná. Na testovanie normality vstupných premenných sme použili Shapiro-Willkov a Kolmogorov-Smirnov test normality. Nulovú 78 hypotézu o normalite sledovaných premenných sme zamietli. Najväčšie odchýlky od normality nájdeme práve pri skonštruovaných faktoroch. Na základe testu zhody vektorov stredných hodnôt sa ukázalo, že diskriminačnú schopnosť (zamietli sme nulovú hypotézu o rovnosti priemerov v sledovaných skupinách) majú najmä premenné EBIT_CK, HROA, TZ, HVB_KZ, OA, FAKTOR 3 a FAKTOR 4. Keďže nepoznáme apriórne pravdepodobnosti zaradenia podniku do zvolených skupín, urobili sme diskrimináciu s voľbou pravdepodobností na základe veľkosti skupín. Na základe Boxovho testu sme zamietli zhodu kovariačných matíc, preto sme použili aj voľbu Separategroups covariance matrix. Schopnosť diskriminácie sme overili na dátach nasledujúceho roku (2003, 2004). Výstup programu SPSS indikoval silnú koreláciu medzi niektorými dvojicami sledovaných. Vysoká korelácia medzi premennými môže spôsobiť, že nemôžeme interpretovať koeficienty diskriminačnej funkcie a diskriminácia môže byť nadhodnotená. Korelačná matica naynačuje prítomnosť multikolinearity. Nesplnenie podmienky normality diskriminujúcich premenných a zhody kovariačných matíc môže ďalej spôsobiť, že ako diskriminujúce premenné vystupujú premenné, ktoré v skutočnosti nemajú diskriminujúcu schopnosť. Na výpočet sme použili krokovú metódu postupne so nasledujúcimi metódami dostupnými v SPSS (Wilkovo lambda, Nevysvetlená variabilita, Mahalanobisova vzdialenosť, najmenšia hodnota F štatistiky). V všetkých prípadoch získame identickú kanonickú diskriminačnú funkciu, ktorá je štatisticky signifikantná. Okrem hodnota Wilkovho lambda, 0,622 a kanonická korelácia 0,615 naznačujú pomerne uspokojivú kvalitu diskriminačnej funkcie Dostávame nesledujúcu kanonickú diskriminačnú funkciu spolu s klasifikačnou tabuľkou uvedenú v tabuľke 4. Tabuľka 4. Štandardizované koeficienty kanonickej diskriminačnej funkcie EBIT_CK ,765 TZ -,475 OA -,387 Faktorové skóre 4. faktora ,564 Na základe hodnôt centroidov výstupov kanonickej diskriminačnej funkcie pre obe skupiny podnikov sme určili priemernú hodnotu, ktorá sa dá interpretovať ako hraničná hodnota pre klasifikáciu. Jednoduchý vážený priemer centroidov je -0,4315, čo znamená že vyššia hodnota výsledku kanonickej diskriminačnej funkcie znamená zaradenie medzi fungujúce podniky a nižšia hodnota zaradenie medzi neprosperujúce podniky. V tabuľke 5 sú uvedené výsledky klasifikácie na vstupných dátach diskriminačnej analýzy (rok 2002) a takisto posúdená správnosť zaradenia aj pre údaje za ďalšie 2 roky. Tabuľka 5. Výsledky klasifikácie ab Predicted Group Membership 0 Cases Selected Cases Not Selected Original Group Membership Count % Count Original Group Membership % 0 1 0 1 0 1 0 1 a 83,8% of selected original grouped cases correctly classified. b 85,6% of unselected original grouped cases correctly classified. 79 Total 1 35 18 76,1 13,5 73 30 76,8 11 115 23,9 86,5 22 236 23,2 46 133 100,0 100,0 95 266 100,0 11,3 88,7 100,0 Z tabuľky 5 je zrejmé, že schopnosť predikovať týmto spôsobom finančnú nestabilitu slovenských podnikov je pomerne dobrá, pretože sme schopní dosiahnuť predikčnú kvalitu približne 88,7 % fungujúcich podnikov a 76,8 % v prípade neprosperujúcich podnikov na dátach za roky 2003-2004. Pri aplikácii výsledkov analýzy je však nevyhnutná opatrnosť, keďže neboli splnené vstupné predpoklady diskriminačnej analýzy a vyskytovala sa multikolinearita medzi premennými. 5. Záver Ukázalo sa, že z pomerových ukazovateľov finančnej analýzy podniku do konečného modelu vstupuje prevádzková rentabilita majetku, schopnosť niesť dlh vyjadrená ukazovateľom tokového zadlženia, obrátka aktív a dôležitým faktorom pri sklone k prosperite je aj kapitálová štruktúra podniku. Obrátka aktív pôsobí opačným smerom ako sme predpokladali, čo je možné interpretovať nasledujúcim spôsobom. Kapitálovo intenzívnejšie spoločnosti, ktoré sú zároveň aj väčšie majú menší sklon stať sa neprosperujúcimi. 6. Literatúra 1. ALTMAN, E. I. 2000. Predicting financial distress of companies: Revisiting the Z-score and Z Model, working paper, www. stern.nyu.edu. 2. GAVLIAK, R. 2007. Využitie lineárnych pravdepodobnostných modelov pri tvorbe bonitného modelu v slovenských podmienkach. In: Evropské finanční systémy 2007. Zborník príspevkov z medzinárodnej vedeckej konferencie. Brno : ESF MU, 2007, s. 69 – 75. ISBN 978-80-210-4319-0. 3. HEBÁK, P. – HUSTOPECKÝ, J. – JAROŠOVÁ, E. – PECÁKOVÁ, I. 2004. Vícerozměrné statistické metody (1). Praha: INFORMATORIUM, 2004. 239 s. ISBN 807333-025-3. 4. HEBÁK, P. – HUSTOPECKÝ, J. – JAROŠOVÁ, E. – PECÁKOVÁ, I. 2005. Vícerozměrné statistické metody (3). Praha: INFORMATORIUM, 2005. 255 s. ISBN 807333-039-3. 5. HIADLOVSKÝ, V. – KRÁĽ, P. 2005. Využitie diskriminačnej analýzy na predikovanie finančnej situácie podnikov v SR. In: Forum Statisticum Slovacum, č. 1, 2005, s. 44-50. 6. MELOUN, M. – MILITKÝ, J. 2002. Kompendium statistického spracování dat. Praha: ACADEMIA, 2002. 764 s. ISBN 80-200-1008-4. Adresa autora: Pavol Kráľ, Rudolf Gavliak Katedra kvantitatívnych metód a informatiky Ekonomická fakulta Univerzity Mateja Bela Tajovského 10, 975 10 Banská Bystrica [email protected], [email protected] Vladimír Hiadlovský Katedra ekonomiky a manažmentu podniku Ekonomická fakulta Univerzity Mateja Bela Tajovského 10, 975 10 Banská Bystrica [email protected] 80 Přesnost odhadu v autoregresních modelech Jana Kubanová 1, Bohdan Linda 2 Abstract: The time series analysis is very common problem of the economical practice. AR(p) models can be quite suitable tool in certain cases. The goal is to estimate the parameters of these models. The estimates can be provided by the classical methods of the mathematical statistics, but one important question emerges, respectively how exact is such estimate. The resampling methods can offer any solution when the first or second order autoregressive model is applied. Both of the mentioned methods are based in fitting of the model and subsequently in simulation of its residuals by the bootstrap process. Key words: autoregressive models, bootstrap method, parameters estimate 1. Autoregresní model prvního řádu AR(1) Nechť posloupnost náhodných veličin {Zt }t =0, ±1, ± 2,... (1) tvoří slabě stacionární časovou řadu. Autoregresní model prvního řádu AR(1) předpokládá, že každá náhodná veličina Z t je lineární kombinací předešlé náhodné veličiny Z t-1 a nezávislého poruchového členu Ξ t , což můžeme vyjádřit následujícím způsobem: (2) Z t = α Z t −1 + Ξ t kde pro neznámý parametr α platí α ≤ 1 . O náhodných poruchách (reziduích) Ξ t t = 0, ± 1, ± 2, ... se předpokládá, že představují bílý šum (white noise), tj. tvoří posloupnost nezávislých náhodných veličin majících stejné rozdělení pravděpodobnosti s neznámou distribuční funkcí, nulovou střední hodnotou a směrodatnou odchylkou σ . Odhad parametru α lze na základě empirických dat získat různými způsoby. Použijeme-li metodu nejmenších čtverců, můžeme postupovat následujícím způsobem. Nechť z1, z2 , ..., zn jsou námi napozorovaná data časové řady. Označíme-li a odhad skutečné hodnoty parametru α , můžeme na základě autoregresního modelu (2) pro jednotlivé hodnoty zt psát přibližný vztah (3) zt = a zt −1 + et t = 2, 3, ..., n kde et je odhad hodnoty bílého šumu ξ t Potom pro reziduální součet čtverců odchylek S (a) dostáváme vztah n S (a ) = ∑ ( zt − a zt −1 ) 2 t =2 Hodnotu odhadu α̂ minimalizující tento součet čtverců vypočítáme ze vztahu n ∑ zt ⋅ zt −1 α̂ = t =n2 ∑ ( zt −1 )2 t =2 1 2 Jana Kubanová, Univerzita Pardubice, Fakulta ekonomicko-správní Bohdan Linda, Univerzita Pardubice, Fakulta ekonomicko-správní 81 Logicky navazující otázkou, kterou je třeba řešit v souvislosti s odhadem α̂ , je otázka jeho přesnosti. Přesnost odhadu obvykle hodnotíme jeho biasem a standardní chybou. Vzhledem k tomu, že neznáme distribuční funkci, je problematické určit tyto hodnoty. K určení přesnosti lze využít neparametrickou bootstrapovou metodu, neboť tato metoda se zdá být nejjednodušší, resp. jednodušší nežli analytická metoda založená na složitém matematickém aparátu. Pro bootstrapové odhady biasu a standardní chyby použijeme bootstrapové algoritmy, popsané například v Efron(1990). 2. Princip bootstrapových metod. Základem bootstrapových metod je tvorba tzv. bootstrapových výběrů, které simulujeme pomocí jednoho náhodného výběru z daného rozdělení. Podle toho, zda známe resp. neznáme typ distribuční funkce rozlišujeme parametrický a neparametrický bootstrap. V praxi zpravidla rozložení pravděpodobností neznáme, proto dále postupujeme neparametrickým bootstrapem. Předpokládáme, že ( x1 , x2 , ..., xn ) je náhodný výběr z neznámého rozdělení F s parametrem Θ . Nechť Θˆ = g ( x , x , ..., x ) je odhad tohoto parametru získaný na základě naměřených hodnot. 1 2 n Označme dále F̂ empirickou distribuční funkci zkonstruovanou z výše uvedeného náhodného výběru. Náhodný výběr z rozdělení F̂ nazýváme bootstrapový výběr a v literatuře se obvykle značí ( x1* , x2* , ..., xn* ) . Protože v rozdělení F̂ má každá hodnota xi stejnou pravděpodobnost 1 n můžeme se na bootstrapový výběr dívat jako na výběr s vracením z náhodného výběru ( x1 , x2 , ..., xn ) . Veličinu Θˆ * = g ( x1* , x2* , ..., xn* ) nazýváme bootstrapovou replikací odhadu Θˆ . Myšlenka bootstrapových odhadů biasu a standardní chyby odhadu Θˆ spočívá v následující úvaze. Vygenerujeme mnoho bootstrapových replikací Θˆ * . Bias odhadu Θˆ odhadneme empirickým biasem R (4) BΘˆ = 1 ∑ Θˆi* − Θˆ R i =1 kde R je počet vygenerovaných replikací. Standardní chybu odhadneme empirickou standardní (směrodatnou) odchylkou R 2 1 R * (5) SE (Θˆ ) = Θ i − Θ * kde Θ * = 1 ∑ Θˆi* ∑ R i =1 R − 1 i =1 ( ) V případě, že bychom znali hodnotu parametru α , vypočítali bychom hodnoty reziduí ξ t použitím vztahu (2) jako rozdíly ξ t = zt − α zt −1 t = 2, 3, ..., n . Ty bychom považovali za náhodný výběr z rozdělení F. Na jejich základě bychom odhadli empirickou distribuční funkci bílého šumu F̂ . Parametr α je zpravidla neznámý, ale jeho odhad α̂ lze využít k výpočtu přibližných hodnot poruch, tj. (6) ξˆt = zt − αˆ zt −1 t = 2, 3, ..., n Hodnoty ξˆ , ξˆ , ..., ξˆ považujeme za náhodný výběr z rozdělení F z něhož pak provádíme ( ) bootstrapové výběry (ξˆ , ξˆ , ..., ξˆ ). Prvním krokem je určení hodnoty 2 3 n * 2 * 3 * n z1* . Položíme z1* = z 1 , počáteční hodnota této časové řady je pevně danou konstantou. Pomocí bootstrapového výběru rekurzivně vypočítáme bootstrapovou replikaci původní centrované časové řady: z 2* = α̂ z 1 + ξ2 * 82 z 3* = α̂ z 2* + ξ 3 * z 4* = α̂ z 3* + ξ 4 * ....................... * z n = α̂ z n*−1 + ξ n * Aplikací metody nejmenších čtverců na bootstrapované hodnoty zt* dostaneme bootstrapové replikace α̂ * odhadu α̂ z nichž pomocí vztahů (4) a (5) provedeme bootstrapové odhady biasu a standardní chyby odhadu α̂ . 3. Autoregresní model druhého řádu AR(2) Autoregresní schéma druhého řádu rozšiřuje závislost až na člen z t-2 . V modelu (2) tak přibude další člen a změní se na tvar (7) Z t = α1 Z t −1 + α 2 Z t − 2 + Ξ t Označíme-li ve shodě s modelem AR(1) odhady parametrů α1, α 2 po řadě a1, a2 , dostaneme analogii vztahu (3) (8) t = 3, 4, ..., n zt = a1 zt −1 + a2 z t −2 + ξ t poslední vztah využijeme k odhadu koeficientů α1, α 2 metodou nejmenších čtverců. Zavedeme následující označení: z1 z3 z2 z z z2 3 4 a ⋅ a = 1 z2 = ⋅ z1 = ⋅ ⋅ a2 ⋅ ⋅ ⋅ ⋅ ⋅ z z z n n −1 n − 2 α potom odhadem vektoru α = 1 získaným metodou nejmenších čtverců bude vektor α 2 αˆ α̂ = 1 který určíme ze vztahu αˆ 2 α̂ = ( z2′z2) −1 z2′z1 Analogicky k (6) použijeme vektor α̂ k výpočtu přibližných hodnot reziduí ξˆt = zt − αˆ1 zt −1 − αˆ 2 zt − 2 t = 3, 4, ..., n z kterých vytváříme bootstrapové výběry. Odhady biasu a standardní chyby provádíme stejným způsobem jako v modelu AR(1). (9) 4. Příklady Popisovaná metoda je demonstrována na následujících příkladech: První příklad je ryze teoretického charakteru. Vygenerovali jsme časovou řadu tvaru Z t = −0,8 Z t −1 + Ξ t . Parametr α je tedy předem znám a rovněž známe rozdělení pravděpodobnosti náhodné veličiny Ξ. Náhodné odchylky byly generovány z N(0,1) rozdělené pravděpodobnosti. Při řešení reálných úloh zpravidla tyto informace nemáme. 83 I v tomto případě budeme postupovat tak, jako kdyby parametr i rozdělení odchylek byly neznámé a určíme přesnost jejich odhadu. Odhad parametru α na základě vygenerovaných dat metodou nejmenších čtverců je -0.846. Centrované hodnoty Teoretický model Z t = -0.8 Z t-1 +Ξ z 30.00 24 20.00 18 10.00 12 0.00 -10.00 0 10 20 30 40 t 50 6 -20.00 0 -27 -30.00 -21 -15 -9 Modus Průměr 25% Medián 75% -3 3 9 15 21 27 Graf 1. Teoretický model Z t = −0,8 Z t −1 + Ξ t a histogram centrovaných hodnot Graf 1 ukazuje centrované hodnoty časové řady (vlevo), histogram v pravé části vypovídá o téměř symetrickém rozložení těchto hodnot. Tabulka 1. odhady biasu a standardní chyby při použití metody AR(1) 100 200 300 400 500 600 700 800 R bias -8.254 -3.749 -2.227 -1.463 -1.003 -0.696 -0.476 -0.311 St.Error 0.063 0.044 0.036 0.031 0.028 0.026 0.024 0.022 900 -0.183 0.021 1000 -0.080 0.020 Tabulka 2. odhady biasu a standardní chyby při použití metody AR(2) 100 200 300 400 500 600 700 R bias1 -5.919 -2.683 -1.589 -1.040 -0.709 -0.489 -0.331 St.Error1 0.482 0.341 0.279 0.241 0.216 0.197 0.182 bias2 1.570 0.699 0.406 0.259 0.170 0.111 0.069 St.Error2 0.456 0.323 0.264 0.228 0.204 0.186 0.173 900 -0.120 0.160 0.011 0.153 1000 -0.047 0.152 -0.009 0.145 800 -0.213 0.171 0.036 0.162 V tabulkách 1 a 2 jsou uvedeny hodnoty biasu a standardní chyby odhadu parametru při 100 až 1000 bootstrapových replikacích při použití metod AR(1) a AR(2). Uvedené hodnoty jsou průměry při 100 opakování každé replikace. Je zajímavé, že i když výchozí model byl tvaru AR(1), je hodnota biasu při aplikaci metody AR(2) menší. Na druhé straně ale je hodnota standardní chyby odhadu menší (v hodnotě řádu) u metody AR(1), což ukazuje na oprávněnost užití metody. Na základě této hodnoty 0,02 standardní chyby můžeme usuzovat na přesnost odhadu. Následující grafy 2 a 3 ukazují vývoj odhadu biasu a standardní chyby při 100 až 1000 bootstrapových replikacích při použití metod AR(1) a AR(2). Všechny křivky naznačují konvergenci po provedení přibližně 800 bootstrapových replikací. Hodnoty biasu konvergují k nule, hodnoty standardní chyby k 0,02 u metody AR(1) a k 0,15 u metody AR(2). Počet nutných replikací býval častou otázkou, řešenou v souvislosti s touto problematikou. K tomu lze jen dodat, že při současném vývoji počítačové techniky není problémem provést několik tisíc, resp. desítek či stovek tisíc replikací. První pokusy jsme prováděli s 5000 replikací, ale tento počet se ukázal jako zbytečný, po 1000 opakováních se již hodnoty přestaly měnit. 84 STANDARD ERROR BIAS 0.07 0 -1100 200 300 400 500 600 700 800 900 100 0.06 -2 0.05 SE -3 bias -4 0.04 -5 0.03 -6 0.02 -7 -8 0.01 -9 100 200 300 400 500 600 700 800 R 1000 900 R Graf 2. Vývoj odhadu biasu a standardní chyby při 100 až 1000 bootstrapových replikacích při použití metody AR(1) B IAS 1 STANDARD ERROR 1 0.6 0 100 200 300 400 500 600 700 800 900 1000 standard error 1 -1 0 bias 1 -2 -3 -4 -5 -6 0.5 0.4 0.3 0.2 0.1 0 -7 0 100 200 300 400 R 600 700 800 900 1000 R B IAS 2 STANDARD ERROR 2 2 0.5 1.5 0.4 standard error 2 bias 2 500 1 0.5 0.3 0.2 0.1 0 0 -0.5 100 200 300 400 500 600 700 800 900 0 1000 R 0 100 200 300 400 500 600 700 800 900 1000R Graf 3. Vývoj odhadu biasu a standardní chyby při 100 až 1000 bootstrapových replikacích při použití metody AR(2) Druhý příklad ukazuje na zpracování reálných dat. Použili jsme čtvrtletní hodnoty reálných mezd v období od prvního čtvrtletí roku 1998 do prvního čtvrtletí roku 2007. Prvním krokem analýzy bylo centrování dat, neboť uvedená časová řada, jak je patrné z grafu 4(vlevo), nesplňuje podmínku stacionarity. Opět byly aplikovány modely AR(1) a AR(2) při stejném počtu bootstrapových replikací jako u prvního příkladu. Odhad parametru α získaný z hodnot reziduí časové řady metodou nejmenších čtverců je -0.65482. Hodnota biasu je nejmenší při použití modelu AR(1), podobně i hodnota standardní chyby. Lze tedy říci, že použití modelu AR(1) je v tomto případě vhodnější . Tabulka 3. odhady biasu a standardní chyby při použití metody AR(1) 100 200 300 400 500 600 700 800 R bias -6.063 -2.737 -1.613 -1.048 -0.708 -0.482 -0.319 -0.197 St.Error 0.437 0.310 0.253 0.219 0.196 0.179 0.166 0.155 85 900 -0.103 0.146 1000 -0.027 0.139 Kčs Tabulka 4. odhady biasu a standardní chyby při použití metody AR(2) 100 200 300 400 500 600 700 R bias1 -7.046 -3.191 -1.888 -1.235 -0.840 -0.578 -0.390 St.Error1 0.569 0.404 0.330 0.286 0.255 0.234 0.216 bias2 -1.515 -0.698 -0.422 -0.283 -0.200 -0.145 -0.105 St.Error2 0.507 0.365 0.301 0.263 0.237 0.218 0.203 Kčs MZDY 900 -0.139 0.191 -0.052 0.182 1000 -0.052 0.181 -0.034 0.173 Mzdy-rezidua y = -0.0047x - 0.0901 y = 267.87x + 10926 R2 = 0.923 24 000 800 -0.249 0.202 -0.076 0.191 1 500 22 000 1 000 20 000 500 18 000 16 000 0 14 000 -500 1 12 000 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 -1 000 10 000 1 3 5 -1 500 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 t t Graf 4 hodnoty časová řady reálných mezd (vlevo) a hodnoty reziduí (vpravo) STANDARD ERROR BIAS 0 100 -1 200 300 400 500 600 700 800 900 0.5 0.45 100 0.4 0.35 -2 -4 0.3 0.25 0.2 -5 0.15 0.1 -6 0.05 0 SE bias -3 -7 100 200 300 400 500 600 700 800 900 1000R R Graf 5 Vývoj odhadu biasu a standardní chyby při 100 až 1000 bootstrapových replikacích při použití metody AR(1) Graf 5 ukazuje na vývoj odhadu biasu a standardní chyby při 100 až 1000 bootstrapových replikacích při použití metody AR(1), graf 6 znázorňuje stejné charakteristiky při stejném počtu replikací v případě, kdy byla použita metoda AR(2). Průběh odhadu biasu vykazuje ve všech případech téměř stejný průběh a konvergenci k nule přibližně po 800 replikacích. BIAS 1 STANDARD ERRO R 1 R R 86 10 00 90 0 80 0 70 0 60 0 50 0 40 0 -8 30 0 0 -6 20 0 -4 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 10 0 10 00 90 0 80 0 70 0 60 0 50 0 40 0 30 0 20 0 standard error 1 bias 1 -2 10 0 0 0 BIAS 2 STANDARD ERRO R 2 R 10 00 90 0 80 0 70 0 60 0 50 0 40 0 -2 30 0 0 -1.5 20 0 -1 0.6 0.5 0.4 0.3 0.2 0.1 0 10 0 standard error 2 90 0 10 00 80 0 70 0 60 0 50 0 40 0 30 0 20 0 0 bias 2 -0.5 10 0 0 R Graf 6 Vývoj odhadu biasu a standardní chyby při 100 až 1000 bootstrapových replikacích při použití metody AR(2) Podobný závěr lze vyslovit o hodnotách standardní chyby, pouze konvergence není k nule, ale k hodnotě 0,18 po 1000 replikací u metody AR(1) a k 0,18, resp. 0,17 pro SE1 a SE2 u metody AR(2). 4. Závěr Obecně lze říci, že bootstrapové metody nejsou zcela přesné, ale jsou schůdným řešením v případech, kdy reálná situace vyžaduje použití složitého modelu, neboť matematická obtížnost modelu nesouvisí s přesností bootstrapové analýzy. Jsou tak kompromisním řešením v případech, kdy použití exaktních metod je příliš složité, anebo při úrovni současného poznání nemožné. 5. Literatura: 1. DIGGLE,P.: Time Series, a Biostatistical Introduction. Clarendon Press, Oxford, 1990 2. EFRON,B.: More efficient bootstrap computation. J. Amer. Statist. Assoc. 85, 79-89, 1990 3. EFRON,B., TIBSHIRANY,R.: The bootstrap method for assessing statistical accuracy. Behaviometrika 17, 1-35, 1985. 4. FERNHOLZ,L.T.:Von Mises Calculus for Statistical Functionals, Lecture Notes in Statistics, Springer, NewYork 1983 5. KALINA,M.: Elementárne o bootstrape. In.: Sborník konference Prastan 2001, Kočovce 2001, s.94-95, ISBN 80-88946-13-1 6. KANDEROVÁ, M., ÚRADNÍČEK, V: Štatistika a pravdepodobnosť pre ekonómov, 2. časť. OZ Financ, Banská Bystrica, 2007, ISBN 978-80-969535-1-6 7. LINDA,B.: Resampling Methods Accuracy in Point Estimates. In: Sborník příspěvků 15. škola statistiky EKOMSTAT´2001 – Aplikace štatistických metód v hospodárskej praxi. Trenčianske Teplice 2001, s.64 – 67, ISBN 80-88946-10-7 8. RAO,R.C.: Lineární metody statistické indukce a jejich aplikace. Academia Praha 1978. Adresa autorů: doc. PaedDr.Jana Kubanová,CSc, doc. RNDr.Bohdan Linda,CSc Univerzita Pardubice Studentská 95 53210 Pardubice 87 [email protected] , [email protected] 88 Přesnost odhadu v autoregresních modelech při použití metody klouzavých bloků Jana Kubanová 1, Bohdan Linda 2, Pavel Semerák 3 Abstract: The method of moving blocks is described in this paper. This method can help to determine the accuracy of the estimated parameters in time series. The commonly used AR(p) methods have such disadvantage that they underlie to the selected model. When the selection of the model is inaccurate, it is possible to reach the misguided or incorrect results. Key words: moving blocks overlapping and not overlapping, bootstrap method, parameters estimate 1. Metoda klouzavých bloků a bootstrap Používáme-li v AR modelech pro odhad koeficientů modelu bootstrap, většina metod nejdříve „napasuje“ vhodný model na původní data z kterého odhadne rezidua a resamplinguje tato rezidua viz. např. [6]. Toto se může stát nevýhodou v případě, když model neodpovídá zkoumané časové řadě. Abychom se vyhnuli možné chybě, která může být způsobena nesprávnou volbou modelu lze resamplingovat původní data. Avšak bootstrapováním jednotlivých hodnot se ztrácí závislosti, kterými jsou svázána původní data. Tento nedostatek lze odstranit tak, že nebudeme bootstrapovat jednotlivá data, ale celé bloky sousedících původních dat. Tato metoda se nazývá metoda klouzavých bloků. V případě, že délka bloku h je dostatečně velká, bude vnitřní souvislost časové řady zachována. Tento požadavek nás nutí vytvářet co nejdelší bloky. Vytvářet příliš dlouhé bloky se ale nedoporučuje, protože bootstrapové výběry vytvořené z dlouhých bloků se mohou často a značně lišit od originálního výběru a bootstrapové replikace Θˆ * odhadu Θˆ nemusí být číselně dobrým odhadem parametru Θ . Bohužel neexistuje jednoznačné pravidlo pro určení ˆ délky bloku. Obecně lze říci jenom to, že délka bloku závisí na typu statistiky Θ . Pro tvorbu blokového resamplingového plánu existuje více způsobů. Uvedeme dva z nich. První plán pracuje s překrývajícími se bloky. Představuje-li n-tice ( x1 , x 2 , ..., x n ) původní data a pokud zvolíme délku bloku m = 5, prvním blokem je ( x1, x2 , ..., x5 ) , druhým blokem je ( x2 , x3 , ..., x6 ) , třetím ( x3 , x4 , ..., x7 ) a posledním (x n-4 , x n-3 , x n-2 , x n-1 , x n ). Celá časová řada n prvků (údajů) je tímto rozdělena na n – m + 1 bloků. Počet vybraných bloků by měl odpovídat délce původní řasové řady, i když v řadě případů nelze získat zcela stejný počet členů časové řady. Je-li např. m = 5, pak vybíráme k bloků tak, aby přibližně n ≈ k ⋅ m. Je zcela zákonité, že první, resp. několik prvních hodnot a podobně poslední hodnoty se objevují v menším počtu bloků, nežli hodnoty ostatní. Tento nedostatek může být odstraněn tzv. “zabalením” původních dat do pomyslného kruhu. To znamená, pokud stále uvažujeme příklad, kde m = 5, že vytvoříme následující bloky: (x n-3 , x n-2 , x n-1 , x n , x 1 ), (x n-2 , x n-1 , x n , x 1 , x 2 ), (x n-1 , x n , x 1 , x 2 , x 3 ), (x n , x 1 , x 2 , x 3 , x 4 ). Tento postup nám již zajišťuje, že každá z hodnot v původním náhodném výběru má stejnou pravděpodobnost být vybrána v některém z náhodných bloků a tím i v následně vytvořené časové řadě. Druhý plán pracuje s disjunktními bloky. Uvažujeme opět n -tici ( x1 , x 2 , ..., x n ) původních dat a volíme délku bloku m. Vytvoříme k disjunktních bloků, uvažujeme, že n ≈ k ⋅ m. Pro ilustraci problému zvolíme m = 5. Prvním blokem je stejně jako v prvním plánu 1 Jana Kubanová, Univerzita Pardubice, Fakulta ekonomicko-správní Bohdan Linda, Univerzita Pardubice, Fakulta ekonomicko-správní 3 Pavel Semerák, Univerzita Pardubice, Fakulta ekonomicko-správní 2 89 blok ( x1, x2 , ..., x5 ) , druhým blokem však je ( x6 , x7 , ..., x10 ) , třetím ( x11 , x12 , ..., x15 ) a posledním (x n-4 , x n-3 , x n-2 , x n-1 , x n ). Při tomto postupu se vybírají jednotlivé bloky, přičemž pravděpodobnost výběru každého z nich je stejná, a to 1/k. Tyto vybrané bloky se skládají za sebe a tvoří novou časovou řadu. Cílem je odhadnout parametry těchto modelů. Odhady lze provést klasickými metodami matematické statistiky, ale vyvstává otázka, jak je takový odhad přesný. Řešení nabízejí uvedené resamplingové metody při použití metody klouzavých bloků (disjunktních nebo překrývajících se). Z bootstrapových výběrů, získaných některým blokovým resamplingem se získají metodou nejmenších čtverců bootstrapové replikace α̂ * odhadu α̂ z nichž pomocí vztahů 1 R Bαˆ = ∑ αˆ i* − αˆ a SE (αˆ ) = R i =1 1 R * (α i − α * )2 , kde ∑ R − 1 i =1 α* = 1 R ˆ* ∑α i R i =1 provedeme bootstrapové odhady biasu a standardní chyby odhadu α̂ . R je počet vygenerovaných replikací. 2. Praktická demonstrace výsledků metody a) Teoretický příklad - vygenerovaná časová řada Z t = −0,8 Z t −1 + Ξ t . Vygenerovali jsme časovou řadu tvaru Z t = −0,8 Z t −1 + Ξ t . Parametr α je předem znám a známe rozdělení pravděpodobnosti náhodné veličiny Ξ. Náhodné odchylky byly generovány z N(0,1) rozdělení pravděpodobnosti. Postupujeme tak, jako by parametr i rozdělení odchylek byly neznámé a určíme přesnost jejich odhadu. Odhad parametru α na základě vygenerovaných dat metodou nejmenších čtverců je -0.846. Tabulka 1. odhady biasu a standardní chyby při použití metody překrývajících se klouzavých bloků, m = délka bloku m 100 200 300 400 500 600 700 800 900 1000 R 3 -4.773 -2.020 -1.091 -0.623 -0.342 -0.154 -0.020 0.081 0.159 0.222 bias St.Error 3 0.436 0.309 0.252 0.218 0.195 0.178 0.165 0.154 0.145 0.138 6 -6,872 -3,051 -1,761 -1,112 -0,722 -0,461 -0,275 -0,135 -0,026 0,061 bias St.Error 6 0,411 0,291 0,238 0,206 0,185 0,169 0,157 0,147 0,138 0,131 8 -7,223 -3,226 -1,879 -1,202 -0,794 -0,521 -0,326 -0,181 -0,067 0,025 bias St.Error 8 0,395 0,281 0,228 0,197 0,177 0,162 0,149 0,139 0,131 0,125 Tabulka 2. odhady biasu a standardní chyby při použití metody disjunktních klouzavých bloků, m = délka bloku m 100 200 300 400 500 600 700 800 900 1000 R 3 -7,823 -3,531 -2,082 -1,353 -0,915 -0,622 -0,413 -0,256 -0,134 -0,036 bias St.Error 3 0,173 0,123 0,100 0,087 0,078 0,071 0,066 0,061 0,058 0,055 6 -7,834 -3,537 -2,086 -1,357 -0,918 -0,625 -0,416 -0,258 -0,136 -0,038 bias St.Error 6 0,172 0,122 0,100 0,086 0,077 0,071 0,066 0,061 0,058 0,055 V tabulkách 1 resp. 2 jsou uvedeny hodnoty biasu a standardní chyby odhadu parametru při 100 až 1000 bootstrapových replikacích u metody překrývajících se klouzavých bloků resp. 90 disjunktních klouzavých bloků. Uvedené hodnoty jsou průměry po 100 opakováních replikačního procesu. V následujících grafech 1 a 2 je ukázán vývoj hodnot biasu a standardní chyby v závislosti na počtu replikací při délce bloku m = 3 . Při počtu replikací větším než 1000 již k žádným významným změnám hodnot biasu a standardní chyby nedocházelo. Při 5000 replikací se bias a směrodatná chyba usadili na hodnotách 0,26 a 0,15 pro překrývající se klouzavé bloky (viz Graf 1) a na hodnotách 0 a 0,05 pro disjunktní klouzavé bloky (viz Graf 2). B IAS STANDARD ERROR 1 0,5 bias -1 0 100 200 300 400 500 600 700 800 standard error 0 900 1000 -2 -3 -4 0,4 0,3 0,2 0,1 0 -5 0 -6 200 400 600 800 1000 R R Graf 1. Vývoj odhadu biasu a standardní chyby při 100 až 1000 bootstrapových replikacích při použití metody překrývajících se klouzavých bloků, m = 3 Podobný je průběh závislosti i pro další délky bloků, tj. pro m = 6 a m = 8. B IAS STANDARD ERROR 0,2 0 100 200 300 400 500 600 700 800 900 1000 standard error -1 0 -2 bias -3 -4 -5 -6 -7 0,15 0,1 0,05 0 -8 0 -9 100 200 300 400 500 600 700 800 900 1000 R R Graf 2. Vývoj odhadu biasu a standardní chyby při 100 až 1000 bootstrapových replikacích při použití metody disjunktních klouzavých bloků, m = 3 Podobný je průběh závislosti i pro m = 6. b) Druhý příklad – časová řada je tvořena čtvrtletními hodnotami reálných mezd v období od prvního čtvrtletí roku 1998 do prvního čtvrtletí roku 2007. Jelikož tato řada není stacionární, bylo nejdříve zapotřebí provést transformaci dat, po němž byl na nově vzniklou číselnou řadu (viz Graf 3. vpravo) aplikován autoregresní model AR(1). Odhad parametru α byl získán metodou nejmenších čtverců, jeho hodnota činí -0,65482. 91 Podobně jako v předchozím příkladu, tabulky 3 a 4 nám ukazují, jaké jsou hodnoty bootstrapového odhadu biasu a směrodatné chyby odhadu parametru α při různých metodách klouzavých bloků a jejich délkách a při různém počtu replikací. Tabulka 3. odhady biasu a standardní chyby při použití metody překrývajících se klouzavých bloků, m = délka bloku m 100 200 300 400 500 600 700 800 900 1000 R 3 bias -4,118 -1,752 -0,954 -0,552 -0,311 -0,149 -0,034 0,052 0,119 0,173 St.Error 3 0,374 0,265 0,216 0,187 0,167 0,153 0,141 0,132 0,125 0,118 6 -5,359 -2,380 -1,374 -0,868 -0,564 -0,360 -0,215 -0,106 -0,021 0,046 bias St.Error 6 0,253 0,180 0,147 0,127 0,114 0,104 0,096 0,090 0,085 0,081 9 -5,757 -2,581 -1,508 -0,969 -0,645 -0,428 -0,274 -0,157 -0,067 0,005 bias St.Error 9 0,246 0,174 0,142 0,123 0,110 0,101 0,093 0,087 0,082 0,078 Tabulka 4. odhady biasu a standardní chyby při použití metody disjunktních klouzavých bloků, m = délka bloku m 100 200 300 400 500 600 700 800 900 1000 R 3 bias -4,696 -2,045 -1,150 -0,700 -0,429 -0,248 -0,119 -0,022 0,054 0,114 St.Error 3 0,132 0,093 0,076 0,066 0,059 0,054 0,050 0,047 0,044 0,042 6 -6,606 -3,009 -1,794 -1,184 -0,817 -0,572 -0,396 -0,265 -0,162 -0,080 bias St.Error 6 0,195 0,138 0,113 0,098 0,087 0,080 0,074 0,069 0,065 0,062 BIAS S TANDARD ERROR 0,5 1 bias -1 0 200 400 600 800 standard error 0 1000 -2 -3 -4 0,4 0,3 0,2 0,1 0 0 -5 R 200 400 600 800 1000 R Graf 4. Vývoj odhadu biasu a standardní chyby při 100 až 1000 bootstrapových replikacích při použití metody překrývajících se klouzavých bloků, m = 3 Podobný je průběh závislosti i pro další délky bloků, tj. pro m = 6 a m = 9. Stejně jako v předcházejícím příkladu, i grafy 4 a 5 ukazují vývoj odhadu biasu a standardní chyby při 100 až 1000 replikacích při délce bloku m = 3 . V případě metody překrývajících se bloků konverguje bias k hodnotě 0,17 a standardní chyba k hodnotě 0,11. U metody disjunktních bloků vykazují hodnoty biasu konvergenci k hodnotě 0,11 a hodnoty standardní chyby k číslu 0,04. Podobný je průběh závislosti i pro m = 6. 92 STANDARD ERRO R BIAS 1 bias -1 0 200 400 600 800 standard error 0 1000 -2 -3 -4 -5 0,16 0,14 0,12 0,1 0,08 0,06 0,04 0,02 0 0 R 200 400 600 800 1000 R Graf 5. Vývoj odhadu biasu a standardní chyby při 100 až 1000 bootstrapových replikacích při použití metody disjunktních klouzavých bloků, m = 3 3. Závěr Uvedené příklady naznačují, že větší délka bloků jak při disjunktních, tak i překrývajících se blocích dává menší hodnoty biasu i standardní chyby. To však v žádném případě neznamená, že menší hodnota je lepší než větší. Aby bylo možno vyvodit obecně platné závěry ohledně délky bloků, bylo by potřeba provést velké množství experimentů, u kterých bychom předem znali výsledky. Statistik si dokáže představit obtížnost tohoto úkolu. Pravděpodobně z toho důvodu ani v literatuře není o této metodě mnoho zmínek. 4. Literatura: 1. DIGGLE,P.: Time Series, a Biostatistical Introduction. Clarendon Press, Oxford, 1990 2. EFRON,B.: More efficient bootstrap computation. J. Amer. Statist. Assoc. 85, 79-89, 1990 3. EFRON,B.,TIBSHIRANY,R.: The bootstrap method for assessing statistical accuracy. Behaviometrika 17, 1-35, 1985. 4. FERNHOLZ,L.T.:Von Mises Calculus for Statistical Functionals, Lecture Notes in Statistics, Springer, NewYork 1983 5. KALINA,M.: Elementárne o bootstrape. In.: Sborník konference Prastan 2001, Kočovce 2001, s.94-95, ISBN 80-88946-13-1 6. KUBANOVÁ,J., LINDA,B.: Přesnost odhadu v autoregresních modelech. Článek zaslaný na konferenci Fernstat, Tajov 2007 7. LINDA,B.: Resampling Methods Accuracy in Point Estimates. In: Sborník příspěvků 15. škola statistiky EKOMSTAT´2001 – Aplikace štatistických metód v hospodárskej praxi. Trenčianske Teplice 2001, s.64 – 67, ISBN 80-88946-10-7 8. RAO,R.C.: Lineární metody statistické indukce a jejich aplikace. Academia Praha 1978. Adresa autorů: doc. PaedDr.Jana Kubanová,CSc, doc. RNDr.Bohdan Linda,CSc, Mgr.Pavel Semerák Univerzita Pardubice Studentská 95 53210 Pardubice [email protected] , [email protected] , [email protected] 93 Dva pohľady na reprezentatívnosť Ján Luha Abstract In this article we dealt with question of representativeness one sample and more samples. 1. Úvod Základné vlastnosti kladené na informácie z empirických výskumov sú objektívnosť, reliabilita a presnosť, validita a reprezentatívnosť. Je dôležité, aby bola zabezpečená reprezentatívnosť výberovho súboru, teda zhoda jeho parametrov s parametrami sledovaného základného súboru (populácie). Princíp reprezentatívnosti zvykneme parafrázovať výrokom Georga Gallupa: Ak kuchárka dobre zamieša obsah hrnca, tak jej stačí nabrať a ochutnať iba za lyžicu polievky, aby zistila, ako to vyzerá s obsahom celého hrnca. Výberová vzorka je ako tá lyžica polievky, ktorú ochutnáva kuchárka. Obsah hrnca je skúmaný základný súbor. Pri kvótovom výbere správne stanovenie kvót a ich dodržanie anketármi predstavuje varechu na dobré premiešanie obsahu hrnca - nášho základného súboru. Pri náhodnom výbere je tom pomyselnou varechou správne realizovaný mechanizmus náhodnosti. Po dobrom "zamiešaní" získavame reprezentatívne výsledky. Obvykle je predmetom záujmu jeden základný súbor a reprezentatívnosť opovedajúceho výberového súboru je vzťahovaná na tento základný súbor. Vyskutujú sa ale situácie keď skúmame viac základných súborov a vtedy je potrebné koncept reprezentatívnosti „predĺžiť“ na novú situáciu. I keď je to na prvý pohľad elementárna úloha, ktorá sa vyskytla napríklad pri zisťovaní spokojnosti poistencov zdravotných poisťovní s liečbou v nemocniciach, môže prísť ku nepochopeniu, ako napríklad zisťovanie poisťovne Apollo, kde sa hovorí o všeobecne uznávanej reprezentatívnej vzorke o rozsahu 1000 respondentov a z tohoto počtu odvodzujú potrebný počet pre zabezpečenie reprezentatívnosť 91 základných súborov jednotlivých nemocníc. V príspevku sa venujeme otázkam reprezentatívnosti za jeden základný súbor a za viac základných súborov. 2. Reprezentatívnosť – jeden základný súbor Všeobecne definujeme pojem reprezentatívnosti ako zhodu distribučných funkcií (rozdelenia pravdepodobnosti) skúmaných výberových charateristík s odpovedajúcimi im distribúciami v záujmovom základnom súbore. Na ilustráciu uvedieme pojem reprezentatívneho výberu z ESOMAR Marketing Research Glossary: Representative Sample is a sample that contains units in the same proportion as the population of interest. V závislosti od skúmaných znakov (charakteristík) a od spôsobu vytvorenia výberového súboru možno pojem reprezentatívnosti ďalej bližšie špecifikovať. Viď napr. Luha J. (2006). 2.1 Formalizácia definície reprezentatívnosti Uvažujme kvalitatívny znak Z s r hodnotami, ktoré okódujeme číslami 1, 2, ..., r. 94 Označme rozdelenie pravdepodobnosti tohoto znaku v skúmanom základnom súbore: Л= (л1, л2, ..., лr), kde r πi =1 ∑ i =1 a rozdelenie pravdepodobnosti daného znaku vo výberovom súbore (empirické relatívne početnosti a absolútne početnosti): r P= (p1, p2, ..., pr), kde ∑ pi =1 a N= (n1, n2, ..., nr), pričom i =1 r ni =n. ∑ i =1 V prípade reprezentatívneho výberu platí hypotéza H0 o zhode uvedených rozdelení pravdepodobnosti. Hypotézu môžeme formulovať nasledovne: H0: Rozdelenie N je multinomické M(л,n). Obvykle stanovíme alternatívnu hypotézu H1: neplatí H0. Reprezentatívnosť v prípade viac znakov môžeme uvažovať za každý znak zvlášť. Výberový súbor potom považujeme za reprezentatívny, ak je reprezentatívny za všetky kontrolované znaky. 2.2 Rozsah výberového súboru Je rozhodujúcim parametrom pre konštrukciu výberového súboru, nesúvisí priamo s reprezentatívnosťou, ale je dôležitý najmä z hľadiska reliability. Teoretickým východiskom pre stanovenie rozsahu výberovej vzorky pri jednoduchom náhodnom výbere je vzorec: n=(1,96/d)2p.q pri úrovni významnosti 5% (za predpokladu npq > 9) a keď uvažujeme znak s odpoveďami (áno / nie), kde q=1-p a d je predpokladaná presnosť odhadu podielu p výskytu hodnoty áno . Pre výber bez opakovania zo základného súboru o veľkosti N, je vzorec na výpočet rozsahu výberu: n=(1,96/d)2pq (1 - f), kde f=n/N je výberový pomer. Na konkretizáciu výpočtov potrebujeme skúmať očakávanú presnosť (reliabilitu) výsledkov a potom na základe rozboru realizovateľnosti prieskumu zvoliť konkrétnu hodnotu rozsahu výberov. Pritom však musíme sledovať splnenie podmienky aplikácie uvedeného vzorca a síce npq > 9. Pre orientáciu uvádzame tabuľku minimálnych rozsahov vyplývajúcu z uvedeného vzťahu pre rôzne hodnoty podielu (Poznámka: Pre p a 1-p sú tieto hodnoty zhodné): p p n 0,01 0,02 0,05 0,10 0,15 0,20 0,30 0,50 0,99 0,98 0,95 0,90 0,85 0,80 0,70 0,50 909 459 189 100 71 56 43 36 Obvykle sa vzorec pre výpočet minimálneho rozsahu výberu zjednodušuje na prípad p=0,5. Potom dostávame: n=(0,98/d)2 . Uvádzame tabuľku minimálnych rozsahov výberu pre vybrané hodnoty požadovanej presnosti (reliability). Keďže je obvyklé udávať hodnoty reliability v percentách je v tabuľke taktiež uvedená v percentách: reliabilita d rozsah n 1 9064 2 2401 3 1067 5 384 8 150 95 10 96 11 79 12 67 12,65 60 15 43 3. Reprezentatívnosť – viac základných súborov Ilustratívny príklad: Všeobecná zdravotná poisťovňa, a.s. (ďalej VšZP), v spolupáci s ÚVVM (podľa metodiky, ktorú navrhol autor tejto práce) uskutočnila už dva reprezentatívne prieskumy spokojnosti: V decembri 2005 a v januári 2006 uskutočnila reprezentatívny prieskum náhodne vybraných poistencov, ktorí v priebehu 2. až 4. štvrťroka 2005 absolvovali liečbu v niektorej nemocnici alebo v kúpeľnom zariadení na Slovensku 112 nemocníc a 21 kúpeľov. Podľa upresnenej smernice realizovala v decembri 2006 a januári 2007 ďalší prieskum spokojnosti poistencov 100 nemocníc. (viď: http://www.vszp.sk/showdoc.do?docid=231). Vybraných poistencov oslovila písomne a požiadala ich, aby vyplnili dotazník, ktorý mapoval úroveň ich spokojnosti s konkrétnym zariadením, kde boli liečení. Špecifikom prieskumu bol fakt, že každé skúmané zariadenie predstavovalo základný súbor, takže bolo nutné overovať viac základných súborov a teda aj výberových súborov. Úlohou je teda garantovať reprezentatívnosť výberových súborov simultánne pre viac záujmových základných súborov. Ak pracujeme napríklad so 100 základnými súbormi, tak musíme skúmať aj 100 výberových súborov a tiež reprezentatívnosť každého z nich. Okrem základných teoretických predpokladov sa stáva viac naliehavý problém nákladov na realizáciu prieskumu. Významným faktorom, ktorý determinuje náklady na prieskum je rozsah výberového súboru. Ak by sme napríklad požadovali reliabilitu do +/- 3%, tak podľa prv uvedenej tabuľky potrebujeme získať reprezentatívny výberový súbor o rozsahu 1067 (ak neuvažujeme konečnosť základného súboru). Pri praktickej realizácii prieskumu pre viac základných súboroch berieme do úvahy aj rozsah záujmových základných súborov. Vyjdime z tabuľky minimálnych rozsahov výberových súborov v závislosti od požadovanej reliability. Predpokladajme, že (aj vzhľadom na náklady) budeme požadovať minimálnu reliabilitu 12%. Potom môžeme vypočítať rozsahy výberových súborov pre alternatívu: n=67 s využím vzorca n=(1,96/d)2pq (1 – n/N) (uvažujeme teda konečnosť základných súborov). Na ilustráciu uvedieme tabuľku výpočtu rozsahov výberových súborov pre niekoľko anonymných zariadení. V tabuľke sme označili n0=(1,96/d)2pq) pre p=0,5. zariadenie n=n0/(1+n0/N) porc Rozsah zákl. súboru n0 n n_zaokr 1 32 731 67 66,86 67 2 22 957 67 66,81 67 3 22 466 67 66,80 67 4 21 380 67 66,79 67 5 20 984 67 66,79 67 6 19 732 67 66,77 67 7 18 870 67 66,76 67 8 18 485 67 66,76 67 9 10 707 67 66,58 67 10 10 369 67 66,57 67 11 159 67 47,14 60 12 5 5 2,50 5 suma 198 845 742 717,13 735 96 4. Literatúra 1. Elliott, C. and Ellingworth, D. (1997) 'Assessing the Representativeness of the 1992 British Crime Survey: The Impact of Sampling Error and Response Biases' Sociological Research Online, vol. 2, no. 4, http://www.socresonline.org.uk/socresonline/2/4/3.html 2. Hastings R.: ESOMAR Marketing Research Glossary. http://www.esomar.org/web/show/id=45195 3. Chajdiak J.: Štatistika jednoducho. Statis Bratislava 2003. 4. Kanderová, M. – Úradníček, V.: Štatistika a pravdepodobnosť pre ekonómov 1. časť. OZ Financ, Banská Bystrica 2005. 5. Kanderová, M. – Úradníček, V.: Štatistika a pravdepodobnosť pre ekonómov 2. časť. OZ Financ, Banská Bystrica 2007. 6. Luha J.: Meranie spoľahlivosti výsledkov výskumu verejnej mienky. Zborník príspevkov Využitie štatistických metód v sociálno - ekonomickej praxi, EKOMSTAT´94 29.5.-3.6. 1994 Trenčianske Teplice, SŠDS. 7. Luha J.: Exaktné intervaly spoľahlivosti pre podiely. Slovenská štatistika a demografia 1/96. 8. Luha J.: Reprezentatívnosť vo výskumoch verejnej mienky. FORUM STATISTICUM SLOVACUM 2/2005. SŠDS Bratislava 2005. 9. Luha J.: Overovanie reprezentatívnosti výberového súboru. FORUM STATISTICUM SLOVACUM 5/2006. SŠDS Bratislava 2006. 10. Luha J.: Kvótový výber. FORUM STATISTICUM SLOVACUM 1/2007. SŠDS Bratislava 2007. 11. Mace A. E.: Samle-size determination. Reihold. New York 1964. 12. http://www.apollo.sk/download/indikator_kvality_reprezent_prieskum_2005_apollo.zip. 13. http://www.vszp.sk/showdoc.do?docid=231, Informácia o prieskume spokojnosti poistencov VšZP za rok 2006 Adresa autora: RNDr. Ján Luha, CSc. [email protected] 97 Analýza civilní a vojenské inflace pomocí kointegrace Jiří Neubauer 1 Abstract: The article is focused on the question of modelling multidimensional nonstationary cointegrated processes. It is a modern method especially used for the description of economic time series. The multidimensional process is called cointegrated if there exists any linear combination of its one-dimensional components which is stationary. Cointegration analysis of civil and military inflation in USA is realized in this article. We will try to answer the question if it is possible to replace military inflation by civil inflation. Key words: cointegration, vector autoregressive process, inflation. 1. Úvod Kointegrace patří mezi moderní metody modelování vícerozměrných nestacionárních procesů, nachází uplatnění převážně v oblasti makroekonomických časových řad. Podrobný popis této metody je možné najít například v [Hamilton, 1994], [Johansen, 1995]. Článek je věnován kointegrační analýze civilní a vojenské inflace v USA. Uvedeme nyní v krátkosti některé základní definice a nezbytná tvrzení. Definice 1. Nechť {ε t } je n-rozměrný bílý šum s nulovou střední hodnotou a varianční maticí Ω . Stochastický proces splňující Yt − EYt = ∑i =1 C i ε t −i se nazývá I(0) proces, jestliže ∞ C = ∑i =0 C i ≠ 0. ∞ Definice 2. O stochastickém procesu {Yt } řekneme, že je integrovaný řádu d a značíme jej I(d), d = 1,2,..., jestliže ∆d (Yt − EYt ) je I(0) proces. Definice 3. Vícerozměrný proces {Yt } nazveme n-rozměrným autoregresním procesem VAR(p), jestliže platí Yt = Φ1 Yt −1 + Φ 2 Yt − 2 + + Φ p Yt − p + ΛD t + ε t pro t = 1,2,T , (1) pro dané počáteční hodnoty Y− p +1 , , Y0 , kde ε t je n-rozměrný bílý šum s normálním rozdělením N (0, Ω) , Φ1 , Φ p jsou matice koeficientů (řádu n), Λ je matice koeficientů deterministického členu D t , který může obsahovat konstantu, lineární člen, sezónní vlivy a další regresory, které jsou nestochastické. Matice Λ je typu n × s , matice D t je typu s × 1 . Autoregresní proces VAR(p) definovaný rovnicí (1) je možné po jednoduchých úpravách zapsat ve tvaru p −1 ∆Yt = ΠYt −1 + ∑ Γ i ∆Yt −i + ΛD t + ε t pro t = 1,2,T , (2) i =1 kde Π = ∑i =1 Φ i − I , Γ i = −∑ j =i +1 Φ j . Tento tvar vyjádření autoregresního procesu se p p nazývá ECM („error correction model“), používá se pro popis a analýzu kointegrovaných procesů resp. časových řad. 1 Jiří Neubauer, Katedra ekonometrie, Fakulta ekonomiky a managementu Univerzity obrany v Brně 98 Hlavní myšlenku kointegrace ukážeme na 2 jednorozměrných procesech typu I(1). Řekneme, že procesy X t a Yt jsou kointegrované, jestliže existuje taková lineární kombinace aX t + bYt , která je stacionární. Uvedeme nyní obecnou definici kointegrovaného procesu. Definice 4. Nechť Yt je n-rozměrný integrovaný proces řádu 1. Tento proces nazveme kointegrovaný s kointegračním vektorem β ( β ∈ R n , β ≠ 0 ), jestliže při vhodné volbě počátečních hodnot je proces β ′Yt stacionární. V případě dvourozměrného procesu může existovat pouze jeden kointegrační vektor. Pokud je n > 2 , mohou existovat dva vektory β1 , β 2 takové, že β1′ Yt i β ′2 Yt jsou stacionární a přitom jsou β1 , β 2 lineárně nezávislé. Obecně může existovat r < n lineárně nezávislých kointegračních vektorů. Jejich maximální počet budeme označovat jako řád (hodnost) kointegrace a vektorový prostor, který tyto vektory generují, jako kointegrační prostor. 2. Maximálně věrohodné odhady kointegračních vektorů Grangerova věta (viz např. [Johansen, 1995]) udává nutnou a postačující podmínku, aby autoregresní VAR(p) proces byl I(1) a kointegrovaný. Podle hodnosti matice Π v jeho ECM reprezentaci se definuje tzv. H (r ) model procesu I(1). Definice 5. H (r ) model procesu I(1) je definován jako model VAR(p) splňující Π = αβ ′ , kde α a β jsou n × r matice. ECM reprezentace tohoto modelu má tvar p −1 ∆Yt = αβ ′Yt −1 + ∑ Γ i ∆Yt −i + ΛD t + ε t pro t = 1,2,T , (3) i =1 kde α, β, Γ1 , , Γ p −1 Λ, Ω jsou parametry, na které nejsou kladena žádná omezení. Za předpokladu platnosti hypotézy H (r ) : Π = αβ ′ získáme maximálně věrohodný odhad parametru β následujícím postupem (viz [Johansen, 1995], [Hamilton, 1994]). Nejprve vyřešíme rovnici 2 −1 | λS11 − S10 S 00 S 01 |= 0 pro vlastní čísla 1 > λ1 > > λ n a vlastní vektory V = ( v 1 , , v n ) , které jsou normalizovány vztahem V ′S11 V ′ = I . Kointegrační vztahy odhadneme z βˆ = ( v , , v ) , 1 r maximalizovaná hodnota věrohodnostní funkce je dána vztahem r 2/T L−max =| S 00 | ∏ (1 − λi ) . (4) i =1 Test věrohodnostním poměrem („likelihood ratio test“) Q( H (r ) | H (n)) modelu H (r ) v modelu H (n) dvou výrazů (4) pro r a n, tedy r Q( H (r ) | H (n)) 2 − T = | S 00 | ∏ (1 − λi ) i =1 n | S 00 | ∏ (1 − λi ) i =1 Po zlogaritmování obdržíme tzv. „TRACE“ statistiku 2 Konstrukce matic S 00 , , S11 je podrobně popsána v [Johansen, 1995] 99 . n ∑ ln(1 − λ ) . − 2 ln Q( H (r ) | H (n)) = −T i = r +1 i (5) Statistika pro testování modelu H (r ) v H (r + 1) (tzv. „MAX“ statistika) je dána vztahem (6) − 2 ln Q( H (r ) | H (r + 1)) = −T ln(1 − λ r +1 ) . Předpokládejme, že hodnost matice Π je rovna r. Asymptotické rozdělení statistik (5) a (6) závisí na existenci deterministického členu v modelu. 3. Odhad kointegračního vektoru lineární regresí Jiná metoda odhadu kointegračního vektoru je založena na lineární regresi. Definujme regresní model (7) Y1t = a + γ 2Y2t + + γ nYnt + U t , kde a je konstanta, Yt = (Y1t , Y2t , , Ynt )′ a U t jsou rezidua. Hlavní myšlenka testování kointegrace pomocí lineární regrese vychází z tvrzení, že pokud existuje nějaký kointegrační vektor v procesu Yt , potom rezidua U t jsou stacionární. V případě, že rezidua stacionární nejsou, hovoříme o tzv. zdánlivé („spurious“) regresi. K testování stacionarity reziduí můžeme použít testy jednotkových kořenů, které jsou např. popsány v [Hamilton, 1994]. Asymptotické rozdělení těchto statistik však není stejné jako v jednorozměrném případě, kritické hodnoty daných testů je možno případně najít v [Hamilton, 1994]. V krátkosti ukážeme konstrukci jednoho ze základních typů testů. Nechť Û t jsou odhadnutá rezidua v regresním modelu (7). Z regresního modelu Uˆ = ρUˆ + E pro t = 2,3,T dostáváme odhad parametru ρ t −1 t t T ρˆ = ∑Uˆ t =2 T Uˆ t t −1 ∑Uˆ t =2 . 2 t −1 Nechť s je odhad rozptylu Et , potom 2 T s2 = ∑ (Uˆ t t =2 − ρˆUˆ t −1 ) 2 T −2 a standardní chyba odhadu parametru ρ je σˆ ρˆ = s2 . T ∑Uˆ t =2 2 t −1 Odhady autokovariancí reziduí získáme ze vztahu T cˆ j = ∑ Eˆ Eˆ t = j+2 t t− j pro j = 0,1,2,T - 2, T −1 q kde Eˆ t = Uˆ t − ρˆUˆ t −1 a nechť λ̂ = cˆ0 + 2∑ [1 − j /( q + 1)]cˆ j , kde q je počet autokovariancí. j =1 Phillipsova Z Pρ má tvar (viz [Hamilton, 1994]) 100 Z Pρ = (T − 1)( ρˆ − 1) − (1 / 2) ⋅ {(T − 1) 2 σˆ ρ2ˆ / s 2 } ⋅ {λˆ2 − cˆ0 }, Phillipsova Z Pt statistika je dána vztahem Z Pt = (cˆ0 / λˆ2 )1 / 2 ⋅ t − (1 / 2) ⋅ {(T − 1) 2 σˆ ρ2ˆ / s 2 } ⋅ {λˆ2 − cˆ0 } / λˆ, kde t je obvyklý t-test pro testování hypotézy H 0 : ρ = 1 ρˆ − 1 t= . σˆ ρ̂ 4. Kointegrační analýza civilní a vojenské inflace V této části příspěvku se budeme zabývat kointegrační analýzou dvourozměrné časové časové řady, jejíž komponenty jsou civilní a vojenská inflace v USA (viz. obrázek 1). Data byla získána z US DoD inflation Yearbook. První časová řada je inflace v obranných výdajích (DoD inflace), druhou řadu tvoří civilní inflace odvozená od CPI. Nejprve se pokusíme se zjistit, zda je daná dvourozměrná řada kointegrovaná, a poté zkusíme odpovědět na otázku, jestli je možné nahradit inflaci v obranných výdajích inflací civilní. CPI inflace (plna cara), vojenska inflace (carkovane) 14 12 10 8 6 4 2 0 -2 1960 1965 1970 1975 1980 1985 1990 1995 2000 2005 rok Obrázek 1. Civilní a vojenská inflace v USA Při kointegrační analýze použijeme metody stručně popsané v předchozích odstavcích. Označme Y1t DoD inflace, Y2t CPI inflace, Yt = (Y1t , Y2t )′ . Tuto dvourozměrnou časovou řadu můžeme popsat jako VAR(2) proces bez konstanty a lineárního členu. K testu autokorelace reziduí byl použit portmanteau test (hodnota testového kriteria je 29,59, kritická hodnota 31,41). Výsledky kointegrační analýzy pomocí maximální věrohodnosti jsou shrnuty v tabulce 1. Tabulka 1. Testy kointegrace – TRACE a MAX statistika ( α = 0,05 ) r vlastní hodnota λ TRACE statistika krit. hodnota MAX statistika krit. hodnota 0 0,277 15,24 12,21 14,28 11,14 1 0,022 0,97 4,14 0,97 4,14 Na základě daných hodnot můžeme najít jeden kointegrační vektor βˆ = (−0,743;0,821)′ . Regresní model pro danou časovou řadu může být zapsán ve tvaru Y1t = a + γ 2Y2t + U t . 101 Dostáváme odhady parametrů aˆ = 1,026 ( σˆ aˆ = 0,010 ) a γ 2 = 0,863 ( σˆ γˆ = 0,004 ), můžeme psát Y1t = 1,026 + 0,863Y2t + U t . Linearni regresni model civilni a vojenske inflace 18 16 14 Vojenska inflace 12 10 8 6 4 2 0 -2 0 2 4 6 8 Civilni inflace 10 12 14 Obrázek 2. Lineární regresní model civilní a vojenské inflace v USA V tabulce 2 jsou shrnuty výsledky testů kointegrace založené na lineární regresi jedné komponenty časové rady na druhou. Rezidua v dané regresi je možné považovat za stacionární (obě hodnoty testových statistik jsou menší než odpovídající kritické hodnoty pro hladinu významnosti α = 0,05 ). Dané časové řady civilní a vojenské inflace jsou kointegrované. Tabulka 2. Testy kointegrace – Phillipsova Z Pρ a Z Pt statistika ( α = 0,05 ) test testová statistika krit. hodhota -60,65 -20,50 Phillipsova Z Pρ statistika -4,82 Phillipsova Z Pt statistika -3,37 Nyní se pokusíme odpovědět na otázku, zda je možné nahradit vojenskou inflaci inflací civilní. Lineární regresní model je zobrazen na obrázku 2. Pokud by tomu tak bylo, pak bychom měli dostat regresní model Y1t = Y2t + U t . Budeme tedy testovat hypotézy, že a = 0 a γ 2 = 1 . Výsledky individuálních t-testů jsou uvedeny v tabulce 3. Na hladině významnosti 0,05 můžeme zamítnout nulovost koeficientu a (není jej možné vynechat), na dané hladině významnosti však není možné zamítnout hypotézu, že koeficient γ 2 je roven 1. Tabulka 3. Individuální t-test test H o : a = 0 → H1 : a ≠ 0 H o : γ 2 = 0 → H1 : γ 2 ≠ 0 testová statistika p-hodnota 2,602 0,013 -1,773 0,083 102 Provedeme nyní test složené hypotézy a = 0 a zároveň γ 2 = 1 pomocí obecné lineární hypotézy (viz [Hebák, 2005]) Rb = r, kde R je známá matice J × p , r je známý vektor J × 1 a b je vektor p × 1 regresních parametrů v regresním modelu Y = Xb + ε. Testová statistika (r − Rb)′H −1 (r − Rb) / J , (Y − Xb)′(Y − Xb) /( n − p ) kde X je n × p matice regresorů, H = R ( X′X) −1 R ′ , má za platnosti hypotézy H 0 : Rb = r Fisherovo F rozdělení s J a n − p stupni volnosti. V našem případě je F= a 0 1 0 , b = , r = . R = 1 0 1 γ 2 Tabulka 4. Test složené hypotézy test testová statistika p-hodnota 2,602 0,037 H o : Rb = r → H 1 : Rb ≠ r, Na hladině významnosti 0,05 je tedy možné zamítnout tvrzení, že a = 0 a zároveň γ 2 = 1 , což znamená, že existuje statistiky významný rozdíl mezi civilní a vojenskou inflací. 5. Závěr Pomocí několika testů bylo ověřeno, že časové řady civilní a vojenské inflace jsou kointegrované. Dále bylo ukázáno, že existuje statisticky významný rozdíl mezi těmito dvěma časovými řadami, není tedy vhodné popisovat inflaci v obranných výdajích pomocí inflace v civilním sektoru (v našem případě odvozené od CPI). 6. Literatura HAMILTON, J., D. 1994. Time Series Analysis. Princeton: Princeton University Press, 1994, ISBN 0-691-04289-6. HEBÁK, P.- HUSTOPECKÝ- J. MALÁ, I. 2005. Vícerozměrné statistické metody. Praha: Informatorium, 2005, ISBN 80-7333036-9. JOHANSEN, S. 1995. Likelihood-based Inference in Cointegrated Vector Auto-regressive Models. Oxford: Oxford University Press, 1995, ISBN 0-19-877450-7. Adresa autora: Jiří Neubauer Katedra ekonomiky a managementu Univerzity obrany v Brně Kounicova 65 612 00 Brno Česká republika [email protected] 103 Hodnocení míry regulace prostřednictvím statistických klasifikačních metod Jakub Odehnal 1, Jaroslav Michálek 2 Abstract: This contribution is focused on application of multivariate statistical classification analysis to assessment of regulation burden of selected countries in European Union. Indicators were created from the research of Fraser Institute. They are: Size of Government, Legal System and Property Rights, Sound Money, Freedom to Trade Internationally, Regulation. Key words: Cluster Analysis, classification trees, Factor analysis, economic freedom. 1. Úvod Příspěvek vychází z [2] avšak odlišně představuje použití různorodých statistických klasifikačních metod k hodnocení regulačního zatížení zemí Evropské unie. Míra regulačního zatížení, tedy míra státních zásahů do ekonomiky vybraných zemích je hodnocena prostřednictvím indexu ekonomické svobody publikovaném kanadským institutem Fraser. Stát prostřednictvím hospodářské politiky a jejich nástrojů výrazným způsobem ovlivňuje podnikatelské prostředí v jednotlivých členských zemích Evropské unie. Kvantifikace míry státních zásahů tak umožňuje porovnat jednotlivé země dle regulačního zatížení a vytvořit tak závěry o vztahu mezi ekonomickou svobodou, regulací a ekonomickou výkonností sledovaných zemí. 2. Charakteristika datového souboru Konstrukce indexu ekonomické svobody se skládá ze 17 dílčích ukazatelů, které jsou postupně agregovány na výsledných 5 regulačních charakteristik. Hodnoty jednotlivých regulačních charakteristik mohou nabývat hodnot z intervalu (0-10), přičemž vyšší hodnota znamená také vyšší úroveň ekonomické svobody. Souhrnný index je pak konstruován jako průměr ze sledovaných hodnot. Tabulka 1. Přehled regulačních charakteristik Regulační charakteristika Velikost vlády Právní řád a ochrana soukromého vlastnictví Přístup ke zdravým penězům Svoboda směny s cizinci Regulace na dílčích trzích Vybrané dílčí ukazatele výdaje na spotřebu vlády (v % z celkové spotřeby) transfery (v % HDP) dotace (v % HDP) nezávislost a nestrannost ochrana duševního vlastnictví vojenské zásahy do právního řádu integrita právního systému průměrný roční růst peněžní zásoby variabilita inflace současná míra inflace daně z mezinárodního obchodu regulační překážky obchodu skutečná velikost obchodu proti očekávané omezení mezinárodního kapitálového trhu regulace úvěrového trhu regulace trhu práce regulace podnikání 1 Ing. Jakub Odehnal, Ekonomicko správní fakulta, Masarykova univerzita, Brno e-mail: [email protected] Doc. RNDr. Jaroslav Michálek, CSc., Faculty of Mechanical Engineering, Brno UT e-mail: [email protected] Příspěvek vznikl za podpory MSM0021622418. 2 104 3. Klasifikace zemí EU založená na podobnosti regulačních charakteristik Shluková analýza jako reprezentant vícerozměrných statistických metod umožňuje informace obsažené v datech roztřídit do několika stejnorodých shluků. Aplikací vhodných algoritmů můžeme odhalit strukturu datového souboru a jednotlivé objekty klasifikovat. Uvažujme tedy 5 proměnných (5 ukazatelů regulačních charakteristik) a 27 objektů odpovídajících zemím Evropské unie. Z vytvořeného stromového diagramu je dobře patrná klasifikace zemí EU na dvě charakteristické skupiny (hladina spojení 5.0). Úplné spojení Euklid. vzdálenosti 6 5 4 3 2 0 Aust Net Finla L De Bel Swe Fran Ge Irelan Un Cypr Por Malta Esto Gree Pola Italy Latvia C Lith Slo Hu Slo Spain Bul Ro Vzdálen. spojení 1 Obr. 1. Výsledný dendrogram vytvořený shlukovou analýzou První skupina obsahuje 11 tradičních zemí Evropské unie (Velká Británie, Irsko, Německo, Francie, Švédsko, Belgie, Dánsko, Lucembursko, Holandsko, Finsko a Rakousko). Druhá skupina obsahuje 16 zbývajících zemí Evropské unie (Rumunsko, Bulharsko, Slovinsko, Španělsko, Maďarsko, Slovensko, Česká republika, Litva, Lotyšsko, Itálie, Polsko, Řecko, Estonsko, Portugalsko, Malta a Kypr). Při snížení shlukovací hladiny na úroveň 4.0 můžeme pozorovat vytvoření podrobnější klasifikace. Postupně tak dostáváme 3 skupiny zemí (obr. 1). První skupina obsahuje 3 státy (Rumunsko, Bulharsko, Slovinsko) druhá 13 států (Španělsko - Kypr), třetí 11 států (Velká Británie - Rakousko). Rozdílnost mezi vytvořenými skupinami států je dobře patrná z grafu č. 1 srovnávajícím průměrné hodnoty sledovaných charakteristik v jednotlivých shlucích. Dominantní postavení 3. skupiny zemí u většiny charakteristik potvrzuje nižší míru státních zásahů do národních ekonomik u tradičních států Evropské unie, doprovázených novými členskými státy Estonskem a Maďarskem, které svými započatými reformními kroky výrazně zvyšují podnikatelskou atraktivitu svých regionů. 1 Size of Government 10,0 5,0 2 Legal System & Property Rights 5 Regulation 0,0 4 Freedom to Trade Internationally 3 Sound Money Maďarsko Estonsko průměr 3. skupiny Obr. 2. Průměrné hodnoty reg. charakteristik 105 Obr. 3. Srovnání vybraných zemí EU 4. Hodnocení ekonomické svobody pomocí klasifikačních stromů Dílčí výsledky klasifikace zemí pomocí shlukové analýzy budou následně použity ke klasifikaci pomocí regresních stromů. Z výsledků klasifikačního stromu je dobře patrná klasifikace 27 objektů do 3 tříd. Členské státy Evropské unie s hodnotami regulační charakteristiky právní řád a ochrana soukromého vlastnictví vyššími než hodnota 7,573003 klasifikujeme pomocí metody CART (Gini measure) do první samostatné skupiny (shluk 3). Zbývajících 11 členských států je klasifikováno prostřednictvím charakteristiky přístup ke zdravým penězům na základě štěpícího pravidla porovnávající hodnotu ukazatele s hodnotou 8,723635. Státy s vyšší hodnotou této charakteristiky řadí do druhé skupiny (shluk 2) a zbývající 3 země odpovídající nižší hodnotě této charakteristiky přiřazuje do třetí klasifikační skupiny (shluk 1). Výsledná klasifikace tak odpovídá původnímu hodnocení států provedené shlukovou analýzou. Tree 1 graph for kod Num. of non-terminal nodes: 2, Num. of terminal nodes: 3 1 2 3 ID=1 N=27 2 právní řád <= 7,573003 > 7,573003 N=16 ID=2 ID=3 2 N=11 1 přístup k penězům <= 8,723635 ID=4 > 8,723635 N=3 ID=5 3 N=13 2 Obr. 4. Klasifikační strom Zajímavé je zjištění, že k samotné klasifikaci byly použity pouze 2 regulační charakteristiky (Právní řád a ochrana soukromého vlastnictví, Přístup ke zdravým penězům). Významnost jednotlivých charakteristik je znázorněna na obr. 3. Importance plot Dependent variable: kod 1,1 1,0 0,9 0,8 0,7 0,6 0,5 Importance 0,4 0,3 0,2 0,1 0,0 vlada právní řád přístup k penězům svoboda směny regulace Graf 1. Významnost regulačních charakteristik 106 5. Hodnocení ekonomické svobody redukcí dílčích regulačních charakteristik Pro srovnání klasifikace zemí EU prezentované v bodech 3 a 4 tohoto příspěvku použijeme faktorovou analýzu k zjištění vzájemných vztahů mezi všemi dílčími proměnnými a objekty (státy EU). Výsledkem faktorové analýzy (metoda hlavních komponent, faktor zátěže quartimax) je redukce počtu proměnných na 5 faktorů charakterizujících ekonomickou svobodu zemí EU. První faktor charakterizuje právní a obchodní prostředí sledovaných zemí, druhý faktor můžeme nazvat faktorem peněžním a cenovým, třetí faktorem zahraničního obchodu, čtvrtý faktorem trhu práce a pátý faktorem nabídky peněz. Pro sledované země Evropské unie bylo dále spočítáno faktorové skóre, dle kterého byly státy prostřednictvím shlukové analýzy dodatečně klasifikovány. Úplné spojení Euklid. vzdálenosti 6 5 4 3 2 0 Austria German France Portugal Ireland Estonia Latvia Spain Luxe Obr. 5. Výsledný dendrogram (proměnné – fakrotové skóre) Neth U Slova Hungary Czec Belgium Italy Poland Lithuani Denmar Finland Sweden Bulgaria Slovenia Greece Cyprus Romania Malta Vzdálen. spojení 1 Pozorováním stromového diagramu můžeme nalézt společné prvky původní klasifikace s klasifikací založenou na analýze všech proměnných s jejich postupnou redukcí faktorovou analýzou. Zcela samostatné postavení Rumunska potvrzuje výrazné odlišnosti v hodnocených faktorech ve srovnání s ostatními členskými státy Evropské unie. Nejnižší hodnoty sledovaných proměnných tak tento nový členský stát řadí mezi státy s nejnižší ekonomickou svobodou a tedy s vysokou mírou státních zásahů do ekonomiky země. Obdobné hodnocení je patrné i v případě Slovinska a Bulharska, jejichž těsná vazba je ze stromového diagramu též dobře patrná. Největší rozdíly mezi těmito státy Evropské unie a ostatními, zejména tradičními státy Evropské unie, můžeme pozorovat v případě regulační charakteristiky právního řádu a ochrany soukromého vlastnictví a charakteristiky regulace na dílčích trzích, přičemž kvalitní zákony, fungující trh práce společně s regulací úvěrového trhu jako součástí sledovaných charakteristik, tvoří nedílnou součást kvalitního podnikatelského prostředí, které vede ke zvýšení konkurenceschopnosti hodnocených zemí na evropském trhu. 107 6. Závěr Úloha státu a vlád v ekonomice významným způsobem ovlivňuje ekonomickou vyspělost zemí Evropské unie. Index ekonomické svobody publikovaný kanadskou institucí Fraser umožňuje sledovat roli státní regulace jakožto nástroje hospodářské politiky v národním hospodářství země a posuzovat tak vztah mezi její ekonomickou silou a mírou ekonomické svobody. Liberální ideologie přílišné zásahy vlády do národních ekonomik odmítají a regulaci jako vládní nástroj omezují v obecné míře jen na malý soubor činností a potřeb. Naproti tomu intervencionistická politika jako protiklad politiky liberální zásahy vlády do národní ekonomiky hojně podporuje a využívá. Rozdíl mezi jednotlivými typy hospodářských politik a využívaných nástrojů tedy pramení jak z obecného postoje jednotlivých vlád k angažovanosti států do národních ekonomik, tak i z obecných cílů hospodářské politiky. Kvantifikované vyjádření míry regulace, ekonomické svobody tak umožňuje klasifikovat a hodnotit země Evropské unie podle sledovaných proměnných a charakteristik. Rozdílné mnohorozměrné statistické metody ke klasifikaci zemí použité potvrzují rozdílnost mezi novými členskými státy a tradičními zeměmi Evropské unie hospodářsky vyspělejšími, s kvalitním podnikatelským prostředím, vedoucím k přílivu investic a k hospodářskému růstu. Tyto tradiční země jsou následovány především Estonskem, které jako současný leader bývalých socialistických zemí odpovídá úrovní ekonomické svobody nejsvobodnějším zemím Evropské unie i světa. 7. Literatura [1] Lukasová, A., Šarmanová, J.Metody shlukové analýzy. Vyd. 1. Praha: SNTL, 1985. 210 s. [2] Gwartney, James, and Robert Lawson, with William Easterly. 2006. The Economic Freedom of the World: Annual Report 2006. Vancouver: The Fraser Institute. [3] Kadeřábková, Anna. Základy makroekonomické analýzy: růst, konkurenceschopnost, rovnováha. Praha: Linde, 2003. 175 s. ISBN 808613136. [4] Johnson R.A., Wichern D.W.: Applied Multivariate Statistical Analysis. 3rd edition. Englewood Cliffs, NJ: Prentice-Hall, Inc., 1992. [5] http://www.freetheworld.com/download.html#efw Adresy autorů Ing. Jakub Odehnal Katedra aplikované matematiky a informatiky Ekonomicko správní fakulta Masarykovy univerzity Lipová 41a, 600 00 Brno [email protected] Doc. RNDr. Jaroslav Michálek, CSc. Ústav matematiky Fakulta strojního inženýrství Vysoké učení technické v Brně Technická 2896/2, 616 69 Brno [email protected] 108 KOMPARÁCIA KRAJOV SLOVENSKEJ REPUBLIKY Z HĽADISKA PRIRODZENÉHO PRÍRASTKU OBYVATEĽSTVA Poláková Zuzana Abstract: In that paper, we will analyse and compare of the population change in the districts of the Slovak Republic. Population change includes natural increase or decrease of population. Results is pointing out the differencies between indicators of natality and indicators of mortality in districts. Districts of Slovakia consist of eight areas, concrete district of Bratislava, district of Trnava, district of trencin,district of Nitra, districtof Zilina, district of Banska Bystrica, district of Kosice and district of Presov. Key words: population, natality, mortality, natural increase, natural decrease, crude rate of natural increase 1. Úvod Prirodzený pohyb obyvateľstva je charakteristický reprodukciou obyvateľstva, t.j. vzťahom medzi natalitou a mortalitou. Demografická reprodukcia preto predstavuje prirodzenú obnovu obyvateľstva. Berie do úvahy len proces rodenia a vymierania. Neberie do úvahy migračné zmeny dané prisťahovaním a vysťahovaním. Prirodzený pohyb obyvateľstva využíva pojmy prirodzený prírastok a prirodzený úbytok obyvateľstva. Prirodzený prírastok poukazuje na stav, kedy natalita je väčšia ako mortalita obyvateľstva. Prirodzený úbytok znamená obrátený vzťah. Materiál a metodika Východiskovými ukazovateľmi sú: - absolútny počet živonarodených - absolútny počet zomretých Rozdiel medzi nimi vyjadruje bilanciu prirodzeného pohybu obyvateľstva, t.j. prirodzenej reprodukcie, označovaný ako: saldo prirodzenej menlivosti: K = N – M (1) 109 kde N – počet živonarodených v danom roku M – počet zomretých v danom roku K – saldo prirodzenej menlivosti Celkový prírastok, resp. úbytok zohľadňuje aj migráciu. Jej relatívny ukazovateľ je: hrubá miera migrácie: mhm = M / P (2) kde mhm – hrubá miera migrácie M – počet migrantov P – stredný stav obyvateľstva Pre porovnanie štatistickej preukaznosti rozdielov hrubej miery migrácie vo VÚC bol použitý Mann-Whitneyov test. Test bol zvolený na základe malého rozsahu výberovej vzorky. Hodnoty sú usporiadané podľa veľkosti, sú im priradené poradové čísla, pričom poradové čísla hodnôt prvého výberu sú Rx1, Rx2, ..., Rxm a poradové čísla hodnôt druhého výberu sú Ry1, Ry2, ..., Ryn. Pre test použijeme testovacie kritérium T definované nasledovne: T = min(Tx, Ty), kde Tx = Rx1 + Rx2 + ... + Rxm (3) Ty = Ry1 + Ry2 + ... + Ryn. (4) Ak hodnota testovacieho kritéria T je menšia ako kritická hodnota Tα, ktorú vyhľadáme podľa zvolenej hladiny významnosti a podľa rozsahu oboch výberov m a n, zamietneme nulovú hypotézu na hladine významnosti α. 110 2. Výsledky a diskusia V analýze boli porovnávané všetky vyššie územné celky (VÚC) Slovenskej republiky: Bratislavský (BA), Trnavský (TT), Trenčiansky (TN), Nitriansky (NR), Žilinský (ZA), Banskobystrický (BB), Prešovský (PO) a Košický (KE). V tabuľke 1, 2 sú prezentované počty narodených a zomretých vo VÚC v rokoch 2001 až 2005. Vo všetkých VÚC za sledované obdobie dochádza k nárastu počtu narodených, čo je po období, ktoré sa nieslo v dimenziách poklesu pôrodnosti priaznivý vývoj, ale naproti tomu sa zvyšuje aj úmrtnosť, čo negatívne ovplyvňuje ukazovateľ hrubej miery prirodzeného prírastku. Tabuľka 1 Vývoj narodených vo VÚC v rokoch 2001 až 2005 narodení Bratislava Trnava Trenčín Nitra Žilina Banská Bystrica Prešov Košice Zdroj: www.statistics.sk 2001 3139 1037 903 1443 1407 866 1815 3547 2002 3201 1017 934 1362 1415 829 1789 3674 2003 3454 1041 914 1371 1417 844 1803 3857 2004 3672 1151 1000 1454 1460 897 1914 3924 2005 4012 1169 1035 1451 1493 930 1926 3852 Tabuľka 2 Vývoj zomretých vo VÚC v rokoch 2001 až 2005 zomretí Bratislava Trnava Trenčín Nitra Žilina Banská Bystrica Prešov Košice Zdroj: www.statistics.sk 2001 3863 1180 1024 1530 1444 973 1325 2972 2002 3856 1169 1096 1555 1371 1014 1320 3032 2003 3964 1247 1062 1518 1431 978 1358 3002 2004 3974 1255 1081 1518 1448 981 1293 3024 2005 4116 1188 1124 1595 1482 1091 1314 3098 Z údajov v tabuľke 3 a z grafu 1 vývoja hrubej miery prirodzeného prírastku je vidieť, že počas sledovaných rokov má tento ukazovateľ rôzny priebeh. O prírastku môžeme hovoriť len v Prešovskom VÚC, kde v prvých troch sledovaných rokoch tiež dochádza k poklesu, ale následne v roku 2004 k výraznému nárastu hrubej miery prirodzeného prírastku. V Košickom VÚC možno pozorovať stály nárast, až v roku 2005 mierny pokles tohto ukazovateľa. Okrem spomínaných ešte v Žilinskom VÚC sa vyskytujú kladné hodnoty (ide o prírastok), ale nie počas celého sledovaného obdobia. Najskôr dochádza k nárastu, v roku 2003 k výraznému poklesu a následne v ďalšom roku k výraznému nárastu, v poslednom roku k nepatrnému 111 poklesu. V ostatných VÚC sú hodnoty záporné, čo svedčí o úbytku obyvateľstva. Hrubá miera prirodzeného prírastku má ale vo všetkých týchto VÚC priaznivý vývoj v roku 2005 oproti roku 2001, len Nitriansky a Banskobystrický VÚC vykazuje opak. Tabuľka 3 Vývoj hrubej miery prirodzeného prírastku vo VÚC v rokoch 2001 až 2005 2001 Bratislava -0,34 Trnava -1,13 Trenčín -1,07 Nitra -0,53 Žilina -0,24 Banská Bystrica -0,96 Prešov 2,98 Košice 0,33 Zdroj: www.statistics.sk, vlastné prepočty 2002 -0,31 -1,20 -1,44 -1,18 0,28 -1,66 2,85 0,37 2003 -0,24 -1,62 -1,31 -0,90 -0,09 -1,21 2,71 0,49 2004 -0,14 -0,82 -0,72 -0,39 0,08 -0,76 3,78 0,52 2005 -0,05 -0,15 -0,79 -0,88 0,07 -1,45 3,72 0,44 Vývoj prirodzeného prírastku (úbytku) vo VÚC Slovenskej republiky Vývoj hrubej m iery prirodzeného v rokoch 2001prírastku až 2005 vo VÚC Slovenskej republiky v rokoch 2001 až 2005 2005 2005 rok 2004 rok 2003 2003 2002 2001 2001 -1,70 -1,20 -0,70 -0,20 0,30 -1,70 -1,20 -0,70 -0,20 0,80 1,30 1,80 0,30 0,80 1,30 1,80 hrubá miera prirodzeného prírastku 2,30 2,80 3,30 3,80 2,30 2,80 3,30 3,80 hrubá miera prirodzeného prírastku BA TT TN NR ZA BB PO KE Graf 1. Vývoj hrubej miery prirodzeného prírastku vo VÚC SR v rokoch 2001 až 2005 Zdroj: vlastné výpočty Testovali sme významnosť rozdielov ukazovateľa hrubá miera prirodzeného prírastku medzi VÚC Slovenskej republiky neparametrickým Mann Whitneyovým testom. Kritická hodnota pre Wilcoxonov (Mann – Whitneyov) test pre hladinu významnosti α = 0,05 je 17 pri rozsahoch výberov m = 5 a n = 5, kritická hodnota pre hladinu významnosti α = 0,01 je 15. Z výsledkov analýz vyplýva nasledovné. V Bratislavskom VÚC v porovnaní s Trnavským a Žilinským VÚC nie sú preukazné rozdiely v hrubej miere prirodzeného prírastku (tabuľka 4, graf 2), v porovnaní s ostatnými sú vysoko preukazné rozdiely. 112 Bratislavský VÚC (nepreukazné rozdiely) Trnavský VÚC (nepreukazné rozdiely) 0 0,35 -0,2 0,15 -0,25 2001 2002 2003 2004 2005 -0,4 -0,05 2001 2002 2003 2004 2005 -0,45 -0,6 -0,8 -0,65 -1 -0,85 -1,2 -1,05 -1,4 -1,25 -1,45 -1,6 -1,65 -1,8 BA TT ZA TT BA TN NR BB Graf 2 . Bratislavský VÚC (nepreukazné rozdiely) Graf 3. Trnavský VÚC (nepreukazné rozdiely) Zdroj: vlastné výpočty Hrubá miera prirodzeného prírastku v Trnavskom VÚC a ostatných porovnávaných vykazuje preukazné (Žilinský VÚC), resp. vysoko preukazné rozdiely (Prešovský a Košický VÚC). Nepreukazné rozdiely sú v porovnaní s Trenčianskym, Bratislavským, Nitrianskym a Banskobystrickým VÚC (graf 3). Ďalej bol porovnávaný Trenčiansky VÚC so všetkými ostatnými a výsledky sú nasledovné: nepreukazné rozdiely sú v porovnaní s Nitrianskym a Banskobystrickým VÚC (graf 4). S ostatnými sú vysoko preukazné rozdiely. Trenčiansky VÚC (nepreukazné rozdiely) Nitriansky VÚC (nepreukazné rozdiely) 0 0 2001 2002 2003 2004 2005 -0,5 -0,5 -1 -1 -1,5 -1,5 -2 -2 TN NR 2001 2002 NR BB Graf 4. Trenčiansky VÚC (nepreukazné rozdiely) 2003 TT 2005 2004 TN BB Graf 5.Nitriansky VÚC(nepreukazné rozdiely) Zdroj: vlastné výpočty Nitriansky VÚC v porovnaní s ostatnými vykazuje vysoko preukazné rozdiely so všetkými okrem Trnavského, Trenčianskeho a Banskobystrického VÚC (graf 5). Žilinský VÚC vykazuje nepreukazné rozdiely v hrubej miere prirodzeného prírastku s Bratislavským, preukazné rozdiely s Trnavským a vysoko preukazné rozdiely so všetkými ostatnými VÚC. Banskobystrický VÚC vykazuje nepreukazné rozdiely s Trnavským, 113 Trenčianskym a Nitrianskym VÚC, s ostatnými sú vysoko preukazné rozdiely. Prešovský a Košický VÚC v porovnaní so všetkými vykazujú vysoko preukazné rozdiely. Len v týchto dvoch regiónoch na rozdiel od ostatných prevláda počet narodených nad počtom zomretých, čo má za následok kladné hodnoty prirodzeného prírastku, t.j. pozitívny vývoj. Tabuľka 4 Výsledky Mann - Whitneyho testu BA BA TT TN NR ZA BB PO KE x ++ ++ ++ ++ ++ TT x + ++ ++ TN ++ x ++ ++ ++ Zdroj: vlastné výpočty NR ++ x ZA + ++ ++ ++ ++ ++ x ++ ++ ++ BB ++ ++ x ++ ++ PO ++ ++ ++ ++ ++ ++ x KE ++ ++ ++ ++ ++ ++ ++ ++ x 3. Záver Pre demografický vývoj je v poslednom období charakteristické znižovanie prirodzeného prírastku obyvateľstva. Z analýzy VÚC vyplýva, že najviac podobné pri porovnaní hrubej miery prirodzeného prírastku sú Bratislavský, Trnavský, Nitriansky, Žilinský, Trenčiansky, Banskobystrický VÚC (úbytok). Medzi týmito sú nepatrné rozdiely pri porovnaní tohto demografického ukazovateľa. Veľkú podobnosť evidujeme aj v Prešovskom a Košickom VÚC a to z hľadiska stúpajúceho počtu narodených a klesajúceho počtu zomretých v sledovaných rokoch, t.j. kladných hodnôt prirodzeného prírastku obyvateľstva. V tejto súvislosti by bolo zaujímavé venovať pozornosť analýze pôrodnosti a úmrtnosti podľa etnických skupín, nakoľko vo východoslovenskom regióne je vyššia koncentrácia rómskeho obyvateľstva a ono, ako je všeobecne známe vykazuje vyššie počty narodených. Sledovanie prirodzeného prírastku je dôležité z hľadiska nadväznosti (okrem iného) na zdroj pracovnej sily. Dôležitú úlohu zohráva aj migrácia. Vnútorná migrácia je spôsobená rozmiestňovaním ekonomických aktivít v regiónoch, príchodom zahraničných investorov. Vplyv zahraničnej migrácie je najmarkantnejší v hlavnom meste. Vstupom Slovenska do EÚ sa zvýšil migračný prírastok SR. Vývoj pracovnej sily na Slovensku nasvedčuje tomu, že starnutím populácie sa zvyšuje ekonomické zaťaženie obyvateľstva, t. zn., na ekonomicky aktívne obyvateľstvo bude pripadať stále viac ekonomicky neaktívnych osôb. Tieto skutočnosti treba mať na zreteli pri zmenách v systémoch sociálneho poistenia, pri realizácii populačnej a migračnej politiky. 114 4. Literatúra CHAJDIAK, J. 2005. Zoskupenie krajov SR podľa miery negatívnych demografických javov. In: 10. slovenská demografická konferencia Naša demografia, súčasnosť a perspektívy, Smolenice 2005, http://www.infostat.sk/vdc/pdf/zbornik.pdf. CHOVANCOVÁ, J. 1998. Živorodenosť obyvateľstva Slovenska. Priestorová diferencovanosť na úrovni krajov, okresov a obcí. ACTA Universitatis Prešoviensis Folia Geographica 2. Prešov, 1998. MLÁDEK, J. 2000. Aktuálne smery výskumu v demografii. Geografický časopis 52-1. 41-50, 2000. STEHLÍKOVÁ, B. 2005. Poznámky ku kojeneckej úmrtnosti. In: 10. slovenská demografická konferencia Naša demografia, súčasnosť a perspektívy, Smolenice 2005, http://www.infostat.sk/vdc/pdf/zbornik.pdf. SEGER,J., HINDLS, R.1995. Statistické metody v tržním hospodářství. Praha 1, 1995, ISBN 80-7187-058-7. http://www.infostat.sk/vdc/pdf/doc/mladek.pdf Adresa autora: Zuzana Poláková, Ing., PhD. Katedra štatistiky a operačného výskumu, FEM SPU Tr. A. Hlinku 2 949 76 Nitra [email protected] 115 Využití vícerozměrné regresní analýzy při identifikaci faktorů ovlivňujících klesající porodnost v České republice Jitka Poměnková 1, Lenka Němcová 2 Abstract: The aim of this paper is identification of the factors influencing trend of the natality in the Czech Republic between years 1991 – 2005. In the first step, with respect to this aim, correlation analysis for evaluation of dependency between demographical, economical factors and natality trend is used. In next, statistically significant factors are selected and used for multiple regression model design. Key words: natality, correlation analysis, multiple regression analysis. 1. Úvod Česká republika, stejně jako ostatní vyspělé země, řeší v současné době problém klesající porodnosti, která zapříčiňuje demografické stárnutí populace, kolaps důchodových systémů a řadu dalších problémů. Je obtížné jednoznačně určit faktory ovlivňující porodnost, vytvořit opatření, která by tyto vlivy usměrňovala (s cílem zvýšení porodnosti) a nelze také nikdy s jistotou předvídat reakce na tato opatření. Řešení klesající porodnosti je problémem velmi složitým a jeho analýza vyžaduje propojení několika vědních oborů. Cílem předkládaného příspěvku je identifikace faktorů ovlivňujících vývoj klesající porodnosti v České republice. Za tímto účelem je nejprve využita korelační analýza ke zkoumání vlivu jednotlivých demografických a ekonomických veličin na vývoj porodnosti a následně stanovení statisticky významných nezávislých proměnných pro regresní model definující vývoj porodnosti. Poté je provedena formulace a odhad vícerozměrného regresního modelu popisujícího závislost porodnosti na vybraných faktorech. Vzhledem k rozsáhlosti problému a omezené dostupnosti potřebných dat, kdy není možné obsáhnout celou problematiku, je práce zaměřena pouze na vybrané otázky s problémem související. 2. Metodika Pro stanovení vhodných proměnných a následnou formulaci vícerozměrného regresního modelu je nejprve využita korelační analýza, konkrétně výběrový korelační koeficient, který poukazuje na přímou nebo nepřímou závislost porodnosti na zvoleném faktoru. Výběrový korelační koeficient byl rovněž testován na statistickou významnost (Anděl; 1978). Pro formulaci vícerozměrné závislosti porodnosti na zvolených faktorech bylo využito vícenásobného lineárního regresního modelu (Hušek, 1995) vyjádřeného maticovým zápisem (1) y = Xβ + ε , y = (y1, ..., yn) náhodný vektor pozorování závislé proměnné, X = ({xij}) matice pozorování nezávisle proměnných typu (n, k+1); n < k, {xij} hodnota j-tého pozorování vysvětlující proměnné x; i = 1, ..., n, j = 1, ..., k, β = (β0, ..., βk)T vektor neznámých parametrů, RNDr. Jitka Poměnková, Ph.D, Ústav statistiky a operačního výzkumu, Mendelova zemědělská a lesnická univerzita v Brně, Zemědělská l, 613 00 Brno, Česká republika, email: [email protected] 2 Ing. Lenka Němcová, Mendelova zemědělská a lesnická univerzita v Brně, Zemědělská l, 613 00 Brno, Česká republika, [email protected] 1 116 ε = (ε1, ..., εn)T vektor náhodných veličin. Pro odhad parametrů β = (β0, ..., βk)T je využito metody nejmenších čtverců. Za předpokladu, že chybový člen je normálně rozložen budeme testovat statistickou průkaznost odhadnutých parametrů oboustranným t-testem s následující formulací nulové hypotézy H0: βj = 0, neprůkaznost, t < t1-α/2(n-p), H1: βj ≠ 0, průkaznost, t ≥ t1-α/2(n-p), kde testová statistika má tvar t= bj RSS , SE (b j ) = h j +1, j +1 , SE (b j ) n− p (2) bj, j = 1,..., k je odhad parametru βj, SE(bj) je odhadnutá standardní chyba vypočtená, RSS je reziduální součet čtverců, p je počet regresních parametrů, hj+1,j+1 je j+ 1-vý diagonální prvek matice H = (X’X)-1 (Hušek; 1995). Pokud je výsledkem testu závěr, že hypotézu H0 nezamítáme, lze usuzovat, že proměnná daného parametru může být nadbytečnou a zvolený regresní model lze o tuto proměnnou redukovat. Je však potřeba přihlížet i k dalším testů. Nulovou hypotézu pro oboustranný test celkové vhodnosti modelu, F-test, lze formulovat následovně H0: β1 = β2=…= βk= 0, neprůkaznost, F < Fc, H1: alespoň jeden regresní parametr βj není roven nule, průkaznost, F ≥ Fc, kde testová statistika má tvar n (est ( yi ) − y) / ( p − 1) ESS / ( p − 1) ∑ i F= = n TSS / (n − p ) ( yi − y) / (n − p ) ∑ i 2 =1 (3) 2 =1 kritická tabelovaná hodnota Fc = F1-α (p – 1, n – p) je dána Fischer-Snedecorovým rozložením (Hill., Griffiths, Judge; 2001). 3. Empirická analýza Pro analýzu byly použity údaje Českého statistického úřadu (www.czso.cz). Všechny údaje se týkají pouze České republiky, a to včetně hodnot získaných před rokem 1993, které byly Českým statistickým úřadem přepočteny. Jsou to meziroční indexy reálné mzdy, vývoj půjček domácností v ČR v období 1993 - 2005. Index spotřebitelských cen (1989 = 100), míra registrované nezaměstnanosti v % a sociální příjmy v období 1989 – 2005, hrubá míra sňatečnosti a hrubá míra rozvodovosti v období 1991 – 2005. V analýze závislostí jsou použity jak absolutní hodnoty, tak indexy. Důvodem zařazení indexů je snaha zajistit co nejvyšší vypovídací schopnost modelu a současná nedostupnost potřebných ekonomických ukazatelů v absolutním vyjádření. Periodicita sledování u proměnných vstupujících do korelační a regresní analýzy je 1 rok. Vyjdeme-li z demografické teorie (Kalibová; 2003, Roubíček; 1997), pak základním dělením v rámci porodnosti je dělení na živě a mrtvě narozené. Živě narození jsou dále děleni podle rodinného stavu matky v době porodu. Z důvodu zaměření na problém klesající porodnosti bude analyzována pouze klesající složka celkové porodnosti, kterou je porodnost v manželství. Z demografických ukazatelů je vybrán jako určovatel úrovně porodnosti vývoj sňatečnosti a rozvodovosti, a to hodnoty od roku 1991, kdy se změny politického, ekonomického a sociálního systému po roce 1989 začaly významným způsobem promítat také do obousměrné vazby práce a rodiny. Jako další možný určovatel byla vybrána 117 registrovaná míra nezaměstnanosti, index spotřebitelských cen, vývoj půjček domácností, meziroční index reálné mzdy a sociální příjmy domácností. Tyto veličiny ovlivňují finanční situaci a životní úroveň rodin, proto lze předpokládat, že budou mít na porodnost v manželství určitý vliv. S využitím korelační analýzy byly vypočteny hodnoty příslušných korelačních koeficientů pro posouzení závislosti mezi mírou porodnosti v manželství a vybraných faktorech. Korelace jsou uvažovány v čase t,..., t – 4. Nejvyšších hodnot korelačních koeficientů bylo přitom dosaženo při zpoždění řádu t – 1 (viz. Tabulka 1.). Tabulka 1. Závislost míry porodnosti v manželství na vybraných faktorech Koef. korelace Faktor Faktor (p-hodnota) Hrubá míra sňatečnosti 0,962 (0,0000) Vývoje půjček dom. Hrubá míra rozvodovosti - 0,200 (0,4745) Index reálné mzdy Míra nezaměstnanosti - 0,762 (0,0010) Sociální příjmy dom. Indexu spotřebitelských cen - 0,937 (0,0000) Koef. korelace (p-hodnota) - 0,465 (0,1276) 0,250 (0,4340) - 0,825 (0,0010) Pozn. p-hodnota < α indikuje statisticky významnou korelaci na (1-α)% hladině významnosti. Z provedené korelační analýzy vyplývá, že závislost sňatečnosti a porodnosti v manželství je významná při zpoždění časové řady hrubé míry sňatečnosti o jeden rok (r = 0,93). Naopak korelace mezi hrubou mírou rozvodovosti a porodností v manželství je velmi slabá a nelze ji považovat za významnou. V případě korelace mezi porodností v manželství a mírou registrované nezaměstnanosti (r = – 0,7621) zpožděné o jeden rok hodnota značí silnou nepřímou lineární závislost, kdy při zvyšující se nezaměstnanosti míra porodnosti v manželství klesá. Pokud provedeme analýzu odděleně pro muže a ženy, vyjde silná nepřímá závislost u obou pohlaví. U žen bychom tento jev mohli vysvětlit skutečností, že při rostoucí míře nezaměstnanosti je pro ženu, má-li dobrou práci, odchod na mateřskou dovolenou větším rizikem. Také matce s malými dětmi se bude práce hledat tím hůře, čím bude nezaměstnanost vyšší. Rovněž u mužů lze negativní korelaci interpretovat tak, že pokud muž nebude mít jistou práci, nebo ji nebude mít vůbec, nebude schopný financovat potřeby rodiny s dětmi a pár zřejmě založení rodiny odloží na příznivější období. Z hodnoty korelace míry porodnosti v manželství a indexu spotřebitelských cen zpožděné o jeden rok (r = – 0,9375), lze usuzovat, že vzrůstající inflace zvyšuje nejistotu očekávání ekonomických subjektů. Tím dochází k růstu rizika a vyšší rizikovosti úvěrů. Následné vyšší úrokové sazby mohou vést k odkladu založení rodiny, a tedy k poklesu porodnosti v manželství. V případě závislosti vývoje půjček domácností a míry porodnosti v manželství (r = – 0,4651) vyplývá negativní vliv rostoucí zadluženost rodin na vývoj porodnosti v manželství. Růstu reálné mzdy může mít na růst porodnosti v manželství kladný, ale velmi slabý vliv (r = 0,3970). U závislosti porodnosti v manželství a příjmů domácností byl vypočten vyšší koeficient korelace u časové řady sociálních příjmů zpožděné o jeden rok (r = - 0,8251). Na základě tohoto výsledku by při zvyšujících se sociálních příjmech rodin porodnost v manželství klesala. Důvodem takové situace může být fakt, že čím vyšší má rodina sociální příjmy, tím nižší je její ekonomická soběstačnost. Výše sociálních dávek by potom mohla ovlivňovat hlavně porody vyšších pořadí. Na základě předešlé korelační analýzy byly zvoleny ukazatele, které by mohly mít na vývoj porodnosti v manželství významný vliv, a to sňatečnost, rozvodovost, nezaměstnanost a 118 index spotřebitelských cen. K výběru významných proměnných byla použita zpětná kroková metoda. Označme est ( y) odhad hrubé míry porodnosti. Výsledný model má tvar est ( yt ) = 8,38748 n = 15 + 0,562357S t- + 0,235327N t-1 - 0,0165972SC t-1 (0,077609) 3,03221 R2 adj = 0,966879 (0,003914) -4,23998 1 (0,201411) 2,79208 F = 137,23 d = 1,69356 kde St-1 je hrubá míra sňatečnosti zpožděná o jeden rok, Nt-1 je míra registrované nezaměstnanosti zpožděná o jeden rok a SCt-1 index spotřebitelských cen (životních nákladů) se zpožděním jeden rok. Nalezený regresní model popisuje porodnost v závislosti na sňatečnosti, nezaměstnanosti a indexu spotřebitelských cen, přičemž hodnoty těchto ukazatelů jsou zpožděny o jeden rok. Vhodnost zvoleného zpoždění vychází z úvahy, že faktory, které ovlivňují rozhodnutí založit rodinu, mají vliv minimálně devět měsíců před samotným porodem. Správnost této úvahy byla potvrzena výsledky korelační analýzy, kde se na základě vypočtených korelačních koeficientů ukázala závislost mezi porodností a zvolenými ukazateli zpožděnými o jeden rok nejvýznamnější. Výsledky F-testu a t-testů potvrzují významnost jednotlivých regresních koeficientů i modelu jako celku. Dle hodnoty d = 1,69356 (DurbinWatson test) lze rezidua považovat za nekorelovaná. Tento fakt je patrný i z grafu reziduí (Graf 1). 0,6 Reziduum 0,4 0,2 0 -0,2 -0,4 20 05 20 04 20 03 20 02 20 01 20 00 19 99 19 98 19 97 19 96 19 95 19 94 19 93 19 92 19 91 -0,6 Rok Graf 1. Vývoj reziduí regresního modelu pro popis vývoje porodnosti v manželství. Z odhadnutého modelu lze usuzovat, že zvyšující se sňatečnost ovlivňuje růst porodnosti v manželství, a tedy i růst celkové porodnosti, a to pozitivně. Opatření podporující sňatečnost byla ke zvýšení porodnosti využita již v minulosti, například ve formě novomanželských půjček nebo zvýhodněného bydlení pro novomanžele. Zvyšování spotřebitelských cen má na porodnost v manželství negativní vliv. Tento vliv byl také potvrzen již v minulosti, a to v roce 1979, kdy byly na několikanásobek zvýšeny ceny dětského a kojeneckého odívání, což se přesně za devět měsíců projevilo v náhlém úbytku narozených. Nečekaný výsledek se objevil u vlivu nezaměstnanosti na porodnost v manželství. Na základě korelační analýzy bylo předpokládáno záporné znaménko, zatímco v odhadnutém modelu má koeficient nezaměstnanosti znaménko kladné. Tento nesoulad se může objevit v případě, že v korelační analýze byla identifikována zdánlivá závislost a teprve ve vztahu s ostatními proměnnými je identifikována závislost skutečná. Za předpokladu současného 119 vlivu sňatečnosti a indexu spotřebitelských cen ovlivňuje rostoucí nezaměstnanost porodnost pozitivně. Tento vliv by mohl být vysvětlen situací mladých žen v plodném věku, které se rozhodnou pro mateřství v případě, že jsou déle nezaměstnané, nemohou najít práci a se zvyšující se nezaměstnaností jejich šance na trhu práce klesá. Pro potvrzení této úvahy by byla vhodná další analýza ve smyslu existence zdánlivé závislosti, která však z důvodu malého rozsahu souboru dat není možná. Při odebrání proměnné zůstává model jako celek významný, stejně jako koeficienty zbylých nezávislých proměnných. Z provedených analýz a vlivu jednotlivých faktorů na porodnost v manželství je zřetelný nesporný kladný vliv sňatečnosti. Její podpora v rámci propopulační politiky ale byla použita v minulosti a měla pouze krátkodobý účinek. Podpora samotné sňatečnosti nemusí vést ke zvýšení porodnosti a pokud ano, tak na úkor jejího snížení v dalších letech. Pozitivní vliv by mohla mít podpora, jejíž získání by bylo podmíněno současně sňatkem a mateřstvím. Nešlo by o dlouhodobý vliv na vývoj porodnosti, ale spíše na změnu poměru dětí narozených v manželství a mimo manželství, čímž by byl kladen důraz na upřednostňování modelu tradiční rodiny. Jako významné ekonomické faktory byly určeny: index spotřebitelských cen, vývoj reálných mezd, půjčky domácností a sociální příjmy domácností. Vliv těchto faktorů souvisí se snahou zajistit rodinu finančně. Pokud se potenciální rodiče obávají, že by v budoucnu vzhledem k zvyšujícím se spotřebitelským cenám, nízkým mzdám a nedostupnosti půjček neměli dostatek finančních prostředků k zajištění potřeb svých dětí, rodinu nezaloží, nebo se rozhodnou mít pouze jedno dítě. Na základě těchto úvah lze považovat za hlavní příčinu nízké porodnosti, která se týká ekonomické oblasti, neuspokojivou finanční situaci rodin, strach z neschopnosti zajistit rodinu a ze snížení životní úrovně. Vliv má zřejmě také situace na trhu práce, kde jsou ženy stále diskriminovány, což vede k odkládání rodičovství a snižování počtu dětí. Jednoznačný vliv nezaměstnanosti na porodnost se nepodařilo v rámci analýzy závislostí potvrdit. Ke zjištění vlivné proměnné týkající se oblasti zaměstnanosti a pracovního prostředí by bylo třeba provést podrobný rozbor situace na trhu práce, zahrnující zjištění struktury nezaměstnanosti z hlediska věku a pohlaví, důvody nezaměstnanosti, situaci žen v plodném věku a matek na trhu práce atd. 4. Záver Cílem předkládaného příspěvku byla identifikaci faktorů ovlivňujících vývoj klesající porodnosti v České v období 1991 - 2005. V rámci statistické analýzy byla provedena korelační analýza pro porodnost v manželství a pro vybrané demografické a ekonomické proměnné. Z demografických ukazatelů byla vypočtena vysoká pozitivní korelace porodnosti v manželství s mírou sňatečnosti a nepříliš významná korelace s mírou rozvodovosti. Z ekonomických ukazatelů se zdá být v souvislosti s porodností v manželství významný vývoj úrovně životních nákladů, resp. spotřebitelských cen. Určitý vliv mohou mít také půjčky domácností, meziroční index reálné mzdy a sociální příjmy domácností. V rámci vícenásobné regresní analýzy byl odhadnut regresní model popisující vývoj porodnosti v manželství v závislosti na míře sňatečnosti, nezaměstnanosti a na indexu spotřebitelských cen. Model byl shledán statisticky vysoce průkazným. Na základě výsledků analýzy závislosti byla zvolena za nejdůležitější faktor, mající negativní vliv na vývoj porodnosti, obava ze snížení životního standardu rodiny a z neschopnosti zajistit děti, plynoucí z neuspokojivé finanční situace rodin. Nedostatkem empirické analýzy je malý počet pozorování. Z důvodu nedostupnost potřebných dat v odpovídající formě je brán v úvahu pouze omezený počet proměnných. 120 Autorky abstrahují od dalších faktorů ovlivňující porodnost, jako jsou změny v hodnotových orientacích, rozmach emancipace a podobně. 5. Literatura ANDĚL, J. Matematická statistika. Praha: SNTL/ALFA, 1978. 346 s. HILL, C. R., GRIFFITHS, W. E., JUDGE, G.G. Undergraduate econometrics. 2. vyd. New York: John Wiley & Sons, 2001, 402 s. ISBN 0-471-33184-8. HUŠEK, R. Základy ekonometrické analýzy I.: Modely a metody. 1. vyd. Praha: VŠE, 1995. 225 s. ISBN 80-7079-102-0. KALIBOVÁ, K. Úvod do demografie. 2. vyd. Praha: Karolinum, 2003. 52 s. Učební texty Univerzity Karlovy v Praze. ISBN 80-246-0222-9. ROUBÍČEK, V. Úvod do demografie. 1. vyd. Praha: CODEX Bohemia, 1997. 348 s. ISBN 80-85963-43-4. Adresa autora: RNDr. Jitka Poměnková, Ph.D., Zemědělská l, 613 00 Brno, Česká republika [email protected] Lenka Němcová, Ing Zemědělská l, 613 00 Brno, Česká republika [email protected] 121 Modelovanie nárokov v neživotnom poistení Rastislav Potocký, UK Bratislava Abstract:The total claim amount of a homogeneous portfolio in non-life insurance is usualy modelled by the Cramér-Lundberg model.The solution of the problem that an insurance company will not be able to meet its liabilities is well-known when individual claims are not too large ( the so-called case of small claims). However the classical approach cannot be used for extremal events which occur now more frequently than before.The paper deals with the so-called large claims where different methods are needed in order to obtain an acceptable solution. Key words: The total claim amount process,the risk process, the Cramér-Lundberg condition, heavy-tailed distributions, subexponential distributions. . 1.Úvod Predpokladáme, že v nejakom homogénnom portfóliu veľkosti nárokov Xk sú nezávislé rovnako rozdelené náhodné premenné so spoločnou distribučnou funkciou F takou,že F ( x ) <1 pre vsetky x a Pr (Xk >0 ) =1pre všetky k.Naviac požadujeme, aby stredná hodnota bola konečná. Nároky sa vyskytujú v náhodných časoch Tn a ich počet v intervale<0, t> je N (t ) = sup { n ≥ 1 ; Tn ≤ t }.Časy medzi jednotlivými nárokmi sú nezávislé, exponenciálne rozdelené s konečnou strednou hodnotou 1/λ a veľkosti nárokov na nich nezávisia.Tento klasický model sa nazýva Cramérov-Lundbergov model. Proces celkových nárokov pre Cramérov-Lundbergov model je N (t ) S (t ) = ∑ X i ,ak N (t ) >0,inak S (t ) = 0 (1) i =1 Proces rizika prislúchajúci k procesu celkových nárokov je U (t ) = u + c.t − S (t ), t ≥ 0 (2) u je začiatočný kapitál poisťovne a c >0 je poistná sadzba (za časovú jednotku). Ak stredná hodnota nárokov je µ, platí EU (t ) = u + c.t − µ EN (t ) (3) Za predpokladu, že časy medzi jednotlivými nárokmi majú exponenciálne rozdelenie, N (t ) je homogénny Poissonov proces s intenzitou λ a platí EU (t ) = u + c.t − λµt 122 (4) Odtiaľ EU (t ) / t → c − λ.µ (5) Ak má byť poisťovňa solventná, je potrebné, aby c − λ.µ >0.Veličina ρ = c / λ.µ − 1 >0 je bezpečnostná prirážka. Poistné v časovom intervale <0,t> je (1+ ρ ) λ.µ .t .(tzv.rizikové poistné). Predpoklad o exponenciálnom rozdelení časov medzi jednotlivými nárokmi sa niekedy vypúšťa.V takom prípade ide o obnovací model. Ak pre nejaké t nastane U (t ) <0, hovoríme o zruinovaní poisťovne. Pravdepodobnosť zruinovania v konečnom čase T označíme Ψ (u, T ) , pravdepodobnosť zruinovania v nekonečnom čase Ψ (u ) , čo je funkcia začiatočného kapitálu u. Pre dané u a T sa poistná sadzba volí tak, aby Ψ (u, T ) bola malá hodnota a Ψ (u ) <1 pre všetky u≥0. Klasický výsledok je známy ako Cramérova-Lundbergova veta. Nech v Cramérovom-Lundbergovom modeli platí, že ρ > 0 a nech existuje také ν>0, že ∞ − ν .x ∫ e F (x )dx = c/λ. (6) 0 Potom platí: Ψ (u ) ≤ a) ∀u ≥ 0 je ∞ e-νu (7) − ν .x ∫ xe F (x )dx <∞, b) ak 0 lim eνu Ψ (u ) =G<∞ tak (8) u →∞ G=( ν/ρµ kde ∞ ∫ − xeν . x F ( x )dx ) –1 (9) 0 c)ak nároky majú exponenciálne rozdelenie so strednou hodnotou µ,tak Ψ (u ) = 1/ (1+ρ) exp ( -ρu/ µ( 1+ρ)). − (10) Platí F (x )= 1- F( x), tzv.rozdelenie chvosta náhodnej premennej s distribučnou funkciou F. Z vety plynie známy fakt, že pri nulovej bezpečnostnej prirážke je zruinovanie isté. Ako vidieť, kľúčová je existencia konštanty ν, ktorá sa nazýva Lundbergov exponent uvažovaného procesu rizika U(t). Podmienka (6) sa nazýva podmienka malých nárokov. Podmienku spĺňajú exponenciálne rozdelenie, gama rozdelenie,Weibulovo rozdelenie, ak jeho exponenciálny parameter je väčší ako 1 a useknuté normálne rozdelenie. (Pre exponenciálne − rozdelenie je F ( x ) = e −α . x − ,α> 0, pre Weibullovo F ( x ) = e − β . x ,β> 0,τ≥1) 123 τ 2. Rozdelenia veľkých nárokov Väčšina rozdelení v neživotnom poistení však podmienku nespĺňa. Inými slovami, neexistuje také ν>0, pre ktoré platí vzťah (6). To viedlo k definícii rozdelení s ťažkými chvostami. ∞ Trieda rozdelení s ťažkými chvostami Κ=( F; ∫ eν . x dF ( x ) =∞ pre všetky ν>0) 0 − − Trieda rozdelení s dlhými chvostami L= ( F; lim F (x − y ) / F (x ) = 1 pre všetky y>0 ) x →∞ Trieda subexponenciálnych rozdelení S= (F; lim Pr( S n > x )/ Pr( max X k >x )=1 ∀ n≥2 ) x →∞ 1≤ k ≤ n − − Trieda regulárne sa meniacich rozdelení R=( F; lim F (t.x ) / F (x ) = t −α ∀ t>0 a nejaké x →∞ α>0 ) − − Trieda rozdelení s dominantne sa meniacimi chvostami D = ( F ; lim sup F (c.x ) / F ( x ) < ∞ x →∞ ∀0<c <1) n kde S n = ∑ X i . i =1 Platí R⊂S⊂L⊂K a samozrejme R ⊂ D.Tiež S je pravá podmnožina L,ale L∩ D⊂S. Najdôležitejšia je trieda subexponenciálnych rozdelení S.Dá sa ukázať, že − F (x ) / e − r . x → ∞ ∀r > 0, čo znamená, že chvosty týchto rozdelení konvergujú k 0 pomalšie ako chvost exponenciálneho rozdelenia. Na druhej strane rozdelenia, ktorých chvosty konvergujú rýchlejšie ako exponenciálne rozdelenie, do S nepatria. Rozdelenia triedy K sa nazývajú rozdeleniami veľkých nárokov. Do triedy R patria mocninné rozdelenia, napr.Paretovo, ďalej Burrovo rozdelenie, loggama a useknuté α-stabilné rozdelenia ( Pre Paretovo rozdelenie α − k τ F (x ) = ,α>1,k>0, pre Burrovo rozdelenie podobne, len miesto x je x , τ>0). k + x − Weibulovo rozdelenie s chvostovou distribučnou funkciou F ( x ) = e − c. x , 0<τ<1 patrí do S,ale nie do R, podobne lognormálne rozdelenie. Pre rozdelenia s regulárne sa meniacimi chvostami možno ukázať, že pravdepodobnosť zruinovania v nekonečnom čase v Cramérovom –Lundbergovom modeli je ∞ − Ψ (u ) ~ 1 / ρµ ∫ F ( y )dy pre u → ∞ τ (11) u Toto tvrdenie možno zovšeobecniť na subexponenciálne rozdelenia , ktoré majú konečnú strednú hodnotu. Presne povedané (11) platí pre rozdelenia s konečnou strednou hodnotou µ také, že rozdelenie integrovaného chvosta FI (x ) = 1 x − µ ∫0 F ( y )dy, x ≥ 0 124 (12) patrí do S. V tomto prípade možno (11) prepísať do tvaru − Ψ (u ) ~ ρ −1 F I (u ) pre u → ∞ (13) Túto podmienku okrem rozdelení s regulárne sa meniacimi chvostami spl´ňajú aj lognormálne rozdelenie,Weibulovo a Benktanderove rozdelenia prvého a druhého typu. Podmienka je nevyhnutná. Poznamenajme, že F nemusí byť z S, aby F I ∈S. Pre rozdelenia spomenuté v tomto príspevku však platí oboje. Pretože podmienka sa ťažko overuje, v praxi sa využíva tvrdenie, že ak rozdelenie s konečnou strednou hodnotou patrí do D, tak FI ∈S. Podmienka F∈D sa overuje ľahšie.Všimnime si, že požiadavka konečnej strednej hodnoty diskvalifikuje Paretovo rozdelenie s parametrom α, 0<α≤1. Z praktického hľadiska treba poznamenať, že kým výsledok v časti b) CramérovejLundbergovej vety predstavuje veľmi dobrý odhad Ψ (u ) už pre stredne veľké u, (13) má skôr teoretický význam. Lepší odhad možno dostať len v prípade, že F spĺňa aj nejakú inú požiadavku okrem F I ∈S. Tvrdenie (11) možno zovšeobecniť na prípad , že proces počtu nárokov je všeobecnejší ako v Cramérovom-Lundbergovom modeli. Ako uvádzajú viacerí autori, najrealistickejším procesom v poisťovníctve okrem homogénneho Poissonovho procesu je negatívny binomický proces. − Ak F ∈ R s exponentom α+1,tak (11) možno použiť na odhad pravdepodobnosti zruinovania v konečnom čase T. Platí Ψ (u , T ) → 1 − (1 + (1 − ρ )T ) −α pre u → ∞ . Ψ (u ) (14) 3. Klasický model rizika s konštantnou úrokovou sadzbou Nech v Cramérovom-Lundbergovom modeli sa fondy poisťovne zhodnocujú s konštantnou intenzitou úrokovania r>0. Potom pre zodpovedajúci proces rizika (resp.rizikovú rezervu ) U r (t ) platí t t U r (t ) = ue + c ∫ e dy − ∫ e r (t − y ) dS ( y ) rt ry 0 (15) 0 Nech Ψr (u ) znamená pravdepodobnosť zruinovania v nekonečnom čase pre tento proces. Potom platí − − Veta (Asmussen).Ak FI ∈ S a lim sup FI (v.x ) / F I ( x ) <1, ∀v>1, x →∞ ∞ − tak Ψr (u ) ~ λ / r ∫ F ( y ) / ydy pre u → ∞ (16) u V závere sa zmienime o rýchlosti konvergencie pravdepodobností zruinovania. Platí a)v prípade,že FI ∈ D,tak − Ψ (u ) / F I (u )ρ −1 -1 =O (u-1 ) čo je pomalá konvergencia. b) ak zavedieme podtriedu subexponenciálnych rozdelení 125 (17) − − A = ( F; FI ∈ S a lim sup FI (v.x ) / F I ( x ) <1 ,∀v>1 ) x →∞ tak ∞ − Γ(u ) = Ψr (u ) /( λ / r ∫ F ( y ) / ydy ) -1 = O(u-1 ) (18) u pre FI ∈ A ∩D. Dá sa ukázať, že A ∩D zahŕňa regulárne sa meniace rozdelenia. Ak chceme dostať presnejšie tvrdenie, treba jednotlivé rozdelenia analyzovať osobitne. Osobitným problémom je odhad parametrov rozdelení s ťažkými chvostami. Pretože sa tu stretávame s odľahlými pozorovaniami, klasické metódy niekedy zlyhajú. Nádejnejšie sa javí použitie robustných metód, napr.odhadov založených na Johnsonovom skóre. 4. Záver. Diskutovaný problém je len špeciálnym prípadom , s ktorým sa stretávajú poisťovne. Všeobecnejšie úlohy sa týkajú rozdelenia chvostov celkových nárokov, kde opäť hrajú dôležitú úlohu subexponenciálne rozdelenia. Článok vznikol s podporou ASO projektu č.SK-0607-BA-018. 5. Literatúra. 1.ASMUSSEN,S.1998.Subexponential asymptotes for stochastic processes:extremal behavior,stationary distributionand first passage probabilities.In:Ann.Appl.Probab., č.8,1998. 2.EMBRECHTS,P.-KLUPPELBERG,C.- MIKOSH,T.1997.Modelling extremal events for insurance and finance.Springer-Verlag,Berlin,2003,ISBN 3-540-60931-8. 3.EMBRECHTS,P.-VERAVERBEKE,N.1982. Estimates for the probability of ruin with special emphasis on the probability of large claims.In:Insurance,Math.Econom.,č.1,1982. 4.KONSTANTINIDES,D.G.-TANG,Q.H.-TSITSIASHVILI,G.SH.2004.Two-sided bounds for ruin probability under constant interest force.In: Journal of Mathematical Sciences,vol.123,č.1,2004. 5.MIKOSH,T.-NAGAEV,A.2001.Rates in approximation to ruin probabilities for heavytailed distributions.In:Extremes,4,č.1,2001. Adresa autora: Rastislav Potocký Mlynská dolina 842 18 Bratislava [email protected] 126 Využití a význam plochy pod ROC křivkou Marek Sedlačík Abstract: Receiver operating characteristic (ROC) analysis is an important tool for describing the performance of a diagnostic test used to discriminate between two populations. There are several approaches how to estimate it (see Hsieh, Turnbull, 1996). In the contribution the attention is concentrated on using the area under the ROC curve (AUC) as a quality metric. These methods were programmed in the computing software MATLAB and the procedures are applied to the real data processing. Key words: sensitivity and the specificity of the test, ROC curve, area under the ROC curve 1. Úvod V tomto příspěvku je zaměřena pozornost na ROC křivky (Receiver Operator Characteristic Curve), různé techniky jejich odhadu a především na odhad plochy pod ROC křivkou. Jedná se o tzv. AUC (Area under Curve) charakteristiku, která má široké využití v oblasti klasifikace. Uvedené metody odhadu ROC křivky i odhadu AUC charakteristiky budou srovnány na simulovaných datech. Veškeré výpočty a grafické výstupy byly implementovány v prostředí MATLAB 7.0. 2. ROC a ODC křivka Uvažujme diagnostický test, jehož cílem je na základě měření na spojité škále zařadit objekt do jedné ze dvou disjunktních skupin. Například do skupiny D1 nebo do skupiny D2 . Předpokládáme, že měřené testové skóre je ve skupině D1 náhodná veličina X, která má rozdělení pravděpodobností dané distribuční funkcí F (a hustotou f). Ve skupině D2 je měřené testové skóre náhodná veličina Y s rozdělením pravděpodobností o distribuční funkci G (a hustotě g). Předpokládáme, že obě náhodné veličiny X a Y jsou nezávislé. Obrázek 1: Klasifikace objektů do dvou skupin pomocí testového kritéria s mezní hodnotou c, které má rozdělení pravděpodobností s hustotou f ve třídě D1 a s hustotou g ve třídě D2 . ______________________________ 1 Marek Sedlačík, Fakulta ekonomiky a managementu, Univerzita obrany, Brno 127 ROC křivku, která popisuje kvalitu testového kritéria, zavádíme analyticky vztahem ROC (t ) = 1 − G ( F −1 (1 − t )) pro t ∈ (0,1) , pokud uvedená inverzní funkce F −1 (t ) existuje. Ekvivalentně může být ROC křivka vyjádřena parametricky pomocí senzitivity a specificity testového kritéria jako množina bodů o souřadnicích [1 − SP(c ), SE (c )] . Diagnostický test, který má dobrou rozlišovací schopnost mezi oběma populacemi, je charakteristický tím, že jeho ROC křivka zpočátku rapidně roste a potom je téměř konstantní. Naopak u diagnostického testu s malou rozlišovací schopností se jeho ROC křivka přibližuje diagonále. Obě tyto situace jsou dobře patrné z obrázku 2. Podrobněji např. v [7]. Obrázek 2: ROC křivky s odpovídajícími hustotami f a g pro dvě rozdílné diagnostické situace. 3. Odhad ROC křivky Nechť X 1 , , X m je náhodný výběr z rozdělení o distribuční funkci F. Označme Fm (x) výběrovou distribuční funkci příslušnou náhodnému výběru X 1 , , X m . Podobně pro náhodný výběr Y1 , , Yn z rozdělení o distribuční funkci G označíme příslušnou výběrovou distribuční funkci Gn (x) . Když v definičním vzorci ROC křivky nahradíme distribuční funkce F a G příslušnými výběrovými protějšky Fm (x) a Gn (x) a místo inverzní funkce použijeme kvantilovou funkci, dostaneme empirický odhad ROC křivky (ozn. SampleROC) . ( ) ROC (t ) = 1 − Gn Fm−1 (1 − t ) , 0 < t < 1 , (1) Jiné populární spojité odhady vychází z předpokladu, že obě náhodné veličiny X i Y mají normální rozdělení. Mluvíme potom o tzv. binormálním modelu. Patří sem mimo jiné: a) GLS (generalized least squares method) odhad – využívá iterativní váženou metodu nejmenších čtverců, b) AGLS (adaptive generalized least squares method) odhad – jedná se o modifikaci předchozí metody, kdy se ve výpočtu zohlední rychlost růstu ROC křivky, c) Kolmogorov (EBBUCE - Estimate Based on the Best Unbiased Cdf Estimate) odhad – obdobně jako v (1) použijeme místo F a G jejich odhad založený na nejlepším nestranném odhadu distribuční funkce (viz [6]). Podrobnosti o binormálním modelu a uvedených odhadech lze najít např. v [4]. 128 4. Odhad plochy pod ROC křivkou Plocha pod ROC křivkou (AUC) se velmi často používá jako měřítko kvality klasifikace pro daný diagnostický test. Základní vlastností této charakteristiky je, že plocha pod ROC křivkou je rovna pravděpodobnosti P( X < Y ) , tj. ∫ ROC (t )dt = P( X < Y ) . 1 0 (2) Lze ukázat (viz např. 4), že pro plochu pod výběrovou ROC křivkou platí: 1 ∫ F G (t )dt = mn ∑ χ [ 1 0 m −1 n 1≤i ≤ m 1≤ j ≤ n X i <Y j ]= 1 U = Wm , n , mn (3) kde U je Wilcoxonova statistika a Wm ,n známá Mann-Whitneyova statistika. Navíc platí (viz 3), že Wm ,n je silně konzistentním odhadem pravděpodobnosti P( X < Y ) . Statistiku Wm ,n lze tedy použít k odhadu plochy pod ROC křivkou. Pro výpočet AUC charakteristiky spojitých odhadů ROC křivky použijeme numerickou integraci. 5. Simulační studie Abychom vyšetřili vlastnosti uvedených odhadů ROC křivky a především jim příslušných AUC charakteristik, byly provedeny následující experimenty na simulovaných datech. Předpokládejme dva charakterově odlišné binormální modely N (0,1) , N (2,1) a N (0,1) , N (0.5,1) . Nejprve jsou pro m = n = 30 na obrázku 3 zakresleny odhady ROC křivky spočtené užitím metody GLS, metody AGLS, pomocí kolmogorovského odhadu (označeno Kolmogor ROC), pomocí výběrových distribučních funkcí (označeno Sample ROC) a také odhadovaná ROC křivka (označeno RealROC). Hodnota skutečné AUC charakteristiky (tj. plocha pod RealROC) je pro první model rovna RealAUC=0.9213, pro druhý model RealAUC=0.6382. Obrázek 3: Odhadnuté ROC křivky pro binormální modely N(0, 1), N(2, 1), m = n = 30 (vlevo) a N(0, 1), N(0.5, 1), m = n = 30 (vpravo). Hodnoty AUC charakteristiky pro RealROC jsou 0.9213 (vlevo) a 0.6382 (vpravo). Pro tytéž binormální modely bylo dále simuluváno 100 náhodných výběrů, pro které byl spočten odhad ROC křivek, rsp. jim příslušných AUC charakteristik. Z nich byl následně 129 určen výběrový průměr a směrodatná odchylka. Výsledky pro m = n = 15, 30, 60, 100, 500 a 1000 udává tabulka 1 a 2. Tabulka 1: Výběrový průměr a směrodatná odchylka AUC charakteristik pro binormální model N(0, 1), N(2, 1) s rozsahy výběrů m, n. Výpočet byl proveden na základě sta simulací. RealAUC=0.9213 m=n 15 30 60 100 500 1000 SampleAUC 0.9228 (0.0461) 0.9212 (0.0332) 0.9211 (0.0248) 0.9189 (0.0201) 0.9220 (0.0086) 0.9221 (0.0055) GLSAUC 0.8936 (0.0442) 0.9249 (0.0372) 0.9204 (0.0275) 0.9191 (0.0218) 0.9223 (0.0089) 0.9220 (0.0058) AGLSAUC 0.9033 (0.0337) 0.9210 (0.0302) 0.9225 (0.0220) 0.9263 (0.0164) 0.9220 (0.0105) 0.9215 (0.0063) KolmAUC 0.9125 (0.0423) 0.9212 (0.0329) 0.9217 (0.0246) 0.9194 (0.0196) 0.9220 (0.0085) 0.9221 (0.0053) Tabulka 2: Výběrový průměr a směrodatná odchylka AUC charakteristik pro binormální model N(0, 1), N(0.5, 1) s rozsahy výběrů m, n. Výpočet byl proveden na základě sta simulací. m=n 15 30 60 100 500 1000 SampleAUC 0.6484 (0.1031) 0.6292 (0.0717) 0.6388 (0.0592) 0.6404 (0.0403) 0.6367 (0.0154) 0.6390 (0.0131) RealAUC=0.6382 GLSAUC AGLSAUC 0.6184 0.6448 (0.1416) (0.1080) 0.6007 0.64201 (0.0974) (0.0757) 0.6215 0.64678 (0.0660) (0.0653) 0.6297 0.6399 (0.0511) (0.0426) 0.6325 0.6392 (0.0174) (0.0150) 0.6380 0.6396 (0.0149) (0.0128) KolmAUC 0.6472 (0.1014) 0.6300 (0.0720) 0.6388 (0.0589) 0.6404 (0.0400) 0.6369 (0.0154) 0.6390 (0.0129) Z výsledků plyne, že použité odhady ROC křivky poskytují srovnatelné výsledky při odhadu AUC charakteristiky. Obecně lze říci, že AGLS a Kolmogorov (viz 6) odhad je kvalitnější, neboť GLS odhad vykazuje vetší numerickou nestabilitu a SampleROC je hendikepován svou nespojitostí. Dále ověříme vlastnosti Mann-Whitney statistiky jako odhadu plochy pod ROC křivkou (viz (3)). Pro srovnání použijeme dva odlišné binormální modely: A.) N(1,1), N(1.5,1) s RealAUC=0.6382 a B.) N(1,1), N(4,1) s RealAUC=0.9831. 130 Odpovídající (odhadované) ROC křivky jsou znázorněny na následujícím obrázku. Obrázek 4: ROC křiky příslušné binormálním modelům N(1, 1) and N(1.5, 1) (ROC_A) a N(1, 1) and N(4, 1) (ROC_B). Nyní provedeme pro zmíněné binormální modely opět 100 simulací náhodných výběrů, ze kterých spočteme výběrový průměr a směrodatnou odchylku Mann-Whitney statistiky Wm ,n a Wilcoxonovi statistiky U. Výsledky pro m = n = 5, 10, 50, 100, 500 a 1000 udává tabulka 3. Tabulka 3: Výběrový průměr a směrodatná odchylka Mann-Whitney statistiky Wm ,n a Wilcoxonovi statistiky U pro binormální model N(0, 1), N(1.5, 1) a N(0, 1), N(4,1) Výpočet byl proveden na základě sta simulací s rozsahy výběrů m, n. m=n 5 10 50 100 500 1000 N(1,1) a N(1.5,1) RealAUC=0.6382 U Wm,n 16.63 0.6652 (4.3754) (0.1750) 62.9 0.629 (10.927) (0.1093) 1591.1 0.63644 (135.89) (0.0543) 6400.7 0.64007 (358.34) (0.0358) 1.5984.105 0.63935 (4279.2) (0.0171) 6.3739.105 0.63739 (12808) (0.0128) N(1,1) a N(4,1) RealAUC=0.9831 U Wm,n 24.61 0.9844 (0.7771) (0.0311) 97.88 0.9788 (2.7128) (0.0271) 2457.46 0.9830 (23.3349) (0.0093) 9839.71 0.9840 (72.4070) (0.0072) 245696.53 0.9828 (826.8737) (0.0033) 983285.75 0.9833 (2273.7449) (0.0023) Vzhledem k uvedeným výsledkům je vhodné plochu pod ROC křivkou odhadovat pomocí Mann-Whytneyovy statistiky jen pro rozsáhlejší datové soubory. Navíc je třeba zohlednit také skutečnost, že konvergence Wm,n k RealAUC je mnohem rychlejší pro model s větší hodnotou RealAUC. 131 6. Literatura 1. DORFMAN, D. D., ALF, E. 1969. Maximum likelihood estimation for parameters of signal. Math.~Psychol. N. 6, s. 487-496. 2. GREEN, D., SWETS, J. 1966. Signal detection theory and psychophysics. New York: John Wiley and Sons. 3. HANLEY, J., A., MCNEIL B., J. 1982. The meaning and of the area under a receiver operating characteristic (ROC) curve. Radiology. N. 143, s. 29–36. 4. HSIEH, F., TURNBULL, B. W. 1996. Nonparametric and Semiparametric Estimation of the Receiver Operating Characteristic Curve. The Annals of Statistics. vol. 24, no. 1, s. 25-40. 5. METZ, C., E. 1978. Basic Principles of ROC Analysis, In Seminars in Nuclear Medicine. vol. 8, no. 4. 6. MICHÁLEK, J., SEDLAČÍK, M., DOUDOVÁ, L. 2005. A Comparison of Two Parametric ROC Curves Estimators in Binormal Model, 23 rd International Conference Mathematical Methods in Economics 2005, Hradec Králové, Czech Republic. 7. SEDLAČÍK, M., MICHÁLEK, J. 2004. ROC křivky a jejich využití při konstrukci klasifikačních a regresních stromů. In Zborník referátov, XVI. letná škola biometriky. Pribylina (Slovakia). ISBN 801-89162-06-1. Adresa autora: Mgr. Marek Sedlačík, Ph.D. Katedra ekonometrie, UO Kounicova 65, Brno E-mail: [email protected] Telefon: +420 973 443 591 132 Zdravie a ekonomický rast Health and Economic Growth Beáta Stehlíková 1 Abstract: Life expectancy, or the adult survival rate, in a country is a broad measure of population health. The aim of paper is to construct common model between GDP and life expectancy for world countries and European union countries. Key words: life expectancy, GDP, European union 1. Úvod Zdravotná starostlivosť v primeranej kvalite má významný vplyv na zdravotný stav populácie. Údaje z rozvojových krajín dokazujú, že pri výdavkoch nižších ako 60 dolárov na osobu za rok nie je zabezpečená adekvátna zdravotnícka starostlivosť. Existujú však aj opačné limity: zvyšovaním výdavkov na zdravotníctvo nad 1000-1500 dolárov na osobu za rok sa nádej na zdravý život už ďalej nezvyšuje, uvádza sa v Národnej správe o ľudskom rozvoji SR 2001-2002. Nádej na dlhší život v primeranom zdraví je vyššia v krajinách, ktoré investujú do zdravotníctva vyššie sumy. Efektívnosť zdravotníckeho systému, teda pomer medzi investovanými zdrojmi a kvalitou služieb, je však dôležitou i keď ťažko merateľnou podmienkou, uvádza sa ďalej. Zdravie je výsledkom vplyvu mnohých faktorov, z ktorých niektoré majú univerzálny vplyv, napríklad zdravotná starostlivosť. Iné faktory pôsobia pri rovnakej intenzite odlišne, napríklad životné prostredie. Existujú faktory, ktoré vo sa akceptujú ako faktory s pozitívnym vplyvom, iné naopak s negatívnym vplyvom na zdravotný stav. Ich váha, t.j. dôležitosť však nie je v kombinácii s inými faktormi jednoznačná, ide o interakciu komplexu vplyvov. Separátne hodnotenie determinantov zdravia a hľadanie jednoduchých vzťahov je dosť problematické. Prezident Harvardskej univerzity Lawrence Summers a ekonóm Svetovej banky Lant Pritchett tvrdia, že vďaka ekonomickému rastu sú ľudia zdravší, lebo žijú v prijateľnejších podmienkach, majú prístup ku kvalitnej zdravotnej starostlivosti, najkvalitnejším liekom. Ešte významnejší je vplyv kvalitnej vody a výživy, bezpečnejších pracovných podmienok a lepšieho bývania. David E. Bloom a David Canning tiež z Harvardskej univerzity tvrdia opak. Podľa nich zdravšie obyvateľstvo znamená výkonnejšiu ekonomiku, uvádzajú Hospodárske noviny (2007). Zdraví pracovníci sú produktívnejší ako ich kolegovia s horším zdravotným stavom. Z tohto dôvodu investície do zdravotníctva stimulujú ekonomický rast. 2. Materiál a metódy Zdravie je jeden z kľúčových atribútov udržateľného rozvoja spoločnosti. Zdravotný stav obyvateľstva krajiny je výsledkom zložitého spolupôsobenia genetického vybavenia, výživy a životného štýlu, životného prostredia, ekonomickej situácie ako aj kvality zdravotníckych služieb. Zdravá populácia vytvára dobré predpoklady pre priaznivú situáciu na trhu práce. Zdravie a dlhý život meraný očakávanou dĺžkou života pri narodení patrí medzi tri dimenzie kvantifikujúce ľudský rozvoj pomocou indexu ľudského rozvoja. Základným a všeobecne akceptovaným ukazovateľom úrovne životných podmienok obyvateľstva a úmrtnostných pomerov je očakávaná dĺžka života. Podľa Agendy 21 ide o sociálny ukazovateľ udržateľného rozvoja a vyjadruje priemernú predpokladanú dĺžku života 1 Beáta Stehlíková, Katedra štatistiky a operačného výskumu, FEM SPU v Nitre 133 novorodenca, danú súčasnými vekovo špecifickými rizikami úmrtnosti. Očakávaná dĺžka života pri narodení je teda ukazovateľ, ktorý súvisí s úmrtnostnými pomermi a sprostredkovane aj so zdravotnými podmienkami. Očakávaná dĺžka života je tiež najčastejšie slúžiacim demografickým ukazovateľom pre porovnávanie úrovne zdravotného stavu. Vo svete sú vyššie životné štandardy a lepšia výživa spolu s dostupnou, Vyšší standardy života a výživy spolu s dostupnou, stále sa zlepšujúcou lekárskou starostlivosťou hlavnými hnacími silami zvyšovania očakávanej dĺžky života pri narodení. Rozdiely medzi krajinami sú hlavne v zdravotnej starostlivosti a v predchádzaní smrteľným chorobám. Meranie výkonnosti ekonomiky má pre hospodársku politiku veľký význam. Základnými veličinami používanými na meranie a vyjadrovanie výkonnosti ekonomiky sú hrubý domáci produkt a hrubý národný produkt. V príspevku sa výkonnosť ekonomiky budeme merať pomocou HDP. Hrubý domáci produkt (HDP) v trhových cenách predstavuje konečný výsledok činnosti rezidentských jednotiek vyprodukovaný rezidentskými jednotkami na určitom ekonomickom území a za určité obdobie. Parita kúpnej sily je konverzný koeficient, ktorý prepočítava ekonomické ukazovatele, vyjadrené v nominálnych národných menách, na spoločnú umelo vytvorenú menu s názvom štandard kúpnej sily (PKS), ktorá vyrovnáva rozdiely v kúpnej sile rôznych národných mien. HDP krajín vyjadrený v PKS pomocou PPP ako konverzných koeficientov tak vyjadruje čisté objemové porovnanie. Údaje za rok 2005 sú čerpané z databázy Medzinárodného menového fondu. 3. Výsledky a diskusia Závislosť očakávanej dĺžky života ODZ od logaritmu HDP na obyvateľa v parite kúpnej sily 167 štátov sveta možno vyjadriť pomocou vzťahu ODZ = -7,807115 + 8,469561 log (HDP) (4,710820) (0,536522) (1) Model ako celok je vhodný. Hodnota testovacej štatistiky F je 249,1997 a príslušná P hodnota je menšia ako 0,0000001. P hodnota absolútneho člena je 0,0994 a P hodnota regresného koeficienta je menšia ako 0,00001. Koeficient determinácie je 60,1641 percent, upravený je 59,9227 percent. Hodnota Akaikeho kritéria je 6,966307. Whiteov test heteroskedasticity nezamieta neexistenciu heteroskedasticity (P = 0,189350). Obrázok 1. Závislosť očakávanej dĺžky života ODZ od logaritmu HDP na obyvateľa v parite kúpnej sily a príslušné rezíduá pre 167 štátov sveta 134 Závislosť očakávanej dĺžky života ODZ od logaritmu HDP na obyvateľa v parite kúpnej sily 25 štátov Európskej únie možno vyjadriť pomocou vzťahu ODZ = 26,83302 + 4,981931 log (HDP) (10,73763) (1,062147) (2) Model ako celok je vhodný. Hodnota testovacej štatistiky F je 22,00016 a príslušná P hodnota je 0,000101. Koeficient determinácie je 48,8891 percent, upravený je 46,6669 percent. Hodnota Akaikeho kritéria je 4,361986. Whiteov test heteroskedasticity však zamieta neexistenciu heteroskedasticity (P = 0,003060). Upravená štandardná chyba odhadovaných koeficientov je ODZ = 26,83302 + 4,981931 log (HDP) (15,65216) (1,554331) (3) Obrázok 2. Závislosť očakávanej dĺžky života ODZ od logaritmu HDP na obyvateľa v parite kúpnej sily a príslušné rezíduá pre 25 štátov Európskej únie Obrázok 3. Normalita rezíduí modelu pre 25 štátov Európskej únie Je zaujímavé overiť, či sa oba vytvorené regresné modely štatisticky preukazne líšia. Zavedením umelej premennej KOD nadobúdajúcej hodnotu 1 pre štáty Európskej únie a hodnotu 0 inak, dostávame model ODZ = -9,669088 + 8,698640 log (HDP) + 34,12734 KOD – 3,485026 KOD log (HDP) (4) (5,436087) (0,638315) (33,71883) (3,375932) 135 Model ako celok je vhodný. Hodnota testovacej štatistiky F je 83,03962 a príslušná P hodnota je menšia ako 0,0000001. Koeficient determinácie je 60,4483 percent, upravený je 59,7204 percent. Hodnota Akaikeho kritéria je 6,983100. P hodnoty pre jednotlivé regresné koeficienty sú 0,0772; 0,0000; 0,3130 a 0,3035. Whiteov test heteroskedasticity nezamieta neexistenciu heteroskedasticity (P = 0,2889440). Waldov test nulovú hypotézu pre testovanie nulovosti regresného koeficienta pri premennej KOD a súčasne pri premennej KOD log (HDP) nezamieta (P = 0,5580). Posledný výsledok znamená, že sa modely štatisticky preukazne nelíšia. 4. Diskusia Získané výsledky znamenajú, že modely popisujúce vzťah medzi očakávanou dĺžkou života v celosvetvom merítku a na území 25 štátov Európskej únie sa štatisticky preukazne nelíšia. Bolo síce povedané, že separátne hodnotenie determinantov zdravia a hľadanie jednoduchých vzťahov je problematické, ukazuje sa však, že hrubý domáci produkt v parite kúpnej sily zohráva signifikantnú úlohu pri determinácii zdravia kvantifikovanej očakávanou dĺžkou života. 5. Literatúra SOJKOVÁ, Z. – STEHLÍKOVÁ, B. 2005. Socio-ekonomická komparácia krajín EÚ. Nitra : Slovenská poľnohospodárska univerzita, 2005. 67 s. ISBN 80-8069-520-2 BARRO, R. J. 1997. Determinants of Economic Growth: A Cross-county Empirical Study. Cambridge : MIT Press, 1997. Koľko peňazí je vlastne v zdravotníctve? Dostupné na www. hn.hnonline.sk (23.8.2007) Adresa autora: Beáta Stehlíková, doc. RNDr. CSc. Katedra štatistiky a operačného výskumu, FEM SPU v Nitre Tr. A. Hlinku 2 949 76 Nitra [email protected] 136 Porovnanie vybraných metód pre ranking podnikov v odvetví Katarína Šebejová, Trend Holding Abstract: Often, there is no the ranking of the companies as a usual part of sector analyses in Slovakia. Why? There are enough techniques based on multi criteria, but not enough software. Some people are still afraid of Excel special functions. Now we are able to use the RSW, new method in the Slovakia, but not in the Germany. The very special outline of this method is to factor the time in construction of ratios. Some improvement of ratios is necessary, because of different statements structure. The first bigger application of this method is on the companies of construction sector Key words: Sector analyses, macro & micro level, methods based on multi criteria, benchmark, scoring, RSW 1. Úvod V odvetvových analýzach, ktoré sú dnes dostupné v SR ako komerčné produkty sa podnikové dáta často prezentujú vo forme poradia podnikov podľa jedného, či viacerých kritérií. Neporovnávajú sa s odvetvových benchmarkom a nie sú ani spracované do rankingu podľa globálneho ukazovateľa. Toto možno považovať za je jeden z najvážnejších nedostatkov v obsahu odvetvových analýz. Škála metód je široká a neustále sa zdokonaľuje. Dôvod však môže byť v malom rozšírení analytických aplikácií, ktoré eliminujú ručné výpočty a ručný design výstupu. Tento nedostatok síce odstránili tabuľkové procesory, využitie ich funkcií kladie však vyššie nároky na používateľa.. Rôzne sú informačné zdroje, a tým aj štruktúra údajov z nich získavaných, čo komplikuje ich spracovanie do rebríčkov. 2. Viackriteriálne hodnotenie a odvetvový scoring Pod scoringom sa skrýva kvantitatívne hodnotenie subjektu na báze viacerých kritérií. Výsledkom je rebríček podľa sumárneho ukazovateľa. Výstupom je jedna známka, ktorá podľa poradia (rankingu) označuje bonitu hodnoteného subjektu z pohľadu hodnotiaceho mechanizmu 1. Základom scoringového modelu je spravidla viackriteriálne hodnotenie, v ktorom môžu byť aplikované rôzne metódy a modely. Výber ukazovateľov a stanovenie váh rieši buď analytik, alebo expert, prípadne tvorca modelu, či metódy. Scoring je v porovnaní s ratingom jednoduchší, priezračný a časovo nenáročný spôsob zisťovania bonity klienta. Hlavná váha hodnotenia však spravidla spočíva na minulých výsledkoch. Dáta za viacero podnikov sa spracovávajú automatizovane, je potrebné urobiť ich fyzickú i logickú kontrolu. Metódy pre viackriteriálne hodnotenie podnikov patria medzi tzv. vyššie metódy finančnej analýzy. Spravidla sú zapracované v osobitných softwarových produktoch, ale dnes stačí zdatnému analytikovi na ich aplikáciu aj MS Excel. Snahou autorky vždy bolo verifikovať ich na reálnych údajoch konkrétnych firiem. Predmetom záujmu bolo zväčša stavebníctvo, a spoločnosti, ktoré v ňom pôsobia. 2.1 Metódy multikriteriálneho hodnotenia a program ESO Cieľom metód multikriteriálneho hodnotenia je transformácia a syntetizácia hodnôt rôznych ukazovateľov do jedného, integrálneho, ktorý komplexne vyjadruje úroveň 1 Vinš, P. - Liška, V. : Rating. C.H. Beck,. Praha 2005, s. 64. 137 jednotlivých podnikov v súbore. Patrí sem metóda jednoduchého poradia, bodovacia metóda, metóda normovanej premennej, metóda vzdialenosti od fiktívneho bodu (objektu) a metóda klasifikačna. V zostavovaní podnikových rankingov majú zatiaľ najširšie využitie. Existuje viacero publikácií, ktoré podávajú podrobný metodologický základ a postup pre aplikáciu metód 2. Na ich aplikáciu možno dnes už použiť štandardný tabuľkový procesor. Medzi staršie softwarové aplikácie, v ktorých ich tiež bolo možné využiť patril program ESO 3 (Ekonomický Software). Vznikol na Vysokej škole ekonomickej v Prahe na báze databázového procesora MS Access, ale dnes sa už nerozvíja. Analytik si pre hodnotenie môže zvoliť vlastnú sústavu maximálne desiatich ukazovateľov a priradiť im váhy podľa významnosti pre cieľa rankingu. Vyhodnotenie prebieha podľa všetkých metód naraz. Výsledná známka je súčtom poradia za každú metódu. Najlepší podnik ju má najnižšiu (bol na špici rebríčka podľa každej z metód). Pri vytváraní sústavy ukazovateľov treba zohľadniť vzájomnú závislosť medzi nimi. Testuje sa pomocou Spearmanovho koeficientu 4. Aj jednotlivé metódy medzipodnikového porovnávania navzájom korelujú a poskytujú podobné výsledky. Najvyššia závislosť je medzi metódou vzdialenosti od fiktívneho objektu a metódou normovanej premennej., najmenšia medzi klasifikačnou a bodovacou metódou. Tu sa prejavuje skutočnosť, že bodovacia metóda je najjednoduchšia. Celkový výsledok je vysoko závislý od ostatných. Najviac ho odzrkadľuje metóda normovanej premennej, najmenej metóda bodovacia. Tabuľka 1: Spearmanov koeficient korelácia pre jednotlivé metódy Metóda Bodovacia Normovanej Vzdialenosť Klasifikačná Celkové jednoduché metóda premennej od fiktívneho metóda poradie ho poradia objektu 0,8017 0,7721 0,6609 0,6123 0,8522 Metóda jednoduchého poradia 0,8017 0,7680 0,6380 0,5601 0,8344 Bodovacia 0,7721 0,7680 0,9090 0,8802 0,9704 Normovanej premennej 0,6609 0,6380 0,9090 0,8893 0,9152 Vzdialenosť od fiktívneho objektu 0,6123 0,5601 0,8802 0,8893 0,8748 Klasifikačná 0,8522 0,8344 0,9704 0,9152 0,8748 Celkové poradie 2.2 Metóda RSW Metódu RSW vyvinul Reinhart Schmidt. Za akronymom sú tri nemecké slová. Rendita (R) = návratnosť, rentabilita; Sicherheit (S) = istota, stabilita; Wachstum (R) = rast. Jej aplikácia na hodnotenie 304 akciových spoločností bola po prvý raz zverejnená v roku 1987, medzi tým sa rozšírila na všetky kótované nemecké akciové spoločnosti 5. Vybrané ukazovatele ako celok vyjadrujú kvalitu podniku z pohľadu investora. Sleduje sa fundamentálny6 výkon na základe účtovných výkazov. Primárnym cieľom je návratnosť, zachovaná do budúcnosti, zohľadnený je budúci potenciál úspešnosti. Ukazovatele berú do úvahy čas. Rentability postihujú obdobie troch rokov, sú vážené, najaktuálnejší rok má najvyššiu váhu. Ukazovatele rastu vyjadrujú priemerný ročný prírastok bilančnej sumy i obratu, nie iba medziročné zmeny. Všetky sa transformujú do jednej hodnoty, tzv. 2 3 4 5 6 Viď. Zalai, K. a kol.. Finančno-ekonomická analýza podniku. Sprint vfra, Bratislava 2000, s. 262-278. Srpová, J.: Habilitační práce - Vybrané metody ekonomického hodnocení podniku a jejich softwarová podpora při výuce. Vysoká škola ekonomická, Praha 1999, s. 68. Klenovics, G.: Využitie aplikačného programu ESO vo finančnej analýze podniku. Diplomová práca na EU, Bratislava 2000, s. 74. Podľa Baetge, J.: Bilanzanalyse. IDW-Verlag GMBH, Düsseldorf 1998, s. 550-559. Tu v zmysle základný, t.j. výkon, ktorý je podstatou existencie podniku. 138 Fundamentálneho score. Od roku 1994 sa meria výkon podnikov na burze a premieta sa do tzv. Burzového score. Obe score vchádzajú do Celkového score, to je tzv. kvázi-objektívne. Tabuľka 2: Metóda RSW – ukazovatele a ich váhy Oblasť Značka R1 R2 Rentabilita Ukazovateľ Rentabilita vlastného kapitálu Cash flow z obratu (odvetvovo diferencovaný) S1 Miera samofinancovania S2 Miera likvidity Stabilita (odvetvovo diferencovaný) W1 Rast W2 Miera rastu bilančnej sumy Miera rastu obratu (odvetvovo diferencovaný) Odvetvie Všetky odvetvia Váha 0,4444 Priemysel / Obchod / Doprava Verejná správa a samospráva Obchodné banky Hypotekárne banky Úrazové a havarijné poisťovne Životné poisťovne Priemysel / Obchod / Doprava Verejná správa a samospráva Banky / Poisťovne Priemysel / Obchod / Doprava Verejná správa a samospráva Obchodné banky Hypotekárne banky Úrazové a havarijné poisťovne Životné poisťovne Všetky odvetvia 0,2222 0,1111 0,0556 0,1111 Priemysel / Obchod / Doprava 0,0556 Verejná správa a samospráva Banky / Poisťovne S ú č e t v á h 1,0000 Pri výpočte fundamentálneho score sa hodnoty každého ukazovateľa štandardizujú, aby ich bolo možné spočítať, aj keď sú inak vyjadrené, vážia sa váhami a až potom sumarizujú. Štandardizácia prebieha metódou normovanej premennej, za všetky ukazovatele požadujeme rast. Fundamentálne score kvantifikuje odchýlku konkrétneho podniku od priemeru za skupinu podnikov. Ak je pozitívne, je nadpriemerný, negatívne naopak poukazuje na jeho podpriemernosť. Čím vyššia je hodnota score, tým lepšie je na tom podnik a má lepšie poradie. Celkovú pozíciu podniku vyjadruje scoringová známka od A do E. Tá sa pridelí podnikom, zoradeným podľa Celkového score v závislosti od rozpätia, daného autormi. Tabuľka 3: Metóda RSW – rozpätie pre scoringové známky Scoringová známka A B C D E Priradené podniky Najlepší do 5 percent Najlepší od 5 do 25 percent Najlepší od 25 do 75 percent Najlepší od 75 do 95 percent Najhorších 5 percent Aplikácia metódy v slovenských podmienkach vyžaduje modifikácie, hlavne kvôli štruktúre účtovných výkazov. Ukazovateľ cash flow je súčet zisku a odpisov, nie finančný tok z výkazu s identickým názvom. V čitateli miery likvidity nie sú zahrnuté likvidné cenné papiere, ale len likvidné prostriedky7. Celkové score sa rovná Fundamentálnemu score, pretože iba minimum podnikov má kótované cenné papiere na burze. 7 Šebejová, K.: Aktuálne otázky odvetvovej analýzy na príklade odvetvia stavebníctva. Doktorandská dizertačná práca na EU, Bratislava 2007 139 140 Tabuľka 4: Metóda RSW – prvá odvetvová aplikácia - stavebníctvo, údaje z účtovných výkazov za rok 2005, porovnanie s poradím podľa celkových tržieb v rebričku Trend TOP RSW score Známka Názov spoločnosti 1,31424 A IN VEST, s.r.o., Šaľa 0,74631 A Tavros a.s. 0,71578 A PRIEMSTAV STAVEBNÁ, a.s. 0,69886 A MALSTAV INVEST, spol. s r.o. 0,63161 B ADOZ, s.r.o. 0,60798 B Insituform – Hulín Rohrsanierungstechniken, s.r.o., Hlohovec 0,54520 B Hornex, a.s., Bratislava 0,50909 B STAS-stavby a sanácie, s.r.o., Trnava 0,47305 B Trnavská stavebná spoločnosť, a.s., Trnava 0,46338 B STAVECO - stavebná, a.s., Galanta 0,45916 B Steel-Mont, a.s., Holíč 0,32078 B STAVOÚNIA,a.s. 0,30720 B IMOS-ASEK, s.r.o., Hamuliakovo 0,30245 B Remeslo stav, s.r.o., Žiar nad Hronom 0,28637 B Skanska BS, a.s., Prievidza 0,27132 B Arprog, a.s., Poprad 0,26954 B Metrostav SK, a.s., Bratislava C ViOn, a.s., Zlaté Moravce 0,24659 0,20895 C COMERON SPS, spol. s r.o. 0,19389 C Cesty Nitra, a.s., Nitra 0,16502 C Combin Banská Štiavnica, s.r.o., Banská Štiavnica 0,16226 C Považská stavebná, a.s.,Považská Bystrica 0,14272 C Lesostav Nitra, a.s. 0,13519 C Unistav, s.r.o., Prešov 0,12739 C Prefa Sučany, a.s., Sučany 0,10752 C Skanska Technológie, a.s.,Košice 0,09570 C S.O.F. HERCEG, spol. s r.o. 0,09176 C Doprastav, a.s., Bratislava 0,09076 C Scorp, s.r.o., Michalovce 0,08238 C Termostav – Mráz, s.r.o., Košice 0,07011 C Slovpanel a.s. 0,06468 C Mijas, s.r.o., Banská Bystrica 0,06409 C Inžinierske stavby, a.s., Košice C Reding, a.s., Bratislava 0,05708 0,04835 C Chemkostav HSV, a.s., Humenné 0,03335 C Elza – Elektromontážny závod Bratislava, s.r.o., 0,02887 C Váhostav – SK, a.s., Žilina 0,02092 C Bala, a.s., Holice -0,01680 C Chladiace veže Bohunice, s.r.o., Jaslovské Bohunice -0,02058 C Vod-Eko, a.s., Trenčín -0,02223 C KLIMATECH, s.r.o., Piešťany -0,03198 C SVIP, s.r.o., Košice -0,04259 C PUR - STAV KB, s.r.o. -0,06153 C Širila, a.s., Spišská Nová Ves -0,10898 C Skelet Bratislava, a.s., Bratislava -0,11289 C Elektrovod Holding, a.s., Bratislava -0,11545 C Akord, a.s., Námestovo -0,11690 C ZIPP Bratislava, s.r.o., Bratislava -0,14056 C REKORD, spol. s r.o. -0,14398 C ŠTROB - SLOVAKIA s.r.o. D Bardejovské pozemné stavby, a.s. -0,18791 141 Poradie Trend 13. n n n n n 14. 55. 22. 53. 18. n 32. 44. 6. 35. 12. 23. n 8. n 45. n 51. 26. 25. n 1. 46. 33. n 49. 2. 15. 50. 43. 4. 39. 47. 27. 58. 57. n 41. 38. n n 3. n n n Počet podnikov 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33. 34. 35. 36. 37. 38. 39. 40. 41. 42. 43. 44. 45. 46. 47. 48. 49. 50. 51. Tabuľka 5: Metóda RSW – aplikácia v stavebníctve, pokračovanie tabuľky 4 RSW score Známka Názov spoločnosti -0,19280 D PSG-Slovakia, a.s., Žilina -0,19687 D Pozemné stavby Púchov, s.r.o. -0,20585 D Hronstav 01, s.r.o., Brezno -0,20631 D Pienstav, a.s., Stará Ľubovňa -0,21890 D Sibamac, a.s., Bratislava -0,24441 D PSJ Hydrotranzit, a.s., Bratislava -0,26889 D Ekostav, a.s., Michalovce -0,27481 D Stavoindustria Lipt. Mikuláš, a.s. -0,28559 D FINAL spol. s r.o. -0,28604 D Invest In, a.s., Šaľa -0,40239 D BCI, a.s., Žilina -0,41678 D REKOSTA Piešťany, s.r.o. E Stamart Martin, s.r.o., Martin -0,47351 -0,47661 E TELEMONT Slovensko a.s. -1,41213 E KRUSTAV, spol. s r. o. -4,47563 E Stavbár a.s. Poradie Trend n 54. n 37. 11. 28. n 30. n n 36. n 19. n n n Počet podnikov 52. 53. 54. 55. 56. 57. 58. 59. 60. 61. 62. 63. 64. 65. 66. 67. 2.3 Index celkovej výkonnosti a systém Revalex Index celkovej výkonnosti (ICV) je skonštruovaný na báze jednoduchých metód stanovenia hodnoty variantov, ktoré vychádzajú z viackriteriálnej funkcie úžitku. Ako predikčný model sa uplatnil v systéme REVALEX, ktorý slúžil na hodnotenie výkonnosti podniku. Svojím charakterom patril medzi expertné systémy. Analytik si mohol skonštruovať aj vlastný index viackriteriálneho výberového hodnotenia z 24 ponúkaných ukazovateľov, ale nemohol meniť ich váhy. Dnes sa REVALEX už nerozvíja, výpočet ICV umožní aj MS Excel. Pri určení ICV sa integruje stránka vecná, t.j. výber ukazovateľov, ktoré vypovedajú o finančno-ekonomickej situácii podniku a metodická. Tá spočíva v určená významu ukazovateľa a čiastkového ohodnotenia. Váhy jednotlivých skupín ukazovateľov, váhy ukazovateľov v rámci skupiny i výsledné váhy boli v systéme REVALEX stanovené expertne pridaním bodov z bodovej stupnice od 1 do 9. Jeden bod zodpovedá nepatrnému významu, deväť je pre rozhodujúci význam. Výsledná váha je súčinom normovanej váhy príslušného ukazovateľa v rámci skupiny a normovanej váhy skupiny. Normovaná váha skupiny ukazovateľov je daná podielom nenormovanej váhy (prisúdenej expertmi) na súčte váh. Tabuľka 6: Skupiny ukazovateľov, nenormované a normované váhy I II III IV V VI VIII X Skupina ukazovateľov Štruktúra pasív Krytie stálych aktív Štruktúra aktív Likvidita Ukazovatele obratu Rentabilita kapitálu Rentabilita tržieb a podiel Cash flow na tržbách Produktivita Spolu 142 Bodové ohodnotenie 7 3 4 6 5 8 8 5 48 Normovaná váha 0,15 0,06 0,08 0,12 0,10 0,17 0,17 0,15 1 Na určenie čiastkového ohodnotenia podniku z hľadiska každého ukazovateľa sa v programe REVALEX využívala metóda lineárnych čiastkových funkcií úžitku. V nej sa hodnoty jednotlivých kritérií, kvalitatívnych ukazovateľov, transformovali na ich čiastkové ohodnotenie, vyjadrené bezrozmerným číslom. Transformačná funkcia bola definovaná pomocou štyroch bodov so súradnicami: X1=(x1,y1), X2=(x2,y2), X3=(x3,y3), X4=(x4,y4). Index celkovej výkonnosti podniku je váženým súčtom čiastkových ohodnotení 8 podniku, čím je vyšší, tým je finančno-ekonomická situácia podniku lepšia a jej výkonnosť vyššia. ICV = Σ v i . h i (1) i =1 3. Záver Tabuľka 7: Porovnanie parametrov za vybrané metódy Parameter Cieľ hodnotenia Sústava ukazovateľov Metódy MKH Voliteľný podľa potreby Voliteľná podľa cieľa ČAS Váhy Nezohľadňuje Váhy stanoví analytik Aplikačné prostredie Náročnosť na zdroje údajov Program ESO Stredná, podľa cieľa Metóda RSW Rast, hodnota pre investora Pevná, málo ukazovateľov Zohľadňuje Diferencovanéh váhy podľa sektorov stanovil autor metódy MS Excel Nízka Index CV Výkonnosť podniku Pevná, veľký počet ukazovateľov Nezohľadňuje Váhy stanovili experti Program Revalex Vysoká Metóda RSW jediná berie do úvahy čas pri konštrukcii ukazovateľov, čo vyplýva aj z jej cieľa. Ukazovatele aj ich váhy sú vopred stanovené, analytik ich nemôže zmeniť. Všetky metódy by mohli nájsť v blízkom období opäť širšie využitie, nakoľko pre ich aplikáciu sa dajú pripraviť postupy v Exceli. Ranking je zaujímavou súčasťou odvetvovej analýzy. Scoringové hodnotenie podniku sa odvíja od cieľa, ktorý reprezentuje vybraná skupina ukazovateľov. Scoringova známka platí iba do najbližších zmien, ktoré vo firme nastanú.. 4. Literatúra Baetge, J.: Bilanzanalyse. IDW-Verlag GMB, Düsseldorf 1998. Fotr, J. - Dědina, J.: Manažérske rozhodování. Ekopress, Praha 1997, s. 133. Kislingerová, E - Hnilica,J.: Finanční analýza krok za krokem. C. H. Beck, Praha 2005. Srpová, J.: Vybrané metody ekonomického hodnocení podniku a jejich softwarová podpora při výuce. Habilitační práce na VŠE, Praha 1999. Šebejová, K.: Aktuálne otázky odvetvovej analýzy na príklade odvetvia stavebníctva. Doktorandská dizertačná práca na EU, Bratislava 2007 Zalai, K. a kol.: Finančno–ekonomická analýza podniku, Sprint vfra, Bratislava 2000. Vinš, P. - Liška, V. : Rating. C.H. Beck,. Praha 2005 Adresa autora: Katarína Šebejová, Ing. Záborského 18 831 03 Bratislava [email protected], [email protected] 8 Fotr, J. - Dědina, J.: Manažérske rozhodování. Ekopress, Praha 1997, s. 133. 143 Wavelety a časové řady Jana Šimsová1 Abstract: Attention in this paper will be focused on the using of wavelets in time series. First the wavelet analysis is briefly introduced. Then we concentrate on smoothing of time series with using wavelets. Finally we introduce wavelet scalogram and its application in searching of cycles in time series. Key words: Wavelet analysis, Fourier analysis, time series, periodogram, scalograms, threshold. 1. Úvod Na počátku osmdesátých let byla zformulována teorie waveletů, ale některé úvahy související s touto teorií se objevovaly již od počátku 20. století. Podstatou této teorie je reprezentace funkcí pomocí bázových funkcí, které jsou lokalizovány jak v čase, tak ve frekvenci. V devadesátých letech minulého století pak tato teorie zaznamenala bouřlivý rozvoj a je široce aplikována v mnoha oblastech matematiky, fyziky a technických věd (zpracování signálů a obrazu, komprese dat, geofyzika, seismika, atd.), ale také statistiky. Mateřský wavelet je funkce, pomocí níž se vytvářejí funkce dyadickými zjemněními a posunutími. Takto vytvořené funkce tvoří bázi prostoru L2 ( R) a mohou být tedy použity k reprezentaci libovolné funkce z tohoto prostoru. V praxi se často používají ortogonální wavelety s kompaktním nosičem. V úvodu článku v krátkosti nastíníme základní myšlenku waveletové analýzy a porovnáme ji s Fourierovou analýzou. Pak se soustředíme na použití waveletů při zpracování časových řad. 2. Waveletová analýza Teorie waveletů je matematicky poměrně složitá teorie, proto zde pouze nastíníme základní vlastnosti waveletů. Předem dodejme, že budeme pracovat s funkcemi, které jsou integrovatelné s kvadrátem, tedy jsou z prostoru L2 ( R) . Vyjdeme od funkce označované většinou φ(x), která má název škálová funkce. Pro tuto funkci platí který má název dilatační rovnice ∫ ϕ (x )dx = 1 a také vztah, R ϕ (x ) = 2 ∑ hk ϕ (2 x − k ). (1) k∈Z Koeficienty hk se nazývají škálové koeficienty. Pokud má škálová funkce konečný nosič, škálových koeficientů je konečně mnoho nenulových. Funkce zvaná (mateřský) wavelet ψ(x), pro který ∫ ψ ( x )dx = 0 , je definována vztahem R ψ (x ) = 2 ∑ g k ϕ (2 x − k ), (2) k∈Z kde koeficienty gk se nazývají waveletové koeficienty a platí pro ně vztah g k = (− 1) h1− k . k Příklad waveletu je uveden na grafu č.1. 1 Jana Šimsová, Katedra matematiky a statistiky, FSE UJEP Ústí nad Labem 143 Graf 1. Wavelet-mexický klobouk Z mateřského waveletu a škálové funkce lze vytvořit funkce následujícím způsobem j ϕ j ,k (x ) = 2 2 ϕ (2 j x − k ), j , k ∈ Z j 2 ψ j ,k (x ) = 2 ψ (2 j x − k ), j , k ∈ Z . (3) (4) Protože {ψ j ,k ( x )}j ,k∈Z tvoří bázi prostoru L2 (R ) , můžeme libovolnou funkci f(x) z tohoto prostoru zapsat ve tvaru { f ( x ) = ∑∑ d j ,kψ j ,k ( x) . } Navíc systém ϕ j0 k ( x),ψ j ,k ( x ) psát jako (5) j∈Z k∈Z j ≥ j0 j , k∈Z je také bází prostoru L2 (R ) a tedy funkci f(x) můžeme f ( x ) = ∑ c j0 ,k ϕ j0 ,k ( x) + ∑∑ d j ,kψ j ,k ( x) , k∈Z (6) j ≥ j0 k∈Z kde c j0 ,k = ∫ f ( x)ϕ j0 ,k ( x)dx , (7) d j ,k = ∫ f ( x)ψ j ,k ( x)dx . (8) R a R Další důležitá vlastnost waveletů jsou nulové momenty ∫ R x pψ ( x )dx = 0 , kde 0 ≤ p < N . Waveletů bylo zkonstruováno již mnoho. K nejznámějším patří wavelety zkonstruované I. Daubeschies, které mají řadu užitečných vlastností. Například jsou ortogonální, mají konečný nosič, jistý stupeň hladkosti a určitý počet nulových momentů. Příkladem nejjednoduššího a nejstaršího waveletu je Haarův vavelet (1910) daný předpisem 0≤ x< 1 , 2 1 ≤ x < 1, 2 jinde. 1, ψ (x) = − 1, 0, 144 (9) Pro škálové a waveletové koeficienty Haarova waveletu platí g 0 = − g1 = 1 h0 = h1 = 1 2 a 2. Pokud máme data X = ( X 0 , X 1 ,...... X T −1 ) , kde T = 2 J , J > 0, J ∈ Z , pocházející například z nějakého stochastického procesu, diskrétní waveletová transformace X je definována vztahem T −1 d j ,k = ∑ X tψ j ,k (t ) , (10) t =0 j = 0,1,..., J − 1, k = 0,1,...,2 j − 1 . V maticovém tvaru můžeme psát d = MX nebo X = M −1d . Pokud pracujeme s ortogonálními wavelety, platí M T = M −1 . Koeficienty d j ,k Pro mohou být spočteny pomocí Malatova algoritmu, který využívá vztahů mezi koeficienty c j ,k a d j ,k z (7) a (8) na sousedních úrovních. Platí totiž c j −1,k = ∑ h l − 2 k c j ,l (11) d j −1,k = ∑ g l − 2 k c j ,l (12) l l Pro Haarův wavelet odtud platí d j ,k 2 j ( k +1) 2 ( k + 12 ) . X X =2 − ∑ t t t =∑ j t =2 j ( k + 1 ) 2 k2 − j 2 j (13) 3. Vyhlazování časové řady Pokud chceme z časové řady odstranit náhodnou složku (vyloučit z ní šum), která je většinou zachycena vysokofrekvenčními složkami časové řady ( obecně signálu), provedeme tzv. prahování. Neboli upravíme koeficienty d j ,k . Uveďme některé techniky 1) Tvrdé prahování- všechny koeficienty d j ,k , které jsou v absolutní hodnotě menší než jistá předem zvolená prahová hodnota , položíme rovny nule a ostatní necháme beze změny. 2) Měkké prahování- všechny koeficienty d j ,k (v absolutní hodnotě) se sníží o předem zvolenou prahovou hodnotu λ . Pak v případě, že d j ,k − λ je záporné, položí se dˆ j ,k rovny nule, v opačném případě se položí dˆ j ,k = d j ,k − λ . 3) Kvantilové prahování- vynuluje se p% nejmenších koeficientů d j ,k a ostatní zůstanou beze změny. Optimální volba univerzální prahové hodnoty byla navržena ve tvaru λ = 2 ln T , kde T je počet pozorování . Chceme-li tedy časovou řadu zbavit náhodné složky, nejprve vypočteme koeficienty d j ,k z maticové rovnice d = MX . Následně provedeme prahování a nakonec s novýni koeficienty dˆ znovu složíme časovou řadu pomocí X = M −1d . j ,k 145 2. Periodogram a škálogram Připomeňme, že diskrétní Fourierova transformace diskrétního stacionárního procesu {X t , t ∈ Z } je dána vztahem d (ω ) = d j kde ω j = 2πj j = T −1 1 ∑X e 2πT t =0 − iω j t t , T j = 0,1,..., , 2 (14) 2 jsou Fourierovy frekvence. Periodogram je potom definován jako I j = d j . T Waveletový periodogram je definován pomocí koeficientů d j ,k předpisem (15) I j ,k = (d j ,k ) . Tady je dobré připomenout, že každý waveletový periodogram je závislý na zvoleném waveletu. Periodogram, který vyjadřuje „energii“ procesu pro každé j, k , není konzistentní. Škálogram pro škálu j nese informaci o „energii“ na každé škále 2 S ( j) = 2 ( T − j ) −1 ∑I k =0 j ,k j = 0,1,..., T − 1 . (16) Nyní uvedeme, jak lze využít škálogramu k identifikaci cyklu v časové řadě. Uvažujme nejprve ideální příklad. Mějme časovou řadu s 2 8 daty xt . Z diskrétní waveletové transfomace této časové řady dostáváme vektor d = (c00 , d 00 , d10 , d11 , d 20 ,..., d 7 , 27 −1 ) . Škálogram této časové řady nechť je zobrazen na grafu číslo 2. Na škálogramu jsou zřetelné dva vrcholy. Jeden ve vyšších hodnotách waveletové úrovně j , který indikuje cyklus s vyšší frekvencí v časové řadě a druhý vrchol škálogramu je v nižších hodnotách waveletové úrovně j , který indikuje cyklus s nižší frekvencí v časové řadě. Jestliže se ve škálogramu objeví dva a více vrcholů, můžeme waveletovou dekompozici také rozdělit na dvě dekompozice. A to tak, že jedna se bude nulovat na úrovních okolo prvního vrcholu a druhá bude mít nulové hodnoty na úrovních druhého vrcholu škálogramu. 500 400 300 200 100 0 0 1 2 3 4 5 Graf 2. Škálogram 146 6 7 8 V našem případě tedy položíme d j , k d (j1,k) = 0 j = 0,1,...,4 . j = 5,...7 (17) 0 d (j 2,k) = d j , k j = 0,1,...,4 . j = 5,...7 (18) (19) c (j1,k) = c00, a c (j2,k) = 0 Pomocí těchto koeficientů a inverzní waveletové transformace můžeme získat dvě časové řady y = M −1 d (1) a z = M −1 d ( 2 ) z nichž první zachycuje cyklus původní časové řady v nižších frekvencích a druhá cyklus ve vyšších frekvencích. Uveďme teď ale reálnější případ, totiž případ, kdy mezi dvěma vrcholy škálogramu je jistá úroveň, jak je ukázáno například na grafu číslo 3. Nyní nastává problém, jak oddělit koeficienty diskrétní waveletové transformace v úrovních mezi dvěma vrcholy. Uveďme zde dvě metody tohoto rozdělení, jak je navrhli ARINO,M.A,MORETTIN,P.A. , VIDAKOVIC,B. První metoda je aditivní vzhledem k energii a druhá vzhledem ke koeficientům d j ,k . Označme nejprve a = d d 2j +1, 2 k + d 2j +1, 2 k +1 . V první metodě, která zachovává 2 energii, rozštěpíme koeficienty dané waveletové úrovně j následovně 2 j −1, d (j1,k) = [] a b= k 2 a d j ,k a+b d (j 2,k) = a ( ) ( ) b d j ,k . a+b (20) Lze se jednoduše přesvědčit, že (d j ,k ) = d (j1,k) + d (j 2,k) , ale d j ,k ≠ d (j1,k) + d (j 2,k) . Ve druhé metodě je rozdělení koeficientů definováno následovně a b d (j1,k) = d j ,k a d (j 2,k) = d j ,k . a+b a+b 2 2 2 500 400 300 200 100 0 0 2 4 6 Graf 3. Škálogram 147 8 (21) ( ) + (d ) , Nyní platí, že (d j ,k ) ≠ d (j1,k) 2 2 ( 2) 2 j ,k ale d j ,k = d (j1,k) + d (j 2,k) . Jestliže hodnota E ( j ) pro příslušnou úroveň j je poměrně velká vzhledem k vrcholům škálogramu, autoři navrhují užít druhou metodu. V opačném případě první metodu. V případě naznačeném na grafu číslo 3 bychom tedy koeficienty páté waveletové úrovně rozdělili podle první metody. 3. Závěr Wavelety se užívají v dalších oblastech statistiky, než je zde naznačeno (neparametrická regrese, předpovídání v časových řadách, atd.). Waveletové metody rozšiřují skupinu běžných metod pro vyšetřování časových řad. Pro práci s wavelety z softwarových balíků zmiňme Wavelet tool box pro MATLAB a S+Wavelets-přídavný modul do S-PLUS. 4. Literatura ARINO,M.A,-MORETTIN,P.A.-VIDAKOVIC,B. 2004.Wavelet Scalograms and their applications in economic time series. Brazilian Journal of Probability and Statistics, Vol. 18, 37-51. ABRAMOVICH,F,-BAILEY,T.C.-SAPATINAS,T. 2000. In The Statistician, Vol. 49, Part1, p.1-29. ANTONIADIS,A., 1997. Wavelets in Statistics: A Review. Preprint CHUI,CH., 1992. An Introduction to Wavelets, Academic Press, ISBN 0-12-174584-8. DAUBECHIES,I., 1992. Ten Lectures on Wavelets. SIAM. Philadelphia, ISBN 0-89871-274-2. MORETTIN, P.A. 1997. Wavelets in statistics. Resenhas,vol. 3, p.211-272 MORETTIN, P.A.-CAINN,CH. 1998. A Wavelet Analysis for Time Series. In Journal of Nonparametric Statistics, Vol. 10, 1-46. MORETTIN, P.A. 1996. From Fourier to Wavelet Analysis of Time Series. Proceedings in Computational Statistics (A.Prat, editor), Physica-Verlag, 111-122. VESELÝ, V. 1995. In sborník z celostátního semináře ANALÝZA DAT 95/II Adresa autora: RNDr.Jana Šimsová,Ph.D. Moskevská 54 400 96 Ústí nad Labem [email protected] 148 Prognóza cien jatočných ošípaných spektrálnou analýzou a nákupnej ceny mlieka nelineárnym regresným modelom Božena Viktorínová 1 Abstract: The article focuses on the prognosis of prices of pig flesh for the period from January to November 2007 with the application of spectral analysis method and with the prognosis of buying prices of milk for the year 2007. In the first case we have used the monthly data and in the second case we have used the annual data. The prognosis of prices on the one year we have to make with the application of nonlinear regression. Key words: Time series, prognosis, spectral analysis, prices, nonlinear regression. 1. Úvod Pri riešení úlohy sme vychádzali z mesačných časových radov cien jatočných ošípaných v Sk/kg za SR uvedených v Tab.1. K dispozícii sme mali údaje od apríla 1997 do decembra 2006 , spolu 117 údajov . Dostatočný počet údajov nám umožnil aplikovať na mesačnú prognózu týchto cien spektrálnu analýzu. Pri nákupnej cene mlieka v Sk/kg za SR sme vychádzali z ročných údajov cien a to od r.1995 do r.2006 vrátane, ktoré sú uvedené v Tab.2. K dispozícii sme mali časový rad dvanástich údajov a preto sme na prognózu nemohli použiť spektrálnu analýzu a teda prognózu ceny sme vypočítali pomocou modelu viacnásobnej nelineárnej regresie s umelými premennými. 2.Postup pri riešení danej problematiky Vychádzali sme z nasledujúcich údajov dvoch časových radov: Tabuľka 1. Ceny za jatočné ošípané v Sk/kg bez DPH, za SR mesiac 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 1. - 52,87 48,69 52,06 57,11 60,79 46,99 44,04 55,08 53,71 2. - 52,49 50,10 51,26 56,99 59,99 46,16 42,03 51,96 50,50 3. - 51,79 48,22 49,85 56,46 57,14 42,00 41,88 52,27 49,09 4. 47,53 50,23 49,91 49,20 58,00 55,99 43,26 43,78 49,76 48,74 5. 47,27 49,84 48,48 48,72 57,14 52,59 42,32 44,10 48,73 47,96 6. 46,00 49,91 50,43 49,16 58,66 50,63 47,48 49,94 53,29 51,87 7. 49,12 52,41 49,25 50,77 61,62 53,24 44,88 59,29 56,05 55,14 8. 52,56 52,81 52,25 53,15 63,99 61,39 57,15 55,33 55,44 57,60 9. 51,97 53,57 54,36 55,88 66,94 65,79 59,61 58,57 56,58 59,66 10. 53,54 55,14 54,78 57,90 67,83 63,83 55,38 60,39 55,52 56,51 11. 54,61 55,04 54,93 57,55 66,14 56,79 47,68 55,01 54,29 50,50 12. 54,91 55,07 54,45 57,76 62,53 47,62 47,44 53,64 54,71 48,98 Zdroj :PPA - ATIS 1 Božena Viktorínová, Ekonomická univerzita, FHI 149 Tabuľka 2. Nákupné ceny mlieka v Sk/kg v SR bez DPH Rok 1995 1996 Nákupná 6,79 6,86 cena mlieka Zdroj: ML (MP SR) 6-12 1997 7,52 1998 8,02 1999 7,94 2000 8,62 2001 9,07 2002 9,27 2003 8,96 2004 9,17 2005 9,48 2006 9,31 V prípade prognózy cien jatočných ošípaných na január až november 2007 náš časový rad y t pre t = 1,2,....T nebol stacionárny v strednej hodnote a museli sme ho nahradiť časovým radom jeho prvých diferencií dy t , takže predikované hodnoty diferencovaného časového radu boli počítané podľa vzťahu : (1) dy t HAT = a1 * cos(α 1 * t ) + b1 * sin (α 1 * t ) kde α i sú frekvencie z intervalu od 0 po π . U nás (2) dy t HAT = −1,63813 * cos(0,54165 * t ) + 1,72980 * sin (0,54165 * t ) Keďže predikované hodnoty časového radu y t HAT boli aj centrované, museli sme ich odcentrovať: (3) y t HAT = y t HAT + (t − T ) * PRIEM kde PRIEM je priemerná hodnota zadaného časového radu. U nás y t HAT = y t HAT + (t − 117 ) * 0,0125000 (4) Potom rekurentný vzťah pre výpočet predikovaných hodnôt pôvodného časového radu je: (5) y t HAT = y t −1 HAT + dy t HAT + PRIEM U nás (6) y t HAT = y t −1 HAT + dy t HAT + 0,0125000 kde t = 119, 120, ...129. Vypočítané predikované hodnoty spolu s vypočítanými predikovanými hodnotami diferencovaného časového radu uvádzame v nasledujúcej tabuľke: Tabuľka 3. Prognóza cien jat. ošípaných v Sk/kg bez DPH za SR yt y t HAT = prognóza Obs. dy t HAT 118 0,76099 48,98 49,7535 119 1,81595 . 51,5819 jan.2007 120 2,35103 . 53,9455 121 2,21305 . 56,1710 122 1,44150 . 57,6250 123 0,25727 . 57,8948 124 -1,00061 . 56,9067 125 -1,97203 . 54,9471 126 -2,37889 . 52,5808 127 -2,10471 . 50,4886 128 -1,22797 . 49,2731 129 0,00031 . 49,2859 november V štvrtom stĺpci od druhého riadku Tab.3, teda od januára 2007 do novembra 2007 je uvedená prognóza cien jatočných ošípaných. Zhodu empirických (prerušovaná čiara) a teoretických (plná čiara) hodnôt časového radu spolu s prognózou môžeme sledovať na Obr.1.: 150 C 70 60 50 40 0 10 20 30 40 50 60 70 80 90 100 110 120 130 t Obr.1 Grafické porovnanie teoretických a empirických cien jatočných ošípaných spolu s prognózou Pri výpočte prognózy nákupnej ceny mlieka sme vychádzali z Tab.2 a použili sme nelineárnu regresiu s umelými premennými, teda vychádzali sme z rovnice: (7) y t = 6,43582 + 0,41208.t − 0,00106.t 3 − 0,40212.S 2 − 0,22569.S 3 − 0,33261.S 5 (0,0001) (0,0001) ( 0,0005) ( 0,0040) ( 0,0437) ( 0,0129) Model vyšiel na hladine α = 0,05 významný ( F = 0,0001 ) a testy koeficientov sú uvedené v okrúhlych zátvorkách pod rovnicou (7) a sú významné. Predpovedaná nákupná cena mlieka v SR na rok 2007 je 9,4669 Sk/kg. Zhodu empirických (plná čiara) a teoretických (prerušovaná čiara) hodnôt časového radu spolu s prognózou možno sledovať na Obr.2: CENA 10 9 8 7 6 1 2 3 4 5 6 7 8 9 10 11 T 151 12 13 Obr.2 Grafické porovnanie teoretických a empirických nákupných cien mlieka v Sk/kg v SR 3. Záver Článok vznikol na základe potrieb praxe a problematika bola riešená v rámci grantovej úlohy VEGA 1/ 2631/ 05. Aj keď sa modely ukázali byť vhodné na prognózovanie našich cien, nemusí to znamenať, že veľké náhodné výkyvy tieto prognózy neovplyvnia. 4. Literatúra CIPRA,T.1986. Analýza časových řad s aplikacemi v ekonomii, Praha, SNTL, 1986 CHAJDIAK,J.–MEDVEĎOVÁ,E.1995. Prognózovanie časových radov, Bratislava, STATIS, 1995 CHAJDIAK,J.–RUBLÍKOVÁ,E.–GUDÁBA,Štatistické metódy v praxi ,Bratislava, STATIS, 1994 Adresa autora: Mgr. Božena Viktorínová, CSc. Ekonomická univerzita, FHI, Dolnozemská 1, 852 35 Bratislava [email protected] 152 Vplyv úpravy charakteru premenných na metódy viackriteriálneho hodnotenia Mária Vojtková Abstract: This article deals with the partial problem of multivariate methods of evalution. Applied on real-life data we ilustrate the differences between the two ways of determination of data characters. The data are concentrated on structural indicators of Lisbon strategy. Key words: methods of evalution, differences between two ways of determination the methods, structural indicators of Lisbon strategy 1. Úvod Usporiadanie objektov súboru podľa rôznych ukazovateľov je často riešenou úlohou. Najmä pri väčšom počte objektov je usporiadanie pomerne prácna, a tým aj zdĺhavá záležitosť, samo osebe je v princípe veľmi jednoduché. Často však chceme usporiadať súbor podľa vlastnosti, ktorá sa nedá vyjadriť jednou premennou (ukazovateľom). Príkladom takýchto vlastností sú veľkosť, efektívnosť atď. Takéto vlastnosti sú viackriteriálne, pričom každé kritérium vyjadruje iný ukazovateľ. 2. Podstata metód viackriteriálneho hodnotenia Spoločným základom všetkých metód viackriteriálneho hodnotenia je východisková matica objektov (štatistických jednotiek) a ich charakteristík (ukazovateľov, premenných, štatistických znakov). Samotné hodnotenie zahŕňa nasledujúcu postupnosť krokov: 1. Výber objektov zaradených do analyzovaného súboru pri dodržaní podmienok porovnateľnosti. 2. Výber vlastností (ukazovateľov) charakterizujúcich objekt. 3. Voľba váh ukazovateľov, ktoré vyjadrujú dôležitosť toho-ktorého ukazovateľa. Ide o subjektívny proces, ktorý má svoj metodologický aparát. 4. Určenie charakteru všetkých ukazovateľov: ak je žiadúce, aby ukazovateľ rástol, bude typu +1, ak je žiadúce, aby ukazovateľ klesal, bude typu –1. 5. Voľba metódy viackriteriálneho hodnotenia. Na rozhodnutí samotného analytika zostáva, ktorú z metód viackriteriálneho hodnotenia použije. Medzi najčastejšie používané kvantitatívne metódy patrí: metóda súčtu poradí, bodovacia metóda, metóda normovanej premennej a metóda vzdialenosti od fiktívneho objektu. V procese analýzy je vhodné využiť kombináciu niekoľkých metód so záverečným porovnaním ich výsledkov. Cieľom všetkých metód viackriteriálneho hodnotenia je transformácia a syntetizácia hodnôt rôznych ukazovateľov do jedného – integrálneho ukazovateľa (výslednej charakteristiky) vyjadrujúceho komplexne úroveň jednotlivých objektov v skúmanom súbore. Metódy sa líšia jednak v čiastkových hodnoteniach (podľa jednotlivých ukazovateľov), jednak spôsobom zhrnutia – agregácie týchto čiastkových hodnotení do hodnotenia celkového. V tomto príspevku sa chceme zamerať na 4. krok, ktorý musíme uskutočniť pri hodnotení objektov. Na prvý pohľad ide o zdanlivo jednoduchú záležitosť avšak aj tu sa môžeme stretnúť s rôznymi postupmi. Určenie charakteru všetkých ukazovateľov a následne ich úprava sa môže uskutočniť dvomi spôsobmi: A) Prepočítame ukazovatele na rovnaký smer vývoja a určíme ich poradia, bodové hodnotenie alebo normované tvary. B) Zvlášť určíme poradia, bodové hodnotenie alebo vypočítame normované tvary pre ukazovatele, ktoré minimalizujeme a zvlášť pre ukazovatele, ktoré maximalizujeme. Nakoniec súbory s oboma typmi ukazovateľov spojíme. 153 3. Usporiadania krajín Európskej únie dvomi spôsobmi úpravy charakteru ukazovateľov Aplikáciu oboch spôsobov určenia charakteru premenných si ukážeme na praktickom príklade. Predmetom hodnotenia bude 12 neskôr pristupených krajín Európskej únie (dôvodom výberu práve týchto krajín je prítomnosť Slovenska) charakterizovaných vybranými štruktúrnymi ukazovateľmi Lisabonskej stratégie za rok 2003 (tabuľka 1). Pre zjednodušenie využijeme iba niekoľko navzájom nezávislých ukazovateľov: 1. 2. 3. 4. HDP na obyvateľa v parite kúpnej sily (HDP_obyv)– Hodnoty hrubého domáceho produktu sú v parite kúpnej sily na obyvateľa. Dáta sú poskytnuté členskými štátmi podľa normy ESA 95 (ročné dáta, národné účty a hlavné agregáty). Časový rad je vykazovaný od roku 1995, pre niektoré krajiny od roku 1991. Dosiahnutý (stredoškolský) stupeň vzdelanosti mladých ľudí vo veku 20-24 rokov (Stup_vzdel) – Osoby vo veku 20 až 24 rokov ktoré dosiahli stredoškolské vzdelanie ako percento populácie v rovnakej vekovej skupine. Časový rad je publikovaný od roku 1992 pre členské krajiny, a od 1995 postupne aj pre krajiny pristupujúce. Miera risku chudoby (Risk_chudoby) – Percento obyvateľstva s disponibilným príjmom pod prahom chudoby, ktorý je stanovený ako 60% priemerného disponibilného prímu po sociálnych transferoch. Tento podiel je počítaný pred sociálnymi transfermi (príjem aj s dôchodkami ale bez iných sociálnych transferov) a so sociálnymi transfermi (celkový príjem). Dlhodobá miera nezamestnanosti (Dlhodob_nezam) – Podiel dlhodobo nezamestnaných (12 mesiacov a viac) na ekonomicky aktívnom obyvateľstve – harmonizované s národnými mesačnými odhadmi nezamestnanosti. Tabuľka 1 Krajina EU SLOVINSKO CESKA REP. MADARSKO CYPRUS LITVA LOTYSSKO ESTONSKO MALTA POLSKO SLOVENSKO Vybrané štruktúrne ukazovatele Lisabonskej stratégie za rok 2003 HDP_obyv Stup_vzdel Risk_chudoby Dlhodob_nezam 71 67 56 76 39 42 43 68 42 47 91 92 85 82 74 82 81 43 89 94 11 8 10 16 16 17 18 15 15 21 3 4 2 1 4 6 5 4 11 11 Prvé dva ukazovatele môžeme z hľadiska ich charakteru považovať za maximalizujúce a posledné dva za minimalizujúce. Pri úprave charakteru budeme teda postupovať dvomi spôsobmi: A. ukazovatele, ktoré sú minimalizujúce prenásobíme číslom -1 a potom s nimi pracujeme rovnako ako s maximalizujúcimi, B. zvlášt hodnotíme maximalizujúce ukazovatele a zvlášť minimalizujúce. Pre jednotlivé ukazovatele budeme uvažovať s jednotkovými váhami. Aplikácia najjednoduchšej metódy súčtu poradí priniesla zhodné výsledky pri oboch spôsoboch prepočtu charakteru ukazovateľov. Krajina s najvyššou hodnotou integrálneho 154 ukazovateľa je vo výslednom poradí na prvom mieste, atď. V našom prípade najvyššiu hodnotu integrálneho ukazovateľa dosahuje Slovinsko (tabuľka 2), ktoré v troch štruktúrnych ukazovateľoch dosahuje ôsme poradie a pri HDP deviate poradie. Na poslednom mieste z hodnotiacich krajín sa umiestnilo Lotyšsko a Estónsko i keď ich poradia za jednotlivé ukazovatele nie sú najnižšie. Slovensko vzhľadom k tomu, že dosahuje najvyššie poradie ukazovateľa dosiahnutý stupeň vzdelanosti je celkovo hodnotené ako siedme. Výhodou tejto metódy súčtu poradí je jej jednoduchosť a aplikovateľnosť nielen na kvantitatívne, ale aj kvalitatívne charakteristiky. V prípade kvantitatívnych ukazovateľov dochádza k čiastočnej strate informácií. Poradie objektov (krajín) totižto nevystihuje, o koľko je jeden objekt lepší ako druhý. Rovnaké poradie možno získať pri rôzne veľkých kvantitatívnych rozdieloch v ukazovateľoch. Tabuľka 2 Krajina EU SLOVINSKO CESKA REP. MADARSKO CYPRUS MALTA POLSKO SLOVENSKO LITVA ESTONSKO LOTYSSKO Usporiadanie krajín EU pomocou metódy súčtu poradí pri oboch spôsoboch určenia charakteru premenných HDP_obyv 9,00 7,00 6,00 10,00 8,00 2,50 5,00 1,00 4,00 2,50 Poradia ukazovateľov Stup_vzdel Risk_chudoby 8,00 8,00 9,00 10,00 6,00 9,00 4,50 4,50 1,00 6,50 7,00 6,50 10,00 1,00 2,00 4,50 3,00 2,00 4,50 3,00 Dlhodob_nezam 8,00 6,00 9,00 10,00 6,00 1,50 1,50 6,00 4,00 3,00 Integrálny ukazovateľ 8,250 8,000 7,500 7,250 5,375 4,375 4,375 3,375 3,250 3,250 Pri aplikácii bodovacej metódy spôsob prepočtu charakteru ukazovateľov ovplyvní aj samotný výsledok. Pri prenásobení minimalizujúcich ukazovateľov číslom -1 a následne ich bodovým hodnotením, tak ako pri maximalizujúcich ukazovateľov dochádza k nadhodnoteniu väčšiny ukazovateľov. Zhodný počet bodov pri oboch spôsoboch transformácie, dosahuje iba ukazovateľ, pri ktorom je nameraná najnižšia hodnota (pri minimalizujúcich ukazovateľoch). Tabuľka 3 Krajina EU SLOVENSKO POLSKO LOTYSSKO ESTONSKO LITVA MALTA CESKA REP. SLOVINSKO MADARSKO CYPRUS Usporiadanie krajín EU pomocou bodovacej metódy pri určení charakteru premenných A. spôsobom HDP_obyv 100,00 88,16 93,42 73,68 89,47 55,26 61,84 56,58 55,26 51,32 Bodové tvary ukazovateľov Stup_vzdel Risk_chudoby 87,23 97,87 96,81 90,43 45,74 94,68 100,00 86,17 87,23 78,72 262,50 187,50 212,50 225,00 200,00 187,50 100,00 137,50 125,00 200,00 155 Dlhodob_nezam 1100 1100 600 500 400 400 400 300 200 100 Integrálny ukazovateľ 381,09 359,36 238,75 216,94 182,51 180,68 171,51 156,93 122,28 121,81 Za vhodnejší a správny spôsob v prípade aplikácie bodovej metódy možno jednoznačne považovať spôsob B (tabuľka 4), pri ktorom zvlášť bodujeme maximalizujúce a zvlášť minimalizujúce ukazovatele. Najlepšie bodové hodnoty štruktúrnych ukazovateľov dosahuje Cyprus, Česká republika, Slovinsko a najhoršie Litva. Tabuľka 4 Krajina EU CYPRUS CESKA REP. SLOVINSKO MADARSKO MALTA POLSKO SLOVENSKO ESTONSKO LOTYSSKO LITVA Usporiadanie krajín EU pomocou bodovacej metódy pri určení charakteru premenných B. spôsobom HDP_obyv 100,00 88,16 93,42 73,68 89,47 55,26 61,84 56,58 55,26 51,32 Bodové tvary ukazovateľov Stup_vzdel Risk_chudoby 87,23 97,87 96,81 90,43 45,74 94,68 100,00 86,17 87,23 78,72 50,00 100,00 72,73 80,00 53,33 53,33 38,10 44,44 47,06 50,00 Dlhodob_nezam 100,00 25,00 33,33 50,00 25,00 9,09 9,09 20,00 16,67 25,00 Integrálny ukazovateľ 84,31 77,76 74,07 73,53 53,39 53,09 52,26 51,80 51,56 51,26 Najvyšší priemerný počet bodov teda dosahuje krajina, ktorá je podľa všetkých ukazovateľov najlepšia. Bodovacia metóda v porovnaní s metódou váženého súčtu poradí umožňuje krajiny hodnotiť „citlivejšie“ vzhľadom k tomu, že počty pridelených bodov (oproti poradiu) vyjadrujú kvantitatívne rozdiely objektov v rámci jednotlivých ukazovateľov. Ak sa napríklad zameriame na krajinu na prvom mieste, ktorou je Cyprus, môžeme skonštatovať, že dosahuje maximálne hodnoty pri dvoch ukazovateľoch avšak ukazovateľ miera risku chudoby dosahuje iba 50 bodov a dosiahnutý stupeň vzdelanosti 87,23 bodov. Pri hodnotení tejto krajiny pomocou metódy súčtu poradí možno vidieť, že takisto pri dvoch ukazovateľoch dosahuje desiate (najvyššie) poradie, avšak zvyšné dva ukazovatele dosahujú iba stredné poradie a z toho dôvodu je Cyprus pri tejto metóde až na štvrtom mieste. Slovensko rovnako ako pri metóde súčtu poradí dosahuje siedme miesto. Spôsob prepočtu ukazovateľov neovplyvní výsledok ani pri metóde normovanej premennej. Stanovené poradie krajín podľa veľkosti priemernej hodnoty normovaných veličín interpretujeme podľa veľkosti integrálneho ukazovateľa (čím vyššia hodnota, tým lepšie poradie). Pri aplikácii tejto metódy sa na prvom mieste umiestnila Česká republika, druhé je Slovinsko a tretie Maďarsko (tabuľka 5). Na poslednom mieste sa nachádza Slovensko, ktoré pri predchádzajúcich dvoch metódach bolo hodnotené priaznivejšie. Je to následkom toho, že metóda normovanej premennej prihliada k relatívnej variabilite jednotlivých ukazovateľov, zatiaľ čo bodovacia metóda uvažuje variabilitu len absolútne. Výsledky tejto metódy sú menej citlivé na extrémne hodnoty ukazovateľov v súbore. Aby krajina dosiahla dobré umiestnenie, musí mať dobré výsledky vo všetkých skúmaných ukazovateľoch, nestačí dosiahnuť vynikajúci výsledok len v jednom, či malom počte ukazovateľov. 156 Tabuľka 5 Krajina EU CESKA REP. SLOVINSKO MADARSKO CYPRUS MALTA LITVA ESTONSKO LOTYSSKO POLSKO SLOVENSKO Usporiadanie krajín EU pomocou metódy normovanej premennej pri oboch spôsoboch určenia charakteru premenných HDP_obyv 0,838458 1,120293 0,063413 1,472586 0,908917 -1,134384 -0,852550 -0,923008 -0,923008 -0,570715 Normované tvary ukazovateľov Stup_vzdel Risk_chudoby 0,724308 0,656616 0,250462 0,047385 -2,592616 -0,494154 -0,020308 0,047385 0,521231 0,859693 1,698154 0,937786 1,191242 -0,329493 -0,076037 -0,329493 -0,836404 -0,582948 -0,076037 -1,596771 Dlhodob_nezam 0,322200 0,615110 0,908020 1,200929 0,322200 0,322200 0,029291 -0,263619 -1,728166 -1,728166 Integrálny ukazovateľ 0,895780 0,832451 0,603284 0,597852 -0,359384 -0,408958 -0,419993 -0,430548 -0,551495 -0,758990 Podobne spôsob prepočtu ukazovateľov nemá vplyv na výsledok ani pri metóde vzdialenosti od fiktívneho objektu. Poradie krajín stanovíme na základe veľkosti integrálneho ukazovateľa (najlepšia je krajina s najmenšou vzdialenosťou od fiktívneho objektu). V našom prípade sa opäť na prvom mieste nachádza Slovinsko, na druhom Česká republika a na treťom Maďarsko(tabuľka 6). Na poslednom mieste je Slovensko. Najnižšia dosiahnuteľná hodnota integrálneho ukazovateľa je rovná nule, a to pre krajinu, ktorá by vo všetkých ukazovateľoch dosahovala najlepšie hodnoty, tzn. z jej hodnôt ukazovateľov bol vymodelovaný fiktívny objekt. Metóda vzdialenosti od fiktívneho objektu sa líši od predošlých metód tým, že pracuje so štvorcami odchýlok. Na jednej strane z toho vyplýva jej výhoda v tom, že výsledky hodnotenia nadobúdajú vždy nezáporné hodnoty. Na druhej strane táto skutočnosť spôsobuje väčšiu citlivosť metódy na zmeny hodnôt ukazovateľov. Tabuľka 6 Krajina EU SLOVINSKO CESKA REP. MADARSKO CYPRUS LITVA LOTYSSKO ESTONSKO MALTA POLSKO SLOVENSKO Usporiadanie krajín EU pomocou metódy vzdialenosti od fiktívneho objektu pri oboch spôsoboch určenia charakteru premenných HDP_obyv 1,120293 0,838458 0,063413 1,472586 -1,134384 -0,923008 -0,852550 0,908917 -0,923008 -0,570715 Normované tvary ukazovateľov Stup_vzdel Risk_chudoby 0,656616 0,724308 0,250462 0,047385 -0,494154 0,047385 -0,020308 -2,592616 0,521231 0,859693 -0,93779 -1,69815 -1,19124 0,32949 0,32949 0,58295 0,83640 0,07604 0,07604 1,59677 Dlhodob_nezam -0,61511 -0,32220 -0,90802 -1,20093 -0,32220 0,26362 -0,02929 -0,32220 1,72817 1,72817 Integrálny ukazovateľ 0,260611 0,273017 0,410768 0,546077 0,918991 0,926925 0,934658 1,004865 1,048236 1,214784 4. Záver Na praktickom príklade sme sa snažili vysvetliť vplyv určenia charakteru a následne spôsob úpravy premenných, ako jedného z krokov metód viackriteriálneho hodnotenia, na výsledky 157 hodnotenia. Zistili sme, že spôsob úpravy premenných pred transformáciou má vplyv iba na výsledky bodovacej metódy, zatiaľ čo výsledky ostatných metód nie sú ovplyvnené použitým spôsobom úpravy. Je zrejmé, že spôsob úpravy premenných je iba jednou z otázok, ktorú treba pri hodnotení akýchkoľvek objektov brať do úvahy. Aplikáciou rôzných metód hodnotenia získame rôzne výsledky a záleží od skúsenosti samotného analytika, ktoré z nich bude považovať za najvhodnejšie. 5. Literatúra [1] FICZOVÁ, I. – SEDLÁČEK, J. – ÚRADNÍČEK, V.: Finančná analýza podniku I. Banská Bystrica: RCPF, 2000. [2] CHAJDIAK, J.: Ekonomická analýza stavu a vývoja firmy. Bratislava: Statis, 2004. [3] KHATTREE, R. – NAIK, N. D.: Multivariate Data Reduction and Discrimination with SAS® Software. First edition, Cary, NC: SAS Institute Inc., 2000. [4] PAŽITNÁ, M. – LABUDOVÁ, V.: Metódy štatistického porovnávania. Kapitola 8, s. 148-173. Bratislava: ES EU, 2007. [5] ZALAI, K. a kol.: Finančno-ekonomická analýza podniku. Bratislava: Sprint, 1998. Kontakt: Ing. Mária Vojtková, PhD. Katedra štatistiky, FHI, EU Bratislava E-mail: [email protected] __________________ Príspevok bol spracovaný v rámci riešenia grantovej úlohy VEGA 1/2631/05 „Analýza možností aplikácie viacrozmerných štatistických metód na skúmanie ekonomických výsledkov na príklade priemyslu SR prípadne iných oblastí ekonomiky“. 158
Podobné dokumenty
XX. KONGRES ODS
sebe, nebudeme si zřejmě namlouvat, že pozůstatky totality a nesvobody úplně pominuly. Potýkáme se s nimi v rovině materiální i duchovní, nebo chcete-li morální. Jsem si jist, že bez naší strany by...
Víceč. 1/2015
intervalové odhady umožňují vyrovnat se zejména s problémem neznámého pozorovaného rozdělení pravděpodobnosti, s extrémně odchýlenými hodnotami a také s nepříliš velkými rozsahy pozorovaných statis...
VícePROSTORY FUNKCÍ A ŘEŠITELNOST ZÁKLADNÍCH TYPŮ
Cílem předkládaného textu je vysvětlit, že existence a násobnost řešení okrajových úloh parciálních diferenciálních rovnic závisí na funkčním prostoru, v němž tato řešení hledáme. Čtenář bude sezná...
VíceZobrazit
budeme žádat Stč. kraj o dotaci. Vybudováním denního stacionáře bychom vyšli vstříc požadavkům veřejnosti.“ Informuje J. Duras. V domově seniorů jsou lidé závislí na pomoci 24 hodin denně. Domov má...
Víceforum statisticum slovacum - Slovenská štatistická a demografická
(pozri tiež www.ssds.sk, blok Poriadané akcie)
VíceSouhrnná teritoriální informace Rakousko
Občan ČR může vstupovat a pobývat na území ostatních členských států EU bez zvláštních omezení, a to pouze na základě platného cestovního dokladu nebo průkazu totožnosti. Od 1. ledna 2006 nabyla úč...
Vícečíslo 1, 2014
tisknul. Od roku 1981 používá techniku leptu, často v kombinaci s akvatintou. Vedle volné grafické tvorby, která je námětově spjatá s malbou, tvoří od roku 1982 exlibris. V roce 1982 vytvořil pr...
Více