Osakogumite kitsendustega hinnang Kaja Sõstra 1 Eesti Statistikaamet Sissejuhatus Valikuuringute üheks oluliseks ülesandeks on osakogumite hindamine.

Seotud dokumendid
raamat5_2013.pdf

Microsoft Word - Praks1.doc

Microsoft PowerPoint - Loeng2www.ppt [Compatibility Mode]

Antennide vastastikune takistus

Matemaatiline analüüs IV 1 3. Mitme muutuja funktsioonide diferentseerimine 1. Mitme muutuja funktsiooni osatuletised Üleminekul ühe muutuja funktsioo

Relatsiooniline andmebaaside teooria II. 6. Loeng

Polünoomi juured Juure definitsioon ja Bézout teoreem Vaadelgem polünoomi kus K on mingi korpus. f = a 0 x n + a 1 x n a n 1 x

Praks 1

Praks 1

Ppt [Read-Only]

Microsoft PowerPoint - Kliiniliste auditite kogemused [Read-Only] [Compatibility Mode]

VL1_praks6_2010k

Statistikatarkvara

Matemaatilised meetodid loodusteadustes. I Kontrolltöö I järeltöö I variant 1. On antud neli vektorit: a = (2; 1; 0), b = ( 2; 1; 2), c = (1; 0; 2), d

Praks 1

Tartu Ülikool Matemaatika-informaatikateaduskond Matemaatilise statistika instituut Ann-Mari Koppel Determinatsioonikordaja ja prognoosikordaja Bakala

(Microsoft Word - Matsalu Veev\344rk AS aktsion\344ride leping \(Lisa D\) Valemid )

TARTU ÜLIKOOL MATEMAATIKA-INFORMAATIKATEADUSKOND MATEMAATILISE STATISTIKA INSTITUUT Astrid Haas Üldistatud lineaarne segamudel ESM-uuringu andmetele M

Microsoft Word - DEVE_PA_2012_492570_ET.doc

vv05lah.dvi

10/12/2018 Riigieksamite statistika 2017 Riigieksamite statistika 2017 Selgitused N - eksaminandide arv; Keskmine - tulemuste aritmeetiline keskmine (

Microsoft Word - Uudiskirja_Toimetulekutoetus docx

Mining Meaningful Patterns

TARTU ÜLIKOOL MATEMAATIKA-INFORMAATIKATEADUSKOND MATEMAATILISE STATISTIKA INSTITUUT Kristi Läll Mitmemõõtmeline analüüs peptiidide käitumise uurimisek

Word Pro - digiTUNDkaug.lwp

Neurovõrgud. Praktikum aprill a. 1 Stohhastilised võrgud Selles praktikumis vaatleme põhilisi stohhastilisi võrke ning nende rakendust k

Regressioonanalüüsi kodutöö Indrek Zolk 30. mai a. 1 Andmestiku kirjeldus Käesoleva kodutöö jaoks vajalik andmestik on saadud veebiaadressilt ht

Microsoft Word - loeng8.doc

Ruutvormid Denitsioon 1. P n Ütleme, et avaldis i;j=1 a ijx i x j ; kus a ij = a ji ; a ij 2 K ja K on korpus, on ruutvorm üle korpuse K muutujate x 1

TELLIJAD Riigikantselei Eesti Arengufond Majandus- ja Kommunikatsiooniministeerium KOOSTAJAD Olavi Grünvald / Finantsakadeemia OÜ Aivo Lokk / Väärtusi

KINNITATUD programmi nõukogu koosolekul Haridus ja Teadusministeeriumi teadus- ja arendustegevuse programmi Eesti keel ja kultuur digiajast

AASTAARUANNE

Institutsioonide usaldusväärsuse uuring

Imbi Traat, Natalja Lepik (Tartu Ülikool), 2013 E-kursuse Bayesi statistika Markovi ahelatega materjalid Aine maht 6 EAP Imbi Traat, Natalja Lepik (Ta

ANOVA Ühefaktoriline dispersioonanalüüs Treeningu sagedus nädalas Kaal FAKTOR UURITAV TUNNUS Mitmemõõtmeline statistika Kairi Osula 2017/kevad

Microsoft PowerPoint - e-maits08_aruanne.pptx

EVS standardi alusfail

Institutsioonide usaldusväärsuse uuring

Sissejuhatus mehhatroonikasse MHK0120

6

IMO 2000 Eesti võistkonna valikvõistlus Tartus, aprillil a. Ülesannete lahendused Esimene päev 1. Olgu vaadeldavad arvud a 1, a 2, a 3,

I Generaatori mõiste (Java) 1. Variantide läbivaatamine Generaator (ehk generaator-klass) on klass, milles leidub (vähemalt) isendimeetod next(). Kons

6. KLASSI MATEMAATIKA E-TASEMETÖÖ ERISTUSKIRI Alus: haridus- ja teadusministri määrus nr 54, vastu võetud 15. detsembril E-TASEMETÖÖ EESMÄRK Tas

DVD_8_Klasteranalüüs

Õpetajate täiendkoolituse põhiküsimused

Suunised Euroopa turu infrastruktuuri määruse (EMIR) kohaste kesksetele vastaspooltele suunatud protsüklilisusvastaste tagatismeetmete kohta 15/04/201

QUANTUM SPIN-OFF - Experiment UNIVERSITEIT ANTWERPEN

EUPL v 1 1-all versions _4_

Microsoft PowerPoint - Loodusteaduslik uurimismeetod.ppt

efo09v2pke.dvi

Solaariumisalongides UVseadmete kiiritustiheduse mõõtmine. Tallinn 2017

Lisa I_Müra modelleerimine

12. Marek Kolk, Kõrgem matemaatika, Tartu Ülikool, Algfunktsioon ja määramata integraal Sisukord 12 Algfunktsioon ja määramata integraal 1

Saksa keele riigieksamit asendavate eksamite tulemuste lühianalüüs Ülevaade saksa keele riigieksamit asendavatest eksamitest Saksa keele riigi

Institutsioonide usaldusväärsuse uuring

Tartu Ülikool Matemaatika-informaatikateaduskond Matemaatilise statistika instituut Võrgupeo külastaja uurimine Andmeanalüüs I projekt Koostajad: Urma

PÄRNU TÄISKASVANUTE GÜMNAASIUM ESITLUSE KOOSTAMISE JUHEND Pärnu 2019

Microsoft Word - Errata_Andmebaaside_projekteerimine_2013_06

Matemaatiline analüüs III 1 4. Diferentseeruvad funktsioonid 1. Diferentseeruvus antud punktis. Olgu funktsiooni f : D R määramispiirkond D R selles p

Microsoft Word Kutseliste hindajate aruandluse ja auditeerimise kord.doc

PowerPoint Presentation

Microsoft Word - ref - Romet Piho - Tutorial D.doc

SPORTident Air+

E-õppe ajalugu

Funktsionaalne Programmeerimine

PowerPoint Presentation

Microsoft PowerPoint - KESTA seminar 2013

Microsoft PowerPoint - Niitmise_tuv_optiline_ja_radar.pptx

KULUDOKUMENTIDE AUDITI ARUANNE

Andmebaasid, MTAT Andmebaasikeeled 11.loeng

Microsoft PowerPoint - Keskkonnamoju_rus.ppt

Lisa 7.1. KINNITATUD juhatuse a otsusega nr 2 MTÜ Saarte Kalandus hindamiskriteeriumite määratlemine ja kirjeldused 0 nõrk e puudulik -

Microsoft Word - EVS_ISO_IEC_27001;2014_et_esilehed.doc

VKE definitsioon

lvk04lah.dvi

Statistiline andmetöötlus

Matemaatika ainekava 8.klass 4 tundi nädalas, kokku 140 tundi Kuu Õpitulemus Õppesisu Algebra (65 t.) Geomeetria (60 t.) Ajavaru kordamiseks (15 õppet

Microsoft Word - MKM74_lisa2.doc

Microsoft PowerPoint - loeng2.pptx

Microsoft PowerPoint - Mis on EstWin.pptx

Ohtlike ainete sisaldus kalades

PISA 2015 tagasiside koolile Tallinna Rahumäe Põhikool

Microsoft PowerPoint IntroRiskAnal.ppt

Andmed arvuti mälus Bitid ja baidid

(Tõrked ja töökindlus \(2\))

ITI Loogika arvutiteaduses

19. Marek Kolk, Kõrgem matemaatika, Tartu Ülikool, Arvridade koonduvustunnused Sisukord 19 Arvridade koonduvustunnused Vahelduvat

PowerPoint Presentation

PRESENTATION HEADER IN GREY CAPITALS Subheader in orange Presented by Date Columbus is a part of the registered trademark Columbus IT

Eesti Keskkonnauuringute Keskus OÜ Pädevuskatsete programm 2019 Koostas: Urmas Muinasmaa Kinnitas: Margus Kört versioon Pädev

Füüsika

Control no:

Markina

Microsoft PowerPoint - MihkelServinski_rahvastikust.pptx

Millest mõtleb depressioon (ja kuidas temast aru saada?) Maarja-Liisa Oitsalu kliiniline psühholoog

Pealkiri

AMB_Loeng1_andmed_a

MAJANDUSAASTA ARUANNE aruandeaasta algus: aruandeaasta lõpp: nimi: Mittetulundusühing Hooandja registrikood: tänava nim

Väljavõte:

Osakogumite kitsendustega hinnang Kaja Sõstra 1 Eesti Statistikaamet Sissejuhatus Valikuuringute üheks oluliseks ülesandeks on osakogumite hindamine. Kasvanud on nõudmine usaldusväärsete ja kooskõlaliste hinnangute järele, mis omakorda on andnud tõuke vastava teooria arengule. Senistes teoreetilistes käsitlustes on suurt tähelepanu pööratud hinnangute täpsuse tõstmisele, seda eriti väikese valimimahuga osakogumite korral. Sellele teemale on pühendatud raamatuid (Rao, 2003), kirjutatud teadusartikleid (Lehtonen jt, 2003, 2005) ja läbi viidud suuri uurimisprojekte (EURAREA konsortsium, 2005). Käesoleva töö põhiteemaks on teine tähtis probleem osakogumite hindamise valdkonnas, see on hinnangute kooskõlalisuse ehk ühilduvuse probleem. Osakogumite ja üldkogumi parameetrid on sageli omavahel seotud. Näiteks peavad osakogumite kogusummad summeeruma üldkogumi kogusummaks. Hinnangute jaoks pole need seosed aga sageli täidetud, st hinnangud pole ühilduvad. Statistika tarbijad ei aktsepteeri mitteühilduvaid hinnanguid. Statistiliste andmete ühilduvus on samuti oluline Euroopa statistikasüsteemi kvaliteedikomponent (Euroopa Komisjon, 2005, põhimõte 14). Mitteühilduvuse põhjusteks on hinnangute juhuslikkus, mitteaditiivsus, erinevate hinnangumeetodite kasutamine, hinnangute pärinemine erinevatest uuringutest jm. Kirjeldatud probleem tekib nii suurte kui ka väikeste osakogumite korral. Tavaliselt kasutatakse lihtsaid ad hoc meetodeid ühilduvuse probleemi lahendamiseks. Sageli pole teada selliselt saadud hinnangute dispersiooni valem. Kui soovitakse saavutada ühilduvus 1 Autor kaitses doktoritöö matemaatilise statistika erialal 21.detsembril 2007. 53

54 Kaja Sõstra erinevatel tasemetel (väikesed osakogumid, suuremad osakogumid, üldkogum), siis muutub probleem matemaatiliselt keeruliseks. 1. Kasutatud hinnangud ja valikudisiainid Käesolevas töös kasutatakse disainipõhist lähenemist, kus hinnangute omadused (keskväärtus, dispersioon, kovariatsioon) on määratud valikudisainiga. Vaadeldud on kahte valikudisaini: lihtne juhuslik valik (SI) ja hüpergeomeetriline valik (HG). Nendest SIvalik on võrdsete kaasamistõenäosustega tagasipanekuta valikudisain ja HG-valik on ebavõrdsete kaasamistõenäosustega tagasipanekuga valikudisain. Mõlemad valikudisainid on laialdaselt kasutuses valikuuringutes. Avaldiste esitamisel on kasutatud valikuvektori meetodit (Traat, 2000), mis võimaldab samaaegselt käsitleda tagasipanekuta ja tagasipanekuga valikudisaine. Seega on paljud töö tulemused üldisemad kui seni kirjanduses käsitletud, nad kehtivad mõlema disainitüübi jaoks. Antud töös eeldatakse, et osakogumite valimimahud pole liiga väikesed, st spetsiaalseid väikese osakogumi hinnanguid pole siin vaadeldud. GR-hinnang vajab esialgseid hinnanguid oma konstruktsioonis. On vaadeldud kahte esialgset hinnangut osakogumite jaoks: lineaarset ja suhtehinnangut. Lineaarne hinnang on kirjanduses tuntud ka Horvitz-Thompsoni nime all (seda tagasipanekuta disainide korral). Mõlemad hinnangud on otsesed osakogumi hinnangud selles mõttes, et kasutavad ainult neid uuritava tunnuse väärtusi, mis on mõõdetud vaadeldavas osakogumis. Suhtehinnangus kasutatakse lisaks osakogumi kohta teadaolevat abitunnuse kogusummat. Töös on ära toodud lineaarse ja suhtehinnangu dispersioonide ja kovariatsioonide üldised valemid, kusjuures suhtehinnangu korral on need Taylori reaksarendusele baseeruvad ligikaudsed avaldised. Üldistest valemitest on tuletatud dispersiooni ja kovariatsiooni valemid SI- ja HG-valikute jaoks.

Osakogumite kitsendustega hinnang 55 2. Osakogumi hinnangud Käsitletakse osakogumeid ja osakogumi kogusumma hindamist, kasutades lineaarset ja suhtehinnangut. Antud töö seisukohalt on oluline teada nende hinnangute kovariatsioonimaatriksit. Seepärast tuletatakse üldised dispersiooni ja kovariatsioonivalemid osakogumi hinnangute jaoks ja ka valemid SI- ja HG-valikudisainide korral. Osakogumite hinnangute kovariatsiooni pole siiani kirjanduses väga põhjalikult käsitletud. Suhtehinnangu ja tagasipanekuta disainide korral on kovariatsiooniavaldis toodud Särndal (1992), teatud erijuhtudel on kovariatsioonimaatriksi hinnangut vaadeldud raamatus Lehtonen (1995). Antud töös saadud valemid võimaldavad teha mitmeid huvitavaid järeldusi osakogumite hinnangute sõltuvuse kohta. Selgus, et teatud valikudisainide ja suhtehinnangu korral on osakogumite hinnangud mittekorreleeritud. Samade valikudisainide jaoks võrdub osakogumi ja üldkogumi suhtehinnangute kovariatsioon osakogumi hinnangu dispersiooniga. Esitatud on ka kaks näidet väikese üldkogumi ja kahe osakogumi korral. Esitatud tulemused on üldise iseloomuga, mis võimaldab neid rakendada nii tagasipanekuga kui ka tagasipanekuta valikudisainide korral. 3. Osakogumite kitsendustega hinnang Käesolevas töös kasutatakse raamatus Knottnerus (2003) välja pakutud üldist kitsendustega hinnangut (General Restriction estimator), lühidalt GR-hinnang. Olgu θ = (θ 1, θ 2,..., θ k ) uuritav parameetrite vektor ja ˆθ = (ˆθ1, ˆθ 2,..., ˆθ ) k k-dimensionaalne nihketa hinnangute vektor. Tähistame ˆθ kovariatsioonimaatriksi V. Parameetrid peavad rahuldama järgmisi lineaarseid kitsendusi: Rθ = c, (1) kus R on r k maatriks ja c on r-dimensionaalne konstantide vektor.

56 Kaja Sõstra Teoreem 3.1. (Knottnerus, 2003, p. 328-329) Kitsendustega hinnang ˆθ GR, mis rahuldab tingimusi (1), ja hinnangu kovariatsioonimaatriks on järgmised: ˆθ GR = ˆθ + K(c Rˆθ), V GR Cov(ˆθ GR ) = (I k KR)V, kus K = VR (RVR ) 1. Töös rakendatakse teoreemis 3.1 esitatud Knottneruse üldisi ideid osakogumite hindamise ülesandele. Tuletatakse osakogumite jaoks GR-hinnangud ja nende dispersioonide ning kovariatsioonide avaldised. Tuletatud hinnangutele kandub üle GR-hinnangu optimaalsuse omadus. Seega on saadud osakogumite hinnangud dispersiooni mõttes parimad võimalikud kõigi osakogumite hinnangute hulgas, mis baseeruvad samadel alghinnangutel ja rahuldavad samu kitsendusi. Töös vaadeldakse summeeruvuskitsendust, st et D osakogumi kogusummad Y 1, Y 2,..., Y D peavad summeeruma üldkogumi kogusummaks D Y d = Y. Teoreemis 3.2 esitatakse kitsendustega hinnangu ja selle dispersiooni avaldised eeldusel, et üldkogumi kogusumma Y on teada. Kitsendused (1) avalduvad kujul: Rθ = ( 1 1 1 ) Y 1... Y d Y D = Y. (2) Teoreem 3.2. Olgu osakogumite esialgsed hinnangud Ŷi, i D ja hinnangute kovariatsioonimaaktriks V = (V ij ). Kitsendustega (2) hinnang osakogumi U d jaoks, Ŷd GR, ja selle dispersioon, Vdd GR on

Osakogumite kitsendustega hinnang 57 järgmised: Ŷd GR = Ŷd + Y D Ŷi D V ij ( Vdd GR = V dd D V ij V di, i D i D V ) 2 di. Antud metoodika annab võimaluse hinnangute arvutamiseks, kui parameetrite vahel peavad kehtima etteantud seosed. Töös on tõestatud teoreemid üldkogumi ja osakogumite GR-hinnangute kujust ja vastavatest dispersioonidest ja kovariatsioonidest. Tulemused on esitatud kolme tähtsa juhu jaoks: teadaolev üldkogumi kogusumma, samast või mõnest teisest uuringust hinnatud üldkogumi kogusumma, hinnatud ja tinglikult fikseeritud üldkogumi kogusumma. Esialgsete hinnangutena on eeldatud lineaarset ja suhtehinnangut. Tuletatud on ka valemid SI- ja HG-valikudisainide jaoks. Tuletatud GR-hinnangutel on oluline omadus, nad on minimaalse dispersiooniga kõigi teiste samu kitsendusi rahuldavate ja samu esialgseid hinnanguid kasutavate hinnangute hulgas. Osutus, et GR-hinnangu dispersioon (v.a. tingliku GR-hinnangu juht) ei ole suurem esialgse hinnangu dispersioonist. Seega üldjuhul on GRhinnangul mitu head omadust: rahuldab kitsendusi ja on täpsem kui esialgne hinnang. Töös arendatakse diskussiooni, kuidas GRhinnangu analüütilise kuju uurimine võimaldab konstrueerida teisi lihtsamaid (pole vaja teada alghinnangu kovariatsioonimaatriksit), kuid siiski optimaalsele lähedasi hinnanguid. 4. Simuleerimisülesanne Simuleerimiseksperimendi eesmärgiks oli uurida kitsendustega hinnangu käitumist praktikas ja seda, kuidas asümptootilised tulemused töötavad lõpliku valimimahu korral. Selleks moodustati 2000 isikust üldkogum ja võeti 10000 valimit suurusega ligikaudu 200 isikut, kasutades SI- ja HG-valikudisaine. Eksperimentides vaadeldakse kitsendustega hinnangut kolmel erijuhul: teadaolev

58 Kaja Sõstra üldkogumi kogusumma, hinnatud üldkogumi kogusumma ja tinglik kitsendustega hinnang. Simuleerimiseksperiment kinnitas töös saadud teoreetilisi tulemusi. Isegi asümptootilised valemid töötasid hoolimata küllaltki väikesest valimimahust hästi. Eksperiment illustreeris järgmisi aspekte: GR-hinnangud olid nihketa või oli nihe väga väike. GR-hinnangu dispersioon oli väiksem esialgse hinnangu dispersioonist. Suurim suhteline vähenemine oli osakogumis, mille esialgse hinnangu dispersioon oli suurim. Hinnatud kovariatsioonimaatriksi kasutamine GR-hinnangus suurendas vähesel määral hinnangu dispersiooni. Tinglik GR-hinnang oli vähem efektiivne kui sama osakogumi esialgne hinnang. Osakogumite GR-hinnangute korrelatsioon oli tugevam kui vastavatel esialgsetel hinnangutel. Tugev sõltuvus ilmnes isegi juhul, kui esialgsed hinnangud ei olnud korreleeritud. GRhinnangute korrelatsioon oli negatiivne. Tingliku GR-hinnangu korral, kui üldkogumi kogusumma hinnang fikseeritakse, tuleb selle juhuslikkust kindlasti arvestada osakogumi hinnangu dispersiooni valemis, et mitte alahinnata dispersiooni. Lõpetuseks võib öelda, et töös tuletatud summeeruvuskitsendust rahuldavad osakogumite hinnangutel on mitmeid häid omadusi, nad on ühilduvad ja üldiselt täpsemad kui esialgsed hinnangud. Nad on praktikas rakendatavad. Kirjandus [1] EURAREA Consortium with K. Sõstra among the members (2004), Enhancing Small Area Estimation Techniques to meet European Needs (EURAREA project) Final Reference Volume: Vol. 1 3 https://www.statistics.gov.uk/eurarea/default.asp.

Osakogumite kitsendustega hinnang 59 [2] European Commission (2005), European Statistics Code of Practice. http://epp.eurostat.ec.europa.eu/. [3] Knottnerus, P. (2003), Sample Survey Theory. Some Pythagorean Perspectives. New York: Springer. [4] Lehtonen, R., Pahkinen, E. (1995), Practical Methods for Design and Analysis of Complex Surveys. Chichester: Wiley. [5] Sõstra, K. (2004), Comparison of Small Area Estimation Methods: Simulation Study in EURAREA Project. Acta et Commentationes Universitatis Tartuensis de Mathematica, 8, 243 252. [6] Särndal, C.-E., Swensson, B., Wretman, J. (1992), Model Assisted Survey Sampling. New York: Springer-Verlag. [7] Traat, I., Meister, K., Sõstra, K. (2001), Statistical inference in sampling theory. Theory of Stochastic Processes, vol. 7(23), 301 316. [8] Traat, I. (2000), Sampling design as a multivariate distribution. New trends in Probability and Statistics 5, Multivariate Statistics. Vilnius, Utrecht: VSP/TEV, 195 208.