Microsoft PowerPoint - loeng2.pptx

Seotud dokumendid
AMB_Loeng1_andmed_a

Praks 1

Statistikatarkvara

raamat5_2013.pdf

VL1_praks2_2009s

Praks 1

Mida me teame? Margus Niitsoo

10/12/2018 Riigieksamite statistika 2017 Riigieksamite statistika 2017 Selgitused N - eksaminandide arv; Keskmine - tulemuste aritmeetiline keskmine (

Kodutöö Töö eesmärk: Antud töö eesmärgiks on analüüsida vabalt valitud andmestikust leiduvat infot ning luua antud teema kohta ülesandeid, mille lahen

ANOVA Ühefaktoriline dispersioonanalüüs Treeningu sagedus nädalas Kaal FAKTOR UURITAV TUNNUS Mitmemõõtmeline statistika Kairi Osula 2017/kevad

Praks 1

Tartu Ülikool Matemaatika-informaatikateaduskond Matemaatilise statistika instituut Võrgupeo külastaja uurimine Andmeanalüüs I projekt Koostajad: Urma

Matemaatilised meetodid loodusteadustes. I Kontrolltöö I järeltöö I variant 1. On antud neli vektorit: a = (2; 1; 0), b = ( 2; 1; 2), c = (1; 0; 2), d

DVD_8_Klasteranalüüs

VL1_praks6_2010k

Regressioonanalüüsi kodutöö Indrek Zolk 30. mai a. 1 Andmestiku kirjeldus Käesoleva kodutöö jaoks vajalik andmestik on saadud veebiaadressilt ht

Microsoft PowerPoint - Loeng2www.ppt [Compatibility Mode]

Sügis 2018 Kõrgema matemaatika 2. kontrolltöö tagasiside Üle 20 punkti kogus tervelt viis üliõpilast: Robert Johannes Sarap, Enely Ernits, August Luur

Excel Valemite koostamine (HARJUTUS 3) Selles peatükis vaatame millistest osadest koosnevad valemid ning kuidas panna need Excelis kirja nii, et

Majandus- ja kommunikatsiooniministri 10. aprill a määrus nr 26 Avaliku konkursi läbiviimise kord, nõuded ja tingimused sageduslubade andmiseks

Kirjeldav_statistika_pdfiks

Statistiline andmetöötlus

19. Marek Kolk, Kõrgem matemaatika, Tartu Ülikool, Arvridade koonduvustunnused Sisukord 19 Arvridade koonduvustunnused Vahelduvat

Microsoft Word - Toetuste veebikaardi juhend

6. KLASSI MATEMAATIKA E-TASEMETÖÖ ERISTUSKIRI Alus: haridus- ja teadusministri määrus nr 54, vastu võetud 15. detsembril E-TASEMETÖÖ EESMÄRK Tas

IMO 2000 Eesti võistkonna valikvõistlus Tartus, aprillil a. Ülesannete lahendused Esimene päev 1. Olgu vaadeldavad arvud a 1, a 2, a 3,

(Microsoft PowerPoint - Juhtr\374hma kohtumine detsember 2015.pptx [Read-Only])

(10. kl. I kursus, Teisendamine, kiirusega, kesk.kiirusega \374lesanded)

Tallinna Tehnikakõrgkooli teadustegevuse kajastus Eesti Teadusinfosüsteemi andmebaasis Agu Eensaar, füüsika-matemaatikakandidaat Eesti Teadusinfosüste

Microsoft PowerPoint - Roosimaa.ppt

Microsoft PowerPoint - KESTA seminar 2013

Present enesejuhtimine lühi

Polünoomi juured Juure definitsioon ja Bézout teoreem Vaadelgem polünoomi kus K on mingi korpus. f = a 0 x n + a 1 x n a n 1 x

Microsoft Word - Praks1.doc

3D mänguarenduse kursus (MTAT ) Loeng 3 Jaanus Uri 2013

Matemaatiline analüüs IV 1 3. Mitme muutuja funktsioonide diferentseerimine 1. Mitme muutuja funktsiooni osatuletised Üleminekul ühe muutuja funktsioo

Andmed arvuti mälus Bitid ja baidid

DK_prax3_2010

Word Pro - diskmatTUND.lwp

Microsoft PowerPoint - Kliiniliste auditite kogemused [Read-Only] [Compatibility Mode]

Projekt Kõik võib olla muusika

II lisa Ravimi omaduste kokkuvõtte ja pakendi infolehe muudatused, esitatud Euroopa Ravimiameti poolt Käesolev ravimi omaduste kokkuvõte ja pakendi in

Matemaatika ainekava 8.klass 4 tundi nädalas, kokku 140 tundi Kuu Õpitulemus Õppesisu Algebra (65 t.) Geomeetria (60 t.) Ajavaru kordamiseks (15 õppet

lvk04lah.dvi

Relatsiooniline andmebaaside teooria II. 6. Loeng

Slide 1

efo03v2pkl.dvi

Programmeerimiskeel APL Raivo Laanemets 17. mai a.

FIDE reitingumäärus 1. juuli 2014 Kuremaa, Marek Kolk

(Tõrked ja töökindlus \(2\))

1

VÄHEMA EEST ROHKEM...IGA PÄEV Riided, millesse armud, hindadega, mis sulle meeldivad Pakkumised kehtivad KAUPA ON PIIRATUD KOGUSES. ku

IDA-TALLINNA KESKHAIGLA Statsionaarsete patsientide rahulolu uuring

HCB_hinnakiri2017_kodukale

HWU_AccountingAdvanced_October2006_EST

Avatud ja läbipaistev e-riik: Ees6 kui rajaleidja Andrus Kaarelson RIA peadirektori asetäitja riigi infosüsteemi alal 10. oktoober 2017

Tartu Ülikool Loodus- ja tehnoloogiateaduskond Ökoloogia ja Maateaduse instituut Geograafia osakond Lõputöö Inimeste ruumilise käitumise sõltuvus eluk

Tartu Ülikool Matemaatika-informaatikateaduskond Matemaatilise statistika instituut Ann-Mari Koppel Determinatsioonikordaja ja prognoosikordaja Bakala

KITSAS JA LAI MATEMAATIKA Matemaatikapädevus Matemaatikapädevus tähendab matemaatiliste mõistete ja seoste süsteemset tundmist, samuti suutlikkust kas

DIGITAALTEHNIKA DIGITAALTEHNIKA Arvusüsteemid Kümnendsüsteem Kahendsüsteem Kaheksandsüsteem Kuueteistkü

Microsoft Word - 08.doc

PÄRNU TÄISKASVANUTE GÜMNAASIUM ESITLUSE KOOSTAMISE JUHEND Pärnu 2019

Word Pro - digiTUNDkaug.lwp

TALLINNA PAE GÜMNAASIUMI AINEKAVAD GÜMNAASIUM AINEVALDKOND: MATEMAATIKA

Image segmentation

prakt8.dvi

Ppt [Read-Only]

EESTI RAHVASTIK RAHVALOENDUST...

Microsoft Word - Ettevotjatulu_2016 kodukale.doc

tallinn arvudes 2003.indd

Microsoft PowerPoint - e-maits08_aruanne.pptx

A Peet Üldiseid fakte diabeedi tekkemehhanismide kohta \(sealhulgas lühiülevaade

2. tüüpi diabeedi ravijuhise täitmise automaatse hindamise võimalikkuse analüüs Digiloo epikriiside mõõteandmete näitel

Microsoft PowerPoint - Loodusteaduslik uurimismeetod.ppt

Võistlusülesanne Vastutuulelaev Finaal

Hoia oma arvuti turvaline ja kiire 1.Leia start nupust alustades Juhtpaneel 2.Juhtpaneeli aadressiribalt leia Kõik juhtpaneeli üksused 3.Avanenud tööa

Läkaköha toksiini vastaste IgG tüüpi antikehade tase läkaköhaga patsientide hulgas ning kolme aasta jooksul pärast haiguse põdemist

Eesti koolinoorte LIII matemaatikaolümpiaad 28. jaanuar 2006 Piirkonnavoor Hindamisjuhised Lp hindaja! 1. Juhime Teie tähelepanu sellele, et alljärgne

Institutsioonide usaldusväärsuse uuring

SQL

ÕPILASTE TEHNOLOOGILISTE TEADMISTE VÕRDLEV UURING SOOMES JA EESTIS KASSARI PUHKEKESKUS Mart Soobik, Phd 12. juuni 2017

TARTU ÜLIKOOL MATEMAATIKA-INFORMAATIKATEADUSKOND MATEMAATILISE STATISTIKA INSTITUUT Kristi Läll Mitmemõõtmeline analüüs peptiidide käitumise uurimisek

XV kursus

PowerPoint Presentation

2016 aasta märtsi tulumaksu laekumine omavalitsustele See ei olnud ette arvatav Tõesti ei olnud, seda pole juhtunud juba tükk aega. Graafikult näeme,

Lisa 2 Maanteeameti peadirektori käskkirjale nr 0250 Kattega riigimaanteede taastusremondi objektide valikumetoodika Maanteeamet Tallinn 20

Tartu Ülikool Loodus- ja tehnoloogiateaduskond Ökoloogia ja Maateaduste Instituut Geograafia osakond Bakalaureusetöö loodusgeograafia Merejää paksuse

Maksu- ja Tolliamet MAKSUKOHUSTUSLANE Vorm KMD INF Nimi Registri- või isikukood A-osa ANDMED VÄLJASTATUD ARVETE KOHTA. Esitatakse koos käibedeklaratsi

KUUM! OTSI POEST ja heade hindadega! 2 49 DRESSIPLUUS tüdrukutele, värvilise kirjaga, suurused: cm DRESSIPLUUS poistele, kirja ja pealetrükiga

Euroopa Liidu Nõukogu Brüssel, 24. september 2015 (OR. en) 12353/15 ADD 2 ENV 586 ENT 199 MI 583 SAATEMÄRKUSED Saatja: Kättesaamise kuupäev: Saaja: Eu

EESTI VUTI MUNAJÕUDLUSNÄITAJATE VAHELISTEST SEOSTEST

Kontrollijate kommentaarid a. matemaatikaolümpiaadi piirkonnavooru tööde kohta Kokkuvõtteks Ka tänavu püüdsime klasside esimesed 2 ülesa

HCB_hinnakiri2018_kodukale

Microsoft Word - RM_ _17lisa2.rtf

Põllumajandusliku tegevusega alustava noore ettevõtja toetus, rakendamistulemuste analüüs, VII taotlusvoor

Pärnu Spordikooli nelja ala mitmevõistlus 2018 Pärnu, Event 1 Women, 50m Butterfly Open Results Points: FINA 2015 Rank YB T

Sotsiaalministeerium, 2019 PIAAC Eesti andmestiku analüüsi lühiülevaade hariduslikust ülejäägist kõrgharitute hulgas 1. Taust Probleem: erinevate andm

Väljavõte:

Kirjeldavad statistikud ja graafikud pidevatele tunnustele Krista Fischer

Pidevad tunnused ja nende kirjeldamine Pidevaid (tihti ka diskreetseid) tunnuseid iseloomustatakse tavaliselt kirjeldavate statistikute abil, nt keskmine (mean) ja standardhälve (standard deviation, SD). Graafikutest on tihti sobivaim histogramm. Histogram of weight females Histogram of weight males Frequency 0 1000 2000 3000 4000 Frequency 0 2000 4000 6000 8000 50 100 150 200 weight (kg) 50 100 150 weight (kg)

Veidi keerulisemad histogrammid

.Ja veel.(populatsioonipüramiid) 15000 10000 5000 0 5000 10000 15000 Age 85+ EGCUT males 80 75 70 65 60 55 50 45 40 35 30 25 20 18 Estonian population by age group (01.01.2008) EGCUT females Estonian population 700 500 300 100 100 300 500 700 No of gene donors by age group

Kirjeldavad statistikud Weight (mean, SD) Height (mean, SD) Men 84,4 (15,8) 178,5 (7,3) Women 71,3 (15,4) 164,7 (6,6) Mean (average): keskmine, keskväärtus Standard deviation: standardhälve Standardhälve (SD) iseloomustab keskmist kaugust keskmisest 95% valimist asub vahemikus keskmine ± 2x SD

Examples of data summaries: Estonian Biobank N=9,842 FINRISK 1997 N=7,503 Women no. (%) 6,334 (64%) 3,741 (50%) Age years (range) 45.3 (18 103) 48.4 (24 74) Body mass index (kg/m 2 ) 26.5±5.5 26.7±4.5 Systolic blood pressure (mmhg) 126±17 136±20 Current smokers no. (%) 2,963 (30%) 1,770 (24%) Use of antihypertensive therapy no. (%) 2,489 (25%) 1,009 (13%) Prevalent diabetes no. (%) 737 (7.5%) 437 (5.8%) (shortened) Fischer et al. PlosMed 2014

Astakutel põhinevad statistikud: mediaan ja kvantiilid Kui andmed (arvulise tunnuse väärtused) sorteerida väiksemast suuremani, siis iga vaatluse järjekorranumbrit nimetatakse selle vaatluse astakuks (rank). Näide 11 isiku pikkused (cm): 155, 160, 171, 182, 162, 153, 190, 167, 168, 165, 191. Järjestatud andmed: 153 155 160 162 165 167 168 170 171 182 191 Mediaan on järjestatud valimi keskpunkt kas keskmise vaatluse väärtus (paarituarvulise valimisuuruse korral) või kahe keskmise vaatluse keskmine (paarisarvulise korral). 50% valimist on mediaanist suurem, 50% väiksem.

Miks eelistada keskmisele mediaani? Näide 11 hiire eluiga päevades: 5 9 10 12 12 14 23 25 28 28 29 Ülejäänud 4 hiirt olid 30 päeva kestnud uuringu lõpus veel elus. Kuidas neid andmeid esitada? Keskmist ei saa arvutada, kuid andmed saab kirja panna nii: 5 9 10 12 12 14 23 25 28 28 29 30+ 30+ 30+ 30+ Elukestuse mediaan on 25 päeva Mediaani nimetatakse robustseks statistikuks, sest ta ei ole tundlik andmetes esinevate erandlikult suurte või väikeste väärtuste suhtes.

Karpdiagramm BMI 20 30 40 50 60 Mediaan jagab andmestiku kaheks võrdseks osaks, kvartiilid (quartiles) jagavad neljaks mediaan on keskmine kvartiil. Ülemine kvartiil (75%) mediaan (50%) 0 1 2 Alumine kvartiil(25%) FTO risk alleles

Aga näiteks siin on keskmine parem kui mediaan (TÜ EGV: kohvi tarbimine vastavalt vanusele ja liitumise ajale): Period 1: 2002-2005; Period 2: 2007-2008; Period 3: 2009-2010 Cups of coffee per day

Teised kvantiilid (quantiles) k% kvantiil Q k on defineeritud nii, et k% andmetest on väiksemad ja (100-k)% suuremad kui Q k 10%, 20%,...,90% kvantiilid jagavad valimi 10 detsiiliks 20%, 40%, 60%, 80% kvantiilid jagavad valimi 5 kvintiiliks

Näide: geneetilise riskiskoori kvantiilid T2D prevalence in individuals aged 45-80 25% 20% 15% 10% Below-median (<50%) genetic risk Above-median (50-90%) genetic risk Highest decile (>90%) of the genetic risk 134 52 119 198 84 116 154 47 5% 0% 80 24 27 5 BMI <25 BMI 25..30 BMI 30..35 BMI >35 (n=1810) (n=2020) (n=1337) (n=685)

Logaritmiline teisendus ja geomeetriline keskmine Kasutatakse siis, kui suhtelised erinevused on mõttekamad kui absoluutsed (väga tihti erinevate ainete kontsentratsiooni puhul mingites proovides, samuti geeniekspressiooni korral). Nt väärtused 10, 10000, 300, 20, 1000 Geomeetriline keskmine on defineeritud kui n-s juur vaatluste korrutisest tavaliselt kasutatakse selle arvutamiseks logaritmimist

Geomeetrilise keskmine arvutamine: Leia logaritmitud tunnuse aritmeetiline keskmine Teisenda keskmine tagasi originaalskaalasse, kasutades astendamist (eksponenti) Oletame, et mingi aine kontsentratsioonid 4 inimese veres on 1, 10, 100 ja 1000. Aritmeetiline keskmine on 1111/4 = 277.5. Kümnenlogaritmid (log10) neist väärtustest on 0, 1, 2 ja 3 ning nende keskmine (0+1+2+3)/4 =1.5. Geomeetriline keskmine on 10 1.5 = 31.6

Pole tähtsust, millist logaritmini kasutada ka naturaallogaritm (ln) annab sama tulemuse: Mean: Geometric mean:

R funktsioonid hist(x) - tunnuse x histogramm mean(x) - keskmine sd(x) - standardhälve median(x) - mediaan quantile(x, p= ) - kvantiil, asemele arv 0-st 1-ni boxplot(x) - karpdiagramm boxplot(x~g) - karpdiagramm gruppide kaupa

Kokkuvõte Enne statistilise analüüsi juurde asumist, on kasulik andmeid visualiseerida ja kirjeldavaid statistikuid leida lisaks esmase ülevaate saamisele saab nii leida ka andmetes esinevaid vigu Kirjeldavate kokkuvõtete tegemine andmetest võib olla sama aeganõudev kui keerukam statistiline analüüs