Admeaalüüs molekulaarbioloogias LOMR.10.007 6. loeg Regressiooaalüüs. Regressiooseose tugevus (korrelatsiooikordaja, determatsiooikordaja) Märt Möls martm@ut.ee Kas Argetiias elavad õelikud iimesed? eadmestik: http://worlddatabaseofhappiess.eur.l/ riik õ Cprus 7.3 Greece 6.4 Lebao 5.6 Spai 7.2 Caada 7.6... Argetiiat ei leia? Kas Argetiias elavad õelikud iimesed? eadmestik: http://worlddatabaseofhappiess.eur.l/ riik õ kokaii Cprus 7.3 0.6 Greece 6.4 0.1 Lebao 5.6 0.1 Spai 7.2 3.0 Caada 7.6 2.3... Argetiias kokaiiitarvitajate osakaal rahvastikus (09a admed): 2,6% Küsimusi... Kas kokaiiitarvitajate protsedi abil üldse saab rahva õelikust progoosida? Kui saab, siis millie tuleb progoos Argetiia rahva õelikkuse kohta? Kui täpe o leitud progoos? http://www.guardia.co.uk/ews/datablog/09/ju/24/drugs-trade-drugs 1
Demark Switzerlad Meico Filad Austria Norwa Luembourg Costa Rica Cprus Guatemala Thailad Kuwait Jamaica Idoesia Paama Greece Polad Philippies Croatia South Africa Urugua Estoia Bolivia Lebao Zambia Portugal Romaia Hugar Turke Morocco Latvia Armeia Albaia Ukraie Macedoia, FYR Bulgaria Belarus Caada Spai Kumb o parem sirge? 2
ε i ε 2 i = 44.2 Millie sirge o kõigist sirgetest parim? ε i ε 2 i = 44.2 2 ε i = 42.4 ε i ε 2 i = 44.2 2 ε i = 42.4 2 ε i = 39.3 =c 0 + c 1 =c 0 + c 1 +ε õ= c 0 + c 1 kokaii+ε õ=5.81+ 0.835kokaii+ε 3
õ=5.81+ 0.835kokaii+ε 0,835 õ=5.81+ 0.835kokaii+ε Vabaliige (Itercept) Sirge tõus (Slope) elikkuse progoos Argetiia jaoks Kui täpselt me teame parimat sirget? 7,98 õ=5.81+ 0.835kokaii+ε õ= 5.81+ 0.835*2.6+ε Usaldusitervall (Cofidece Iterval) regressiooisirgele 95% poitwise cofidece iterval 4
Kui täpe o meie progoos? Kas kokaiiitarbijate protsedi teadmisest O progoosimisel üldse migit abi? Progoosiitervall (Predictio Iterval) H 0 : c 1 =0 H 1 : c 1 0 Regressiooaalüüs R is > mudel=lm(o~kokaii) > summar(mudel) Residuals: Mi 1Q Media 3Q Ma -1.9150-0.6562-0.2974 0.9938 1.7510 Kas c0 võib olla 0? Coefficiets: Estimate Std. Error t value Pr(> t ) (Itercept) 5.8139 0.2278 25.524 < 2e-16 *** kokaii 0.8351 0.2697 3.096 0.00373 ** Residual stadard error: 1.031 o 37 degrees of freedom Kas c1 võib olla 0? Multiple R-squared: 0.57, Adjusted R-squared: 0.1843 F-statistic: 9.584 o 1 ad 37 DF, p-value: 0.003731 > predict(mudel, data.frame(kokaii=2.6)) 1 7.985145 > predict(mudel, data.frame(kokaii=2.6), iterval="cofidece") fit lwr upr 1 7.985145 6.832635 9.137655 > predict(mudel, data.frame(kokaii=2.6), iterval="predictio") fit lwr upr 1 7.985145 5.599986 10.3703 Usaldusitervall Progoosiitervall Argetiilaste õe suurus tegelikult: 7,5 5
Seose tugevuse iseloomustamie Mõikord o üht tuust teades võimalik väga suure täpsusega ära arvata teise tuuse värtust, teiekord mitte. Kuidas mõõta seose tugevust? 50 60 70 Tugev seos 10 15 25 50 60 70 Nõrk seos 10 15 25 Determiatsiooikordaja R DY D = DY 2 ε Kui suure osa uuritava tuuse hajuvusest suutis meie mudel ära kirjeldada Soovi korral võib esitada protsetides (kui korrutad läbi 100%-ga) 0 5 10 15 25 DY=0.8 De=0.01 R2 = 0.99 = 10+ 2*+ε 0 5 10 15 25 DY=5.8 De=5 R 2 = 0.14 = 10+ 2*+ε 4 5 4 5 6
0 5 10 15 25 DY=.8 De= R 2 = 0.03 = 10+ 2*+ε 4 5 Lieaare korrelatsiooikordaja Pearsoi korrelatsiooikordaja Kui tuuste X ja Y vahel o lieaare fuktsioaale seos Y=a+bX (ehk täpe lieaare seos), siis o korrelatsiooikordaja väärtus kas 1 või -1 vastavalt kordaja b märgile. Kui r>0, siis ühe tuuse suureedes keskmiselt teie tuus kasvab ja vastupidi - ühe väheedes väheeb ka teie. Kui r<0, siis ühe tuuse väärtuste suureedes keskmiselt teise tuuse väärtused kahaevad ja vastupidi - ühe kahaedes teie kasvab. Kui tuused o lieaarselt sõltumatud (tuuste vahel võib aga olla mittelieaare sõltuvus), siis o korrelatsiooikordaja ull r = 0. Lieaare korrelatsiooikordaja Pearsoi korrelatsiooikordaja Korrelatsiooikordaja ruut r 2 ehk determiatsiooikordaja R 2 äitab, kui suur osa ühe tuuse hajuvusest (dispersiooist) o kirjeldatud teise poolt. Mida suurem o korrelatsiooikordaja absoluutväärtus, seda tugevam o korrelatiive seos tuuste vahel. Mõõtühiku (lieaare) vahetus ei muuda korrelatsiooikordaja suurust (Korrelatsiooikordaja ei muutu, kui mõõdame temperatuuri Celsiuse kraadide C o asemel Fareheitides F o, samuti võime pikkust mõõta setimeetrites või meetrites- korrelatsiooikordaja jääb samaks). O 60 80 100 1 1 160 180 cor = -0.37 50 60 70 80 Vaus 7
Y 7 80 70 6 60 5 50 4 3 70 80 90 100 110 1 1 01 10 100 90 80 70 60 50 10 0-10 - 10-4 9 10 11 12 13 14 15 0 10 X 50 10 0-10 480 470 460 450 4 4 4 410 0 390 380 370 360 350 3 3 3 310 0 9 90 80 70 8 60 50 7 6 10 0-10 5 - - - 4-50 7 8 9 10 11 12 13 4 5 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 - -10 0 10 e progoos kokaiiitarbimise järgi kokaiiitarbimise progoos õelikkuse järgi 8