Uudiseid k-meride abil bakterite leidmisest [Compatibility Mode]

Seotud dokumendid
(Microsoft Word - Des. k\344tepuhastusvahu tehniline ohukaart.doc)

(Microsoft PowerPoint - seminar_6_n\365uded-ainemudel tagasiside.ppt [Compatibility Mode])

raamat5_2013.pdf

Loeng03

PowerPoint Presentation

1 / loeng Tekstitöötlus Sisend/väljund Teksti lugemine Sõnad

Tartu Ülikool


(10. kl. I kursus, Teisendamine, kiirusega, kesk.kiirusega \374lesanded)

Microsoft PowerPoint - Vere bakterioloogilised külvid.ppt [Compatibility Mode]

PowerPoint Presentation

SAF 7 demo paigaldus. 1.Eeldused SAF 7 demo vajab 32- või 64-bitist Windows 7, Window 8, Windows 10, Windows Server 2008 R2, Windows Server 2012, Wind

GRUPI-SMS Veebirakenduse kasutamise juhend Rakendus Elisa grupi-smsi rakendus Väljaandja Elisa Eesti AS Juhendi koostamise kuupäev Versioon

Microsoft Word - estiskmappe udenbilleder

Hoia oma arvuti turvaline ja kiire 1.Leia start nupust alustades Juhtpaneel 2.Juhtpaneeli aadressiribalt leia Kõik juhtpaneeli üksused 3.Avanenud tööa

Õppimine Anne Villems, Margus Niitsoo ja Konstantin Tretjakov

loeng2

Õppematerjalide esitamine Moodle is (alustajatele) seminar sarjas Lõunatund e-õppega 12. septembril 2017 õppedisainerid Ly Sõõrd (LT valdkond) ja Dian

Euroopa Liidu L 215 Teataja Eestikeelne väljaanne Õigusaktid 61. aastakäik 23. august 2018 Sisukord III Muud aktid EUROOPA MAJANDUSPIIRKOND EMP ühisko

Monitooring

Kom igang med Scratch

P2P süsteemid

B120_10 estonian.cdr

Tartu Kutsehariduskeskus IKT osakond Merlis Karja-Kännaste ASUTUSE DOKUMENDIREGISTRI AVALIK VAADE Analüüs Juhendaja Mirjam-Merike Sõmer Tartu 2015

DE_loeng5

Microsoft Word - essee_CVE ___KASVANDIK_MARKKO.docx

Programmi AnimatorDV Simple+ lühike kasutajajuhend

Linux süsteemi administreerimine

Estonian_TBW-106UB(V1).cdr

CPA4164 USB 2.0 kõrgekvaliteediline videoadapter KASUTUSJUHEND 1. PEATÜKK - Ülevaade 1.1 Tutvustus CPA4164 USB 2.0 videoadapter võimaldab teil arvutis

Infektsioonide profülaktika ja ravi siirdatud haigetel

(Microsoft Word - Purgatsi j\344rve supluskoha suplusvee profiil l\374hike)

Mida räägivad logid programmeerimisülesande lahendamise kohta? Heidi Meier

View PDF

Tiia Salm 2011 Online kirjastus CALAMÉO Calameo kujutab endast on-line kirjastust, mis võimaldab oma dokumente avaldada e-raamatuna tasuta. Failid (Pd

Elisa Ring Elisa Ringi mobiilirakendus Versioon

ELAMUD, SAUNAD, SUVILAD Norra puitmaja kvaliteet Eestis

Taskuprinter KASUTUSJUHEND

Microsoft Word - Document in Unnamed

Sügis 2018 Kõrgema matemaatika 2. kontrolltöö tagasiside Üle 20 punkti kogus tervelt viis üliõpilast: Robert Johannes Sarap, Enely Ernits, August Luur

Pealkiri on selline

Microsoft Word - TallinnLV_lihtsustatud_manual_asutuse_juhataja_ doc

Microsoft Word - installation-guide.doc

VaadePõllult_16.02

Eesti kõrgusmudel

Microsoft Word - Karu 15 TERMO nr 527.doc

vv05lah.dvi

(Microsoft Word - T\366\366leht m\365isaprogramm algklassilastele tr\374kk 2.doc)

Microsoft Word - RE_LABMB_7_2.docx

(Microsoft Word - T\366\366leht m\365isaprogramm 4-6 kl tr\374kkimiseks.doc)

A Peet Üldiseid fakte diabeedi tekkemehhanismide kohta \(sealhulgas lühiülevaade

Pealkiri

EDL Liiga reeglid 1. ÜLDSÄTTED 1.1. EDL Liiga toimub individuaalse arvestuse alusel, kus mängijad on jagatud hooaja EDL Liiga tulemuste põhj

TUNNUSTATUD TURVALAHENDUS Esitaja: G4S Eesti AS, Alarmtec AS Automaatse numbrituvastussüsteemi paigaldamine keelatud piirikaubanduse vastu võitlemisek

Microsoft PowerPoint - loeng.ppt

Infix Operaatorid I Infix operaatorid (näiteks +) ja tüübid (näiteks ->) kirjutatakse argumentide vahele, mitte argumentide ette. Näiteks: 5 + 2, 2*pi

Dr Maire Kuddu - Keda ohustab pea ja kaelapiirkonna vähk

Dias nummer 1

Microsoft PowerPoint - Keskkonnamoju_rus.ppt

Microsoft PowerPoint - Lisa 5 koolituse materjalid

Müük (Microsoft Dynamics AX (Axapta) tarkvara) Paigaldusjuhend bifree.ee qlik.com

IFI6083_Algoritmid_ja_andmestruktuurid_IF_3

Tallinna Järveotsa Lasteaed Peokava Tere, Vastlapäev! Autor: Olga Carjova, Tallinna Järveotsa Lasteaia muusikaõpetaja 1 Tallinn, a. Tallinna Jär

Microsoft Word - Toetuste veebikaardi juhend

ITI Loogika arvutiteaduses

PowerPoint Presentation

Slide 1

MS Word Sisukord Uue dokumendi loomine... 2 Dokumendi salvestamine... 3 Faili nimi... 4 Teksti sisestamine... 6 Klaviatuuril mitteleiduvat sümbolite l

Itella Estonia OÜ Uuendatud EXPRESS BUSINESS DAY BALTICS PAKKIDE JA ALUSTE TRANSPORT Express Business Day Baltics paki lubatud maksimaalsed

Veebipõhised andmebaasid ja otsi(ngu)mootorid Internet on Oluline, peagi peamine andmeallikas! 2/3 Eesti aktiivsest elanikkonnast kasutab;! 90% arvuti

PowerPoint Presentation

ANOVA Ühefaktoriline dispersioonanalüüs Treeningu sagedus nädalas Kaal FAKTOR UURITAV TUNNUS Mitmemõõtmeline statistika Kairi Osula 2017/kevad

EBSCO täistekstiandmebaaside kasutamine Otsingu sooritamiseks: 1. Logi sisse 2. Vali EBSCOhost Web 3. Seejärel vali andmebaas, milles soovid otsingut

I klassi õlipüüdur kasutusjuhend

G OSA A VARIANT RESPONDENDILE ISE TÄITMISEKS

1. AKE Ajalise keerukuse empiiriline hindamine

M16 Final Decision_Recalculation of MTR for EMT

Slide 1

FIDE reitingumäärus 1. juuli 2014 Kuremaa, Marek Kolk

Kasutusjuhend Dragon Winch vintsile DWM, DWH, DWT seeria Sisukord Üldised ohutusnõuded... 3 Vintsimise ohutusnõuded... 3 Kasulik teada... 4 Vintsimise

Õppeprogramm „vesi-hoiame ja austame seda, mis meil on“

Microsoft PowerPoint - Ettekanne_3Dprojekt_ESTGIS.ppt [Compatibility Mode]

EID TARKVARA (v.1812 baasil)

Microsoft PowerPoint - geodb_090507v1.ppt [Read-Only] [Compatibility Mode]

Juhend nutiterminali seadistamiseks ja kaardimaksete vastuvõtmiseks Ingenico Link/2500 ja icmp

ATAP4_töökava

MTAT Operatsioonisüsteemid - Turvalisus

Microsoft PowerPoint - Loodusteaduslik uurimismeetod.ppt

Failiotsing: find paljude võimalustega otsingukäsk find kataloog tingimused kataloog - otsitakse sellest kataloogist ja tema alamkataloogidest tingimu

3D mänguarenduse kursus (MTAT ) Loeng 3 Jaanus Uri 2013

Microsoft PowerPoint - loeng2.pptx

MTAT Operatsioonisüsteemid - Turvalisus

Andmed arvuti mälus Bitid ja baidid

AASTAARUANNE

kaubamärgikaitsmineEkke [Kirjutuskaitstud] [Ühilduvusrežiim]

Microsoft PowerPoint - Eurotoetused esitlus 2010.ppt

2016 aasta märtsi tulumaksu laekumine omavalitsustele See ei olnud ette arvatav Tõesti ei olnud, seda pole juhtunud juba tükk aega. Graafikult näeme,

Microsoft Word - VG loodus

Mining Meaningful Patterns

Väljavõte:

Uudiseid k-meride abil bakterite leidmisest CLARK: fast and accurate classification of metagenomic and genomic sequences using discriminative k-mers(2015) Rachid Ounit, Steve Wanamaker, Timothy J. Close and Stefano Lonardi Ja CoMeta: Classification of Metagenomes Using k-mers(2015) Jolanta Kawulok and Sebastian Deorowicz Bioinformaatika ajakirjaklubi 8. Oktoober 2015 Märt Roosaare

CLARK CLAssifier based on Reduced K-mers Määrab iga lugemi eraldi (nagu Kraken) Suur töökiirus väidetavalt kiirem kui Kraken Suudab määrata viiruseid, baktereid ja ilmselt ka muud (olenevalt andmebaasi ülesehitusest), aga mõeldud eelkõige bakterite detekteerimiseks Mõeldud töötama eelkõige liigi/perekonna tasemel (tase tuleb ise määrata alguses) Ei kasuta juhtpuud määramisprotsessis

CLARK -andmebaas Võimalik kasutajal ise luua, defineerides eraldi iga märklaua ning nende jaotuse mingi kindla taksonoomia piires Andmebaasi ei saa alla laadida, ehitatakse algul üles (2700+ RefSeq bakterit üle 8h) Igast märklauast tehakse k-meride list ja iga k-meri kohta märgitakse märklauad, kus nad esinevad ning esinemiste arv Viimase sammuna visatakse minema kõik k-merid mis esinevad rohkem kui ühes märklauas

CLARK -märklauad /storage8/bakter1.fasta bacillus /storage8/bakter2.fasta bacillus /storage8/bakter3.fasta clostridium /storage8/bakter4.fasta bacillus /storage8/bakter5.fasta clostridium /storage8/bakter6.fasta bacillus.txt fail kus on FASTA aadress ning kasutaja poolt määratud taksonoomiline klass (ei ole NCBI taksonoomiast sõltuv) Automaatselt ehitatakse andmebaas mitte taksonite nimede, vaid ID-numbritega

CLARK -tööpõhimõte 1. Sisse antud lugemid tehakse k-merideks 2. Otsitakse kõik k-merid lugemist, mis esinevad andmebaasis 3. Lugem määratakse sellele taksonile, mille k-mere esineb kõige rohkem, juhtpuud ei kasutata ning seega saab määrata ainult üht taksonoomilist taset 4. Määramisele antakse ka usaldusväärtus, valemiga: conf = h 1 /(h 1 +h 2 ) h = k-meri esinemise arv

CLARK erinevad variandid 1. CLARK L (light) analüüsib vaid osa k-meeridest(iga 27- meri kohta jäetakse 4 järgmist mitte ülekattuvat vahele) 2. CLARK e (express) analüüsitakse samuti vähendatud hulka k-mere(ainult mitte ülekattuvad) ning määramine tehakse esimese k-meri järgi mis andmebaasist vaste saab 3. CLARK põhiprogramm kiirendatud kujul kui üks andmebaasis olev organism on rohkem kui poolte võimalike k-meridegamatchisaanud määratakse kohe ja lõpetatakse edasine analüüs CLARK-L ja CLARK-e väga sarnane minikrakenile

CLARK võrdlus NBC ja Krakeniga CLARK on tundlikum ja kiirem kui Kraken. NBC jääb mängust välja, sest on liiga aeglane praktiliselt ei ole võimalik kasutada

CLARK võrdlus ja tulemused 1. Raske aru saada, mis andmebaasiga Krakenit kasutati (default andmebaasis on ka arhed ja viirused) kas andmebaasid on võrdsed? 2. Kui k-meride pikkused on samad, siis peaks CLARK ja Kraken saama liigi kohta (Kraken liigi ja alamate taksonite) sama palju k-mere kuidas saab Krakeni juhtpuu abil määramine anda halvema tulemuse kui CLARKi ilma juhtpuuta? 3. Krakeni tulemused erinevad üsnagi palju sõltuvalt kasutajast (vähemalt järgmise artikli andmetes) 4. CLARK tundub vägagi nagu Krakeni lihtsustatud variant, mis ei näita head terviklikku pilti (paljusid lugemeid ei suudeta ilmselt määrata liigi tasemel ja CLARK jätab need määramata, mõjutades seega üldpilti, kui kasutajat huvitab proovi koostis) 5. Andmebaas väga hästi seadistatav, võib olla nii kasulik (erinevad uued rakendused resistentsusgeenide otsimine) kui kahjulik (suurt bakterite andmebaasi keerulisem teha)

CLARK praktiline kasutamine 1. Väga hea lihtne alla laadida ja installida 2. Skriptid andmebaasi ja taksonoomia ehitamiseksallatõmbamiseks NCBI andmebaasidest programm ei leia neid hiljem üles ja tõmbab uuesti 3. Väljund.csv formaadis iga lugemi kohta, edasine küljendamine on keeruline (ei saanud täpselt aru), tõenäoliselt lihtsam ise skript kirjutada 4. Väljundist ei ole automaatselt aru saada, mis organismidega tegu (ainult NCBI tax ID numbrid)

CLARK testimine MAMBA-s Sisendiks 12,3 Gbp lugemeid 10-st eri bakteriliigist: Chromobacterium violaceum ATCC 12472 (gb: AE016825.1), Corynebacterium glutamicum ATCC 13032 (gb: BA000036.3), Escherichia coli ATCC 8739 (gb: CP000946.1), Escherichia coli W (gb: CP002185.1), Klebsiella pneumoniae KCTC 2242 (gb: CP002910.1), Polaromonas naphthalenivorans CJ2 (gb: CP000529.1), Pseudomonas stutzeri ATCC 17588 (gb: CP002881.1), Roseobacter denitrificans OCh 114 (gb: CP000362.1), and Staphylococcus epidermidis ATCC 12228 (gb: AE015929.1) Faili analüüsimise ajad: 1.StrainSeeker 41 minutit (tänu vähesele liikide hulgale vaja vähe puu harusid läbida) 2.Kraken 1h 42min 3.CLARK 1h 40m Krakeni ja StrainSeekeri tulemused ühtisid suurel määral, CLARKi tulemusi ei saanud mõistlikult analüüsida, aga ilmselt sarnased Kui vaid ühe taseme järgi määrata, siis iga lugem, kus esineb lähedase tüve k-mer vea tõttu, määratakse valesti (ja neid on päris palju eriti suures proovis)

CoMeta Classification of Metagenomes Määrab iga lugemi eraldi (nagu Kraken) Töökiirus kordades aeglasem kui Krakenil Suudab määrata viiruseid, baktereid ja ilmselt ka muud (olenevalt andmebaasi ülesehitusest), aga mõeldud eelkõige bakterite detekteerimiseks Kasutab juhtpuud määramisprotsessis, kuid määrab iteratiivselt (kõigepealt hõimkond ja edasi järjest täpsemaks)

CoMeta -uuendused Olulisim uuendus iga lugemi skoorimine Skoorimiselei loeta mitte k-meridearvu, mis leitakse andmebaasist, vaid mittekattuvate nukleotiidide arvu k-merides, mis andmebaasis vaste annavad

CoMeta võrdlus (täpsus ja tundlikkus)

CoMeta võrdlus (kiirus ja RAM)

CoMeta võrdlus Krakeniga Skoorimisel arvestada vaid mittekattuvaid k- mere/nukleotiide tundub nutikas, kuid aeganõudev Eraldi taksonoomiliste tasemete analüüs aeganõudev andmebaas on väiksem, kuid tuleb mitu korda iga lugemit analüüsida CPU kasutus kasutab palju rohkem mälu ning võtab OLULISELT rohkem aega kui Kraken (minutid vs mõni tund) ei ole kasutatav kiireks diagnostikaks Kasutati palju suuremat andmebaasikui minikrakeni puhul (võrreldav Kraken-GB) tundlikkuse erinevused andmebaasist tingitud

KÜSIMUSED?