Odkrivanje zakonitosti iz literature kot pomoc pri interpretaciji … let... · 2019. 1. 10. ·...
Transcript of Odkrivanje zakonitosti iz literature kot pomoc pri interpretaciji … let... · 2019. 1. 10. ·...
![Page 1: Odkrivanje zakonitosti iz literature kot pomoc pri interpretaciji … let... · 2019. 1. 10. · Odkrivanje zakonitosti iz literature kot pomo c pri interpretaciji podatkov pridobljenih](https://reader033.fdocument.pub/reader033/viewer/2022052000/60125b095955f304ef0d1316/html5/thumbnails/1.jpg)
Odkrivanje zakonitosti iz literature kot pomoc
pri interpretaciji podatkov pridobljenih z
metodami visokozmogljivega sekvenciranja
Dimitar Hristovski1 , Gaber Bergant2, Andrej Kastrin1, Borut Peterlin2
15. november 2018
1Univerza v Ljubljani, Medicinska fakulteta, Institut za biostatistiko in medicinsko in-
formatiko2Univerzitetni klinicni center Ljubljana, Klinicni institut za medicinsko genetiko
![Page 2: Odkrivanje zakonitosti iz literature kot pomoc pri interpretaciji … let... · 2019. 1. 10. · Odkrivanje zakonitosti iz literature kot pomo c pri interpretaciji podatkov pridobljenih](https://reader033.fdocument.pub/reader033/viewer/2022052000/60125b095955f304ef0d1316/html5/thumbnails/2.jpg)
Motivacija
• Metode sekvenciranja nove generacije imajo velik potencial,
toda . . .
• Rezultati tezki za interpretacijo (zlasti za diagnosticne
namene)
• Cilj: Razvoj bioinformaticnega orodja za podporo klinicnemu
diagnosticnemu procesu
1
![Page 3: Odkrivanje zakonitosti iz literature kot pomoc pri interpretaciji … let... · 2019. 1. 10. · Odkrivanje zakonitosti iz literature kot pomo c pri interpretaciji podatkov pridobljenih](https://reader033.fdocument.pub/reader033/viewer/2022052000/60125b095955f304ef0d1316/html5/thumbnails/3.jpg)
Motivacija
• Metode sekvenciranja nove generacije imajo velik potencial,
toda . . .
• Rezultati tezki za interpretacijo (zlasti za diagnosticne
namene)
• Cilj: Razvoj bioinformaticnega orodja za podporo klinicnemu
diagnosticnemu procesu
1
![Page 4: Odkrivanje zakonitosti iz literature kot pomoc pri interpretaciji … let... · 2019. 1. 10. · Odkrivanje zakonitosti iz literature kot pomo c pri interpretaciji podatkov pridobljenih](https://reader033.fdocument.pub/reader033/viewer/2022052000/60125b095955f304ef0d1316/html5/thumbnails/4.jpg)
Motivacija
• Metode sekvenciranja nove generacije imajo velik potencial,
toda . . .
• Rezultati tezki za interpretacijo (zlasti za diagnosticne
namene)
• Cilj: Razvoj bioinformaticnega orodja za podporo klinicnemu
diagnosticnemu procesu
1
![Page 5: Odkrivanje zakonitosti iz literature kot pomoc pri interpretaciji … let... · 2019. 1. 10. · Odkrivanje zakonitosti iz literature kot pomo c pri interpretaciji podatkov pridobljenih](https://reader033.fdocument.pub/reader033/viewer/2022052000/60125b095955f304ef0d1316/html5/thumbnails/5.jpg)
Slovarcek izrazov
• Sekvenciranje naslednje generacije (NGS)
• Sekvenciranje celotnega eksoma
• Gen, mutacija, protein
• Genetska variacija
• Genotip: mnozica genov s specificnimi mutacijami
(operacionalna definicija)
• Fenotip: mnozica klinicnih znakov (operacionalna definicija)
2
![Page 6: Odkrivanje zakonitosti iz literature kot pomoc pri interpretaciji … let... · 2019. 1. 10. · Odkrivanje zakonitosti iz literature kot pomo c pri interpretaciji podatkov pridobljenih](https://reader033.fdocument.pub/reader033/viewer/2022052000/60125b095955f304ef0d1316/html5/thumbnails/6.jpg)
Slovarcek izrazov
• Sekvenciranje naslednje generacije (NGS)
• Sekvenciranje celotnega eksoma
• Gen, mutacija, protein
• Genetska variacija
• Genotip: mnozica genov s specificnimi mutacijami
(operacionalna definicija)
• Fenotip: mnozica klinicnih znakov (operacionalna definicija)
2
![Page 7: Odkrivanje zakonitosti iz literature kot pomoc pri interpretaciji … let... · 2019. 1. 10. · Odkrivanje zakonitosti iz literature kot pomo c pri interpretaciji podatkov pridobljenih](https://reader033.fdocument.pub/reader033/viewer/2022052000/60125b095955f304ef0d1316/html5/thumbnails/7.jpg)
Slovarcek izrazov
• Sekvenciranje naslednje generacije (NGS)
• Sekvenciranje celotnega eksoma
• Gen, mutacija, protein
• Genetska variacija
• Genotip: mnozica genov s specificnimi mutacijami
(operacionalna definicija)
• Fenotip: mnozica klinicnih znakov (operacionalna definicija)
2
![Page 8: Odkrivanje zakonitosti iz literature kot pomoc pri interpretaciji … let... · 2019. 1. 10. · Odkrivanje zakonitosti iz literature kot pomo c pri interpretaciji podatkov pridobljenih](https://reader033.fdocument.pub/reader033/viewer/2022052000/60125b095955f304ef0d1316/html5/thumbnails/8.jpg)
Slovarcek izrazov
• Sekvenciranje naslednje generacije (NGS)
• Sekvenciranje celotnega eksoma
• Gen, mutacija, protein
• Genetska variacija
• Genotip: mnozica genov s specificnimi mutacijami
(operacionalna definicija)
• Fenotip: mnozica klinicnih znakov (operacionalna definicija)
2
![Page 9: Odkrivanje zakonitosti iz literature kot pomoc pri interpretaciji … let... · 2019. 1. 10. · Odkrivanje zakonitosti iz literature kot pomo c pri interpretaciji podatkov pridobljenih](https://reader033.fdocument.pub/reader033/viewer/2022052000/60125b095955f304ef0d1316/html5/thumbnails/9.jpg)
Slovarcek izrazov
• Sekvenciranje naslednje generacije (NGS)
• Sekvenciranje celotnega eksoma
• Gen, mutacija, protein
• Genetska variacija
• Genotip: mnozica genov s specificnimi mutacijami
(operacionalna definicija)
• Fenotip: mnozica klinicnih znakov (operacionalna definicija)
2
![Page 10: Odkrivanje zakonitosti iz literature kot pomoc pri interpretaciji … let... · 2019. 1. 10. · Odkrivanje zakonitosti iz literature kot pomo c pri interpretaciji podatkov pridobljenih](https://reader033.fdocument.pub/reader033/viewer/2022052000/60125b095955f304ef0d1316/html5/thumbnails/10.jpg)
Slovarcek izrazov
• Sekvenciranje naslednje generacije (NGS)
• Sekvenciranje celotnega eksoma
• Gen, mutacija, protein
• Genetska variacija
• Genotip: mnozica genov s specificnimi mutacijami
(operacionalna definicija)
• Fenotip: mnozica klinicnih znakov (operacionalna definicija)
2
![Page 11: Odkrivanje zakonitosti iz literature kot pomoc pri interpretaciji … let... · 2019. 1. 10. · Odkrivanje zakonitosti iz literature kot pomo c pri interpretaciji podatkov pridobljenih](https://reader033.fdocument.pub/reader033/viewer/2022052000/60125b095955f304ef0d1316/html5/thumbnails/11.jpg)
NGS delotok
3
![Page 12: Odkrivanje zakonitosti iz literature kot pomoc pri interpretaciji … let... · 2019. 1. 10. · Odkrivanje zakonitosti iz literature kot pomo c pri interpretaciji podatkov pridobljenih](https://reader033.fdocument.pub/reader033/viewer/2022052000/60125b095955f304ef0d1316/html5/thumbnails/12.jpg)
Raziskovalna ideja
Uporaba odkrivanja zakonitosti iz literature (LBD) za izboljsanje
procesa interpretacije rezultatov NGS.
4
![Page 13: Odkrivanje zakonitosti iz literature kot pomoc pri interpretaciji … let... · 2019. 1. 10. · Odkrivanje zakonitosti iz literature kot pomo c pri interpretaciji podatkov pridobljenih](https://reader033.fdocument.pub/reader033/viewer/2022052000/60125b095955f304ef0d1316/html5/thumbnails/13.jpg)
Odkrivanje zakonitosti iz literature (LBD)
• Metoda za samodejno generiranje raziskovalnih domnev iz
literature
• Vsaka domneva sledi vzorcu: Koncept1 - Relacija -
Koncept2
• Primer: Ribje olje - Zdravi - Raynaudjev sindrom
• Dva tipa iskanja: odprto ali zaprto
X Z
Y
5
![Page 14: Odkrivanje zakonitosti iz literature kot pomoc pri interpretaciji … let... · 2019. 1. 10. · Odkrivanje zakonitosti iz literature kot pomo c pri interpretaciji podatkov pridobljenih](https://reader033.fdocument.pub/reader033/viewer/2022052000/60125b095955f304ef0d1316/html5/thumbnails/14.jpg)
Odkrivanje zakonitosti iz literature (LBD)
• Metoda za samodejno generiranje raziskovalnih domnev iz
literature
• Vsaka domneva sledi vzorcu: Koncept1 - Relacija -
Koncept2
• Primer: Ribje olje - Zdravi - Raynaudjev sindrom
• Dva tipa iskanja: odprto ali zaprto
X Z
Y
5
![Page 15: Odkrivanje zakonitosti iz literature kot pomoc pri interpretaciji … let... · 2019. 1. 10. · Odkrivanje zakonitosti iz literature kot pomo c pri interpretaciji podatkov pridobljenih](https://reader033.fdocument.pub/reader033/viewer/2022052000/60125b095955f304ef0d1316/html5/thumbnails/15.jpg)
Odkrivanje zakonitosti iz literature (LBD)
• Metoda za samodejno generiranje raziskovalnih domnev iz
literature
• Vsaka domneva sledi vzorcu: Koncept1 - Relacija -
Koncept2
• Primer: Ribje olje - Zdravi - Raynaudjev sindrom
• Dva tipa iskanja: odprto ali zaprto
X Z
Y
5
![Page 16: Odkrivanje zakonitosti iz literature kot pomoc pri interpretaciji … let... · 2019. 1. 10. · Odkrivanje zakonitosti iz literature kot pomo c pri interpretaciji podatkov pridobljenih](https://reader033.fdocument.pub/reader033/viewer/2022052000/60125b095955f304ef0d1316/html5/thumbnails/16.jpg)
Odkrivanje zakonitosti iz literature (LBD)
• Metoda za samodejno generiranje raziskovalnih domnev iz
literature
• Vsaka domneva sledi vzorcu: Koncept1 - Relacija -
Koncept2
• Primer: Ribje olje - Zdravi - Raynaudjev sindrom
• Dva tipa iskanja: odprto ali zaprto
X Z
Y
5
![Page 17: Odkrivanje zakonitosti iz literature kot pomoc pri interpretaciji … let... · 2019. 1. 10. · Odkrivanje zakonitosti iz literature kot pomo c pri interpretaciji podatkov pridobljenih](https://reader033.fdocument.pub/reader033/viewer/2022052000/60125b095955f304ef0d1316/html5/thumbnails/17.jpg)
Podatkovni viri
• Klinicni podatki o pacientih
• genotip (iz NGS)
• fenotip (od klinicnega genetika)
• Populacijski genetski podatki iz javnodostopnih zbirk
• GnomAD projekt (140 000 eksomov iz populacije zdravih
kontrol)
• UK10k (10 000 zdravih kontrol iz Velike Britanije)
• SgvDB (2500 klinicnih in celotnih eksomov iz Slovenije)
6
![Page 18: Odkrivanje zakonitosti iz literature kot pomoc pri interpretaciji … let... · 2019. 1. 10. · Odkrivanje zakonitosti iz literature kot pomo c pri interpretaciji podatkov pridobljenih](https://reader033.fdocument.pub/reader033/viewer/2022052000/60125b095955f304ef0d1316/html5/thumbnails/18.jpg)
Podatkovni viri
• Klinicni podatki o pacientih
• genotip (iz NGS)
• fenotip (od klinicnega genetika)
• Populacijski genetski podatki iz javnodostopnih zbirk
• GnomAD projekt (140 000 eksomov iz populacije zdravih
kontrol)
• UK10k (10 000 zdravih kontrol iz Velike Britanije)
• SgvDB (2500 klinicnih in celotnih eksomov iz Slovenije)
6
![Page 19: Odkrivanje zakonitosti iz literature kot pomoc pri interpretaciji … let... · 2019. 1. 10. · Odkrivanje zakonitosti iz literature kot pomo c pri interpretaciji podatkov pridobljenih](https://reader033.fdocument.pub/reader033/viewer/2022052000/60125b095955f304ef0d1316/html5/thumbnails/19.jpg)
. . . podatkovni viri
• Napovedne vrednosti patogenosti (na osnovi prostodostopnihalgoritmov, ki temeljijo na razliki med referencnimi inalternativnimi biokemijskimi in prostorskimi lastnostmi,poziciji v proteinu itd.):
• SIFT
• Polyphen2
• MutationTaster
• PROVEAN.prediction
• CADD.score
• M.CAP.score
7
![Page 20: Odkrivanje zakonitosti iz literature kot pomoc pri interpretaciji … let... · 2019. 1. 10. · Odkrivanje zakonitosti iz literature kot pomo c pri interpretaciji podatkov pridobljenih](https://reader033.fdocument.pub/reader033/viewer/2022052000/60125b095955f304ef0d1316/html5/thumbnails/20.jpg)
. . . podatkovni viri
• SemMedDB: distribucija semanticnih relacij izluscenih iz
celotnega MEDLINE s pomocjo orodja SemRep (NLP orodje)
• Primer: iz stavka dexamethasone is a potent inducer ofmultidrug resistance-associated protein expression in rathepatocytes SemRep izlusci:
• Dexamethasone STIMULATES Multidrug Resistence-Associated
Proteins
• Multidrug Resistance-Associated Proteins PART OF Rats
• Hepatocytes PART OF Rats
8
![Page 21: Odkrivanje zakonitosti iz literature kot pomoc pri interpretaciji … let... · 2019. 1. 10. · Odkrivanje zakonitosti iz literature kot pomo c pri interpretaciji podatkov pridobljenih](https://reader033.fdocument.pub/reader033/viewer/2022052000/60125b095955f304ef0d1316/html5/thumbnails/21.jpg)
. . . podatkovni viri
• SemMedDB: distribucija semanticnih relacij izluscenih iz
celotnega MEDLINE s pomocjo orodja SemRep (NLP orodje)
• Primer: iz stavka dexamethasone is a potent inducer ofmultidrug resistance-associated protein expression in rathepatocytes SemRep izlusci:
• Dexamethasone STIMULATES Multidrug Resistence-Associated
Proteins
• Multidrug Resistance-Associated Proteins PART OF Rats
• Hepatocytes PART OF Rats
8
![Page 22: Odkrivanje zakonitosti iz literature kot pomoc pri interpretaciji … let... · 2019. 1. 10. · Odkrivanje zakonitosti iz literature kot pomo c pri interpretaciji podatkov pridobljenih](https://reader033.fdocument.pub/reader033/viewer/2022052000/60125b095955f304ef0d1316/html5/thumbnails/22.jpg)
Metode
• Konstruiramo omrezje s katerim predstavimo:
• genotip pacienta
• fenotip pacienta
• obstojece (biomedicinsko) znanje
• Na osnovi omrezja bomo:
• napovedovali nove povezave med genotipom in fenotipom
• podali razlago za znane in nove povezave
9
![Page 23: Odkrivanje zakonitosti iz literature kot pomoc pri interpretaciji … let... · 2019. 1. 10. · Odkrivanje zakonitosti iz literature kot pomo c pri interpretaciji podatkov pridobljenih](https://reader033.fdocument.pub/reader033/viewer/2022052000/60125b095955f304ef0d1316/html5/thumbnails/23.jpg)
Metode
• Konstruiramo omrezje s katerim predstavimo:
• genotip pacienta
• fenotip pacienta
• obstojece (biomedicinsko) znanje
• Na osnovi omrezja bomo:
• napovedovali nove povezave med genotipom in fenotipom
• podali razlago za znane in nove povezave
9
![Page 24: Odkrivanje zakonitosti iz literature kot pomoc pri interpretaciji … let... · 2019. 1. 10. · Odkrivanje zakonitosti iz literature kot pomo c pri interpretaciji podatkov pridobljenih](https://reader033.fdocument.pub/reader033/viewer/2022052000/60125b095955f304ef0d1316/html5/thumbnails/24.jpg)
Gradnja omrezja
Vozlisca
• Pacienti
• Fenotipi (na osnovi Human Phenotype Ontology)
• Biomedicinski koncepti (s 126 podtipi):
• argumenti semanticnih relacij izlusceni iz MEDLINE
• Parkinsonova bolezen (Disease or Syndrome)
• Levodopa (Pharmacologic Substance)
• LRRK2 (Gene or Genome)
10
![Page 25: Odkrivanje zakonitosti iz literature kot pomoc pri interpretaciji … let... · 2019. 1. 10. · Odkrivanje zakonitosti iz literature kot pomo c pri interpretaciji podatkov pridobljenih](https://reader033.fdocument.pub/reader033/viewer/2022052000/60125b095955f304ef0d1316/html5/thumbnails/25.jpg)
Gradnja omrezja
Vozlisca
• Pacienti
• Fenotipi (na osnovi Human Phenotype Ontology)
• Biomedicinski koncepti (s 126 podtipi):
• argumenti semanticnih relacij izlusceni iz MEDLINE
• Parkinsonova bolezen (Disease or Syndrome)
• Levodopa (Pharmacologic Substance)
• LRRK2 (Gene or Genome)
10
![Page 26: Odkrivanje zakonitosti iz literature kot pomoc pri interpretaciji … let... · 2019. 1. 10. · Odkrivanje zakonitosti iz literature kot pomo c pri interpretaciji podatkov pridobljenih](https://reader033.fdocument.pub/reader033/viewer/2022052000/60125b095955f304ef0d1316/html5/thumbnails/26.jpg)
Gradnja omrezja
Vozlisca
• Pacienti
• Fenotipi (na osnovi Human Phenotype Ontology)
• Biomedicinski koncepti (s 126 podtipi):
• argumenti semanticnih relacij izlusceni iz MEDLINE
• Parkinsonova bolezen (Disease or Syndrome)
• Levodopa (Pharmacologic Substance)
• LRRK2 (Gene or Genome)
10
![Page 27: Odkrivanje zakonitosti iz literature kot pomoc pri interpretaciji … let... · 2019. 1. 10. · Odkrivanje zakonitosti iz literature kot pomo c pri interpretaciji podatkov pridobljenih](https://reader033.fdocument.pub/reader033/viewer/2022052000/60125b095955f304ef0d1316/html5/thumbnails/27.jpg)
Gradnja omrezja
Vozlisca
• Pacienti
• Fenotipi (na osnovi Human Phenotype Ontology)
• Biomedicinski koncepti (s 126 podtipi):
• argumenti semanticnih relacij izlusceni iz MEDLINE
• Parkinsonova bolezen (Disease or Syndrome)
• Levodopa (Pharmacologic Substance)
• LRRK2 (Gene or Genome)
10
![Page 28: Odkrivanje zakonitosti iz literature kot pomoc pri interpretaciji … let... · 2019. 1. 10. · Odkrivanje zakonitosti iz literature kot pomo c pri interpretaciji podatkov pridobljenih](https://reader033.fdocument.pub/reader033/viewer/2022052000/60125b095955f304ef0d1316/html5/thumbnails/28.jpg)
. . . gradnja omrezja
Povezave
• PHENO: povezuje paciente s fenotipi
• GENO: povezuje paciente z (mutiranimi) geni
• Semanticne relacije (30 tipov):
• predstavljajo (biomedicinsko) znanje
• izluscene so iz celotnega MEDLINE s pomocjo SemRep
• TREATS
• CAUSES
• INHIBITS
• STIMULATES
11
![Page 29: Odkrivanje zakonitosti iz literature kot pomoc pri interpretaciji … let... · 2019. 1. 10. · Odkrivanje zakonitosti iz literature kot pomo c pri interpretaciji podatkov pridobljenih](https://reader033.fdocument.pub/reader033/viewer/2022052000/60125b095955f304ef0d1316/html5/thumbnails/29.jpg)
. . . gradnja omrezja
Povezave
• PHENO: povezuje paciente s fenotipi
• GENO: povezuje paciente z (mutiranimi) geni
• Semanticne relacije (30 tipov):
• predstavljajo (biomedicinsko) znanje
• izluscene so iz celotnega MEDLINE s pomocjo SemRep
• TREATS
• CAUSES
• INHIBITS
• STIMULATES
11
![Page 30: Odkrivanje zakonitosti iz literature kot pomoc pri interpretaciji … let... · 2019. 1. 10. · Odkrivanje zakonitosti iz literature kot pomo c pri interpretaciji podatkov pridobljenih](https://reader033.fdocument.pub/reader033/viewer/2022052000/60125b095955f304ef0d1316/html5/thumbnails/30.jpg)
. . . gradnja omrezja
Povezave
• PHENO: povezuje paciente s fenotipi
• GENO: povezuje paciente z (mutiranimi) geni
• Semanticne relacije (30 tipov):
• predstavljajo (biomedicinsko) znanje
• izluscene so iz celotnega MEDLINE s pomocjo SemRep
• TREATS
• CAUSES
• INHIBITS
• STIMULATES
11
![Page 31: Odkrivanje zakonitosti iz literature kot pomoc pri interpretaciji … let... · 2019. 1. 10. · Odkrivanje zakonitosti iz literature kot pomo c pri interpretaciji podatkov pridobljenih](https://reader033.fdocument.pub/reader033/viewer/2022052000/60125b095955f304ef0d1316/html5/thumbnails/31.jpg)
. . . gradnja omrezja
Povezave
• PHENO: povezuje paciente s fenotipi
• GENO: povezuje paciente z (mutiranimi) geni
• Semanticne relacije (30 tipov):
• predstavljajo (biomedicinsko) znanje
• izluscene so iz celotnega MEDLINE s pomocjo SemRep
• TREATS
• CAUSES
• INHIBITS
• STIMULATES
11
![Page 32: Odkrivanje zakonitosti iz literature kot pomoc pri interpretaciji … let... · 2019. 1. 10. · Odkrivanje zakonitosti iz literature kot pomo c pri interpretaciji podatkov pridobljenih](https://reader033.fdocument.pub/reader033/viewer/2022052000/60125b095955f304ef0d1316/html5/thumbnails/32.jpg)
Algoritem za podporo klinicnemu odlocanju
• Vhod (za enega pacienta):
• mnozica genotipov (X)
• mnozica fenotipov (Z)
• Filtriramo mnozico genotipov X
• Uporabimo LBD za:
• napovedovanje novih povezav med genotipom in fenotipom
• razlago znanih in novih povezav
• rangiranje (prioritizacija) rezultatov
• Izhod:
• napovedane (nove) povezave med genotipom in fenotipom
• vmesni koncepti, ki povezujejo genotip in fenotip ter
pojasnjujejo povezavo
12
![Page 33: Odkrivanje zakonitosti iz literature kot pomoc pri interpretaciji … let... · 2019. 1. 10. · Odkrivanje zakonitosti iz literature kot pomo c pri interpretaciji podatkov pridobljenih](https://reader033.fdocument.pub/reader033/viewer/2022052000/60125b095955f304ef0d1316/html5/thumbnails/33.jpg)
Algoritem za podporo klinicnemu odlocanju
• Vhod (za enega pacienta):
• mnozica genotipov (X)
• mnozica fenotipov (Z)
• Filtriramo mnozico genotipov X
• Uporabimo LBD za:
• napovedovanje novih povezav med genotipom in fenotipom
• razlago znanih in novih povezav
• rangiranje (prioritizacija) rezultatov
• Izhod:
• napovedane (nove) povezave med genotipom in fenotipom
• vmesni koncepti, ki povezujejo genotip in fenotip ter
pojasnjujejo povezavo
12
![Page 34: Odkrivanje zakonitosti iz literature kot pomoc pri interpretaciji … let... · 2019. 1. 10. · Odkrivanje zakonitosti iz literature kot pomo c pri interpretaciji podatkov pridobljenih](https://reader033.fdocument.pub/reader033/viewer/2022052000/60125b095955f304ef0d1316/html5/thumbnails/34.jpg)
Algoritem za podporo klinicnemu odlocanju
• Vhod (za enega pacienta):
• mnozica genotipov (X)
• mnozica fenotipov (Z)
• Filtriramo mnozico genotipov X
• Uporabimo LBD za:
• napovedovanje novih povezav med genotipom in fenotipom
• razlago znanih in novih povezav
• rangiranje (prioritizacija) rezultatov
• Izhod:
• napovedane (nove) povezave med genotipom in fenotipom
• vmesni koncepti, ki povezujejo genotip in fenotip ter
pojasnjujejo povezavo
12
![Page 35: Odkrivanje zakonitosti iz literature kot pomoc pri interpretaciji … let... · 2019. 1. 10. · Odkrivanje zakonitosti iz literature kot pomo c pri interpretaciji podatkov pridobljenih](https://reader033.fdocument.pub/reader033/viewer/2022052000/60125b095955f304ef0d1316/html5/thumbnails/35.jpg)
Algoritem za podporo klinicnemu odlocanju
• Vhod (za enega pacienta):
• mnozica genotipov (X)
• mnozica fenotipov (Z)
• Filtriramo mnozico genotipov X
• Uporabimo LBD za:
• napovedovanje novih povezav med genotipom in fenotipom
• razlago znanih in novih povezav
• rangiranje (prioritizacija) rezultatov
• Izhod:
• napovedane (nove) povezave med genotipom in fenotipom
• vmesni koncepti, ki povezujejo genotip in fenotip ter
pojasnjujejo povezavo
12
![Page 36: Odkrivanje zakonitosti iz literature kot pomoc pri interpretaciji … let... · 2019. 1. 10. · Odkrivanje zakonitosti iz literature kot pomo c pri interpretaciji podatkov pridobljenih](https://reader033.fdocument.pub/reader033/viewer/2022052000/60125b095955f304ef0d1316/html5/thumbnails/36.jpg)
Algoritem za podporo klinicnemu odlocanju
• Vhod (za enega pacienta):
• mnozica genotipov (X)
• mnozica fenotipov (Z)
• Filtriramo mnozico genotipov X
• Uporabimo LBD za:
• napovedovanje novih povezav med genotipom in fenotipom
• razlago znanih in novih povezav
• rangiranje (prioritizacija) rezultatov
• Izhod:
• napovedane (nove) povezave med genotipom in fenotipom
• vmesni koncepti, ki povezujejo genotip in fenotip ter
pojasnjujejo povezavo
12
![Page 37: Odkrivanje zakonitosti iz literature kot pomoc pri interpretaciji … let... · 2019. 1. 10. · Odkrivanje zakonitosti iz literature kot pomo c pri interpretaciji podatkov pridobljenih](https://reader033.fdocument.pub/reader033/viewer/2022052000/60125b095955f304ef0d1316/html5/thumbnails/37.jpg)
Algoritem za podporo klinicnemu odlocanju
• Vhod (za enega pacienta):
• mnozica genotipov (X)
• mnozica fenotipov (Z)
• Filtriramo mnozico genotipov X
• Uporabimo LBD za:
• napovedovanje novih povezav med genotipom in fenotipom
• razlago znanih in novih povezav
• rangiranje (prioritizacija) rezultatov
• Izhod:
• napovedane (nove) povezave med genotipom in fenotipom
• vmesni koncepti, ki povezujejo genotip in fenotip ter
pojasnjujejo povezavo
12
![Page 38: Odkrivanje zakonitosti iz literature kot pomoc pri interpretaciji … let... · 2019. 1. 10. · Odkrivanje zakonitosti iz literature kot pomo c pri interpretaciji podatkov pridobljenih](https://reader033.fdocument.pub/reader033/viewer/2022052000/60125b095955f304ef0d1316/html5/thumbnails/38.jpg)
Algoritem za podporo klinicnemu odlocanju
• Vhod (za enega pacienta):
• mnozica genotipov (X)
• mnozica fenotipov (Z)
• Filtriramo mnozico genotipov X
• Uporabimo LBD za:
• napovedovanje novih povezav med genotipom in fenotipom
• razlago znanih in novih povezav
• rangiranje (prioritizacija) rezultatov
• Izhod:
• napovedane (nove) povezave med genotipom in fenotipom
• vmesni koncepti, ki povezujejo genotip in fenotip ter
pojasnjujejo povezavo
12
![Page 39: Odkrivanje zakonitosti iz literature kot pomoc pri interpretaciji … let... · 2019. 1. 10. · Odkrivanje zakonitosti iz literature kot pomo c pri interpretaciji podatkov pridobljenih](https://reader033.fdocument.pub/reader033/viewer/2022052000/60125b095955f304ef0d1316/html5/thumbnails/39.jpg)
Algoritem za podporo klinicnemu odlocanju
• Vhod (za enega pacienta):
• mnozica genotipov (X)
• mnozica fenotipov (Z)
• Filtriramo mnozico genotipov X
• Uporabimo LBD za:
• napovedovanje novih povezav med genotipom in fenotipom
• razlago znanih in novih povezav
• rangiranje (prioritizacija) rezultatov
• Izhod:
• napovedane (nove) povezave med genotipom in fenotipom
• vmesni koncepti, ki povezujejo genotip in fenotip ter
pojasnjujejo povezavo
12
![Page 40: Odkrivanje zakonitosti iz literature kot pomoc pri interpretaciji … let... · 2019. 1. 10. · Odkrivanje zakonitosti iz literature kot pomo c pri interpretaciji podatkov pridobljenih](https://reader033.fdocument.pub/reader033/viewer/2022052000/60125b095955f304ef0d1316/html5/thumbnails/40.jpg)
Algoritem za podporo klinicnemu odlocanju
• Vhod (za enega pacienta):
• mnozica genotipov (X)
• mnozica fenotipov (Z)
• Filtriramo mnozico genotipov X
• Uporabimo LBD za:
• napovedovanje novih povezav med genotipom in fenotipom
• razlago znanih in novih povezav
• rangiranje (prioritizacija) rezultatov
• Izhod:
• napovedane (nove) povezave med genotipom in fenotipom
• vmesni koncepti, ki povezujejo genotip in fenotip ter
pojasnjujejo povezavo
12
![Page 41: Odkrivanje zakonitosti iz literature kot pomoc pri interpretaciji … let... · 2019. 1. 10. · Odkrivanje zakonitosti iz literature kot pomo c pri interpretaciji podatkov pridobljenih](https://reader033.fdocument.pub/reader033/viewer/2022052000/60125b095955f304ef0d1316/html5/thumbnails/41.jpg)
Algoritem za podporo klinicnemu odlocanju
• Vhod (za enega pacienta):
• mnozica genotipov (X)
• mnozica fenotipov (Z)
• Filtriramo mnozico genotipov X
• Uporabimo LBD za:
• napovedovanje novih povezav med genotipom in fenotipom
• razlago znanih in novih povezav
• rangiranje (prioritizacija) rezultatov
• Izhod:
• napovedane (nove) povezave med genotipom in fenotipom
• vmesni koncepti, ki povezujejo genotip in fenotip ter
pojasnjujejo povezavo
12
![Page 42: Odkrivanje zakonitosti iz literature kot pomoc pri interpretaciji … let... · 2019. 1. 10. · Odkrivanje zakonitosti iz literature kot pomo c pri interpretaciji podatkov pridobljenih](https://reader033.fdocument.pub/reader033/viewer/2022052000/60125b095955f304ef0d1316/html5/thumbnails/42.jpg)
Algoritem za podporo klinicnemu odlocanju
• Vhod (za enega pacienta):
• mnozica genotipov (X)
• mnozica fenotipov (Z)
• Filtriramo mnozico genotipov X
• Uporabimo LBD za:
• napovedovanje novih povezav med genotipom in fenotipom
• razlago znanih in novih povezav
• rangiranje (prioritizacija) rezultatov
• Izhod:
• napovedane (nove) povezave med genotipom in fenotipom
• vmesni koncepti, ki povezujejo genotip in fenotip ter
pojasnjujejo povezavo
12
![Page 43: Odkrivanje zakonitosti iz literature kot pomoc pri interpretaciji … let... · 2019. 1. 10. · Odkrivanje zakonitosti iz literature kot pomo c pri interpretaciji podatkov pridobljenih](https://reader033.fdocument.pub/reader033/viewer/2022052000/60125b095955f304ef0d1316/html5/thumbnails/43.jpg)
Napovedovanje in pojasnjevanje novih klinicnih povezav
X
gen
P
pacient
Yi
(celicna funkcija)
Yj
(bolezen)
Z
fenotipGENO PHENO
nova povezava?
ze znana povezava
13
![Page 44: Odkrivanje zakonitosti iz literature kot pomoc pri interpretaciji … let... · 2019. 1. 10. · Odkrivanje zakonitosti iz literature kot pomo c pri interpretaciji podatkov pridobljenih](https://reader033.fdocument.pub/reader033/viewer/2022052000/60125b095955f304ef0d1316/html5/thumbnails/44.jpg)
Implementacija
• Neo4j grafovska podatkovna zbirka
• Podpira grafovski podatkovni model
• Cypher kot deklarativni poizvedovalni jezik• Zakaj smo izbrali Neo4j?
• Ker se dobro prilega nasim podatkom
• Ker vsebuje algoritme za analizo omrezij (za nadaljnje delo)
14
![Page 45: Odkrivanje zakonitosti iz literature kot pomoc pri interpretaciji … let... · 2019. 1. 10. · Odkrivanje zakonitosti iz literature kot pomo c pri interpretaciji podatkov pridobljenih](https://reader033.fdocument.pub/reader033/viewer/2022052000/60125b095955f304ef0d1316/html5/thumbnails/45.jpg)
Priprava podatkov, agregacija in nalaganje podatkov
• Agregacija z AWK skriptami
• Priprava vhodnih datotek z AWK skriptami in lupinskimi
orodji (join, sort)
• Orodje Neo4j import uporabili za uvoz semanticnih relacij iz
literature
• Za ostale podatke: LOAD CSV ...FROM FILE ...
15
![Page 46: Odkrivanje zakonitosti iz literature kot pomoc pri interpretaciji … let... · 2019. 1. 10. · Odkrivanje zakonitosti iz literature kot pomo c pri interpretaciji podatkov pridobljenih](https://reader033.fdocument.pub/reader033/viewer/2022052000/60125b095955f304ef0d1316/html5/thumbnails/46.jpg)
Rezultati – konstrukcija podatkovne zbirke
• 1205 pacientov
• 262132 GENO povezav, ki povezujejo paciente z 15 294
vozlisci za gene (mozne veckratne povezave)
• 4751 PHENO povezav med pacienti in 1450 vozlisci za
fenotipe
• 27 263 265 procesiranih MEDLINE zapisov
• 91 567 597 instanc semanticnih relacij izluscenih s SemRep
• 20 818 782 semanticnih relacij med 277 160 biomedicinskimi
koncepti
16
![Page 47: Odkrivanje zakonitosti iz literature kot pomoc pri interpretaciji … let... · 2019. 1. 10. · Odkrivanje zakonitosti iz literature kot pomo c pri interpretaciji podatkov pridobljenih](https://reader033.fdocument.pub/reader033/viewer/2022052000/60125b095955f304ef0d1316/html5/thumbnails/47.jpg)
Vrednotenje
• Za znane povezave genotip–fenotip:
• s filtriranjem in rangiranjem dobimo:
• dobro znane relacije na prvem mestu
• ustrezne razlage (vmestne koncepte) za povezave
• Za neznane povezave genotip–fenotip:
• vrednotenje domenskih ekspertov kot nadaljnje delo
• preliminarni rezulati zelo obetajoci
17
![Page 48: Odkrivanje zakonitosti iz literature kot pomoc pri interpretaciji … let... · 2019. 1. 10. · Odkrivanje zakonitosti iz literature kot pomo c pri interpretaciji podatkov pridobljenih](https://reader033.fdocument.pub/reader033/viewer/2022052000/60125b095955f304ef0d1316/html5/thumbnails/48.jpg)
Vrednotenje
• Za znane povezave genotip–fenotip:
• s filtriranjem in rangiranjem dobimo:
• dobro znane relacije na prvem mestu
• ustrezne razlage (vmestne koncepte) za povezave
• Za neznane povezave genotip–fenotip:
• vrednotenje domenskih ekspertov kot nadaljnje delo
• preliminarni rezulati zelo obetajoci
17
![Page 49: Odkrivanje zakonitosti iz literature kot pomoc pri interpretaciji … let... · 2019. 1. 10. · Odkrivanje zakonitosti iz literature kot pomo c pri interpretaciji podatkov pridobljenih](https://reader033.fdocument.pub/reader033/viewer/2022052000/60125b095955f304ef0d1316/html5/thumbnails/49.jpg)
Pojasnjevanje znanih povezav genotip - fenotip
MATCH
(c1)<-[:PHENO_UMLS]-(p:Patient {id:"###"})-[r:GENO]->(g)
WHERE # filtering
(r.HMZinSLO < 2) AND (r.GnomADHMZ < 10) WITH c1,p,r,g
MATCH (c1)-[r2]-(g) WITH c1,r,p,r2,g
# ranking
ORDER BY r2.freq desc, r.functional_impact desc,
r.GnomADAlleleCount asc, r.ExACGeneralMAF asc,
r.HTZinSLO asc, r.UK10KAlleleCount asc,
r.cadd_score desc, r.SIFT asc LIMIT 20
MATCH (c1)<-[r3]-(c2)<-[r4:ISA|STIMULATES|...]-(g)
WHERE ...exclude too general items... # more filtering
RETURN distinct c1,r3,c2,r4,g
ORDER BY r3.freq*r4.freq desc;18
![Page 50: Odkrivanje zakonitosti iz literature kot pomoc pri interpretaciji … let... · 2019. 1. 10. · Odkrivanje zakonitosti iz literature kot pomo c pri interpretaciji podatkov pridobljenih](https://reader033.fdocument.pub/reader033/viewer/2022052000/60125b095955f304ef0d1316/html5/thumbnails/50.jpg)
19
![Page 51: Odkrivanje zakonitosti iz literature kot pomoc pri interpretaciji … let... · 2019. 1. 10. · Odkrivanje zakonitosti iz literature kot pomo c pri interpretaciji podatkov pridobljenih](https://reader033.fdocument.pub/reader033/viewer/2022052000/60125b095955f304ef0d1316/html5/thumbnails/51.jpg)
STIMULATES
AFFECTS
GEN
OINHIBITS
ASSOCIATED_WITH
GEN
O
STIMULATES
GEN
O
ISA
GEN
O
STIMULATES
GENO
INHIBITS
GENO
INHIBITS
GEN
O
STIMULATES
GENO
GENO
GENO
STIMULATESGENO
INHIBITS
GENO
GENO
STIMULATES
GENO
INHIBITS
GENO
STIMULATES
GENO
INHIBITS
GENO
STIMULATES
GEN
O
INHIBITS
GENO
INHIBITS
GENO
STIMULATES
GENO
STIMULATES
GENO
STIMULATES
GENO
STIMULATES
GEN
O
INHIBITS
GENO
STIMULATES
GENO INHIBITS
STIMULA
TES
GEN
O
ISA
GENO
STIM
ULATES
INH
IBIT
S
INHIBITS
GENO
STIMULATES
GENO
INHIBITS
GEN
O
STIMULATESGENO
INHIBITS
STIMULATES
GENO
MS428…
ARHGE…
TNFRS…
White Matter
Demyelination
MS346…
MS838…
MAPK14
MS4391
HSD3B1
MS700…
EGFR
MS723… SULT2A1
MS878…
SDCBP2
MS268…
KIF20B
MS132…
MS414…
MS369…
CASP1
MS491…
HACE1
MS221…
MS5008
WDR48
MS966…
MS305…
FOXO3
MS341…
MS395…
IL1R1
MS480…
MS235…
IL7R
MS160…
ISG20
MS222…
ITGAX
MS107… HCLS1
MS344…
CUX1
MS609…
TFRCMS626…
PSMC6
MS594…
TLR2
MS316…
TNFRS…
MS990…
IL1RL1
MS350…
NUP43
MS839…
MS619…
TRAF2
ROR2
20
![Page 52: Odkrivanje zakonitosti iz literature kot pomoc pri interpretaciji … let... · 2019. 1. 10. · Odkrivanje zakonitosti iz literature kot pomo c pri interpretaciji podatkov pridobljenih](https://reader033.fdocument.pub/reader033/viewer/2022052000/60125b095955f304ef0d1316/html5/thumbnails/52.jpg)
Nadaljnje delo
• Evalvacija z biomedicinskega zornega kota
• Razvoj spletne aplikacije z ustreznim
• iskalnim modulom
• vizualizacijskim modulom
• Detekcija in filtriranje napacno pozitivnih rezultatov ter
“prevec” splosnih konceptov in relacij
• Vkljucitev v klinicno-genetski diagnosticni delotok
21
![Page 53: Odkrivanje zakonitosti iz literature kot pomoc pri interpretaciji … let... · 2019. 1. 10. · Odkrivanje zakonitosti iz literature kot pomo c pri interpretaciji podatkov pridobljenih](https://reader033.fdocument.pub/reader033/viewer/2022052000/60125b095955f304ef0d1316/html5/thumbnails/53.jpg)
Nadaljnje delo
• Evalvacija z biomedicinskega zornega kota
• Razvoj spletne aplikacije z ustreznim
• iskalnim modulom
• vizualizacijskim modulom
• Detekcija in filtriranje napacno pozitivnih rezultatov ter
“prevec” splosnih konceptov in relacij
• Vkljucitev v klinicno-genetski diagnosticni delotok
21
![Page 54: Odkrivanje zakonitosti iz literature kot pomoc pri interpretaciji … let... · 2019. 1. 10. · Odkrivanje zakonitosti iz literature kot pomo c pri interpretaciji podatkov pridobljenih](https://reader033.fdocument.pub/reader033/viewer/2022052000/60125b095955f304ef0d1316/html5/thumbnails/54.jpg)
Nadaljnje delo
• Evalvacija z biomedicinskega zornega kota
• Razvoj spletne aplikacije z ustreznim
• iskalnim modulom
• vizualizacijskim modulom
• Detekcija in filtriranje napacno pozitivnih rezultatov ter
“prevec” splosnih konceptov in relacij
• Vkljucitev v klinicno-genetski diagnosticni delotok
21
![Page 55: Odkrivanje zakonitosti iz literature kot pomoc pri interpretaciji … let... · 2019. 1. 10. · Odkrivanje zakonitosti iz literature kot pomo c pri interpretaciji podatkov pridobljenih](https://reader033.fdocument.pub/reader033/viewer/2022052000/60125b095955f304ef0d1316/html5/thumbnails/55.jpg)
Nadaljnje delo
• Evalvacija z biomedicinskega zornega kota
• Razvoj spletne aplikacije z ustreznim
• iskalnim modulom
• vizualizacijskim modulom
• Detekcija in filtriranje napacno pozitivnih rezultatov ter
“prevec” splosnih konceptov in relacij
• Vkljucitev v klinicno-genetski diagnosticni delotok
21
![Page 56: Odkrivanje zakonitosti iz literature kot pomoc pri interpretaciji … let... · 2019. 1. 10. · Odkrivanje zakonitosti iz literature kot pomo c pri interpretaciji podatkov pridobljenih](https://reader033.fdocument.pub/reader033/viewer/2022052000/60125b095955f304ef0d1316/html5/thumbnails/56.jpg)
Zakljucki
• Grafovska podatkovna zbirka Neo4j je ustrezna za hranjenje
heterogenih genomskih podatkov, ki jih potrebujemo za
diagnosticno podporo v klinicni genetiki
• LBD lahko uporabimo kot komplementarno metodo v klinicni
diagnostiki s poudarkom na novih povezavah gen–fenotip
22
![Page 57: Odkrivanje zakonitosti iz literature kot pomoc pri interpretaciji … let... · 2019. 1. 10. · Odkrivanje zakonitosti iz literature kot pomo c pri interpretaciji podatkov pridobljenih](https://reader033.fdocument.pub/reader033/viewer/2022052000/60125b095955f304ef0d1316/html5/thumbnails/57.jpg)
Zakljucki
• Grafovska podatkovna zbirka Neo4j je ustrezna za hranjenje
heterogenih genomskih podatkov, ki jih potrebujemo za
diagnosticno podporo v klinicni genetiki
• LBD lahko uporabimo kot komplementarno metodo v klinicni
diagnostiki s poudarkom na novih povezavah gen–fenotip
22