cancer bioinformatics IV.ppt [兼容模式]csbl.bmb.uga.edu/mirrors/JLU/DragonStar2016winter... ·...

66
肿瘤信息学 徐鹰 佐治亚大学生化系、 吉林大学计算机学院

Transcript of cancer bioinformatics IV.ppt [兼容模式]csbl.bmb.uga.edu/mirrors/JLU/DragonStar2016winter... ·...

肿瘤信息学

徐鹰

佐治亚大学生化系、 吉林大学计算机学院

2

3

Lecture IV

Genomic mutations, epigenomic alterations in response to stresses 

Homework• Reading

• Chapter 4 of the text book “Cancer Bioinformatics”

• Cancer Genome Landscapes, Bert Vogelstein et al, Science, 2013

4

5

Genomic Mutations 

• Four main types of genomic mutations have been detected

• Single point mutations (e.g., C ‐> G)

• DNA breaks

• Copy‐number changes : a genomic segment is duplicated or deleted

• Translocations: genomic segments moved from one location to another

6

Genomic Mutations

• Single‐point mutations or breaks tend to be the result of (micro‐) environment such as ROS, which tends to increase in stressed cells

• Copy‐number changes and translocations are generally the results of DNA‐repair machinery under emergency conditions

7

Genomic Mutations in Cancer• The concept of oncogene was coined in 1969 by NIH scientists, George Todaroand Robert Heubner

• The first confirmed oncogene was discovered in 1970 and was termed SRC by Dr. Steve Martin

• For demonstrating mutations in human SRC, MYC, RAS and a few other oncogenes can transform normal cells to cancer  cells, Bishop and Varmus received Nobel Prize in 1989.

• AG Knudson was the first to propose the concept of tumor suppressor genes, whose functions are to stop cancerous development  and their mutations are necessary for a cancer to develop

8

Genomic Mutations in Cancer

• The combination of the two concepts form the foundation for the mutation‐centric view of cancer, which has been the dominating theory of cancer formation in the past 40 years

• Published literature suggests that cancer is the result of somatic mutations

9

• As of now, tens of thousands of cancer genomes have been sequenced

• These sequenced data have led to some very interesting observations

• 50% of all cancers have mutations in the p53 genes in their genomes

• ~90% of  colorectal cancer have mutations in the APC gene in their genomes

• 95% of CML have Philadelphia chromosome in their genomes

• …

Knowledge Derived from Cancer Genomes

10

•Widely observed oncogenic mutations

• RAS, WNT, MYC, Erk, TRK, SRC, RET, EGFR, β‐Catenin, ERBB, JUN, MDM2, RAF, KIT

•Widely observed tumor suppressor gene mutations in

• P53, PTEN, RB1, VHL, SMAD4, MSH, KEAP1, BAX, NOTCH1

Knowledge Derived from Cancer Genomes

11

• Different types of cancers tend to have different levels of mutations rates

• Lung cancer may have tens of thousands of mutations 

• Pediatric cancers tend to have a far fewer mutations, typically a few tens.

Analysis of Cancer Genomes

Possible Projects

• Explain why certain cancers tend to have higher mutation rates than the other cancer types

•What are the relationships between the average mutation rates and X‐year survival rates?

• How  mutation rates increase as a cancer advances?

12

13

•While a cancer genome may harbor thousands to tens of thousands of mutations, it is believed that only a small portion of them contribute to cancer development 

• B. Vogelstein suggests that a typical cancer needs only 2‐8 key mutations 

• He speculates that out of all the mutations found in cancer genomes, only ~300 contribute to cancer development

Analysis of Cancer Genomes

14

Driver vs Passenger Mutations

• In their review article “The Cancer Genome” published in Nature (2009), the authors stated

All cancers arise as a result of somatically acquired changes in the DNA of cancer cells. That does not mean, however, that all the somatic abnormalities present in a cancer genome have been involved in development of the cancer. Indeed, it is likely that some have made no contribution at all. To embody this concept, the terms 'driver' and 'passenger' mutation have been coined.

15

Driver vs Passenger Mutations

• The authors went further by defining 

A driver mutation is causally implicated in oncogenesis. It has been positively selected. A driver mutation need not be required for maintenance of the final cancer but it must have been selected at some point. A passenger mutation has not been selected, has not conferred clonal growth advantage and has therefore not contributed to cancer development.

16

Driver vs Passenger Mutations• The authors continue to state

• Currently there are no scientifically sound and operational criteria for determining “driver” vs “passenger” mutations

A central goal of cancer genome analysis is the identification of cancer genes that carry driver mutations. A key challenge will therefore be to distinguish driver from passenger mutations. 

Cancer Genomes• In their recent Science paper “Cancer Genome Landscapes” the authors, Vogelstein et al stated:

For most cancer types, this landscape consists of a small number of “mountains” (genes altered in a high percentage of tumors) and a much larger number of “hills” (genes altered infrequently). To date, these studies have revealed ~140 genes that, when altered by intragenic mutations, can promote or “drive” tumorigenesis. 

A typical tumor contains two to eight of these “driver gene” mutations; the remaining mutations are passengers that confer no selective growth advantage. 

Driver genes can be classified into 12 signaling pathways that regulate three core cellular processes: cell fate, cell survival, and genome maintenance.

17

• The authors further stated: 

The first mutation provides a selective growth advantage to a normal epithelial cell, allowing it to outgrow the cells that surround it and become a microscopic clone. [Such] mutations in the colon most often occur in the APC gene. 

The small adenoma that results from this mutation grows slowly, but a second mutation in another gene, such as KRAS, unleashes a second round of clonal growth that allows an expansion of cell number. The cells with only the APCmutation may persist, but their cell numbers are small compared with the cells that have mutations in both genes. 

This process of mutation followed by clonal expansion continues, with mutations in genes such as PIK3CA, SMAD4, and TP53, eventually generating a malignant tumor that can invade through the underlying basement membrane. 

18

Cancer Genomes

• The authors found that observed mutations tend to enrich 14 pathways

19

Cancer Genomes

20

•We have recently examined two published sets of genomic mutation data of colon cancers

• One with 20 samples consisting of 1 polyp with 4 mutations, 8 mild and small adenoma samples harboring 272 mutations, 8 severe and large adenoma samples having 344 mutations and 3 adenocarcinoma samples with 198 mutations

• One with 131 samples, 18 stage‐1 samples with 1,439 mutations, 47 stage‐2 samples with 3,683 mutations, 43 stage‐3 samples harboring 3,657 mutations and 23 stage‐4 samples having 2,061 mutations131 adenocarcinoma samples, 

• According to the published papers by original authors, the first data has nine driver mutations and the second set has 32 driver mutations

A Case Study

21

A Case Study•We have done a pathway enrichment analysis of the “passenger” mutations considered by the published studies

• Discovered that at least 20% of the “passenger” mutations contributing to cancer development

• In early adenoma, mutations enrich:  the composition of the extracellular matrix (ECM) and cell‐ECM interactions, cell‐cell adhesion, cell morphology and cell cycle

• In large adenoma, mutations enrich EGF‐like (epidermal growth factor like) domain, ABC transporters, cadherin, and actin binding  in addition to above

22

A Case Study

• In stage I adenocarcinoma, mutations enrich: ion transporters, plasma membrane, immunoglobulins and complement control in addition to the above

• In stage II ‐ IV adenocarcinoma, mutations enrich: Rho guanyl‐nucleotide exchange factor activity (stage 2), GTPase binding (stage 4); cell motion (stages 2, 3 and 4); differentiation (stages 3 and 4); embryonic development; and a tyrosine kinase (stages 3 and 4)

23

A Case Study

•Mutations in early adenocarcinoma are mostly to disrupt the normal timing control of cell cycle events, enhance glycolytic ATP production and disrupt the immune system

•Mutations in later adenocarcinoma are mostly related to cell motion, cell de‐differentiation and tissue development

24

A Case Study•Overall, mutation data, particularly the so called passengermutations, provide substantially more information than just cell proliferation or tumor suppression 

• A combination of both “driver” and “passenger” mutations provides a whole picture about cancer evolution of a specific type

• Current analysis studies of cancer genomes have been somewhat misguided as they tend to focus on the so called driver mutations, which are largely determined based on cellular level data

25

Some Thoughts• The original definition of driver mutations: a mutation that gives a selective advantage to a clone in its microenvironment, through either increasing its survival or reproduction

•Oncogenes and tumor suppressor genes are originally both defined in terms of their relevance to cancer tissue development 

•Over the years, their original meanings have evolved to a cellular level function, which has limited our vision when analyzing cancer genome data

•Overall, mutations are probably the results of ROS, including hydroxyl radicals

• Some mutations are selected to help the host cells adjust to the changing microenvironments (rather than giving them a growth advantage as widely believed)

26

Some Thoughts

• … Increasingly, somatic mutations are being identified in diseases other than cancer, including neurodevelopmental diseases. Somatic mutations can arise during the course of prenatal brain development and cause neurological disease, resulting in brain malformations associated with epilepsy and intellectual disability. Novel, highly sensitive technologies will allow more accurate evaluation of somatic mutations in neuro‐developmental disorders.

27

Mutations in Other Diseases

Mutations in Other Diseases

• The authors stated: Mutation of the gene PARK2, which encodes an E3 ubiquitin ligase, is the most common cause of early‐onset Parkinson's disease. In a search for multisite tumor suppressors, we identified PARK2as a frequently targeted gene on chromosome 6q25.2–q27 in cancer. 

28

• Authors stated: Chromosome aneuploidy, particularly for chromosome 21, could be one of the mechanisms underlying both AD and the dementia

29

Mutations in Other Diseases

•… After testing an independent cohort of 2,009 cases of ulcerative colitis and 1,580 controls, we identified 13 loci that were significantly associated with ulcerative colitis (P < 5 × 10−8)

30

Mutations in Other Diseases

31

Mutations in Other Diseases

Questions

•Why are cancer considered as a disease of genomic mutations but other diseases are not?

• Is it possible that this is a result of 先入为主; i.e, genomic mutations were first aberrant detected in the disease? For example, if epigenomic irregularity was first discovered in cancer before other irregularities, it may be considered as an “epigenomic disease”?

• It is worth thinking!

32

33

Oncogenic Mutations We consider oncogenic mutations as those that offer assistance to enable proliferating cells to divide fast enough to keep up with the rate of Fenton reactions

Tumor Suppressor Mutations•We consider tumor suppressor mutations as those that enable neoplastic cells to overcome gate keepers so they can survive

34

Functional Gain/Loss by Mutations

• To study the detailed functional gains or losses by specific mutations in specific caner tissue

• This can be done through comparative analyses of gene‐expression patterns between tissues with a specific mutation versus those without the mutation

35

Epigenomic Changes and Stresses

36

Homework• Reading Chapter 9 of the text book

• “Environmental stress and epigenetic trans‐generational inheritance”, BMC Medicine, 2014

• “Stress and the epigenetic landscape: a link to the pathobiology of human diseases?”, Nature Review Genetics, 2010

• “The Epigenomics of Cancer”, Cell, 2007.

• “Cancer epigenomics: beyond genomics”, Current Opinion in Genetics and Development, 2012.

• “Epigenetically heritable alteration of fly development in response to toxic challenge”, Cell Report, 2012

37

Stresses Encountered by Cancer

• As the disease evolves, cancer (or cancer forming) cells have to overcome tremendous stresses encountered

• The defining stresses of a cancer are probably those induced by Fenton reactions• overcoming increased pH

• coping with continuous damages to cellular components, including DNA

• riding of continuously synthesized nucleotides• coordinating different aspects of cell division, which is not driven by top down signals

• ROS associated stresses

38

• Hypoxia due to tumor growth and continuous production of ROS; and even more challenging is intermittent hypoxia (hypoxia and angiogenesis) 

• Acidosis due to continuous release of lactic and other acids • Destruction by cellular surveillance such as apoptosis• Destruction by immune attacks

• Cell‐cell competition in growing tissue

•Major internal stresses such as mitochondrial and ER stresses due to massive (and local) changes in metabolisms

39

Stresses Encountered by Cancer

Responses to the Stresses• Some of these stresses are responded through regulatory mechanisms such as 

• activation of glycolytic ATP synthesis and nucleotide synthesis to produce protons for neutralizing continuous OH‐ production

• utilization of more powerful mitogenic factors, such as cholesterol and steroidal derivatives, to accelerate cell division to keep pace with nucleotide synthesis

• Some of these stresses are responded through selection of mutations such as 

• P53 to avoid immune attacks as well as cell‐cell competition

• MYC to accelerate cell cycle progression to meet the need to rid of synthesized nucleotides at a rate comparable to that of their synthesis

40

•When none of the above work (i.e., cells are increasingly more stressed), there is one last resort that our cellular system can activate, to give the most stressed cells a chance to escape 

• Changes at the epigenomic level!

41

Responses to the Stresses

Epigenomics in Human • DNA can have chemical modifications, such as methylation and histone modification, which can affect transcription of the relevant genes.

42

• These modifications are collectively defined as the epigenome of a cell.

• Unlike genomes, epigenomes can be modified by environmental conditions

• Like genomes, some epigenomic modifications can be inherited by future off‐springs but for a limited number of generations.

Epigenomic Machinery• Human cells have at least two sets of enzymes that execute DNA methylation and histone modifications that impact on DNA‐protein interactions, folding, packing and nucleosome positioning, thus facilitating or inhibiting various DNA‐related functions such as transcription or DNA replication , namely 

• a number of DNA methylation and demethylation enzymes  and

• a large collection of histone modification enzymes (at least 65) , including acetylation, deamination, methylation, phosphorylation, sumoylation and ubiquitination

43

Functions of Epigenomes • The epigenome of a cell is largely responsible for the dynamic reorganization of chromosomes to modulate transcriptional accessibility of genes and pathways

• T

44

Functions of Epigenomes

• The current understanding is that epigenomic level activities such as DNA methylation and histone modification are largely regulated by long non‐coding RNAs (lncRNAs) through utilizing the RNA structures as scaffolds for organizing DNA‐modifying proteins 

45

Functions of Epigenomes

• In addition, miRNAs have also been found to play regulatory roles in epigenomic activities 

• For example, miRNAs have been found to regulate DNA methyltransferases, histone deacetylases and polycomb group genes.

46

Examples of Epigenomic Functions• Early‐life stress (ELS) is known to be associated with an increased risk of neuropsychiatric disease in later life. 

• Using a cohort of 83 men, who experienced ELS in the form of separation from their parents during childhood, and a group of 83 matched controls, researchers found differences in DNA methylation in association with the development of at least mild depressive symptoms over the subsequent 5–10 years, at genes with roles in brain development and/or function in association with depressive symptoms. 

47

• Neuralogy research has found that there are DNA methylation as well as chromatin marks in memory‐associated genes

48

Elucidated Functions of Epigenomes

General Purpose of Epigenomes• The epigenome of a cell probably records the key information about the main functionalities of the  cell – the score of a symphony

• In addition, it seems to give the cells the flexibility to memorize new experiences, particularly repeated experiences, and how the experiences are handled. 

• This is particularly useful, even essential, for cells to survive previously unexperienced stresses.  

49

Stresses and Epigenomes• A variety of studies have reported relationships between stresses and transgenerational epigenomic level changes, such as restraint stress and forced swimming promoted preterm birth risk and adverse newborn outcomes generationally

•One specific mechanism is through generation of stress hormones such as glucocorticoid and corticosterone, which can regulate changes at the epigenomic level of HPA axis genes in the hippocampus 

• Interestingly longer exposure to stresses and hence stress hormones tend to leave longer lasting epigenomic changes

50

Stresses and Epigenomes• Researchers have detected a distinctive epigenomic 'signature' in the DNA of children born in the aftermath of the massive Quebec ice storm.

• Five months after the event, researchers recruited women who had been pregnant during the disaster and assessed their degrees of hardship and distress

• Thirteen years later, the researchers found that DNA within the T cells of 36 children showed distinctive patterns in DNA methylation.

• A variety of stress types, such as physical stress, mental stress, maternal stress, all seem to leave marks on the epigenomes

51

Stresses and Epigenomes•Multiple cellular and micro‐environmental stresses have been found to leave marks in the relevant epigenomes

• Oxidative stress

• ER stress

• Mitochondrial stress

• Inflammation associated stresses

• Energetic stress

• Nutrient depletion associated stress

• ….

52

Epigenomic Changes in Cancer• Various observations have been made regarding epigenomic changes in cancer genomes

• Examples: 

• DNA hypermethylation tends to occur in tumor suppressor genes

• The majority of DNA methylation changes are located at the non‐promoter CGI shores, defined as regions next to CGIs (CpG islands), up to 2 kb long rather than in CGIs in cancer

• Global reduction of trimethyl‐H4K20 and acetyl‐H4K16 in hypomethylated repeat sequences has been reported in several cancer types

53

•Overall cancer genomes tend to have a global reduction in DNA methylation, while promoter regions of protein‐encoding genes generally have increased methylation compared with the matching noncancerous genomes

• A global reduction in mono‐acetylated and tri‐methylated histone H4 has been observed in the epigenomes of numerous cancer types 

•Over‐production of histone methyltransferases for methylation of the K4 or K27 residue of histone H3 has been found across multiple cancer types

54

Epigenomic Changes in Cancer

Possible Projects

•Why do cancer cells tend to have reduced global level of methylation?

• Can you possibly identify the master regulator of global methylation?

55

• Compared to other areas of epigenomic studies, cancer epigenomicsseem to be behind in terms of understanding of the biological roles played by epigenomics in cancer development

• The reasons, we suspect, are two: (a) there has not been systematic characterization of “stresses” occurring in cancer, knowing that epigenomic activities are probably largely responsive to stresses; and (b) there have been lacking general frameworks for linking epigenomic contributions to cancer evolution (beyond the level of transcription regulation of individual genes) 

56

Epigenomic Changes in Cancer

A Model Potentially Useful• A group of researchers in Israel has conducted an interesting study aiming to elucidate the mechanism of (a) how epigenomic level activities may be regulated and (b) what type of epigenomic information may be passed on to the future generations

• They prepared a toxin G418, which can kill the cells of fruit‐fly larva if injected and not pumped out

• They also developed a genetic system to insert a gene into larva cells, which encodes a transporter and can pump out the toxin if activated, plus a random promoter associated with development 

57

A Model Potentially Useful• They prepared two sets of cultures, one being generally engineered and one being wild type; for the genetically engineered one, they tried 8 different and randomly selected promoters

• Then they injected the toxin into each cultured larva

• All the ones without the inserted gene are killed

• 7 out of the 8 groups of larvae with the inserted gene and promoter pumped out the toxin and developed into the adulthood fruit‐flies but with a long delay. 

• The off‐springs of the survived larvae all pumped out the toxin after insertion and develop into adulthood without any delays, but only for four generations. 

58

A Model Potentially Useful• Speculations and proposal by the authors:• Larva has an encoded mechanism to allow the cells to “broaden” the application of development‐associated “IF‐THEN” response systems, in a systematic manner, through epigenomic level changes

• This system is probably activated under persistent and unfamiliar stresses

• The authors even suggest that Polycomb is the master regulator of this general stress‐response system at the epigenomic level

59

Possible Relevance to Human Cancer• The overall epigenomic level activities seem to go up between normal and cancer tissues

60

methylations

histone modification

Gastric cancer melanoma Lung cancer

• In addition, Polycomb seems to be behave in a similar fashion to those of the epigenomic associated enzymes, suggesting the possibility that Polycombmay have similar roles to those in fruit fly larva

61

Possible Relevance to Human Cancer

Gastric cancer melanoma Lung cancer

Issues to Think About • Functional inference of epigenomic activities through association studies between stresses and, e.g., methylation patterns 

62Finding specific and strong associations.

Issues to Think About •Mechanism studies of epigenomic level response to stresses through co‐expression analyses, possibly using Polycomb as a starting point• To identify regulators of various epigenomic related enzymes

• To identify functional links between these regulators and stresses, including stress hormones

• May need to include lncRNA and miRNA as they have been found to be heavily involved in regulation of epigenomic activities 

• There are some major discoveries to be made in cancer epigenomics as the state of the art is cancer epigenomics is behind other epigenomics studies, particularly plant epigenomic studies

63

Possible Links between Epigenomic and Genomics

•One early study found that decreasing the level of DNA methylation on a genomic scale by activating methylation inhibitors can lead to the instability of the CTG∙CAG repeat in the genome.

•Other studies found that hypo‐methylation tends to be associated with increased genomic instability in general.

• A more recent study suggests that it is the activity of DNA demethylation rather than the hypo‐methylation state of a genome that correlates with genome instability, an observation made on colon cancer.

64

Possible Links between Epigenomic and Genomics

• In addition, there seems to be a deep connection between DNA repair and methylation mechanisms, by sharing common components

• Improved understanding on the relationships between epigenomic activity levels and genomic mutations could have profound impact not just in cancer research but also in human biology in general.

65

Summary• Cancer is a survival process by way of cell proliferation

• Specific genomic mutations  are selected overcome specific stresses to enable cancer cells survival

• General stress response via the epigenomic level has been actively used by cancer cells to overcome highly stressful conditions

• Association analysis between stresses and epigenomic activities can possibly 

66