2. 분자생물학 데이터베이스 2.1 역사적인 배경

19
2. 분분분분분 분분분분분분 2.1 분분분분 분분 분분분분분분분 분분분

description

2. 분자생물학 데이터베이스 2.1 역사적인 배경. 분자유전체학과 이영애. 분자생물학 데이터베이스의 발전. - 19 세기 : 유전학과 세포생물학 - 20 세기 : 분자생물학. - 생물학의 기초적인 관찰 - 컴퓨터화된 데이터베이스 ( 팽창해가는 지식들의 기반 ). 분자생물학 데이터베이스. 문헌 데이터베이스 정보 검색의 목적 도서목록과 온라인 간행물 검색 사실정보 데이터베이스 실험 데이터들의 집합 핵산 염기 서열 , 단백질 서열 , 3 차원 분자 구조 지식 기반 - PowerPoint PPT Presentation

Transcript of 2. 분자생물학 데이터베이스 2.1 역사적인 배경

2 분자생물학 데이터베이스

21 역사적인 배경

분자유전체학과

이영애

분자생물학 데이터베이스의 발전

- 19 세기 유전학과 세포생물학

- 20 세기 분자생물학

- 생물학의 기초적인 관찰

- 컴퓨터화된 데이터베이스

( 팽창해가는 지식들의 기반 )

분자생물학 데이터베이스

1 문헌 데이터베이스- 정보 검색의 목적- 도서목록과 온라인 간행물 검색

2 사실정보 데이터베이스- 실험 데이터들의 집합- 핵산 염기 서열 단백질 서열 3 차원 분자 구조

3 지식 기반- 저장된 지식으로부터 새로운 지식 추론을 목적- 생물학적 기능들에 대한 지식 표현

lt 표 2-1gt 분자생물학 데이터베이스들의 발전

데이터베이스 종류 데이터 내용 예

1 문헌 데이터베이스 서지학적 인용 MEDLINE (1971)

2 사실정보 데이터베이스 핵산서열 GenBank(1982) EMBL(1982)

DDBJ(1984)아미노산 서열 PIR(1968) PRF(1979)

SWISS- PROT(1986)

3 차원 분자 구조 PDB(1971) CSD(1965)

3 지식 기반 모티프 라이브러리 PROSITE(1988)

분자 분류 SCOP(1994)

생화학 경로 KEGG(1995)

온라인 간행물

lt 표 2-2gt 중요한 데이터베이스들의 주소

데이터베이스 기관 주소

MEDLINE 국립 의학도서관 wwwnlmnihgov

GenBank 국립 생명공학 정보센터 wwwncbi nlmnihgov

EMBL 유럽 생물정보학 연구소 www ebiacuk

DDBJ 일본 국립 유전학 연구소 www ddbjnigacjp

SWISS-PROT 스위스 생물정보학 연구소 wwwexpasych

PIR 국립 생명의학 연구재단 www-nbrfgeorgetownedu

PRF 일본 단백질 연구재단 wwwprforjp PDB 구조생명정보학 연구공동체 wwwrcsborg

CSD 캠브리지 결정학 데이터센터 wwwccdccamacuk

lt표 2-3gt 새로운 세대의 분자생물학 데이터베이스

정보 데이터베이스 주소

화합물과 반응 LIGAND wwwgenomeadjpdbgetligandhtml

AAindex wwwgenomeadjpdbgetaaindexhtml

단백질 군과 PROSITE wwwexpasychsprotprositehtml

서열 모티프 Blocks www blocksfhcrcorg

PRINTS wwwbiochemuclacukbsmdbbrowserPRINTS

Pfam wwwsangeracukPfampfamwustledu

ProDom proteintoulouseinrafrprodomhtml

lt표 2-3gt 새로운 세대의 분자생물학 데이터베이스

정보 데이터베이스 주소

3 차원 폴드 분류 SCOP scopmrc-lmbcamacukscop

CATH wwwbiochemuclacukbsmcath

오소로그 유전자 COG wwwncbinlmnihgovCOG

KEGG www genomeadjpkegg

생화학 경로 KEGG www genomeadjpkegg

WIT wwwmcsanlgovWIT2

Ecocyc ecocycPangeaSystemscomecocyc

UM-BBD wwwlabmedumneduumbbd

유전체 다양성 NCBI Taxonomy wwwncbinlmnihgovTaxonomy

OMIM wwwncbinlmnihgovOmim

도서목록 데이터베이스

MEDLINE

- 1971 년 이후 온라인으로 이용

미국 국립보건원 (NIH) 의 국립의학도서관 (NLM) 통관

-1988 년 국립생명공학정보센터 (NCBI) 로 이관된 후

분자생물학 최고의 데이터베이스

① DNA 염기 서열 단백질 서열 3 차원 분자구조 등의 사실 정보 데이터 베이스와 연결

② 온라인으로 Full text 를 제공하는 간행물 출판사와 연결

③ 인터넷으로 무료로 사용 가능

아미노산 서열 데이터베이스

PIR-International Protein Sequence Database

- 1968-1978 년 ldquo데이호프rdquo가 ldquo단백질 서열과 구조 도해서rdquo 출판 1980 년대 NBRF 단백질 서열 데이터베이스가 시초

- 1984 년 Protein Information Resource (PIR) 이 NIH 지원으로 설립 -1988 년 독일 뮌헨 단백질 서열 정보센터 (MIPS) 와 일본 국제 단백질 서열 데이터베이스 (JIPID) 와 협력

아미노산 서열 데이터베이스

Protein Research Foundation (PRF)

-1975 년 일본의 단백질 연구 재단 (PRE) 이 ldquo펩티드 정보(Peptide information)rdquo 를 출판

-1979 년 전산화한 데이터베이스 SEQDB 와 LITDB 제작

-아미노산 서열을 서지학적 정보 부분으로 다룸

아미노산 서열 데이터베이스

SWISS-PROT

- 1986 년 제네바대학에서 제작

데이터의 질적인 면에서 최고

- 1987 년 유럽 분자 생물학연구소 (EMBL) 과 협력하여

뉴클레오티드 서열 데이터베이스를 번역하여 보완

- 현재 스위스생물정보학협회 (SIB) EMBL 의

유럽생물정보학협회 (EBI) 와 공동으로 운영

3차원 구조 데이터베이스Protein Data Bank(PDB)

-1971 년 북하벤 국립연구소 (BNL) 에 설립

-1999 년 구조생물 정보학 연구협력 기구 (RCSB) 가 운영

- 단백질 RNA DNA 탄수화물 분자 합성물 바이러스 구조 정보

Cambridge Structural Database(CSD)

-1965 년 캠브리지대학에 설립

-1989 년 캠브리지 결정데이터센터 (CCDC) 에 의해 유지

-서지학적 화학적 결정학적 데이터와 X- 레이 중성자 회절방법에 의한 3 차원 분자좌표 데이터를 포함

뉴클레오티드 서열 데이터베이스

GeneBank

-1982 년 로스 알라모스 국립연구소

-1992 년 NCBI 로 이관

EMBL-1982 년 유럽 분자생물학 연구소-1994 년 EBI 로 이관

DDBJ

-1984 년 일본 DNA 데이터 은행

이들 세 기관이 ldquo국제 뉴클레오티드 서열 데이터베이스

협력기구rdquo 결성하여 매일 데이터를 교환

lt 그림 2-1gt (a) 등록자료의 개수와 (b) 잔기의 개수에서 본 서열과 3차원 구조 데이터베이스들의 성장

플랫 파일 (Flat File) 형식

- 핵산 서열 단백질 서열 3 차원 분자 구조 데이터베이스에 널리 사용

- 데이터 처리 및 이용이 쉬움

-서열 데이터베이스 등록자료 내용

① 명명법 서지학적 정보

② 서열 특성에 대한 생물학적 주석을 포함한 특징표

③ 일차 서열 데이터

GeneBank 의 서열데이터베이스

LOCUS DRODPPC 4001 bp mRNA linear INV 26-APR-1993 DEFINITION Dmelanogaster decapentaplegic gene complex (DPP-C) complete cdsACCESSION M30116 VERSION M301161 GI157291 KEYWORDS SOURCE Drosophila melanogaster (fruit fly) ORGANISM Drosophila melanogaster Eukaryota Metazoa Arthropoda Hexapoda Insecta Pterygota Neoptera Endopterygota Diptera Brachycera Muscomorpha Ephydroidea Drosophilidae Drosophila REFERENCE 1 (bases 1 to 4001) AUTHORS PadgettRW St JohnstonRD and GelbartWM TITLE A transcript from a Drosophila pattern gene predicts a protein homologous to the transforming growth factor-beta family JOURNAL Nature 325 (6099) 81-84 (1987) PUBMED 3467201 COMMENT Original source text Dmelanogaster cDNA to mRNA The initiation codon could be at either 1188-1190 or 1587-1589 FEATURES LocationQualifiers source 14001 organism=Drosophila melanogaster mol_type=mRNA db_xref=taxon7227 mRNA lt13918 product=decapentaplegic protein mRNA CDS 11882954 note=decapentaplegic protein (1188 could be 1587) codon_start=1 protein_id=AAA284821 db_xref=GI157292 translation=MRAWLLLLAVLATFQTIVRVASTEDISQRFIAAIAPVAAHIPLAhelliphellipLGYDAYYCHGKC PFPLADHFNSTNHAVVQTLVNNMNPGKVPKACCVPTQLDSVAMLYL NDQSTVVLKNYQEMTVVGCGCR ORIGIN 1 gtcgttcaac agcgctgatc gagtttaaat ctataccgaa atgagcggcg gaaagtgagc 61 cacttggcgt gaacccaaag ctttcgagga aaattctcgg acccccatat acaaatatcg 121 gaaaaagtat cgaacagttt cgcgacgcga agcgttaaga tcgccaaaag atctccgtgc 181 ggaaacaaag aaattgaggc actattaaga gattgttgtt gtgcgcgagt gtgtgtcttc 241 agctgggtgt gtggaatgtc aactgacggg ttgtaaaggg aaaccctgaa atccgaacgg helliphelliphelliphellip 3841 aactgtataa acaaaacgta tgccctataa atatatgaat aactatctac atcgttatgc 3901 gttctaagct aagctcgaat aaatccgtac acgttaatta atctagaatc gtaagaccta 3961 acgcgtaagc tcagcatgtt ggataaatta atagaaacga g

SWISS-PROT의 서열 데이터 베이스Entry information

Entry name DECA_DROME

Primary accession number P07713

Secondary accession numbers P91651 Q6AWM1 Q8I0M7 Q8ITK4 Q9VQC6

Integrated into Swiss-Prot on April 1 1988

Sequence was last modified on September 13 2005 (Sequence version 2)

Annotations were last modified on

March 21 2006 (Entry version 66)

Name and origin of the protein

Protein name Protein decapentaplegic [Precursor]

Synonym Protein DPP-C

Gene name Name dpp

ORFNames CG9885

From Drosophila melanogaster (Fruit fly) [TaxID 7227]

Taxonomy Eukaryota

Metazoa Arthropoda Hexapoda Insecta Pterygota Neoptera Endopterygota Diptera Brachycera Muscomorpha Ephydroidea Drosophilidae Drosophila

References

[1] NUCLEOTIDE SEQUENCE [MRNA]DOI=101038325081a0 PubMed=3467201 [NCBI ExPASy EBI Israel Japan]Padgett RW St Johnston RD Gelbart WMA transcript from a Drosophila pattern gene predicts a protein homologous to the transforming growth factor-beta familyNature 32581-84(1987)

Features helliphelliphellip

Sequence information helliphelliphelliphellip

유전체 데이터베이스

- 생물 종에 대한 유전적 지도 물리적 지도 핵산 서열 아미노산 서열과 같은 여러 종류의 데이터를 포함- 다양한 해상력에서의 유전체 구조- 다양한 단계에서의 유전체 기능- 유전자 기능에 따른 계층적 분류- DNA 칩 단백질 칩과 같은 실험 방법들로부터 얻은

새로운 종류의 발현 데이터들과 통합 발전

lt 표 2-4gt 라일리 (Monica Riley) 에 따른 대장균 (E coli)유전자들의 기능적인 분류

  • Slide 1
  • Slide 2
  • Slide 3
  • Slide 4
  • Slide 5
  • Slide 6
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Slide 12
  • Slide 13
  • Slide 14
  • Slide 15
  • Slide 16
  • Slide 17
  • Slide 18
  • Slide 19

분자생물학 데이터베이스의 발전

- 19 세기 유전학과 세포생물학

- 20 세기 분자생물학

- 생물학의 기초적인 관찰

- 컴퓨터화된 데이터베이스

( 팽창해가는 지식들의 기반 )

분자생물학 데이터베이스

1 문헌 데이터베이스- 정보 검색의 목적- 도서목록과 온라인 간행물 검색

2 사실정보 데이터베이스- 실험 데이터들의 집합- 핵산 염기 서열 단백질 서열 3 차원 분자 구조

3 지식 기반- 저장된 지식으로부터 새로운 지식 추론을 목적- 생물학적 기능들에 대한 지식 표현

lt 표 2-1gt 분자생물학 데이터베이스들의 발전

데이터베이스 종류 데이터 내용 예

1 문헌 데이터베이스 서지학적 인용 MEDLINE (1971)

2 사실정보 데이터베이스 핵산서열 GenBank(1982) EMBL(1982)

DDBJ(1984)아미노산 서열 PIR(1968) PRF(1979)

SWISS- PROT(1986)

3 차원 분자 구조 PDB(1971) CSD(1965)

3 지식 기반 모티프 라이브러리 PROSITE(1988)

분자 분류 SCOP(1994)

생화학 경로 KEGG(1995)

온라인 간행물

lt 표 2-2gt 중요한 데이터베이스들의 주소

데이터베이스 기관 주소

MEDLINE 국립 의학도서관 wwwnlmnihgov

GenBank 국립 생명공학 정보센터 wwwncbi nlmnihgov

EMBL 유럽 생물정보학 연구소 www ebiacuk

DDBJ 일본 국립 유전학 연구소 www ddbjnigacjp

SWISS-PROT 스위스 생물정보학 연구소 wwwexpasych

PIR 국립 생명의학 연구재단 www-nbrfgeorgetownedu

PRF 일본 단백질 연구재단 wwwprforjp PDB 구조생명정보학 연구공동체 wwwrcsborg

CSD 캠브리지 결정학 데이터센터 wwwccdccamacuk

lt표 2-3gt 새로운 세대의 분자생물학 데이터베이스

정보 데이터베이스 주소

화합물과 반응 LIGAND wwwgenomeadjpdbgetligandhtml

AAindex wwwgenomeadjpdbgetaaindexhtml

단백질 군과 PROSITE wwwexpasychsprotprositehtml

서열 모티프 Blocks www blocksfhcrcorg

PRINTS wwwbiochemuclacukbsmdbbrowserPRINTS

Pfam wwwsangeracukPfampfamwustledu

ProDom proteintoulouseinrafrprodomhtml

lt표 2-3gt 새로운 세대의 분자생물학 데이터베이스

정보 데이터베이스 주소

3 차원 폴드 분류 SCOP scopmrc-lmbcamacukscop

CATH wwwbiochemuclacukbsmcath

오소로그 유전자 COG wwwncbinlmnihgovCOG

KEGG www genomeadjpkegg

생화학 경로 KEGG www genomeadjpkegg

WIT wwwmcsanlgovWIT2

Ecocyc ecocycPangeaSystemscomecocyc

UM-BBD wwwlabmedumneduumbbd

유전체 다양성 NCBI Taxonomy wwwncbinlmnihgovTaxonomy

OMIM wwwncbinlmnihgovOmim

도서목록 데이터베이스

MEDLINE

- 1971 년 이후 온라인으로 이용

미국 국립보건원 (NIH) 의 국립의학도서관 (NLM) 통관

-1988 년 국립생명공학정보센터 (NCBI) 로 이관된 후

분자생물학 최고의 데이터베이스

① DNA 염기 서열 단백질 서열 3 차원 분자구조 등의 사실 정보 데이터 베이스와 연결

② 온라인으로 Full text 를 제공하는 간행물 출판사와 연결

③ 인터넷으로 무료로 사용 가능

아미노산 서열 데이터베이스

PIR-International Protein Sequence Database

- 1968-1978 년 ldquo데이호프rdquo가 ldquo단백질 서열과 구조 도해서rdquo 출판 1980 년대 NBRF 단백질 서열 데이터베이스가 시초

- 1984 년 Protein Information Resource (PIR) 이 NIH 지원으로 설립 -1988 년 독일 뮌헨 단백질 서열 정보센터 (MIPS) 와 일본 국제 단백질 서열 데이터베이스 (JIPID) 와 협력

아미노산 서열 데이터베이스

Protein Research Foundation (PRF)

-1975 년 일본의 단백질 연구 재단 (PRE) 이 ldquo펩티드 정보(Peptide information)rdquo 를 출판

-1979 년 전산화한 데이터베이스 SEQDB 와 LITDB 제작

-아미노산 서열을 서지학적 정보 부분으로 다룸

아미노산 서열 데이터베이스

SWISS-PROT

- 1986 년 제네바대학에서 제작

데이터의 질적인 면에서 최고

- 1987 년 유럽 분자 생물학연구소 (EMBL) 과 협력하여

뉴클레오티드 서열 데이터베이스를 번역하여 보완

- 현재 스위스생물정보학협회 (SIB) EMBL 의

유럽생물정보학협회 (EBI) 와 공동으로 운영

3차원 구조 데이터베이스Protein Data Bank(PDB)

-1971 년 북하벤 국립연구소 (BNL) 에 설립

-1999 년 구조생물 정보학 연구협력 기구 (RCSB) 가 운영

- 단백질 RNA DNA 탄수화물 분자 합성물 바이러스 구조 정보

Cambridge Structural Database(CSD)

-1965 년 캠브리지대학에 설립

-1989 년 캠브리지 결정데이터센터 (CCDC) 에 의해 유지

-서지학적 화학적 결정학적 데이터와 X- 레이 중성자 회절방법에 의한 3 차원 분자좌표 데이터를 포함

뉴클레오티드 서열 데이터베이스

GeneBank

-1982 년 로스 알라모스 국립연구소

-1992 년 NCBI 로 이관

EMBL-1982 년 유럽 분자생물학 연구소-1994 년 EBI 로 이관

DDBJ

-1984 년 일본 DNA 데이터 은행

이들 세 기관이 ldquo국제 뉴클레오티드 서열 데이터베이스

협력기구rdquo 결성하여 매일 데이터를 교환

lt 그림 2-1gt (a) 등록자료의 개수와 (b) 잔기의 개수에서 본 서열과 3차원 구조 데이터베이스들의 성장

플랫 파일 (Flat File) 형식

- 핵산 서열 단백질 서열 3 차원 분자 구조 데이터베이스에 널리 사용

- 데이터 처리 및 이용이 쉬움

-서열 데이터베이스 등록자료 내용

① 명명법 서지학적 정보

② 서열 특성에 대한 생물학적 주석을 포함한 특징표

③ 일차 서열 데이터

GeneBank 의 서열데이터베이스

LOCUS DRODPPC 4001 bp mRNA linear INV 26-APR-1993 DEFINITION Dmelanogaster decapentaplegic gene complex (DPP-C) complete cdsACCESSION M30116 VERSION M301161 GI157291 KEYWORDS SOURCE Drosophila melanogaster (fruit fly) ORGANISM Drosophila melanogaster Eukaryota Metazoa Arthropoda Hexapoda Insecta Pterygota Neoptera Endopterygota Diptera Brachycera Muscomorpha Ephydroidea Drosophilidae Drosophila REFERENCE 1 (bases 1 to 4001) AUTHORS PadgettRW St JohnstonRD and GelbartWM TITLE A transcript from a Drosophila pattern gene predicts a protein homologous to the transforming growth factor-beta family JOURNAL Nature 325 (6099) 81-84 (1987) PUBMED 3467201 COMMENT Original source text Dmelanogaster cDNA to mRNA The initiation codon could be at either 1188-1190 or 1587-1589 FEATURES LocationQualifiers source 14001 organism=Drosophila melanogaster mol_type=mRNA db_xref=taxon7227 mRNA lt13918 product=decapentaplegic protein mRNA CDS 11882954 note=decapentaplegic protein (1188 could be 1587) codon_start=1 protein_id=AAA284821 db_xref=GI157292 translation=MRAWLLLLAVLATFQTIVRVASTEDISQRFIAAIAPVAAHIPLAhelliphellipLGYDAYYCHGKC PFPLADHFNSTNHAVVQTLVNNMNPGKVPKACCVPTQLDSVAMLYL NDQSTVVLKNYQEMTVVGCGCR ORIGIN 1 gtcgttcaac agcgctgatc gagtttaaat ctataccgaa atgagcggcg gaaagtgagc 61 cacttggcgt gaacccaaag ctttcgagga aaattctcgg acccccatat acaaatatcg 121 gaaaaagtat cgaacagttt cgcgacgcga agcgttaaga tcgccaaaag atctccgtgc 181 ggaaacaaag aaattgaggc actattaaga gattgttgtt gtgcgcgagt gtgtgtcttc 241 agctgggtgt gtggaatgtc aactgacggg ttgtaaaggg aaaccctgaa atccgaacgg helliphelliphelliphellip 3841 aactgtataa acaaaacgta tgccctataa atatatgaat aactatctac atcgttatgc 3901 gttctaagct aagctcgaat aaatccgtac acgttaatta atctagaatc gtaagaccta 3961 acgcgtaagc tcagcatgtt ggataaatta atagaaacga g

SWISS-PROT의 서열 데이터 베이스Entry information

Entry name DECA_DROME

Primary accession number P07713

Secondary accession numbers P91651 Q6AWM1 Q8I0M7 Q8ITK4 Q9VQC6

Integrated into Swiss-Prot on April 1 1988

Sequence was last modified on September 13 2005 (Sequence version 2)

Annotations were last modified on

March 21 2006 (Entry version 66)

Name and origin of the protein

Protein name Protein decapentaplegic [Precursor]

Synonym Protein DPP-C

Gene name Name dpp

ORFNames CG9885

From Drosophila melanogaster (Fruit fly) [TaxID 7227]

Taxonomy Eukaryota

Metazoa Arthropoda Hexapoda Insecta Pterygota Neoptera Endopterygota Diptera Brachycera Muscomorpha Ephydroidea Drosophilidae Drosophila

References

[1] NUCLEOTIDE SEQUENCE [MRNA]DOI=101038325081a0 PubMed=3467201 [NCBI ExPASy EBI Israel Japan]Padgett RW St Johnston RD Gelbart WMA transcript from a Drosophila pattern gene predicts a protein homologous to the transforming growth factor-beta familyNature 32581-84(1987)

Features helliphelliphellip

Sequence information helliphelliphelliphellip

유전체 데이터베이스

- 생물 종에 대한 유전적 지도 물리적 지도 핵산 서열 아미노산 서열과 같은 여러 종류의 데이터를 포함- 다양한 해상력에서의 유전체 구조- 다양한 단계에서의 유전체 기능- 유전자 기능에 따른 계층적 분류- DNA 칩 단백질 칩과 같은 실험 방법들로부터 얻은

새로운 종류의 발현 데이터들과 통합 발전

lt 표 2-4gt 라일리 (Monica Riley) 에 따른 대장균 (E coli)유전자들의 기능적인 분류

  • Slide 1
  • Slide 2
  • Slide 3
  • Slide 4
  • Slide 5
  • Slide 6
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Slide 12
  • Slide 13
  • Slide 14
  • Slide 15
  • Slide 16
  • Slide 17
  • Slide 18
  • Slide 19

분자생물학 데이터베이스

1 문헌 데이터베이스- 정보 검색의 목적- 도서목록과 온라인 간행물 검색

2 사실정보 데이터베이스- 실험 데이터들의 집합- 핵산 염기 서열 단백질 서열 3 차원 분자 구조

3 지식 기반- 저장된 지식으로부터 새로운 지식 추론을 목적- 생물학적 기능들에 대한 지식 표현

lt 표 2-1gt 분자생물학 데이터베이스들의 발전

데이터베이스 종류 데이터 내용 예

1 문헌 데이터베이스 서지학적 인용 MEDLINE (1971)

2 사실정보 데이터베이스 핵산서열 GenBank(1982) EMBL(1982)

DDBJ(1984)아미노산 서열 PIR(1968) PRF(1979)

SWISS- PROT(1986)

3 차원 분자 구조 PDB(1971) CSD(1965)

3 지식 기반 모티프 라이브러리 PROSITE(1988)

분자 분류 SCOP(1994)

생화학 경로 KEGG(1995)

온라인 간행물

lt 표 2-2gt 중요한 데이터베이스들의 주소

데이터베이스 기관 주소

MEDLINE 국립 의학도서관 wwwnlmnihgov

GenBank 국립 생명공학 정보센터 wwwncbi nlmnihgov

EMBL 유럽 생물정보학 연구소 www ebiacuk

DDBJ 일본 국립 유전학 연구소 www ddbjnigacjp

SWISS-PROT 스위스 생물정보학 연구소 wwwexpasych

PIR 국립 생명의학 연구재단 www-nbrfgeorgetownedu

PRF 일본 단백질 연구재단 wwwprforjp PDB 구조생명정보학 연구공동체 wwwrcsborg

CSD 캠브리지 결정학 데이터센터 wwwccdccamacuk

lt표 2-3gt 새로운 세대의 분자생물학 데이터베이스

정보 데이터베이스 주소

화합물과 반응 LIGAND wwwgenomeadjpdbgetligandhtml

AAindex wwwgenomeadjpdbgetaaindexhtml

단백질 군과 PROSITE wwwexpasychsprotprositehtml

서열 모티프 Blocks www blocksfhcrcorg

PRINTS wwwbiochemuclacukbsmdbbrowserPRINTS

Pfam wwwsangeracukPfampfamwustledu

ProDom proteintoulouseinrafrprodomhtml

lt표 2-3gt 새로운 세대의 분자생물학 데이터베이스

정보 데이터베이스 주소

3 차원 폴드 분류 SCOP scopmrc-lmbcamacukscop

CATH wwwbiochemuclacukbsmcath

오소로그 유전자 COG wwwncbinlmnihgovCOG

KEGG www genomeadjpkegg

생화학 경로 KEGG www genomeadjpkegg

WIT wwwmcsanlgovWIT2

Ecocyc ecocycPangeaSystemscomecocyc

UM-BBD wwwlabmedumneduumbbd

유전체 다양성 NCBI Taxonomy wwwncbinlmnihgovTaxonomy

OMIM wwwncbinlmnihgovOmim

도서목록 데이터베이스

MEDLINE

- 1971 년 이후 온라인으로 이용

미국 국립보건원 (NIH) 의 국립의학도서관 (NLM) 통관

-1988 년 국립생명공학정보센터 (NCBI) 로 이관된 후

분자생물학 최고의 데이터베이스

① DNA 염기 서열 단백질 서열 3 차원 분자구조 등의 사실 정보 데이터 베이스와 연결

② 온라인으로 Full text 를 제공하는 간행물 출판사와 연결

③ 인터넷으로 무료로 사용 가능

아미노산 서열 데이터베이스

PIR-International Protein Sequence Database

- 1968-1978 년 ldquo데이호프rdquo가 ldquo단백질 서열과 구조 도해서rdquo 출판 1980 년대 NBRF 단백질 서열 데이터베이스가 시초

- 1984 년 Protein Information Resource (PIR) 이 NIH 지원으로 설립 -1988 년 독일 뮌헨 단백질 서열 정보센터 (MIPS) 와 일본 국제 단백질 서열 데이터베이스 (JIPID) 와 협력

아미노산 서열 데이터베이스

Protein Research Foundation (PRF)

-1975 년 일본의 단백질 연구 재단 (PRE) 이 ldquo펩티드 정보(Peptide information)rdquo 를 출판

-1979 년 전산화한 데이터베이스 SEQDB 와 LITDB 제작

-아미노산 서열을 서지학적 정보 부분으로 다룸

아미노산 서열 데이터베이스

SWISS-PROT

- 1986 년 제네바대학에서 제작

데이터의 질적인 면에서 최고

- 1987 년 유럽 분자 생물학연구소 (EMBL) 과 협력하여

뉴클레오티드 서열 데이터베이스를 번역하여 보완

- 현재 스위스생물정보학협회 (SIB) EMBL 의

유럽생물정보학협회 (EBI) 와 공동으로 운영

3차원 구조 데이터베이스Protein Data Bank(PDB)

-1971 년 북하벤 국립연구소 (BNL) 에 설립

-1999 년 구조생물 정보학 연구협력 기구 (RCSB) 가 운영

- 단백질 RNA DNA 탄수화물 분자 합성물 바이러스 구조 정보

Cambridge Structural Database(CSD)

-1965 년 캠브리지대학에 설립

-1989 년 캠브리지 결정데이터센터 (CCDC) 에 의해 유지

-서지학적 화학적 결정학적 데이터와 X- 레이 중성자 회절방법에 의한 3 차원 분자좌표 데이터를 포함

뉴클레오티드 서열 데이터베이스

GeneBank

-1982 년 로스 알라모스 국립연구소

-1992 년 NCBI 로 이관

EMBL-1982 년 유럽 분자생물학 연구소-1994 년 EBI 로 이관

DDBJ

-1984 년 일본 DNA 데이터 은행

이들 세 기관이 ldquo국제 뉴클레오티드 서열 데이터베이스

협력기구rdquo 결성하여 매일 데이터를 교환

lt 그림 2-1gt (a) 등록자료의 개수와 (b) 잔기의 개수에서 본 서열과 3차원 구조 데이터베이스들의 성장

플랫 파일 (Flat File) 형식

- 핵산 서열 단백질 서열 3 차원 분자 구조 데이터베이스에 널리 사용

- 데이터 처리 및 이용이 쉬움

-서열 데이터베이스 등록자료 내용

① 명명법 서지학적 정보

② 서열 특성에 대한 생물학적 주석을 포함한 특징표

③ 일차 서열 데이터

GeneBank 의 서열데이터베이스

LOCUS DRODPPC 4001 bp mRNA linear INV 26-APR-1993 DEFINITION Dmelanogaster decapentaplegic gene complex (DPP-C) complete cdsACCESSION M30116 VERSION M301161 GI157291 KEYWORDS SOURCE Drosophila melanogaster (fruit fly) ORGANISM Drosophila melanogaster Eukaryota Metazoa Arthropoda Hexapoda Insecta Pterygota Neoptera Endopterygota Diptera Brachycera Muscomorpha Ephydroidea Drosophilidae Drosophila REFERENCE 1 (bases 1 to 4001) AUTHORS PadgettRW St JohnstonRD and GelbartWM TITLE A transcript from a Drosophila pattern gene predicts a protein homologous to the transforming growth factor-beta family JOURNAL Nature 325 (6099) 81-84 (1987) PUBMED 3467201 COMMENT Original source text Dmelanogaster cDNA to mRNA The initiation codon could be at either 1188-1190 or 1587-1589 FEATURES LocationQualifiers source 14001 organism=Drosophila melanogaster mol_type=mRNA db_xref=taxon7227 mRNA lt13918 product=decapentaplegic protein mRNA CDS 11882954 note=decapentaplegic protein (1188 could be 1587) codon_start=1 protein_id=AAA284821 db_xref=GI157292 translation=MRAWLLLLAVLATFQTIVRVASTEDISQRFIAAIAPVAAHIPLAhelliphellipLGYDAYYCHGKC PFPLADHFNSTNHAVVQTLVNNMNPGKVPKACCVPTQLDSVAMLYL NDQSTVVLKNYQEMTVVGCGCR ORIGIN 1 gtcgttcaac agcgctgatc gagtttaaat ctataccgaa atgagcggcg gaaagtgagc 61 cacttggcgt gaacccaaag ctttcgagga aaattctcgg acccccatat acaaatatcg 121 gaaaaagtat cgaacagttt cgcgacgcga agcgttaaga tcgccaaaag atctccgtgc 181 ggaaacaaag aaattgaggc actattaaga gattgttgtt gtgcgcgagt gtgtgtcttc 241 agctgggtgt gtggaatgtc aactgacggg ttgtaaaggg aaaccctgaa atccgaacgg helliphelliphelliphellip 3841 aactgtataa acaaaacgta tgccctataa atatatgaat aactatctac atcgttatgc 3901 gttctaagct aagctcgaat aaatccgtac acgttaatta atctagaatc gtaagaccta 3961 acgcgtaagc tcagcatgtt ggataaatta atagaaacga g

SWISS-PROT의 서열 데이터 베이스Entry information

Entry name DECA_DROME

Primary accession number P07713

Secondary accession numbers P91651 Q6AWM1 Q8I0M7 Q8ITK4 Q9VQC6

Integrated into Swiss-Prot on April 1 1988

Sequence was last modified on September 13 2005 (Sequence version 2)

Annotations were last modified on

March 21 2006 (Entry version 66)

Name and origin of the protein

Protein name Protein decapentaplegic [Precursor]

Synonym Protein DPP-C

Gene name Name dpp

ORFNames CG9885

From Drosophila melanogaster (Fruit fly) [TaxID 7227]

Taxonomy Eukaryota

Metazoa Arthropoda Hexapoda Insecta Pterygota Neoptera Endopterygota Diptera Brachycera Muscomorpha Ephydroidea Drosophilidae Drosophila

References

[1] NUCLEOTIDE SEQUENCE [MRNA]DOI=101038325081a0 PubMed=3467201 [NCBI ExPASy EBI Israel Japan]Padgett RW St Johnston RD Gelbart WMA transcript from a Drosophila pattern gene predicts a protein homologous to the transforming growth factor-beta familyNature 32581-84(1987)

Features helliphelliphellip

Sequence information helliphelliphelliphellip

유전체 데이터베이스

- 생물 종에 대한 유전적 지도 물리적 지도 핵산 서열 아미노산 서열과 같은 여러 종류의 데이터를 포함- 다양한 해상력에서의 유전체 구조- 다양한 단계에서의 유전체 기능- 유전자 기능에 따른 계층적 분류- DNA 칩 단백질 칩과 같은 실험 방법들로부터 얻은

새로운 종류의 발현 데이터들과 통합 발전

lt 표 2-4gt 라일리 (Monica Riley) 에 따른 대장균 (E coli)유전자들의 기능적인 분류

  • Slide 1
  • Slide 2
  • Slide 3
  • Slide 4
  • Slide 5
  • Slide 6
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Slide 12
  • Slide 13
  • Slide 14
  • Slide 15
  • Slide 16
  • Slide 17
  • Slide 18
  • Slide 19

lt 표 2-1gt 분자생물학 데이터베이스들의 발전

데이터베이스 종류 데이터 내용 예

1 문헌 데이터베이스 서지학적 인용 MEDLINE (1971)

2 사실정보 데이터베이스 핵산서열 GenBank(1982) EMBL(1982)

DDBJ(1984)아미노산 서열 PIR(1968) PRF(1979)

SWISS- PROT(1986)

3 차원 분자 구조 PDB(1971) CSD(1965)

3 지식 기반 모티프 라이브러리 PROSITE(1988)

분자 분류 SCOP(1994)

생화학 경로 KEGG(1995)

온라인 간행물

lt 표 2-2gt 중요한 데이터베이스들의 주소

데이터베이스 기관 주소

MEDLINE 국립 의학도서관 wwwnlmnihgov

GenBank 국립 생명공학 정보센터 wwwncbi nlmnihgov

EMBL 유럽 생물정보학 연구소 www ebiacuk

DDBJ 일본 국립 유전학 연구소 www ddbjnigacjp

SWISS-PROT 스위스 생물정보학 연구소 wwwexpasych

PIR 국립 생명의학 연구재단 www-nbrfgeorgetownedu

PRF 일본 단백질 연구재단 wwwprforjp PDB 구조생명정보학 연구공동체 wwwrcsborg

CSD 캠브리지 결정학 데이터센터 wwwccdccamacuk

lt표 2-3gt 새로운 세대의 분자생물학 데이터베이스

정보 데이터베이스 주소

화합물과 반응 LIGAND wwwgenomeadjpdbgetligandhtml

AAindex wwwgenomeadjpdbgetaaindexhtml

단백질 군과 PROSITE wwwexpasychsprotprositehtml

서열 모티프 Blocks www blocksfhcrcorg

PRINTS wwwbiochemuclacukbsmdbbrowserPRINTS

Pfam wwwsangeracukPfampfamwustledu

ProDom proteintoulouseinrafrprodomhtml

lt표 2-3gt 새로운 세대의 분자생물학 데이터베이스

정보 데이터베이스 주소

3 차원 폴드 분류 SCOP scopmrc-lmbcamacukscop

CATH wwwbiochemuclacukbsmcath

오소로그 유전자 COG wwwncbinlmnihgovCOG

KEGG www genomeadjpkegg

생화학 경로 KEGG www genomeadjpkegg

WIT wwwmcsanlgovWIT2

Ecocyc ecocycPangeaSystemscomecocyc

UM-BBD wwwlabmedumneduumbbd

유전체 다양성 NCBI Taxonomy wwwncbinlmnihgovTaxonomy

OMIM wwwncbinlmnihgovOmim

도서목록 데이터베이스

MEDLINE

- 1971 년 이후 온라인으로 이용

미국 국립보건원 (NIH) 의 국립의학도서관 (NLM) 통관

-1988 년 국립생명공학정보센터 (NCBI) 로 이관된 후

분자생물학 최고의 데이터베이스

① DNA 염기 서열 단백질 서열 3 차원 분자구조 등의 사실 정보 데이터 베이스와 연결

② 온라인으로 Full text 를 제공하는 간행물 출판사와 연결

③ 인터넷으로 무료로 사용 가능

아미노산 서열 데이터베이스

PIR-International Protein Sequence Database

- 1968-1978 년 ldquo데이호프rdquo가 ldquo단백질 서열과 구조 도해서rdquo 출판 1980 년대 NBRF 단백질 서열 데이터베이스가 시초

- 1984 년 Protein Information Resource (PIR) 이 NIH 지원으로 설립 -1988 년 독일 뮌헨 단백질 서열 정보센터 (MIPS) 와 일본 국제 단백질 서열 데이터베이스 (JIPID) 와 협력

아미노산 서열 데이터베이스

Protein Research Foundation (PRF)

-1975 년 일본의 단백질 연구 재단 (PRE) 이 ldquo펩티드 정보(Peptide information)rdquo 를 출판

-1979 년 전산화한 데이터베이스 SEQDB 와 LITDB 제작

-아미노산 서열을 서지학적 정보 부분으로 다룸

아미노산 서열 데이터베이스

SWISS-PROT

- 1986 년 제네바대학에서 제작

데이터의 질적인 면에서 최고

- 1987 년 유럽 분자 생물학연구소 (EMBL) 과 협력하여

뉴클레오티드 서열 데이터베이스를 번역하여 보완

- 현재 스위스생물정보학협회 (SIB) EMBL 의

유럽생물정보학협회 (EBI) 와 공동으로 운영

3차원 구조 데이터베이스Protein Data Bank(PDB)

-1971 년 북하벤 국립연구소 (BNL) 에 설립

-1999 년 구조생물 정보학 연구협력 기구 (RCSB) 가 운영

- 단백질 RNA DNA 탄수화물 분자 합성물 바이러스 구조 정보

Cambridge Structural Database(CSD)

-1965 년 캠브리지대학에 설립

-1989 년 캠브리지 결정데이터센터 (CCDC) 에 의해 유지

-서지학적 화학적 결정학적 데이터와 X- 레이 중성자 회절방법에 의한 3 차원 분자좌표 데이터를 포함

뉴클레오티드 서열 데이터베이스

GeneBank

-1982 년 로스 알라모스 국립연구소

-1992 년 NCBI 로 이관

EMBL-1982 년 유럽 분자생물학 연구소-1994 년 EBI 로 이관

DDBJ

-1984 년 일본 DNA 데이터 은행

이들 세 기관이 ldquo국제 뉴클레오티드 서열 데이터베이스

협력기구rdquo 결성하여 매일 데이터를 교환

lt 그림 2-1gt (a) 등록자료의 개수와 (b) 잔기의 개수에서 본 서열과 3차원 구조 데이터베이스들의 성장

플랫 파일 (Flat File) 형식

- 핵산 서열 단백질 서열 3 차원 분자 구조 데이터베이스에 널리 사용

- 데이터 처리 및 이용이 쉬움

-서열 데이터베이스 등록자료 내용

① 명명법 서지학적 정보

② 서열 특성에 대한 생물학적 주석을 포함한 특징표

③ 일차 서열 데이터

GeneBank 의 서열데이터베이스

LOCUS DRODPPC 4001 bp mRNA linear INV 26-APR-1993 DEFINITION Dmelanogaster decapentaplegic gene complex (DPP-C) complete cdsACCESSION M30116 VERSION M301161 GI157291 KEYWORDS SOURCE Drosophila melanogaster (fruit fly) ORGANISM Drosophila melanogaster Eukaryota Metazoa Arthropoda Hexapoda Insecta Pterygota Neoptera Endopterygota Diptera Brachycera Muscomorpha Ephydroidea Drosophilidae Drosophila REFERENCE 1 (bases 1 to 4001) AUTHORS PadgettRW St JohnstonRD and GelbartWM TITLE A transcript from a Drosophila pattern gene predicts a protein homologous to the transforming growth factor-beta family JOURNAL Nature 325 (6099) 81-84 (1987) PUBMED 3467201 COMMENT Original source text Dmelanogaster cDNA to mRNA The initiation codon could be at either 1188-1190 or 1587-1589 FEATURES LocationQualifiers source 14001 organism=Drosophila melanogaster mol_type=mRNA db_xref=taxon7227 mRNA lt13918 product=decapentaplegic protein mRNA CDS 11882954 note=decapentaplegic protein (1188 could be 1587) codon_start=1 protein_id=AAA284821 db_xref=GI157292 translation=MRAWLLLLAVLATFQTIVRVASTEDISQRFIAAIAPVAAHIPLAhelliphellipLGYDAYYCHGKC PFPLADHFNSTNHAVVQTLVNNMNPGKVPKACCVPTQLDSVAMLYL NDQSTVVLKNYQEMTVVGCGCR ORIGIN 1 gtcgttcaac agcgctgatc gagtttaaat ctataccgaa atgagcggcg gaaagtgagc 61 cacttggcgt gaacccaaag ctttcgagga aaattctcgg acccccatat acaaatatcg 121 gaaaaagtat cgaacagttt cgcgacgcga agcgttaaga tcgccaaaag atctccgtgc 181 ggaaacaaag aaattgaggc actattaaga gattgttgtt gtgcgcgagt gtgtgtcttc 241 agctgggtgt gtggaatgtc aactgacggg ttgtaaaggg aaaccctgaa atccgaacgg helliphelliphelliphellip 3841 aactgtataa acaaaacgta tgccctataa atatatgaat aactatctac atcgttatgc 3901 gttctaagct aagctcgaat aaatccgtac acgttaatta atctagaatc gtaagaccta 3961 acgcgtaagc tcagcatgtt ggataaatta atagaaacga g

SWISS-PROT의 서열 데이터 베이스Entry information

Entry name DECA_DROME

Primary accession number P07713

Secondary accession numbers P91651 Q6AWM1 Q8I0M7 Q8ITK4 Q9VQC6

Integrated into Swiss-Prot on April 1 1988

Sequence was last modified on September 13 2005 (Sequence version 2)

Annotations were last modified on

March 21 2006 (Entry version 66)

Name and origin of the protein

Protein name Protein decapentaplegic [Precursor]

Synonym Protein DPP-C

Gene name Name dpp

ORFNames CG9885

From Drosophila melanogaster (Fruit fly) [TaxID 7227]

Taxonomy Eukaryota

Metazoa Arthropoda Hexapoda Insecta Pterygota Neoptera Endopterygota Diptera Brachycera Muscomorpha Ephydroidea Drosophilidae Drosophila

References

[1] NUCLEOTIDE SEQUENCE [MRNA]DOI=101038325081a0 PubMed=3467201 [NCBI ExPASy EBI Israel Japan]Padgett RW St Johnston RD Gelbart WMA transcript from a Drosophila pattern gene predicts a protein homologous to the transforming growth factor-beta familyNature 32581-84(1987)

Features helliphelliphellip

Sequence information helliphelliphelliphellip

유전체 데이터베이스

- 생물 종에 대한 유전적 지도 물리적 지도 핵산 서열 아미노산 서열과 같은 여러 종류의 데이터를 포함- 다양한 해상력에서의 유전체 구조- 다양한 단계에서의 유전체 기능- 유전자 기능에 따른 계층적 분류- DNA 칩 단백질 칩과 같은 실험 방법들로부터 얻은

새로운 종류의 발현 데이터들과 통합 발전

lt 표 2-4gt 라일리 (Monica Riley) 에 따른 대장균 (E coli)유전자들의 기능적인 분류

  • Slide 1
  • Slide 2
  • Slide 3
  • Slide 4
  • Slide 5
  • Slide 6
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Slide 12
  • Slide 13
  • Slide 14
  • Slide 15
  • Slide 16
  • Slide 17
  • Slide 18
  • Slide 19

lt 표 2-2gt 중요한 데이터베이스들의 주소

데이터베이스 기관 주소

MEDLINE 국립 의학도서관 wwwnlmnihgov

GenBank 국립 생명공학 정보센터 wwwncbi nlmnihgov

EMBL 유럽 생물정보학 연구소 www ebiacuk

DDBJ 일본 국립 유전학 연구소 www ddbjnigacjp

SWISS-PROT 스위스 생물정보학 연구소 wwwexpasych

PIR 국립 생명의학 연구재단 www-nbrfgeorgetownedu

PRF 일본 단백질 연구재단 wwwprforjp PDB 구조생명정보학 연구공동체 wwwrcsborg

CSD 캠브리지 결정학 데이터센터 wwwccdccamacuk

lt표 2-3gt 새로운 세대의 분자생물학 데이터베이스

정보 데이터베이스 주소

화합물과 반응 LIGAND wwwgenomeadjpdbgetligandhtml

AAindex wwwgenomeadjpdbgetaaindexhtml

단백질 군과 PROSITE wwwexpasychsprotprositehtml

서열 모티프 Blocks www blocksfhcrcorg

PRINTS wwwbiochemuclacukbsmdbbrowserPRINTS

Pfam wwwsangeracukPfampfamwustledu

ProDom proteintoulouseinrafrprodomhtml

lt표 2-3gt 새로운 세대의 분자생물학 데이터베이스

정보 데이터베이스 주소

3 차원 폴드 분류 SCOP scopmrc-lmbcamacukscop

CATH wwwbiochemuclacukbsmcath

오소로그 유전자 COG wwwncbinlmnihgovCOG

KEGG www genomeadjpkegg

생화학 경로 KEGG www genomeadjpkegg

WIT wwwmcsanlgovWIT2

Ecocyc ecocycPangeaSystemscomecocyc

UM-BBD wwwlabmedumneduumbbd

유전체 다양성 NCBI Taxonomy wwwncbinlmnihgovTaxonomy

OMIM wwwncbinlmnihgovOmim

도서목록 데이터베이스

MEDLINE

- 1971 년 이후 온라인으로 이용

미국 국립보건원 (NIH) 의 국립의학도서관 (NLM) 통관

-1988 년 국립생명공학정보센터 (NCBI) 로 이관된 후

분자생물학 최고의 데이터베이스

① DNA 염기 서열 단백질 서열 3 차원 분자구조 등의 사실 정보 데이터 베이스와 연결

② 온라인으로 Full text 를 제공하는 간행물 출판사와 연결

③ 인터넷으로 무료로 사용 가능

아미노산 서열 데이터베이스

PIR-International Protein Sequence Database

- 1968-1978 년 ldquo데이호프rdquo가 ldquo단백질 서열과 구조 도해서rdquo 출판 1980 년대 NBRF 단백질 서열 데이터베이스가 시초

- 1984 년 Protein Information Resource (PIR) 이 NIH 지원으로 설립 -1988 년 독일 뮌헨 단백질 서열 정보센터 (MIPS) 와 일본 국제 단백질 서열 데이터베이스 (JIPID) 와 협력

아미노산 서열 데이터베이스

Protein Research Foundation (PRF)

-1975 년 일본의 단백질 연구 재단 (PRE) 이 ldquo펩티드 정보(Peptide information)rdquo 를 출판

-1979 년 전산화한 데이터베이스 SEQDB 와 LITDB 제작

-아미노산 서열을 서지학적 정보 부분으로 다룸

아미노산 서열 데이터베이스

SWISS-PROT

- 1986 년 제네바대학에서 제작

데이터의 질적인 면에서 최고

- 1987 년 유럽 분자 생물학연구소 (EMBL) 과 협력하여

뉴클레오티드 서열 데이터베이스를 번역하여 보완

- 현재 스위스생물정보학협회 (SIB) EMBL 의

유럽생물정보학협회 (EBI) 와 공동으로 운영

3차원 구조 데이터베이스Protein Data Bank(PDB)

-1971 년 북하벤 국립연구소 (BNL) 에 설립

-1999 년 구조생물 정보학 연구협력 기구 (RCSB) 가 운영

- 단백질 RNA DNA 탄수화물 분자 합성물 바이러스 구조 정보

Cambridge Structural Database(CSD)

-1965 년 캠브리지대학에 설립

-1989 년 캠브리지 결정데이터센터 (CCDC) 에 의해 유지

-서지학적 화학적 결정학적 데이터와 X- 레이 중성자 회절방법에 의한 3 차원 분자좌표 데이터를 포함

뉴클레오티드 서열 데이터베이스

GeneBank

-1982 년 로스 알라모스 국립연구소

-1992 년 NCBI 로 이관

EMBL-1982 년 유럽 분자생물학 연구소-1994 년 EBI 로 이관

DDBJ

-1984 년 일본 DNA 데이터 은행

이들 세 기관이 ldquo국제 뉴클레오티드 서열 데이터베이스

협력기구rdquo 결성하여 매일 데이터를 교환

lt 그림 2-1gt (a) 등록자료의 개수와 (b) 잔기의 개수에서 본 서열과 3차원 구조 데이터베이스들의 성장

플랫 파일 (Flat File) 형식

- 핵산 서열 단백질 서열 3 차원 분자 구조 데이터베이스에 널리 사용

- 데이터 처리 및 이용이 쉬움

-서열 데이터베이스 등록자료 내용

① 명명법 서지학적 정보

② 서열 특성에 대한 생물학적 주석을 포함한 특징표

③ 일차 서열 데이터

GeneBank 의 서열데이터베이스

LOCUS DRODPPC 4001 bp mRNA linear INV 26-APR-1993 DEFINITION Dmelanogaster decapentaplegic gene complex (DPP-C) complete cdsACCESSION M30116 VERSION M301161 GI157291 KEYWORDS SOURCE Drosophila melanogaster (fruit fly) ORGANISM Drosophila melanogaster Eukaryota Metazoa Arthropoda Hexapoda Insecta Pterygota Neoptera Endopterygota Diptera Brachycera Muscomorpha Ephydroidea Drosophilidae Drosophila REFERENCE 1 (bases 1 to 4001) AUTHORS PadgettRW St JohnstonRD and GelbartWM TITLE A transcript from a Drosophila pattern gene predicts a protein homologous to the transforming growth factor-beta family JOURNAL Nature 325 (6099) 81-84 (1987) PUBMED 3467201 COMMENT Original source text Dmelanogaster cDNA to mRNA The initiation codon could be at either 1188-1190 or 1587-1589 FEATURES LocationQualifiers source 14001 organism=Drosophila melanogaster mol_type=mRNA db_xref=taxon7227 mRNA lt13918 product=decapentaplegic protein mRNA CDS 11882954 note=decapentaplegic protein (1188 could be 1587) codon_start=1 protein_id=AAA284821 db_xref=GI157292 translation=MRAWLLLLAVLATFQTIVRVASTEDISQRFIAAIAPVAAHIPLAhelliphellipLGYDAYYCHGKC PFPLADHFNSTNHAVVQTLVNNMNPGKVPKACCVPTQLDSVAMLYL NDQSTVVLKNYQEMTVVGCGCR ORIGIN 1 gtcgttcaac agcgctgatc gagtttaaat ctataccgaa atgagcggcg gaaagtgagc 61 cacttggcgt gaacccaaag ctttcgagga aaattctcgg acccccatat acaaatatcg 121 gaaaaagtat cgaacagttt cgcgacgcga agcgttaaga tcgccaaaag atctccgtgc 181 ggaaacaaag aaattgaggc actattaaga gattgttgtt gtgcgcgagt gtgtgtcttc 241 agctgggtgt gtggaatgtc aactgacggg ttgtaaaggg aaaccctgaa atccgaacgg helliphelliphelliphellip 3841 aactgtataa acaaaacgta tgccctataa atatatgaat aactatctac atcgttatgc 3901 gttctaagct aagctcgaat aaatccgtac acgttaatta atctagaatc gtaagaccta 3961 acgcgtaagc tcagcatgtt ggataaatta atagaaacga g

SWISS-PROT의 서열 데이터 베이스Entry information

Entry name DECA_DROME

Primary accession number P07713

Secondary accession numbers P91651 Q6AWM1 Q8I0M7 Q8ITK4 Q9VQC6

Integrated into Swiss-Prot on April 1 1988

Sequence was last modified on September 13 2005 (Sequence version 2)

Annotations were last modified on

March 21 2006 (Entry version 66)

Name and origin of the protein

Protein name Protein decapentaplegic [Precursor]

Synonym Protein DPP-C

Gene name Name dpp

ORFNames CG9885

From Drosophila melanogaster (Fruit fly) [TaxID 7227]

Taxonomy Eukaryota

Metazoa Arthropoda Hexapoda Insecta Pterygota Neoptera Endopterygota Diptera Brachycera Muscomorpha Ephydroidea Drosophilidae Drosophila

References

[1] NUCLEOTIDE SEQUENCE [MRNA]DOI=101038325081a0 PubMed=3467201 [NCBI ExPASy EBI Israel Japan]Padgett RW St Johnston RD Gelbart WMA transcript from a Drosophila pattern gene predicts a protein homologous to the transforming growth factor-beta familyNature 32581-84(1987)

Features helliphelliphellip

Sequence information helliphelliphelliphellip

유전체 데이터베이스

- 생물 종에 대한 유전적 지도 물리적 지도 핵산 서열 아미노산 서열과 같은 여러 종류의 데이터를 포함- 다양한 해상력에서의 유전체 구조- 다양한 단계에서의 유전체 기능- 유전자 기능에 따른 계층적 분류- DNA 칩 단백질 칩과 같은 실험 방법들로부터 얻은

새로운 종류의 발현 데이터들과 통합 발전

lt 표 2-4gt 라일리 (Monica Riley) 에 따른 대장균 (E coli)유전자들의 기능적인 분류

  • Slide 1
  • Slide 2
  • Slide 3
  • Slide 4
  • Slide 5
  • Slide 6
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Slide 12
  • Slide 13
  • Slide 14
  • Slide 15
  • Slide 16
  • Slide 17
  • Slide 18
  • Slide 19

lt표 2-3gt 새로운 세대의 분자생물학 데이터베이스

정보 데이터베이스 주소

화합물과 반응 LIGAND wwwgenomeadjpdbgetligandhtml

AAindex wwwgenomeadjpdbgetaaindexhtml

단백질 군과 PROSITE wwwexpasychsprotprositehtml

서열 모티프 Blocks www blocksfhcrcorg

PRINTS wwwbiochemuclacukbsmdbbrowserPRINTS

Pfam wwwsangeracukPfampfamwustledu

ProDom proteintoulouseinrafrprodomhtml

lt표 2-3gt 새로운 세대의 분자생물학 데이터베이스

정보 데이터베이스 주소

3 차원 폴드 분류 SCOP scopmrc-lmbcamacukscop

CATH wwwbiochemuclacukbsmcath

오소로그 유전자 COG wwwncbinlmnihgovCOG

KEGG www genomeadjpkegg

생화학 경로 KEGG www genomeadjpkegg

WIT wwwmcsanlgovWIT2

Ecocyc ecocycPangeaSystemscomecocyc

UM-BBD wwwlabmedumneduumbbd

유전체 다양성 NCBI Taxonomy wwwncbinlmnihgovTaxonomy

OMIM wwwncbinlmnihgovOmim

도서목록 데이터베이스

MEDLINE

- 1971 년 이후 온라인으로 이용

미국 국립보건원 (NIH) 의 국립의학도서관 (NLM) 통관

-1988 년 국립생명공학정보센터 (NCBI) 로 이관된 후

분자생물학 최고의 데이터베이스

① DNA 염기 서열 단백질 서열 3 차원 분자구조 등의 사실 정보 데이터 베이스와 연결

② 온라인으로 Full text 를 제공하는 간행물 출판사와 연결

③ 인터넷으로 무료로 사용 가능

아미노산 서열 데이터베이스

PIR-International Protein Sequence Database

- 1968-1978 년 ldquo데이호프rdquo가 ldquo단백질 서열과 구조 도해서rdquo 출판 1980 년대 NBRF 단백질 서열 데이터베이스가 시초

- 1984 년 Protein Information Resource (PIR) 이 NIH 지원으로 설립 -1988 년 독일 뮌헨 단백질 서열 정보센터 (MIPS) 와 일본 국제 단백질 서열 데이터베이스 (JIPID) 와 협력

아미노산 서열 데이터베이스

Protein Research Foundation (PRF)

-1975 년 일본의 단백질 연구 재단 (PRE) 이 ldquo펩티드 정보(Peptide information)rdquo 를 출판

-1979 년 전산화한 데이터베이스 SEQDB 와 LITDB 제작

-아미노산 서열을 서지학적 정보 부분으로 다룸

아미노산 서열 데이터베이스

SWISS-PROT

- 1986 년 제네바대학에서 제작

데이터의 질적인 면에서 최고

- 1987 년 유럽 분자 생물학연구소 (EMBL) 과 협력하여

뉴클레오티드 서열 데이터베이스를 번역하여 보완

- 현재 스위스생물정보학협회 (SIB) EMBL 의

유럽생물정보학협회 (EBI) 와 공동으로 운영

3차원 구조 데이터베이스Protein Data Bank(PDB)

-1971 년 북하벤 국립연구소 (BNL) 에 설립

-1999 년 구조생물 정보학 연구협력 기구 (RCSB) 가 운영

- 단백질 RNA DNA 탄수화물 분자 합성물 바이러스 구조 정보

Cambridge Structural Database(CSD)

-1965 년 캠브리지대학에 설립

-1989 년 캠브리지 결정데이터센터 (CCDC) 에 의해 유지

-서지학적 화학적 결정학적 데이터와 X- 레이 중성자 회절방법에 의한 3 차원 분자좌표 데이터를 포함

뉴클레오티드 서열 데이터베이스

GeneBank

-1982 년 로스 알라모스 국립연구소

-1992 년 NCBI 로 이관

EMBL-1982 년 유럽 분자생물학 연구소-1994 년 EBI 로 이관

DDBJ

-1984 년 일본 DNA 데이터 은행

이들 세 기관이 ldquo국제 뉴클레오티드 서열 데이터베이스

협력기구rdquo 결성하여 매일 데이터를 교환

lt 그림 2-1gt (a) 등록자료의 개수와 (b) 잔기의 개수에서 본 서열과 3차원 구조 데이터베이스들의 성장

플랫 파일 (Flat File) 형식

- 핵산 서열 단백질 서열 3 차원 분자 구조 데이터베이스에 널리 사용

- 데이터 처리 및 이용이 쉬움

-서열 데이터베이스 등록자료 내용

① 명명법 서지학적 정보

② 서열 특성에 대한 생물학적 주석을 포함한 특징표

③ 일차 서열 데이터

GeneBank 의 서열데이터베이스

LOCUS DRODPPC 4001 bp mRNA linear INV 26-APR-1993 DEFINITION Dmelanogaster decapentaplegic gene complex (DPP-C) complete cdsACCESSION M30116 VERSION M301161 GI157291 KEYWORDS SOURCE Drosophila melanogaster (fruit fly) ORGANISM Drosophila melanogaster Eukaryota Metazoa Arthropoda Hexapoda Insecta Pterygota Neoptera Endopterygota Diptera Brachycera Muscomorpha Ephydroidea Drosophilidae Drosophila REFERENCE 1 (bases 1 to 4001) AUTHORS PadgettRW St JohnstonRD and GelbartWM TITLE A transcript from a Drosophila pattern gene predicts a protein homologous to the transforming growth factor-beta family JOURNAL Nature 325 (6099) 81-84 (1987) PUBMED 3467201 COMMENT Original source text Dmelanogaster cDNA to mRNA The initiation codon could be at either 1188-1190 or 1587-1589 FEATURES LocationQualifiers source 14001 organism=Drosophila melanogaster mol_type=mRNA db_xref=taxon7227 mRNA lt13918 product=decapentaplegic protein mRNA CDS 11882954 note=decapentaplegic protein (1188 could be 1587) codon_start=1 protein_id=AAA284821 db_xref=GI157292 translation=MRAWLLLLAVLATFQTIVRVASTEDISQRFIAAIAPVAAHIPLAhelliphellipLGYDAYYCHGKC PFPLADHFNSTNHAVVQTLVNNMNPGKVPKACCVPTQLDSVAMLYL NDQSTVVLKNYQEMTVVGCGCR ORIGIN 1 gtcgttcaac agcgctgatc gagtttaaat ctataccgaa atgagcggcg gaaagtgagc 61 cacttggcgt gaacccaaag ctttcgagga aaattctcgg acccccatat acaaatatcg 121 gaaaaagtat cgaacagttt cgcgacgcga agcgttaaga tcgccaaaag atctccgtgc 181 ggaaacaaag aaattgaggc actattaaga gattgttgtt gtgcgcgagt gtgtgtcttc 241 agctgggtgt gtggaatgtc aactgacggg ttgtaaaggg aaaccctgaa atccgaacgg helliphelliphelliphellip 3841 aactgtataa acaaaacgta tgccctataa atatatgaat aactatctac atcgttatgc 3901 gttctaagct aagctcgaat aaatccgtac acgttaatta atctagaatc gtaagaccta 3961 acgcgtaagc tcagcatgtt ggataaatta atagaaacga g

SWISS-PROT의 서열 데이터 베이스Entry information

Entry name DECA_DROME

Primary accession number P07713

Secondary accession numbers P91651 Q6AWM1 Q8I0M7 Q8ITK4 Q9VQC6

Integrated into Swiss-Prot on April 1 1988

Sequence was last modified on September 13 2005 (Sequence version 2)

Annotations were last modified on

March 21 2006 (Entry version 66)

Name and origin of the protein

Protein name Protein decapentaplegic [Precursor]

Synonym Protein DPP-C

Gene name Name dpp

ORFNames CG9885

From Drosophila melanogaster (Fruit fly) [TaxID 7227]

Taxonomy Eukaryota

Metazoa Arthropoda Hexapoda Insecta Pterygota Neoptera Endopterygota Diptera Brachycera Muscomorpha Ephydroidea Drosophilidae Drosophila

References

[1] NUCLEOTIDE SEQUENCE [MRNA]DOI=101038325081a0 PubMed=3467201 [NCBI ExPASy EBI Israel Japan]Padgett RW St Johnston RD Gelbart WMA transcript from a Drosophila pattern gene predicts a protein homologous to the transforming growth factor-beta familyNature 32581-84(1987)

Features helliphelliphellip

Sequence information helliphelliphelliphellip

유전체 데이터베이스

- 생물 종에 대한 유전적 지도 물리적 지도 핵산 서열 아미노산 서열과 같은 여러 종류의 데이터를 포함- 다양한 해상력에서의 유전체 구조- 다양한 단계에서의 유전체 기능- 유전자 기능에 따른 계층적 분류- DNA 칩 단백질 칩과 같은 실험 방법들로부터 얻은

새로운 종류의 발현 데이터들과 통합 발전

lt 표 2-4gt 라일리 (Monica Riley) 에 따른 대장균 (E coli)유전자들의 기능적인 분류

  • Slide 1
  • Slide 2
  • Slide 3
  • Slide 4
  • Slide 5
  • Slide 6
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Slide 12
  • Slide 13
  • Slide 14
  • Slide 15
  • Slide 16
  • Slide 17
  • Slide 18
  • Slide 19

lt표 2-3gt 새로운 세대의 분자생물학 데이터베이스

정보 데이터베이스 주소

3 차원 폴드 분류 SCOP scopmrc-lmbcamacukscop

CATH wwwbiochemuclacukbsmcath

오소로그 유전자 COG wwwncbinlmnihgovCOG

KEGG www genomeadjpkegg

생화학 경로 KEGG www genomeadjpkegg

WIT wwwmcsanlgovWIT2

Ecocyc ecocycPangeaSystemscomecocyc

UM-BBD wwwlabmedumneduumbbd

유전체 다양성 NCBI Taxonomy wwwncbinlmnihgovTaxonomy

OMIM wwwncbinlmnihgovOmim

도서목록 데이터베이스

MEDLINE

- 1971 년 이후 온라인으로 이용

미국 국립보건원 (NIH) 의 국립의학도서관 (NLM) 통관

-1988 년 국립생명공학정보센터 (NCBI) 로 이관된 후

분자생물학 최고의 데이터베이스

① DNA 염기 서열 단백질 서열 3 차원 분자구조 등의 사실 정보 데이터 베이스와 연결

② 온라인으로 Full text 를 제공하는 간행물 출판사와 연결

③ 인터넷으로 무료로 사용 가능

아미노산 서열 데이터베이스

PIR-International Protein Sequence Database

- 1968-1978 년 ldquo데이호프rdquo가 ldquo단백질 서열과 구조 도해서rdquo 출판 1980 년대 NBRF 단백질 서열 데이터베이스가 시초

- 1984 년 Protein Information Resource (PIR) 이 NIH 지원으로 설립 -1988 년 독일 뮌헨 단백질 서열 정보센터 (MIPS) 와 일본 국제 단백질 서열 데이터베이스 (JIPID) 와 협력

아미노산 서열 데이터베이스

Protein Research Foundation (PRF)

-1975 년 일본의 단백질 연구 재단 (PRE) 이 ldquo펩티드 정보(Peptide information)rdquo 를 출판

-1979 년 전산화한 데이터베이스 SEQDB 와 LITDB 제작

-아미노산 서열을 서지학적 정보 부분으로 다룸

아미노산 서열 데이터베이스

SWISS-PROT

- 1986 년 제네바대학에서 제작

데이터의 질적인 면에서 최고

- 1987 년 유럽 분자 생물학연구소 (EMBL) 과 협력하여

뉴클레오티드 서열 데이터베이스를 번역하여 보완

- 현재 스위스생물정보학협회 (SIB) EMBL 의

유럽생물정보학협회 (EBI) 와 공동으로 운영

3차원 구조 데이터베이스Protein Data Bank(PDB)

-1971 년 북하벤 국립연구소 (BNL) 에 설립

-1999 년 구조생물 정보학 연구협력 기구 (RCSB) 가 운영

- 단백질 RNA DNA 탄수화물 분자 합성물 바이러스 구조 정보

Cambridge Structural Database(CSD)

-1965 년 캠브리지대학에 설립

-1989 년 캠브리지 결정데이터센터 (CCDC) 에 의해 유지

-서지학적 화학적 결정학적 데이터와 X- 레이 중성자 회절방법에 의한 3 차원 분자좌표 데이터를 포함

뉴클레오티드 서열 데이터베이스

GeneBank

-1982 년 로스 알라모스 국립연구소

-1992 년 NCBI 로 이관

EMBL-1982 년 유럽 분자생물학 연구소-1994 년 EBI 로 이관

DDBJ

-1984 년 일본 DNA 데이터 은행

이들 세 기관이 ldquo국제 뉴클레오티드 서열 데이터베이스

협력기구rdquo 결성하여 매일 데이터를 교환

lt 그림 2-1gt (a) 등록자료의 개수와 (b) 잔기의 개수에서 본 서열과 3차원 구조 데이터베이스들의 성장

플랫 파일 (Flat File) 형식

- 핵산 서열 단백질 서열 3 차원 분자 구조 데이터베이스에 널리 사용

- 데이터 처리 및 이용이 쉬움

-서열 데이터베이스 등록자료 내용

① 명명법 서지학적 정보

② 서열 특성에 대한 생물학적 주석을 포함한 특징표

③ 일차 서열 데이터

GeneBank 의 서열데이터베이스

LOCUS DRODPPC 4001 bp mRNA linear INV 26-APR-1993 DEFINITION Dmelanogaster decapentaplegic gene complex (DPP-C) complete cdsACCESSION M30116 VERSION M301161 GI157291 KEYWORDS SOURCE Drosophila melanogaster (fruit fly) ORGANISM Drosophila melanogaster Eukaryota Metazoa Arthropoda Hexapoda Insecta Pterygota Neoptera Endopterygota Diptera Brachycera Muscomorpha Ephydroidea Drosophilidae Drosophila REFERENCE 1 (bases 1 to 4001) AUTHORS PadgettRW St JohnstonRD and GelbartWM TITLE A transcript from a Drosophila pattern gene predicts a protein homologous to the transforming growth factor-beta family JOURNAL Nature 325 (6099) 81-84 (1987) PUBMED 3467201 COMMENT Original source text Dmelanogaster cDNA to mRNA The initiation codon could be at either 1188-1190 or 1587-1589 FEATURES LocationQualifiers source 14001 organism=Drosophila melanogaster mol_type=mRNA db_xref=taxon7227 mRNA lt13918 product=decapentaplegic protein mRNA CDS 11882954 note=decapentaplegic protein (1188 could be 1587) codon_start=1 protein_id=AAA284821 db_xref=GI157292 translation=MRAWLLLLAVLATFQTIVRVASTEDISQRFIAAIAPVAAHIPLAhelliphellipLGYDAYYCHGKC PFPLADHFNSTNHAVVQTLVNNMNPGKVPKACCVPTQLDSVAMLYL NDQSTVVLKNYQEMTVVGCGCR ORIGIN 1 gtcgttcaac agcgctgatc gagtttaaat ctataccgaa atgagcggcg gaaagtgagc 61 cacttggcgt gaacccaaag ctttcgagga aaattctcgg acccccatat acaaatatcg 121 gaaaaagtat cgaacagttt cgcgacgcga agcgttaaga tcgccaaaag atctccgtgc 181 ggaaacaaag aaattgaggc actattaaga gattgttgtt gtgcgcgagt gtgtgtcttc 241 agctgggtgt gtggaatgtc aactgacggg ttgtaaaggg aaaccctgaa atccgaacgg helliphelliphelliphellip 3841 aactgtataa acaaaacgta tgccctataa atatatgaat aactatctac atcgttatgc 3901 gttctaagct aagctcgaat aaatccgtac acgttaatta atctagaatc gtaagaccta 3961 acgcgtaagc tcagcatgtt ggataaatta atagaaacga g

SWISS-PROT의 서열 데이터 베이스Entry information

Entry name DECA_DROME

Primary accession number P07713

Secondary accession numbers P91651 Q6AWM1 Q8I0M7 Q8ITK4 Q9VQC6

Integrated into Swiss-Prot on April 1 1988

Sequence was last modified on September 13 2005 (Sequence version 2)

Annotations were last modified on

March 21 2006 (Entry version 66)

Name and origin of the protein

Protein name Protein decapentaplegic [Precursor]

Synonym Protein DPP-C

Gene name Name dpp

ORFNames CG9885

From Drosophila melanogaster (Fruit fly) [TaxID 7227]

Taxonomy Eukaryota

Metazoa Arthropoda Hexapoda Insecta Pterygota Neoptera Endopterygota Diptera Brachycera Muscomorpha Ephydroidea Drosophilidae Drosophila

References

[1] NUCLEOTIDE SEQUENCE [MRNA]DOI=101038325081a0 PubMed=3467201 [NCBI ExPASy EBI Israel Japan]Padgett RW St Johnston RD Gelbart WMA transcript from a Drosophila pattern gene predicts a protein homologous to the transforming growth factor-beta familyNature 32581-84(1987)

Features helliphelliphellip

Sequence information helliphelliphelliphellip

유전체 데이터베이스

- 생물 종에 대한 유전적 지도 물리적 지도 핵산 서열 아미노산 서열과 같은 여러 종류의 데이터를 포함- 다양한 해상력에서의 유전체 구조- 다양한 단계에서의 유전체 기능- 유전자 기능에 따른 계층적 분류- DNA 칩 단백질 칩과 같은 실험 방법들로부터 얻은

새로운 종류의 발현 데이터들과 통합 발전

lt 표 2-4gt 라일리 (Monica Riley) 에 따른 대장균 (E coli)유전자들의 기능적인 분류

  • Slide 1
  • Slide 2
  • Slide 3
  • Slide 4
  • Slide 5
  • Slide 6
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Slide 12
  • Slide 13
  • Slide 14
  • Slide 15
  • Slide 16
  • Slide 17
  • Slide 18
  • Slide 19

도서목록 데이터베이스

MEDLINE

- 1971 년 이후 온라인으로 이용

미국 국립보건원 (NIH) 의 국립의학도서관 (NLM) 통관

-1988 년 국립생명공학정보센터 (NCBI) 로 이관된 후

분자생물학 최고의 데이터베이스

① DNA 염기 서열 단백질 서열 3 차원 분자구조 등의 사실 정보 데이터 베이스와 연결

② 온라인으로 Full text 를 제공하는 간행물 출판사와 연결

③ 인터넷으로 무료로 사용 가능

아미노산 서열 데이터베이스

PIR-International Protein Sequence Database

- 1968-1978 년 ldquo데이호프rdquo가 ldquo단백질 서열과 구조 도해서rdquo 출판 1980 년대 NBRF 단백질 서열 데이터베이스가 시초

- 1984 년 Protein Information Resource (PIR) 이 NIH 지원으로 설립 -1988 년 독일 뮌헨 단백질 서열 정보센터 (MIPS) 와 일본 국제 단백질 서열 데이터베이스 (JIPID) 와 협력

아미노산 서열 데이터베이스

Protein Research Foundation (PRF)

-1975 년 일본의 단백질 연구 재단 (PRE) 이 ldquo펩티드 정보(Peptide information)rdquo 를 출판

-1979 년 전산화한 데이터베이스 SEQDB 와 LITDB 제작

-아미노산 서열을 서지학적 정보 부분으로 다룸

아미노산 서열 데이터베이스

SWISS-PROT

- 1986 년 제네바대학에서 제작

데이터의 질적인 면에서 최고

- 1987 년 유럽 분자 생물학연구소 (EMBL) 과 협력하여

뉴클레오티드 서열 데이터베이스를 번역하여 보완

- 현재 스위스생물정보학협회 (SIB) EMBL 의

유럽생물정보학협회 (EBI) 와 공동으로 운영

3차원 구조 데이터베이스Protein Data Bank(PDB)

-1971 년 북하벤 국립연구소 (BNL) 에 설립

-1999 년 구조생물 정보학 연구협력 기구 (RCSB) 가 운영

- 단백질 RNA DNA 탄수화물 분자 합성물 바이러스 구조 정보

Cambridge Structural Database(CSD)

-1965 년 캠브리지대학에 설립

-1989 년 캠브리지 결정데이터센터 (CCDC) 에 의해 유지

-서지학적 화학적 결정학적 데이터와 X- 레이 중성자 회절방법에 의한 3 차원 분자좌표 데이터를 포함

뉴클레오티드 서열 데이터베이스

GeneBank

-1982 년 로스 알라모스 국립연구소

-1992 년 NCBI 로 이관

EMBL-1982 년 유럽 분자생물학 연구소-1994 년 EBI 로 이관

DDBJ

-1984 년 일본 DNA 데이터 은행

이들 세 기관이 ldquo국제 뉴클레오티드 서열 데이터베이스

협력기구rdquo 결성하여 매일 데이터를 교환

lt 그림 2-1gt (a) 등록자료의 개수와 (b) 잔기의 개수에서 본 서열과 3차원 구조 데이터베이스들의 성장

플랫 파일 (Flat File) 형식

- 핵산 서열 단백질 서열 3 차원 분자 구조 데이터베이스에 널리 사용

- 데이터 처리 및 이용이 쉬움

-서열 데이터베이스 등록자료 내용

① 명명법 서지학적 정보

② 서열 특성에 대한 생물학적 주석을 포함한 특징표

③ 일차 서열 데이터

GeneBank 의 서열데이터베이스

LOCUS DRODPPC 4001 bp mRNA linear INV 26-APR-1993 DEFINITION Dmelanogaster decapentaplegic gene complex (DPP-C) complete cdsACCESSION M30116 VERSION M301161 GI157291 KEYWORDS SOURCE Drosophila melanogaster (fruit fly) ORGANISM Drosophila melanogaster Eukaryota Metazoa Arthropoda Hexapoda Insecta Pterygota Neoptera Endopterygota Diptera Brachycera Muscomorpha Ephydroidea Drosophilidae Drosophila REFERENCE 1 (bases 1 to 4001) AUTHORS PadgettRW St JohnstonRD and GelbartWM TITLE A transcript from a Drosophila pattern gene predicts a protein homologous to the transforming growth factor-beta family JOURNAL Nature 325 (6099) 81-84 (1987) PUBMED 3467201 COMMENT Original source text Dmelanogaster cDNA to mRNA The initiation codon could be at either 1188-1190 or 1587-1589 FEATURES LocationQualifiers source 14001 organism=Drosophila melanogaster mol_type=mRNA db_xref=taxon7227 mRNA lt13918 product=decapentaplegic protein mRNA CDS 11882954 note=decapentaplegic protein (1188 could be 1587) codon_start=1 protein_id=AAA284821 db_xref=GI157292 translation=MRAWLLLLAVLATFQTIVRVASTEDISQRFIAAIAPVAAHIPLAhelliphellipLGYDAYYCHGKC PFPLADHFNSTNHAVVQTLVNNMNPGKVPKACCVPTQLDSVAMLYL NDQSTVVLKNYQEMTVVGCGCR ORIGIN 1 gtcgttcaac agcgctgatc gagtttaaat ctataccgaa atgagcggcg gaaagtgagc 61 cacttggcgt gaacccaaag ctttcgagga aaattctcgg acccccatat acaaatatcg 121 gaaaaagtat cgaacagttt cgcgacgcga agcgttaaga tcgccaaaag atctccgtgc 181 ggaaacaaag aaattgaggc actattaaga gattgttgtt gtgcgcgagt gtgtgtcttc 241 agctgggtgt gtggaatgtc aactgacggg ttgtaaaggg aaaccctgaa atccgaacgg helliphelliphelliphellip 3841 aactgtataa acaaaacgta tgccctataa atatatgaat aactatctac atcgttatgc 3901 gttctaagct aagctcgaat aaatccgtac acgttaatta atctagaatc gtaagaccta 3961 acgcgtaagc tcagcatgtt ggataaatta atagaaacga g

SWISS-PROT의 서열 데이터 베이스Entry information

Entry name DECA_DROME

Primary accession number P07713

Secondary accession numbers P91651 Q6AWM1 Q8I0M7 Q8ITK4 Q9VQC6

Integrated into Swiss-Prot on April 1 1988

Sequence was last modified on September 13 2005 (Sequence version 2)

Annotations were last modified on

March 21 2006 (Entry version 66)

Name and origin of the protein

Protein name Protein decapentaplegic [Precursor]

Synonym Protein DPP-C

Gene name Name dpp

ORFNames CG9885

From Drosophila melanogaster (Fruit fly) [TaxID 7227]

Taxonomy Eukaryota

Metazoa Arthropoda Hexapoda Insecta Pterygota Neoptera Endopterygota Diptera Brachycera Muscomorpha Ephydroidea Drosophilidae Drosophila

References

[1] NUCLEOTIDE SEQUENCE [MRNA]DOI=101038325081a0 PubMed=3467201 [NCBI ExPASy EBI Israel Japan]Padgett RW St Johnston RD Gelbart WMA transcript from a Drosophila pattern gene predicts a protein homologous to the transforming growth factor-beta familyNature 32581-84(1987)

Features helliphelliphellip

Sequence information helliphelliphelliphellip

유전체 데이터베이스

- 생물 종에 대한 유전적 지도 물리적 지도 핵산 서열 아미노산 서열과 같은 여러 종류의 데이터를 포함- 다양한 해상력에서의 유전체 구조- 다양한 단계에서의 유전체 기능- 유전자 기능에 따른 계층적 분류- DNA 칩 단백질 칩과 같은 실험 방법들로부터 얻은

새로운 종류의 발현 데이터들과 통합 발전

lt 표 2-4gt 라일리 (Monica Riley) 에 따른 대장균 (E coli)유전자들의 기능적인 분류

  • Slide 1
  • Slide 2
  • Slide 3
  • Slide 4
  • Slide 5
  • Slide 6
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Slide 12
  • Slide 13
  • Slide 14
  • Slide 15
  • Slide 16
  • Slide 17
  • Slide 18
  • Slide 19

아미노산 서열 데이터베이스

PIR-International Protein Sequence Database

- 1968-1978 년 ldquo데이호프rdquo가 ldquo단백질 서열과 구조 도해서rdquo 출판 1980 년대 NBRF 단백질 서열 데이터베이스가 시초

- 1984 년 Protein Information Resource (PIR) 이 NIH 지원으로 설립 -1988 년 독일 뮌헨 단백질 서열 정보센터 (MIPS) 와 일본 국제 단백질 서열 데이터베이스 (JIPID) 와 협력

아미노산 서열 데이터베이스

Protein Research Foundation (PRF)

-1975 년 일본의 단백질 연구 재단 (PRE) 이 ldquo펩티드 정보(Peptide information)rdquo 를 출판

-1979 년 전산화한 데이터베이스 SEQDB 와 LITDB 제작

-아미노산 서열을 서지학적 정보 부분으로 다룸

아미노산 서열 데이터베이스

SWISS-PROT

- 1986 년 제네바대학에서 제작

데이터의 질적인 면에서 최고

- 1987 년 유럽 분자 생물학연구소 (EMBL) 과 협력하여

뉴클레오티드 서열 데이터베이스를 번역하여 보완

- 현재 스위스생물정보학협회 (SIB) EMBL 의

유럽생물정보학협회 (EBI) 와 공동으로 운영

3차원 구조 데이터베이스Protein Data Bank(PDB)

-1971 년 북하벤 국립연구소 (BNL) 에 설립

-1999 년 구조생물 정보학 연구협력 기구 (RCSB) 가 운영

- 단백질 RNA DNA 탄수화물 분자 합성물 바이러스 구조 정보

Cambridge Structural Database(CSD)

-1965 년 캠브리지대학에 설립

-1989 년 캠브리지 결정데이터센터 (CCDC) 에 의해 유지

-서지학적 화학적 결정학적 데이터와 X- 레이 중성자 회절방법에 의한 3 차원 분자좌표 데이터를 포함

뉴클레오티드 서열 데이터베이스

GeneBank

-1982 년 로스 알라모스 국립연구소

-1992 년 NCBI 로 이관

EMBL-1982 년 유럽 분자생물학 연구소-1994 년 EBI 로 이관

DDBJ

-1984 년 일본 DNA 데이터 은행

이들 세 기관이 ldquo국제 뉴클레오티드 서열 데이터베이스

협력기구rdquo 결성하여 매일 데이터를 교환

lt 그림 2-1gt (a) 등록자료의 개수와 (b) 잔기의 개수에서 본 서열과 3차원 구조 데이터베이스들의 성장

플랫 파일 (Flat File) 형식

- 핵산 서열 단백질 서열 3 차원 분자 구조 데이터베이스에 널리 사용

- 데이터 처리 및 이용이 쉬움

-서열 데이터베이스 등록자료 내용

① 명명법 서지학적 정보

② 서열 특성에 대한 생물학적 주석을 포함한 특징표

③ 일차 서열 데이터

GeneBank 의 서열데이터베이스

LOCUS DRODPPC 4001 bp mRNA linear INV 26-APR-1993 DEFINITION Dmelanogaster decapentaplegic gene complex (DPP-C) complete cdsACCESSION M30116 VERSION M301161 GI157291 KEYWORDS SOURCE Drosophila melanogaster (fruit fly) ORGANISM Drosophila melanogaster Eukaryota Metazoa Arthropoda Hexapoda Insecta Pterygota Neoptera Endopterygota Diptera Brachycera Muscomorpha Ephydroidea Drosophilidae Drosophila REFERENCE 1 (bases 1 to 4001) AUTHORS PadgettRW St JohnstonRD and GelbartWM TITLE A transcript from a Drosophila pattern gene predicts a protein homologous to the transforming growth factor-beta family JOURNAL Nature 325 (6099) 81-84 (1987) PUBMED 3467201 COMMENT Original source text Dmelanogaster cDNA to mRNA The initiation codon could be at either 1188-1190 or 1587-1589 FEATURES LocationQualifiers source 14001 organism=Drosophila melanogaster mol_type=mRNA db_xref=taxon7227 mRNA lt13918 product=decapentaplegic protein mRNA CDS 11882954 note=decapentaplegic protein (1188 could be 1587) codon_start=1 protein_id=AAA284821 db_xref=GI157292 translation=MRAWLLLLAVLATFQTIVRVASTEDISQRFIAAIAPVAAHIPLAhelliphellipLGYDAYYCHGKC PFPLADHFNSTNHAVVQTLVNNMNPGKVPKACCVPTQLDSVAMLYL NDQSTVVLKNYQEMTVVGCGCR ORIGIN 1 gtcgttcaac agcgctgatc gagtttaaat ctataccgaa atgagcggcg gaaagtgagc 61 cacttggcgt gaacccaaag ctttcgagga aaattctcgg acccccatat acaaatatcg 121 gaaaaagtat cgaacagttt cgcgacgcga agcgttaaga tcgccaaaag atctccgtgc 181 ggaaacaaag aaattgaggc actattaaga gattgttgtt gtgcgcgagt gtgtgtcttc 241 agctgggtgt gtggaatgtc aactgacggg ttgtaaaggg aaaccctgaa atccgaacgg helliphelliphelliphellip 3841 aactgtataa acaaaacgta tgccctataa atatatgaat aactatctac atcgttatgc 3901 gttctaagct aagctcgaat aaatccgtac acgttaatta atctagaatc gtaagaccta 3961 acgcgtaagc tcagcatgtt ggataaatta atagaaacga g

SWISS-PROT의 서열 데이터 베이스Entry information

Entry name DECA_DROME

Primary accession number P07713

Secondary accession numbers P91651 Q6AWM1 Q8I0M7 Q8ITK4 Q9VQC6

Integrated into Swiss-Prot on April 1 1988

Sequence was last modified on September 13 2005 (Sequence version 2)

Annotations were last modified on

March 21 2006 (Entry version 66)

Name and origin of the protein

Protein name Protein decapentaplegic [Precursor]

Synonym Protein DPP-C

Gene name Name dpp

ORFNames CG9885

From Drosophila melanogaster (Fruit fly) [TaxID 7227]

Taxonomy Eukaryota

Metazoa Arthropoda Hexapoda Insecta Pterygota Neoptera Endopterygota Diptera Brachycera Muscomorpha Ephydroidea Drosophilidae Drosophila

References

[1] NUCLEOTIDE SEQUENCE [MRNA]DOI=101038325081a0 PubMed=3467201 [NCBI ExPASy EBI Israel Japan]Padgett RW St Johnston RD Gelbart WMA transcript from a Drosophila pattern gene predicts a protein homologous to the transforming growth factor-beta familyNature 32581-84(1987)

Features helliphelliphellip

Sequence information helliphelliphelliphellip

유전체 데이터베이스

- 생물 종에 대한 유전적 지도 물리적 지도 핵산 서열 아미노산 서열과 같은 여러 종류의 데이터를 포함- 다양한 해상력에서의 유전체 구조- 다양한 단계에서의 유전체 기능- 유전자 기능에 따른 계층적 분류- DNA 칩 단백질 칩과 같은 실험 방법들로부터 얻은

새로운 종류의 발현 데이터들과 통합 발전

lt 표 2-4gt 라일리 (Monica Riley) 에 따른 대장균 (E coli)유전자들의 기능적인 분류

  • Slide 1
  • Slide 2
  • Slide 3
  • Slide 4
  • Slide 5
  • Slide 6
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Slide 12
  • Slide 13
  • Slide 14
  • Slide 15
  • Slide 16
  • Slide 17
  • Slide 18
  • Slide 19

아미노산 서열 데이터베이스

Protein Research Foundation (PRF)

-1975 년 일본의 단백질 연구 재단 (PRE) 이 ldquo펩티드 정보(Peptide information)rdquo 를 출판

-1979 년 전산화한 데이터베이스 SEQDB 와 LITDB 제작

-아미노산 서열을 서지학적 정보 부분으로 다룸

아미노산 서열 데이터베이스

SWISS-PROT

- 1986 년 제네바대학에서 제작

데이터의 질적인 면에서 최고

- 1987 년 유럽 분자 생물학연구소 (EMBL) 과 협력하여

뉴클레오티드 서열 데이터베이스를 번역하여 보완

- 현재 스위스생물정보학협회 (SIB) EMBL 의

유럽생물정보학협회 (EBI) 와 공동으로 운영

3차원 구조 데이터베이스Protein Data Bank(PDB)

-1971 년 북하벤 국립연구소 (BNL) 에 설립

-1999 년 구조생물 정보학 연구협력 기구 (RCSB) 가 운영

- 단백질 RNA DNA 탄수화물 분자 합성물 바이러스 구조 정보

Cambridge Structural Database(CSD)

-1965 년 캠브리지대학에 설립

-1989 년 캠브리지 결정데이터센터 (CCDC) 에 의해 유지

-서지학적 화학적 결정학적 데이터와 X- 레이 중성자 회절방법에 의한 3 차원 분자좌표 데이터를 포함

뉴클레오티드 서열 데이터베이스

GeneBank

-1982 년 로스 알라모스 국립연구소

-1992 년 NCBI 로 이관

EMBL-1982 년 유럽 분자생물학 연구소-1994 년 EBI 로 이관

DDBJ

-1984 년 일본 DNA 데이터 은행

이들 세 기관이 ldquo국제 뉴클레오티드 서열 데이터베이스

협력기구rdquo 결성하여 매일 데이터를 교환

lt 그림 2-1gt (a) 등록자료의 개수와 (b) 잔기의 개수에서 본 서열과 3차원 구조 데이터베이스들의 성장

플랫 파일 (Flat File) 형식

- 핵산 서열 단백질 서열 3 차원 분자 구조 데이터베이스에 널리 사용

- 데이터 처리 및 이용이 쉬움

-서열 데이터베이스 등록자료 내용

① 명명법 서지학적 정보

② 서열 특성에 대한 생물학적 주석을 포함한 특징표

③ 일차 서열 데이터

GeneBank 의 서열데이터베이스

LOCUS DRODPPC 4001 bp mRNA linear INV 26-APR-1993 DEFINITION Dmelanogaster decapentaplegic gene complex (DPP-C) complete cdsACCESSION M30116 VERSION M301161 GI157291 KEYWORDS SOURCE Drosophila melanogaster (fruit fly) ORGANISM Drosophila melanogaster Eukaryota Metazoa Arthropoda Hexapoda Insecta Pterygota Neoptera Endopterygota Diptera Brachycera Muscomorpha Ephydroidea Drosophilidae Drosophila REFERENCE 1 (bases 1 to 4001) AUTHORS PadgettRW St JohnstonRD and GelbartWM TITLE A transcript from a Drosophila pattern gene predicts a protein homologous to the transforming growth factor-beta family JOURNAL Nature 325 (6099) 81-84 (1987) PUBMED 3467201 COMMENT Original source text Dmelanogaster cDNA to mRNA The initiation codon could be at either 1188-1190 or 1587-1589 FEATURES LocationQualifiers source 14001 organism=Drosophila melanogaster mol_type=mRNA db_xref=taxon7227 mRNA lt13918 product=decapentaplegic protein mRNA CDS 11882954 note=decapentaplegic protein (1188 could be 1587) codon_start=1 protein_id=AAA284821 db_xref=GI157292 translation=MRAWLLLLAVLATFQTIVRVASTEDISQRFIAAIAPVAAHIPLAhelliphellipLGYDAYYCHGKC PFPLADHFNSTNHAVVQTLVNNMNPGKVPKACCVPTQLDSVAMLYL NDQSTVVLKNYQEMTVVGCGCR ORIGIN 1 gtcgttcaac agcgctgatc gagtttaaat ctataccgaa atgagcggcg gaaagtgagc 61 cacttggcgt gaacccaaag ctttcgagga aaattctcgg acccccatat acaaatatcg 121 gaaaaagtat cgaacagttt cgcgacgcga agcgttaaga tcgccaaaag atctccgtgc 181 ggaaacaaag aaattgaggc actattaaga gattgttgtt gtgcgcgagt gtgtgtcttc 241 agctgggtgt gtggaatgtc aactgacggg ttgtaaaggg aaaccctgaa atccgaacgg helliphelliphelliphellip 3841 aactgtataa acaaaacgta tgccctataa atatatgaat aactatctac atcgttatgc 3901 gttctaagct aagctcgaat aaatccgtac acgttaatta atctagaatc gtaagaccta 3961 acgcgtaagc tcagcatgtt ggataaatta atagaaacga g

SWISS-PROT의 서열 데이터 베이스Entry information

Entry name DECA_DROME

Primary accession number P07713

Secondary accession numbers P91651 Q6AWM1 Q8I0M7 Q8ITK4 Q9VQC6

Integrated into Swiss-Prot on April 1 1988

Sequence was last modified on September 13 2005 (Sequence version 2)

Annotations were last modified on

March 21 2006 (Entry version 66)

Name and origin of the protein

Protein name Protein decapentaplegic [Precursor]

Synonym Protein DPP-C

Gene name Name dpp

ORFNames CG9885

From Drosophila melanogaster (Fruit fly) [TaxID 7227]

Taxonomy Eukaryota

Metazoa Arthropoda Hexapoda Insecta Pterygota Neoptera Endopterygota Diptera Brachycera Muscomorpha Ephydroidea Drosophilidae Drosophila

References

[1] NUCLEOTIDE SEQUENCE [MRNA]DOI=101038325081a0 PubMed=3467201 [NCBI ExPASy EBI Israel Japan]Padgett RW St Johnston RD Gelbart WMA transcript from a Drosophila pattern gene predicts a protein homologous to the transforming growth factor-beta familyNature 32581-84(1987)

Features helliphelliphellip

Sequence information helliphelliphelliphellip

유전체 데이터베이스

- 생물 종에 대한 유전적 지도 물리적 지도 핵산 서열 아미노산 서열과 같은 여러 종류의 데이터를 포함- 다양한 해상력에서의 유전체 구조- 다양한 단계에서의 유전체 기능- 유전자 기능에 따른 계층적 분류- DNA 칩 단백질 칩과 같은 실험 방법들로부터 얻은

새로운 종류의 발현 데이터들과 통합 발전

lt 표 2-4gt 라일리 (Monica Riley) 에 따른 대장균 (E coli)유전자들의 기능적인 분류

  • Slide 1
  • Slide 2
  • Slide 3
  • Slide 4
  • Slide 5
  • Slide 6
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Slide 12
  • Slide 13
  • Slide 14
  • Slide 15
  • Slide 16
  • Slide 17
  • Slide 18
  • Slide 19

아미노산 서열 데이터베이스

SWISS-PROT

- 1986 년 제네바대학에서 제작

데이터의 질적인 면에서 최고

- 1987 년 유럽 분자 생물학연구소 (EMBL) 과 협력하여

뉴클레오티드 서열 데이터베이스를 번역하여 보완

- 현재 스위스생물정보학협회 (SIB) EMBL 의

유럽생물정보학협회 (EBI) 와 공동으로 운영

3차원 구조 데이터베이스Protein Data Bank(PDB)

-1971 년 북하벤 국립연구소 (BNL) 에 설립

-1999 년 구조생물 정보학 연구협력 기구 (RCSB) 가 운영

- 단백질 RNA DNA 탄수화물 분자 합성물 바이러스 구조 정보

Cambridge Structural Database(CSD)

-1965 년 캠브리지대학에 설립

-1989 년 캠브리지 결정데이터센터 (CCDC) 에 의해 유지

-서지학적 화학적 결정학적 데이터와 X- 레이 중성자 회절방법에 의한 3 차원 분자좌표 데이터를 포함

뉴클레오티드 서열 데이터베이스

GeneBank

-1982 년 로스 알라모스 국립연구소

-1992 년 NCBI 로 이관

EMBL-1982 년 유럽 분자생물학 연구소-1994 년 EBI 로 이관

DDBJ

-1984 년 일본 DNA 데이터 은행

이들 세 기관이 ldquo국제 뉴클레오티드 서열 데이터베이스

협력기구rdquo 결성하여 매일 데이터를 교환

lt 그림 2-1gt (a) 등록자료의 개수와 (b) 잔기의 개수에서 본 서열과 3차원 구조 데이터베이스들의 성장

플랫 파일 (Flat File) 형식

- 핵산 서열 단백질 서열 3 차원 분자 구조 데이터베이스에 널리 사용

- 데이터 처리 및 이용이 쉬움

-서열 데이터베이스 등록자료 내용

① 명명법 서지학적 정보

② 서열 특성에 대한 생물학적 주석을 포함한 특징표

③ 일차 서열 데이터

GeneBank 의 서열데이터베이스

LOCUS DRODPPC 4001 bp mRNA linear INV 26-APR-1993 DEFINITION Dmelanogaster decapentaplegic gene complex (DPP-C) complete cdsACCESSION M30116 VERSION M301161 GI157291 KEYWORDS SOURCE Drosophila melanogaster (fruit fly) ORGANISM Drosophila melanogaster Eukaryota Metazoa Arthropoda Hexapoda Insecta Pterygota Neoptera Endopterygota Diptera Brachycera Muscomorpha Ephydroidea Drosophilidae Drosophila REFERENCE 1 (bases 1 to 4001) AUTHORS PadgettRW St JohnstonRD and GelbartWM TITLE A transcript from a Drosophila pattern gene predicts a protein homologous to the transforming growth factor-beta family JOURNAL Nature 325 (6099) 81-84 (1987) PUBMED 3467201 COMMENT Original source text Dmelanogaster cDNA to mRNA The initiation codon could be at either 1188-1190 or 1587-1589 FEATURES LocationQualifiers source 14001 organism=Drosophila melanogaster mol_type=mRNA db_xref=taxon7227 mRNA lt13918 product=decapentaplegic protein mRNA CDS 11882954 note=decapentaplegic protein (1188 could be 1587) codon_start=1 protein_id=AAA284821 db_xref=GI157292 translation=MRAWLLLLAVLATFQTIVRVASTEDISQRFIAAIAPVAAHIPLAhelliphellipLGYDAYYCHGKC PFPLADHFNSTNHAVVQTLVNNMNPGKVPKACCVPTQLDSVAMLYL NDQSTVVLKNYQEMTVVGCGCR ORIGIN 1 gtcgttcaac agcgctgatc gagtttaaat ctataccgaa atgagcggcg gaaagtgagc 61 cacttggcgt gaacccaaag ctttcgagga aaattctcgg acccccatat acaaatatcg 121 gaaaaagtat cgaacagttt cgcgacgcga agcgttaaga tcgccaaaag atctccgtgc 181 ggaaacaaag aaattgaggc actattaaga gattgttgtt gtgcgcgagt gtgtgtcttc 241 agctgggtgt gtggaatgtc aactgacggg ttgtaaaggg aaaccctgaa atccgaacgg helliphelliphelliphellip 3841 aactgtataa acaaaacgta tgccctataa atatatgaat aactatctac atcgttatgc 3901 gttctaagct aagctcgaat aaatccgtac acgttaatta atctagaatc gtaagaccta 3961 acgcgtaagc tcagcatgtt ggataaatta atagaaacga g

SWISS-PROT의 서열 데이터 베이스Entry information

Entry name DECA_DROME

Primary accession number P07713

Secondary accession numbers P91651 Q6AWM1 Q8I0M7 Q8ITK4 Q9VQC6

Integrated into Swiss-Prot on April 1 1988

Sequence was last modified on September 13 2005 (Sequence version 2)

Annotations were last modified on

March 21 2006 (Entry version 66)

Name and origin of the protein

Protein name Protein decapentaplegic [Precursor]

Synonym Protein DPP-C

Gene name Name dpp

ORFNames CG9885

From Drosophila melanogaster (Fruit fly) [TaxID 7227]

Taxonomy Eukaryota

Metazoa Arthropoda Hexapoda Insecta Pterygota Neoptera Endopterygota Diptera Brachycera Muscomorpha Ephydroidea Drosophilidae Drosophila

References

[1] NUCLEOTIDE SEQUENCE [MRNA]DOI=101038325081a0 PubMed=3467201 [NCBI ExPASy EBI Israel Japan]Padgett RW St Johnston RD Gelbart WMA transcript from a Drosophila pattern gene predicts a protein homologous to the transforming growth factor-beta familyNature 32581-84(1987)

Features helliphelliphellip

Sequence information helliphelliphelliphellip

유전체 데이터베이스

- 생물 종에 대한 유전적 지도 물리적 지도 핵산 서열 아미노산 서열과 같은 여러 종류의 데이터를 포함- 다양한 해상력에서의 유전체 구조- 다양한 단계에서의 유전체 기능- 유전자 기능에 따른 계층적 분류- DNA 칩 단백질 칩과 같은 실험 방법들로부터 얻은

새로운 종류의 발현 데이터들과 통합 발전

lt 표 2-4gt 라일리 (Monica Riley) 에 따른 대장균 (E coli)유전자들의 기능적인 분류

  • Slide 1
  • Slide 2
  • Slide 3
  • Slide 4
  • Slide 5
  • Slide 6
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Slide 12
  • Slide 13
  • Slide 14
  • Slide 15
  • Slide 16
  • Slide 17
  • Slide 18
  • Slide 19

3차원 구조 데이터베이스Protein Data Bank(PDB)

-1971 년 북하벤 국립연구소 (BNL) 에 설립

-1999 년 구조생물 정보학 연구협력 기구 (RCSB) 가 운영

- 단백질 RNA DNA 탄수화물 분자 합성물 바이러스 구조 정보

Cambridge Structural Database(CSD)

-1965 년 캠브리지대학에 설립

-1989 년 캠브리지 결정데이터센터 (CCDC) 에 의해 유지

-서지학적 화학적 결정학적 데이터와 X- 레이 중성자 회절방법에 의한 3 차원 분자좌표 데이터를 포함

뉴클레오티드 서열 데이터베이스

GeneBank

-1982 년 로스 알라모스 국립연구소

-1992 년 NCBI 로 이관

EMBL-1982 년 유럽 분자생물학 연구소-1994 년 EBI 로 이관

DDBJ

-1984 년 일본 DNA 데이터 은행

이들 세 기관이 ldquo국제 뉴클레오티드 서열 데이터베이스

협력기구rdquo 결성하여 매일 데이터를 교환

lt 그림 2-1gt (a) 등록자료의 개수와 (b) 잔기의 개수에서 본 서열과 3차원 구조 데이터베이스들의 성장

플랫 파일 (Flat File) 형식

- 핵산 서열 단백질 서열 3 차원 분자 구조 데이터베이스에 널리 사용

- 데이터 처리 및 이용이 쉬움

-서열 데이터베이스 등록자료 내용

① 명명법 서지학적 정보

② 서열 특성에 대한 생물학적 주석을 포함한 특징표

③ 일차 서열 데이터

GeneBank 의 서열데이터베이스

LOCUS DRODPPC 4001 bp mRNA linear INV 26-APR-1993 DEFINITION Dmelanogaster decapentaplegic gene complex (DPP-C) complete cdsACCESSION M30116 VERSION M301161 GI157291 KEYWORDS SOURCE Drosophila melanogaster (fruit fly) ORGANISM Drosophila melanogaster Eukaryota Metazoa Arthropoda Hexapoda Insecta Pterygota Neoptera Endopterygota Diptera Brachycera Muscomorpha Ephydroidea Drosophilidae Drosophila REFERENCE 1 (bases 1 to 4001) AUTHORS PadgettRW St JohnstonRD and GelbartWM TITLE A transcript from a Drosophila pattern gene predicts a protein homologous to the transforming growth factor-beta family JOURNAL Nature 325 (6099) 81-84 (1987) PUBMED 3467201 COMMENT Original source text Dmelanogaster cDNA to mRNA The initiation codon could be at either 1188-1190 or 1587-1589 FEATURES LocationQualifiers source 14001 organism=Drosophila melanogaster mol_type=mRNA db_xref=taxon7227 mRNA lt13918 product=decapentaplegic protein mRNA CDS 11882954 note=decapentaplegic protein (1188 could be 1587) codon_start=1 protein_id=AAA284821 db_xref=GI157292 translation=MRAWLLLLAVLATFQTIVRVASTEDISQRFIAAIAPVAAHIPLAhelliphellipLGYDAYYCHGKC PFPLADHFNSTNHAVVQTLVNNMNPGKVPKACCVPTQLDSVAMLYL NDQSTVVLKNYQEMTVVGCGCR ORIGIN 1 gtcgttcaac agcgctgatc gagtttaaat ctataccgaa atgagcggcg gaaagtgagc 61 cacttggcgt gaacccaaag ctttcgagga aaattctcgg acccccatat acaaatatcg 121 gaaaaagtat cgaacagttt cgcgacgcga agcgttaaga tcgccaaaag atctccgtgc 181 ggaaacaaag aaattgaggc actattaaga gattgttgtt gtgcgcgagt gtgtgtcttc 241 agctgggtgt gtggaatgtc aactgacggg ttgtaaaggg aaaccctgaa atccgaacgg helliphelliphelliphellip 3841 aactgtataa acaaaacgta tgccctataa atatatgaat aactatctac atcgttatgc 3901 gttctaagct aagctcgaat aaatccgtac acgttaatta atctagaatc gtaagaccta 3961 acgcgtaagc tcagcatgtt ggataaatta atagaaacga g

SWISS-PROT의 서열 데이터 베이스Entry information

Entry name DECA_DROME

Primary accession number P07713

Secondary accession numbers P91651 Q6AWM1 Q8I0M7 Q8ITK4 Q9VQC6

Integrated into Swiss-Prot on April 1 1988

Sequence was last modified on September 13 2005 (Sequence version 2)

Annotations were last modified on

March 21 2006 (Entry version 66)

Name and origin of the protein

Protein name Protein decapentaplegic [Precursor]

Synonym Protein DPP-C

Gene name Name dpp

ORFNames CG9885

From Drosophila melanogaster (Fruit fly) [TaxID 7227]

Taxonomy Eukaryota

Metazoa Arthropoda Hexapoda Insecta Pterygota Neoptera Endopterygota Diptera Brachycera Muscomorpha Ephydroidea Drosophilidae Drosophila

References

[1] NUCLEOTIDE SEQUENCE [MRNA]DOI=101038325081a0 PubMed=3467201 [NCBI ExPASy EBI Israel Japan]Padgett RW St Johnston RD Gelbart WMA transcript from a Drosophila pattern gene predicts a protein homologous to the transforming growth factor-beta familyNature 32581-84(1987)

Features helliphelliphellip

Sequence information helliphelliphelliphellip

유전체 데이터베이스

- 생물 종에 대한 유전적 지도 물리적 지도 핵산 서열 아미노산 서열과 같은 여러 종류의 데이터를 포함- 다양한 해상력에서의 유전체 구조- 다양한 단계에서의 유전체 기능- 유전자 기능에 따른 계층적 분류- DNA 칩 단백질 칩과 같은 실험 방법들로부터 얻은

새로운 종류의 발현 데이터들과 통합 발전

lt 표 2-4gt 라일리 (Monica Riley) 에 따른 대장균 (E coli)유전자들의 기능적인 분류

  • Slide 1
  • Slide 2
  • Slide 3
  • Slide 4
  • Slide 5
  • Slide 6
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Slide 12
  • Slide 13
  • Slide 14
  • Slide 15
  • Slide 16
  • Slide 17
  • Slide 18
  • Slide 19

뉴클레오티드 서열 데이터베이스

GeneBank

-1982 년 로스 알라모스 국립연구소

-1992 년 NCBI 로 이관

EMBL-1982 년 유럽 분자생물학 연구소-1994 년 EBI 로 이관

DDBJ

-1984 년 일본 DNA 데이터 은행

이들 세 기관이 ldquo국제 뉴클레오티드 서열 데이터베이스

협력기구rdquo 결성하여 매일 데이터를 교환

lt 그림 2-1gt (a) 등록자료의 개수와 (b) 잔기의 개수에서 본 서열과 3차원 구조 데이터베이스들의 성장

플랫 파일 (Flat File) 형식

- 핵산 서열 단백질 서열 3 차원 분자 구조 데이터베이스에 널리 사용

- 데이터 처리 및 이용이 쉬움

-서열 데이터베이스 등록자료 내용

① 명명법 서지학적 정보

② 서열 특성에 대한 생물학적 주석을 포함한 특징표

③ 일차 서열 데이터

GeneBank 의 서열데이터베이스

LOCUS DRODPPC 4001 bp mRNA linear INV 26-APR-1993 DEFINITION Dmelanogaster decapentaplegic gene complex (DPP-C) complete cdsACCESSION M30116 VERSION M301161 GI157291 KEYWORDS SOURCE Drosophila melanogaster (fruit fly) ORGANISM Drosophila melanogaster Eukaryota Metazoa Arthropoda Hexapoda Insecta Pterygota Neoptera Endopterygota Diptera Brachycera Muscomorpha Ephydroidea Drosophilidae Drosophila REFERENCE 1 (bases 1 to 4001) AUTHORS PadgettRW St JohnstonRD and GelbartWM TITLE A transcript from a Drosophila pattern gene predicts a protein homologous to the transforming growth factor-beta family JOURNAL Nature 325 (6099) 81-84 (1987) PUBMED 3467201 COMMENT Original source text Dmelanogaster cDNA to mRNA The initiation codon could be at either 1188-1190 or 1587-1589 FEATURES LocationQualifiers source 14001 organism=Drosophila melanogaster mol_type=mRNA db_xref=taxon7227 mRNA lt13918 product=decapentaplegic protein mRNA CDS 11882954 note=decapentaplegic protein (1188 could be 1587) codon_start=1 protein_id=AAA284821 db_xref=GI157292 translation=MRAWLLLLAVLATFQTIVRVASTEDISQRFIAAIAPVAAHIPLAhelliphellipLGYDAYYCHGKC PFPLADHFNSTNHAVVQTLVNNMNPGKVPKACCVPTQLDSVAMLYL NDQSTVVLKNYQEMTVVGCGCR ORIGIN 1 gtcgttcaac agcgctgatc gagtttaaat ctataccgaa atgagcggcg gaaagtgagc 61 cacttggcgt gaacccaaag ctttcgagga aaattctcgg acccccatat acaaatatcg 121 gaaaaagtat cgaacagttt cgcgacgcga agcgttaaga tcgccaaaag atctccgtgc 181 ggaaacaaag aaattgaggc actattaaga gattgttgtt gtgcgcgagt gtgtgtcttc 241 agctgggtgt gtggaatgtc aactgacggg ttgtaaaggg aaaccctgaa atccgaacgg helliphelliphelliphellip 3841 aactgtataa acaaaacgta tgccctataa atatatgaat aactatctac atcgttatgc 3901 gttctaagct aagctcgaat aaatccgtac acgttaatta atctagaatc gtaagaccta 3961 acgcgtaagc tcagcatgtt ggataaatta atagaaacga g

SWISS-PROT의 서열 데이터 베이스Entry information

Entry name DECA_DROME

Primary accession number P07713

Secondary accession numbers P91651 Q6AWM1 Q8I0M7 Q8ITK4 Q9VQC6

Integrated into Swiss-Prot on April 1 1988

Sequence was last modified on September 13 2005 (Sequence version 2)

Annotations were last modified on

March 21 2006 (Entry version 66)

Name and origin of the protein

Protein name Protein decapentaplegic [Precursor]

Synonym Protein DPP-C

Gene name Name dpp

ORFNames CG9885

From Drosophila melanogaster (Fruit fly) [TaxID 7227]

Taxonomy Eukaryota

Metazoa Arthropoda Hexapoda Insecta Pterygota Neoptera Endopterygota Diptera Brachycera Muscomorpha Ephydroidea Drosophilidae Drosophila

References

[1] NUCLEOTIDE SEQUENCE [MRNA]DOI=101038325081a0 PubMed=3467201 [NCBI ExPASy EBI Israel Japan]Padgett RW St Johnston RD Gelbart WMA transcript from a Drosophila pattern gene predicts a protein homologous to the transforming growth factor-beta familyNature 32581-84(1987)

Features helliphelliphellip

Sequence information helliphelliphelliphellip

유전체 데이터베이스

- 생물 종에 대한 유전적 지도 물리적 지도 핵산 서열 아미노산 서열과 같은 여러 종류의 데이터를 포함- 다양한 해상력에서의 유전체 구조- 다양한 단계에서의 유전체 기능- 유전자 기능에 따른 계층적 분류- DNA 칩 단백질 칩과 같은 실험 방법들로부터 얻은

새로운 종류의 발현 데이터들과 통합 발전

lt 표 2-4gt 라일리 (Monica Riley) 에 따른 대장균 (E coli)유전자들의 기능적인 분류

  • Slide 1
  • Slide 2
  • Slide 3
  • Slide 4
  • Slide 5
  • Slide 6
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Slide 12
  • Slide 13
  • Slide 14
  • Slide 15
  • Slide 16
  • Slide 17
  • Slide 18
  • Slide 19

lt 그림 2-1gt (a) 등록자료의 개수와 (b) 잔기의 개수에서 본 서열과 3차원 구조 데이터베이스들의 성장

플랫 파일 (Flat File) 형식

- 핵산 서열 단백질 서열 3 차원 분자 구조 데이터베이스에 널리 사용

- 데이터 처리 및 이용이 쉬움

-서열 데이터베이스 등록자료 내용

① 명명법 서지학적 정보

② 서열 특성에 대한 생물학적 주석을 포함한 특징표

③ 일차 서열 데이터

GeneBank 의 서열데이터베이스

LOCUS DRODPPC 4001 bp mRNA linear INV 26-APR-1993 DEFINITION Dmelanogaster decapentaplegic gene complex (DPP-C) complete cdsACCESSION M30116 VERSION M301161 GI157291 KEYWORDS SOURCE Drosophila melanogaster (fruit fly) ORGANISM Drosophila melanogaster Eukaryota Metazoa Arthropoda Hexapoda Insecta Pterygota Neoptera Endopterygota Diptera Brachycera Muscomorpha Ephydroidea Drosophilidae Drosophila REFERENCE 1 (bases 1 to 4001) AUTHORS PadgettRW St JohnstonRD and GelbartWM TITLE A transcript from a Drosophila pattern gene predicts a protein homologous to the transforming growth factor-beta family JOURNAL Nature 325 (6099) 81-84 (1987) PUBMED 3467201 COMMENT Original source text Dmelanogaster cDNA to mRNA The initiation codon could be at either 1188-1190 or 1587-1589 FEATURES LocationQualifiers source 14001 organism=Drosophila melanogaster mol_type=mRNA db_xref=taxon7227 mRNA lt13918 product=decapentaplegic protein mRNA CDS 11882954 note=decapentaplegic protein (1188 could be 1587) codon_start=1 protein_id=AAA284821 db_xref=GI157292 translation=MRAWLLLLAVLATFQTIVRVASTEDISQRFIAAIAPVAAHIPLAhelliphellipLGYDAYYCHGKC PFPLADHFNSTNHAVVQTLVNNMNPGKVPKACCVPTQLDSVAMLYL NDQSTVVLKNYQEMTVVGCGCR ORIGIN 1 gtcgttcaac agcgctgatc gagtttaaat ctataccgaa atgagcggcg gaaagtgagc 61 cacttggcgt gaacccaaag ctttcgagga aaattctcgg acccccatat acaaatatcg 121 gaaaaagtat cgaacagttt cgcgacgcga agcgttaaga tcgccaaaag atctccgtgc 181 ggaaacaaag aaattgaggc actattaaga gattgttgtt gtgcgcgagt gtgtgtcttc 241 agctgggtgt gtggaatgtc aactgacggg ttgtaaaggg aaaccctgaa atccgaacgg helliphelliphelliphellip 3841 aactgtataa acaaaacgta tgccctataa atatatgaat aactatctac atcgttatgc 3901 gttctaagct aagctcgaat aaatccgtac acgttaatta atctagaatc gtaagaccta 3961 acgcgtaagc tcagcatgtt ggataaatta atagaaacga g

SWISS-PROT의 서열 데이터 베이스Entry information

Entry name DECA_DROME

Primary accession number P07713

Secondary accession numbers P91651 Q6AWM1 Q8I0M7 Q8ITK4 Q9VQC6

Integrated into Swiss-Prot on April 1 1988

Sequence was last modified on September 13 2005 (Sequence version 2)

Annotations were last modified on

March 21 2006 (Entry version 66)

Name and origin of the protein

Protein name Protein decapentaplegic [Precursor]

Synonym Protein DPP-C

Gene name Name dpp

ORFNames CG9885

From Drosophila melanogaster (Fruit fly) [TaxID 7227]

Taxonomy Eukaryota

Metazoa Arthropoda Hexapoda Insecta Pterygota Neoptera Endopterygota Diptera Brachycera Muscomorpha Ephydroidea Drosophilidae Drosophila

References

[1] NUCLEOTIDE SEQUENCE [MRNA]DOI=101038325081a0 PubMed=3467201 [NCBI ExPASy EBI Israel Japan]Padgett RW St Johnston RD Gelbart WMA transcript from a Drosophila pattern gene predicts a protein homologous to the transforming growth factor-beta familyNature 32581-84(1987)

Features helliphelliphellip

Sequence information helliphelliphelliphellip

유전체 데이터베이스

- 생물 종에 대한 유전적 지도 물리적 지도 핵산 서열 아미노산 서열과 같은 여러 종류의 데이터를 포함- 다양한 해상력에서의 유전체 구조- 다양한 단계에서의 유전체 기능- 유전자 기능에 따른 계층적 분류- DNA 칩 단백질 칩과 같은 실험 방법들로부터 얻은

새로운 종류의 발현 데이터들과 통합 발전

lt 표 2-4gt 라일리 (Monica Riley) 에 따른 대장균 (E coli)유전자들의 기능적인 분류

  • Slide 1
  • Slide 2
  • Slide 3
  • Slide 4
  • Slide 5
  • Slide 6
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Slide 12
  • Slide 13
  • Slide 14
  • Slide 15
  • Slide 16
  • Slide 17
  • Slide 18
  • Slide 19

플랫 파일 (Flat File) 형식

- 핵산 서열 단백질 서열 3 차원 분자 구조 데이터베이스에 널리 사용

- 데이터 처리 및 이용이 쉬움

-서열 데이터베이스 등록자료 내용

① 명명법 서지학적 정보

② 서열 특성에 대한 생물학적 주석을 포함한 특징표

③ 일차 서열 데이터

GeneBank 의 서열데이터베이스

LOCUS DRODPPC 4001 bp mRNA linear INV 26-APR-1993 DEFINITION Dmelanogaster decapentaplegic gene complex (DPP-C) complete cdsACCESSION M30116 VERSION M301161 GI157291 KEYWORDS SOURCE Drosophila melanogaster (fruit fly) ORGANISM Drosophila melanogaster Eukaryota Metazoa Arthropoda Hexapoda Insecta Pterygota Neoptera Endopterygota Diptera Brachycera Muscomorpha Ephydroidea Drosophilidae Drosophila REFERENCE 1 (bases 1 to 4001) AUTHORS PadgettRW St JohnstonRD and GelbartWM TITLE A transcript from a Drosophila pattern gene predicts a protein homologous to the transforming growth factor-beta family JOURNAL Nature 325 (6099) 81-84 (1987) PUBMED 3467201 COMMENT Original source text Dmelanogaster cDNA to mRNA The initiation codon could be at either 1188-1190 or 1587-1589 FEATURES LocationQualifiers source 14001 organism=Drosophila melanogaster mol_type=mRNA db_xref=taxon7227 mRNA lt13918 product=decapentaplegic protein mRNA CDS 11882954 note=decapentaplegic protein (1188 could be 1587) codon_start=1 protein_id=AAA284821 db_xref=GI157292 translation=MRAWLLLLAVLATFQTIVRVASTEDISQRFIAAIAPVAAHIPLAhelliphellipLGYDAYYCHGKC PFPLADHFNSTNHAVVQTLVNNMNPGKVPKACCVPTQLDSVAMLYL NDQSTVVLKNYQEMTVVGCGCR ORIGIN 1 gtcgttcaac agcgctgatc gagtttaaat ctataccgaa atgagcggcg gaaagtgagc 61 cacttggcgt gaacccaaag ctttcgagga aaattctcgg acccccatat acaaatatcg 121 gaaaaagtat cgaacagttt cgcgacgcga agcgttaaga tcgccaaaag atctccgtgc 181 ggaaacaaag aaattgaggc actattaaga gattgttgtt gtgcgcgagt gtgtgtcttc 241 agctgggtgt gtggaatgtc aactgacggg ttgtaaaggg aaaccctgaa atccgaacgg helliphelliphelliphellip 3841 aactgtataa acaaaacgta tgccctataa atatatgaat aactatctac atcgttatgc 3901 gttctaagct aagctcgaat aaatccgtac acgttaatta atctagaatc gtaagaccta 3961 acgcgtaagc tcagcatgtt ggataaatta atagaaacga g

SWISS-PROT의 서열 데이터 베이스Entry information

Entry name DECA_DROME

Primary accession number P07713

Secondary accession numbers P91651 Q6AWM1 Q8I0M7 Q8ITK4 Q9VQC6

Integrated into Swiss-Prot on April 1 1988

Sequence was last modified on September 13 2005 (Sequence version 2)

Annotations were last modified on

March 21 2006 (Entry version 66)

Name and origin of the protein

Protein name Protein decapentaplegic [Precursor]

Synonym Protein DPP-C

Gene name Name dpp

ORFNames CG9885

From Drosophila melanogaster (Fruit fly) [TaxID 7227]

Taxonomy Eukaryota

Metazoa Arthropoda Hexapoda Insecta Pterygota Neoptera Endopterygota Diptera Brachycera Muscomorpha Ephydroidea Drosophilidae Drosophila

References

[1] NUCLEOTIDE SEQUENCE [MRNA]DOI=101038325081a0 PubMed=3467201 [NCBI ExPASy EBI Israel Japan]Padgett RW St Johnston RD Gelbart WMA transcript from a Drosophila pattern gene predicts a protein homologous to the transforming growth factor-beta familyNature 32581-84(1987)

Features helliphelliphellip

Sequence information helliphelliphelliphellip

유전체 데이터베이스

- 생물 종에 대한 유전적 지도 물리적 지도 핵산 서열 아미노산 서열과 같은 여러 종류의 데이터를 포함- 다양한 해상력에서의 유전체 구조- 다양한 단계에서의 유전체 기능- 유전자 기능에 따른 계층적 분류- DNA 칩 단백질 칩과 같은 실험 방법들로부터 얻은

새로운 종류의 발현 데이터들과 통합 발전

lt 표 2-4gt 라일리 (Monica Riley) 에 따른 대장균 (E coli)유전자들의 기능적인 분류

  • Slide 1
  • Slide 2
  • Slide 3
  • Slide 4
  • Slide 5
  • Slide 6
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Slide 12
  • Slide 13
  • Slide 14
  • Slide 15
  • Slide 16
  • Slide 17
  • Slide 18
  • Slide 19

GeneBank 의 서열데이터베이스

LOCUS DRODPPC 4001 bp mRNA linear INV 26-APR-1993 DEFINITION Dmelanogaster decapentaplegic gene complex (DPP-C) complete cdsACCESSION M30116 VERSION M301161 GI157291 KEYWORDS SOURCE Drosophila melanogaster (fruit fly) ORGANISM Drosophila melanogaster Eukaryota Metazoa Arthropoda Hexapoda Insecta Pterygota Neoptera Endopterygota Diptera Brachycera Muscomorpha Ephydroidea Drosophilidae Drosophila REFERENCE 1 (bases 1 to 4001) AUTHORS PadgettRW St JohnstonRD and GelbartWM TITLE A transcript from a Drosophila pattern gene predicts a protein homologous to the transforming growth factor-beta family JOURNAL Nature 325 (6099) 81-84 (1987) PUBMED 3467201 COMMENT Original source text Dmelanogaster cDNA to mRNA The initiation codon could be at either 1188-1190 or 1587-1589 FEATURES LocationQualifiers source 14001 organism=Drosophila melanogaster mol_type=mRNA db_xref=taxon7227 mRNA lt13918 product=decapentaplegic protein mRNA CDS 11882954 note=decapentaplegic protein (1188 could be 1587) codon_start=1 protein_id=AAA284821 db_xref=GI157292 translation=MRAWLLLLAVLATFQTIVRVASTEDISQRFIAAIAPVAAHIPLAhelliphellipLGYDAYYCHGKC PFPLADHFNSTNHAVVQTLVNNMNPGKVPKACCVPTQLDSVAMLYL NDQSTVVLKNYQEMTVVGCGCR ORIGIN 1 gtcgttcaac agcgctgatc gagtttaaat ctataccgaa atgagcggcg gaaagtgagc 61 cacttggcgt gaacccaaag ctttcgagga aaattctcgg acccccatat acaaatatcg 121 gaaaaagtat cgaacagttt cgcgacgcga agcgttaaga tcgccaaaag atctccgtgc 181 ggaaacaaag aaattgaggc actattaaga gattgttgtt gtgcgcgagt gtgtgtcttc 241 agctgggtgt gtggaatgtc aactgacggg ttgtaaaggg aaaccctgaa atccgaacgg helliphelliphelliphellip 3841 aactgtataa acaaaacgta tgccctataa atatatgaat aactatctac atcgttatgc 3901 gttctaagct aagctcgaat aaatccgtac acgttaatta atctagaatc gtaagaccta 3961 acgcgtaagc tcagcatgtt ggataaatta atagaaacga g

SWISS-PROT의 서열 데이터 베이스Entry information

Entry name DECA_DROME

Primary accession number P07713

Secondary accession numbers P91651 Q6AWM1 Q8I0M7 Q8ITK4 Q9VQC6

Integrated into Swiss-Prot on April 1 1988

Sequence was last modified on September 13 2005 (Sequence version 2)

Annotations were last modified on

March 21 2006 (Entry version 66)

Name and origin of the protein

Protein name Protein decapentaplegic [Precursor]

Synonym Protein DPP-C

Gene name Name dpp

ORFNames CG9885

From Drosophila melanogaster (Fruit fly) [TaxID 7227]

Taxonomy Eukaryota

Metazoa Arthropoda Hexapoda Insecta Pterygota Neoptera Endopterygota Diptera Brachycera Muscomorpha Ephydroidea Drosophilidae Drosophila

References

[1] NUCLEOTIDE SEQUENCE [MRNA]DOI=101038325081a0 PubMed=3467201 [NCBI ExPASy EBI Israel Japan]Padgett RW St Johnston RD Gelbart WMA transcript from a Drosophila pattern gene predicts a protein homologous to the transforming growth factor-beta familyNature 32581-84(1987)

Features helliphelliphellip

Sequence information helliphelliphelliphellip

유전체 데이터베이스

- 생물 종에 대한 유전적 지도 물리적 지도 핵산 서열 아미노산 서열과 같은 여러 종류의 데이터를 포함- 다양한 해상력에서의 유전체 구조- 다양한 단계에서의 유전체 기능- 유전자 기능에 따른 계층적 분류- DNA 칩 단백질 칩과 같은 실험 방법들로부터 얻은

새로운 종류의 발현 데이터들과 통합 발전

lt 표 2-4gt 라일리 (Monica Riley) 에 따른 대장균 (E coli)유전자들의 기능적인 분류

  • Slide 1
  • Slide 2
  • Slide 3
  • Slide 4
  • Slide 5
  • Slide 6
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Slide 12
  • Slide 13
  • Slide 14
  • Slide 15
  • Slide 16
  • Slide 17
  • Slide 18
  • Slide 19

SWISS-PROT의 서열 데이터 베이스Entry information

Entry name DECA_DROME

Primary accession number P07713

Secondary accession numbers P91651 Q6AWM1 Q8I0M7 Q8ITK4 Q9VQC6

Integrated into Swiss-Prot on April 1 1988

Sequence was last modified on September 13 2005 (Sequence version 2)

Annotations were last modified on

March 21 2006 (Entry version 66)

Name and origin of the protein

Protein name Protein decapentaplegic [Precursor]

Synonym Protein DPP-C

Gene name Name dpp

ORFNames CG9885

From Drosophila melanogaster (Fruit fly) [TaxID 7227]

Taxonomy Eukaryota

Metazoa Arthropoda Hexapoda Insecta Pterygota Neoptera Endopterygota Diptera Brachycera Muscomorpha Ephydroidea Drosophilidae Drosophila

References

[1] NUCLEOTIDE SEQUENCE [MRNA]DOI=101038325081a0 PubMed=3467201 [NCBI ExPASy EBI Israel Japan]Padgett RW St Johnston RD Gelbart WMA transcript from a Drosophila pattern gene predicts a protein homologous to the transforming growth factor-beta familyNature 32581-84(1987)

Features helliphelliphellip

Sequence information helliphelliphelliphellip

유전체 데이터베이스

- 생물 종에 대한 유전적 지도 물리적 지도 핵산 서열 아미노산 서열과 같은 여러 종류의 데이터를 포함- 다양한 해상력에서의 유전체 구조- 다양한 단계에서의 유전체 기능- 유전자 기능에 따른 계층적 분류- DNA 칩 단백질 칩과 같은 실험 방법들로부터 얻은

새로운 종류의 발현 데이터들과 통합 발전

lt 표 2-4gt 라일리 (Monica Riley) 에 따른 대장균 (E coli)유전자들의 기능적인 분류

  • Slide 1
  • Slide 2
  • Slide 3
  • Slide 4
  • Slide 5
  • Slide 6
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Slide 12
  • Slide 13
  • Slide 14
  • Slide 15
  • Slide 16
  • Slide 17
  • Slide 18
  • Slide 19

유전체 데이터베이스

- 생물 종에 대한 유전적 지도 물리적 지도 핵산 서열 아미노산 서열과 같은 여러 종류의 데이터를 포함- 다양한 해상력에서의 유전체 구조- 다양한 단계에서의 유전체 기능- 유전자 기능에 따른 계층적 분류- DNA 칩 단백질 칩과 같은 실험 방법들로부터 얻은

새로운 종류의 발현 데이터들과 통합 발전

lt 표 2-4gt 라일리 (Monica Riley) 에 따른 대장균 (E coli)유전자들의 기능적인 분류

  • Slide 1
  • Slide 2
  • Slide 3
  • Slide 4
  • Slide 5
  • Slide 6
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Slide 12
  • Slide 13
  • Slide 14
  • Slide 15
  • Slide 16
  • Slide 17
  • Slide 18
  • Slide 19

lt 표 2-4gt 라일리 (Monica Riley) 에 따른 대장균 (E coli)유전자들의 기능적인 분류

  • Slide 1
  • Slide 2
  • Slide 3
  • Slide 4
  • Slide 5
  • Slide 6
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Slide 12
  • Slide 13
  • Slide 14
  • Slide 15
  • Slide 16
  • Slide 17
  • Slide 18
  • Slide 19