Post on 19-Feb-2019
Analisi della sequenza nucleotidica AP001519 (gene BH3701)
Davide CittaroValerio ReguzziMarco Stefani
Informazioni di base
Sequenza estratta dal batterio Bacillus halodurans
Codice di accesso sequenza proteica: Q9K6M7
Sequenza di 672 amminoacidi :MINEKLPKIW YGGDYNPEQW EKEVWDEDIR MFKLAGIDVA TLNVFSWALNQPDEETYDFT WLDEQIDRLY ENGIYTCLAT STAAHPAWMA KKYPDVLRVDYQGRKRAFGG RHNSCPNSPT YRKYAERMAD RLGERYKDHP GVLIWHVSNEYGGYCYCDNC AASFRKWLQQ KYGTLQNVNK AWNTRFWGHT FYDWDEIVPPNALSEEWEGD STNFQGISLD YRIFQSDSLL ECFKLERDAL KKHTPNLPVTTNLMGTYKEL DYFKWGKEMD VVSWDNYPAY DTPVSFTAMA HDLMRGLKSGQPFMLMEQTP SQQNWQPYNS LKRPGVMRLW SYQAVARGAD TVMFFQLRRSVGACEKYHGA VIEHVGHENT RVFRETAALG KELGNLSYAL LDARVQAKVAIVFDWENRWA TELSSGPSKA LDYVKEVHNY YAALFDENIP VDMIGVDEDLSKYEIVIAPV LYMVKSGYAD RVKEFVQNGG TFVTTFFSGI VNEHDLVTLGGYPGELRDLL GIWVEEIDAL PPEEKNQIVI TNDTGSLTGT YECRLLFDIIHSEGADVLAE YGSDFYAGTP VITRHAYGKG KAYYVGTCPD QAFLTDFMKTVCAEKEIAPL LNVPKGVEVT ERRKDGASYF FIMNHNASTV ELEIGEGTDLLTGKELTGAT SLEAYGVMIV KR
DB secondari: ricerca motivi
• Prosite indica all’estremità C-terminale un motivo per le fosfolipasi C specifiche per ilfosfatidilinositolo.
• Prosite rules: mostrano i siti di modificazione chimica post-traduzionale
• Solo per proteine eucariotiche
DB secondari: ricerca motivi
• Nessun altro motivo in Prosite, Prints e Blocks con un grado di similarità del 100%
DB primari: Sequenze simili
• BLAST in Swiss-Prot e TrEMBL
• Ricerca limitata a batteri e archea
• Parametri di default
DB primari: Sequenze simili
Db AC Description Score E-valuetr Q9K6M7 Beta-galactosidase [BH3701] [Bacillus halodurans] 1405 0.0tr Q9KI47 Beta-galactosidase [Planococcus sp. 'SOS Orange'] 1065 0.0tr Q45092 Beta-D-galactosidase [BGAA] [Bacillus circulans] 984 0.0tr Q9WYE6 Beta-D-galactosidase [TM0310] [Thermotoga maritima] 683 0.0sp P19668 BGAL_BACST Beta-galactosidase I (EC 3.2.1.23) (Lactase... 628 e-179tr Q45093 Beta-D-galactosidase [BGAB] [Bacillus circulans] 602 e-171tr Q8XP01 Beta-galactosidase [PBG] [Clostridium perfringens] 596 e-169tr Q59312 Beta-galactosidase (EC 3.2.1.23) (Lactase) [PBG] [Clos... 589 e-167tr Q8ZHN8 Puative beta-galactosidase (EC 3.2.1.23) [BGAB] [Yersi... 585 e-166
.
.
.
tn AAN47234 Beta-galactosidase I (EC 3.2.1.23) [LA0035] [Leptosp... 280 2e-74tr O31529 YESZ protein [YESZ] [Bacillus subtilis] 204 8e-52tr Q56306 Beta-galactosidase (lacZ) [Thermotoga maritima] 147 2e-34
.
.
.
DB primari: Sequenze simili
• La proteina P19668 è presente in Swiss-Prot• Origine: Geobacillus stearothermophilus• ß-galattosidasi• Appartiene alla famiglia 42 delle Glicosil-idrolasi,
a tutt’oggi l’unico elemento caratterizzato.• Sito attivo in cui gli amminoacidi E148 ed E303
sono responsabili della catalisi enzimatica.
NCBI Sequence Viewer
...
1: P19668. Beta-galactosidas...[gi:114936] BLink, Domains, Links
...
FEATURES Location/Qualifierssource 1..672
/organism="Geobacillus stearothermophilus"/db_xref="taxon:1422"
gene 1..672/gene="BGAB"
Protein 1..672/gene="BGAB"/product="Beta-galactosidase I"/EC_number="3.2.1.23"
Site 148/gene="BGAB"/site_type="active"/note="PROTON DONOR (POTENTIAL)."
Site 303/gene="BGAB"/site_type="active"/note="NUCLEOPHILE (POTENTIAL)."
Caratterizzazione
Caratterizzazione:Allineamento multiplo
• Clustal-W
• La proteina YESZ di Bacillus subtilis (AC: O31529) come limite inferiore di significatività
Caratterizzazione:allineamento multiplo
CLUSTAL W (1.74) multiple sequence alignment
tr|Q9K6M7 1 -----------MINEKLPKIWYGGDYNPEQWEKEVWDEDIRMFKLAGIDVATLNVFSWAL 49sp|P19668|BGAL_BACST 1 -------------MNVLSSICYGGDYNPEQWPEEIWYEDAKLMQKAGVNLVSLGIFSWSK 47tr|Q9F4C8 1 MAQRRAHRWPKPLSGRPDRIWYGGDYNPDQWPEDVWDEDIRLMRQAGVNLVSVGIFSWAR 60tn|AAN24973 1 -MERKEFKWPQPLAGNKPRIWYGGDYNPDQWPEEVWDEDVALMQQAGVNLVSVAIFSWAK 59tr|Q9X0S2 1 --------------------MLGVCYYPEHWGTEKVEEDFRRMKELGIEYVRIGEFAWSR 40tr|Q9X6C6 1 --------------------MLGVCYYPEHWPRERWSEDARRMRELGLAYVRVGEFAWAL 40tr|O31529 1 ----------------MRKLYHGACYYPELWDEETIQQDIDIMREVGVNVVRIGEFAWSV 44
* * *: * : :* :: *: . : *:*:...
tr|Q9K6M7 109 GRHNSCPNSPTYRKYAERMADRLGERYKDHPGVLIWHVSNEYG----GYCYCDNCAASFR 165sp|P19668|BGAL_BACST 107 SRQHYCPNHPQLITHIKRLVRAIAERYKNHPALKMWHVNNEYACH-VSKCFCENCAVAFR 166tr|Q9F4C8 120 ARQHWRPTSPVFREYALRLCRAMAEHYRDNPYVVAWHVSNEYGCH-NRFDYSEDAERAFR 179tn|AAN24973 119 ARQHWRATSPVFLDYALSLCRKMAEHYKDNPYVVSWHVSNEYGCH-NRFDYSEDAERAFQ 178tr|Q9X0S2 100 SRRHYCFSSPVYREEVKRIVTIIVKRYGKHPAVAGWQTDNEYGCHDTVRCYCPRCKKAFQ 160tr|Q9X6C6 100 GRRHYCFSSPVYHEETRRIVTLLGERYGKHPAVAGFQTDNEYGCHGTVRCYCERCQDAFR 160tr|O31529 104 SRQHACTNNPYFRKKAAIITTAIAKELGRLPGLIGWQLDNEFKCH-VAECMCETCLRLWH 163
.*:: . * : : :. * : :: .**: . . ::...tr|Q9K6M7 279 --------AY-DTPVSFT------AMAHDLMRGLKSGQPFMLMEQTPSQQN-WQPYNSLK 322sp|P19668|BGAL_BACST 275 -------PRE-GLPIQH-------AMMNDLMRSLRKGQPFILMEQVTSHVN-WRDINVPK 318tr|Q9F4C8 292 -------PG--EAHLDEL------AFSASLVDGISRKNPWFLMEHSTSAVN-WRPINYRK 335tn|AAN24973 290 -------PG--EAHFDEL------AYSASLCDGIARKNPWFLMEHSSSAVN-WRPINYRV 333tr|Q9X0S2 272 TLVFLRMKGETKNPFDRVGHPDIISFSHDLYRGVGRGR-FWVMEQQAGPVN-WAPYNLWP 329tr|Q9X6C6 271 TDLMP-LPEEEKLRYARTGHPDVAAFHHDLYRAVGRGR-FWVMEQQPGPVN-WAPHNPNP 327tr|O31529 270 --------QENASAFLLN---------CDLWRNLKQGRPFWILETSPSYAASLESSAYPH 312
.* : . : ::* .. ...
Caratterizzazione:allineamento multiplo
tr|Q9K6M7 609 PLLNVPKG--VEVTERRKDGASYFFIMNHNASTVELEIGEG---TDLLTGKELTG----A 659sp|P19668|BGAL_BACST 598 PILEVAEN--VEVQQRETDEWKYLIIINHNDYEVTLSLPEDKIYQNMIDGKCFRGG---E 652tr|Q9F4C8 622 VPEASDPG-LLRVERVDEASGARFVFLFNRTHAVIEAMQDG---RPVIASLADVGDG--K 675tn|AAN24973 620 TSAEDDRGEVLRVERADETGENHFVFLFNRTHDVAVVDVEG---EPLVASLAQVNESEHT 676tr|Q9X0S2 594 T-KRMPEG--VRIQRR----GEYVFSFNFTSEEVDLEIPTK---VQIVLG---------D 634tr|Q9X6C6 591 P-KPLPSG--LRLRWR----GHLVFAFNYGPEEVVLPVPSG---VRFRLG---------G 631tr|O31529 594 SRSDVTPG--TIVAPRIGENGLVWIVVNMDGKGGSVTLPESG--TDLLTHRLEKAG---R 646
. : . . .
tr|Q9K6M7 660 TSLEAYGVMIVKR------- 672sp|P19668|BGAL_BACST 653 LRIQGVDVAVLREHDEAGKV 672tr|Q9F4C8 676 VTVRPNGVIVLRK------- 688tn|AAN24973 677 AAIQPNGVLVVKL------- 689tr|Q9X0S2 635 QKIPPYGLLIWKENER---- 650tr|Q9X6C6 632 PRLSPYEVAVWEEG------ 645tr|O31529 645 LAVGPHEYRVIQFDNHS--- 663
: : .
Gli amminoacidi conservati sono presenti soprattutto nella regione N-terminale, mentre nella regione C-terminale si notano numerosi inserimenti per mantenere l’allineamento.
Caratterizzazione:allineamento multiplo
• Ulteriore analisi della regione C-terminale– Ricerca di omologhi in Swissprot con PSI-
BLAST riferita sia all’intera proteina che alla sola regione C-terminale.
– Per la regione C-terminale ricerca ristretta agli ultimi 200, 150 e 100 amminoacidi
• Probabilmente non ha alcun ruolo funzionale.
Caratterizzazione: conservazioniMINEKLPKIW YGGDYNPEQW EKEVWDEDIR MFKLAGIDVA TLNVFSWALNQPDEETYDFT WLDEQIDRLY ENGIYTCLAT STAAHPAWMA KKYPDVLRVDYQGRKRAFGG RHNSCPNSPT YRKYAERMAD RLGERYKDHP GVLIWHVSNEYGGYCYCDNC AASFRKWLQQ KYGTLQNVNK AWNTRFWGHT FYDWDEIVPPNALSEEWEGD STNFQGISLD YRIFQSDSLL ECFKLERDAL KKHTPNLPVTTNLMGTYKEL DYFKWGKEMD VVSWDNYPAY DTPVSFTAMA HDLMRGLKSGQPFMLMEQTP SQQNWQPYNS LKRPGVMRLW SYQAVARGAD TVMFFQLRRSVGACEKYHGA VIEHVGHENT RVFRETAALG KELGNLSYAL LDARVQAKVAIVFDWENRWA TELSSGPSKA LDYVKEVHNY YAALFDENIP VDMIGVDEDLSKYEIVIAPV LYMVKSGYAD RVKEFVQNGG TFVTTFFSGI VNEHDLVTLGGYPGELRDLL GIWVEEIDAL PPEEKNQIVI TNDTGSLTGT YECRLLFDIIHSEGADVLAE YGSDFYAGTP VITRHAYGKG KAYYVGTCPD QAFLTDFMKTVCAEKEIAPL LNVPKGVEVT ERRKDGASYF FIMNHNASTV ELEIGEGTDLLTGKELTGAT SLEAYGVMIV KR
In rosso sono identificati gli amminoacidi del sito attivo conservati. In grassetto gli acidi glutammici.
Struttura 3D
• Modellizzazione in 3D-PSSM.
• Modello proposto β-galattosidasi diThermus thermophilus (AC:1KWK)
• Modello proposto con E = 1.55e-14
• L’aggiunta della sequenza di 1KWK nel precedente allineamento multiplo mantiene le conservazioni trovate.
Struttura 3D: comparazione1KWK Modello per Q9K6M7
Struttura 3D: comparazione• La principale differenza strutturale è la
mancanza della 12a e della 13a α-elica in Q9K6M7, a cui si sostituisce un breve random coil
Q9K6M7 YP----------AYD-------TPVS
1KWK YPLGFTDLMPLPPEEKLRYARTGHPD
HHHHHHH HHHHHH
| | |
260 270 280
Caratterizzazione sito attivo
• In base all’allineamento multiplo è possibile individuare le corrispondenze degli amminoacidi responsabili della catalisi
E307E312E303
E150E141E148
Q9K6M71KWKP19668
Caratterizzazione sito attivo
• Gli aminoacidi E141 ed E312 sono orientati verso il legame β−1→4 del lattosio
• Sono stati evidenziati tutti gli aminoacidi che potenzialmente interagiscono con il substrato.
Caratterizzazione sito attivo
His 358His 363
Glu 355Glu 360
Phe 345Phe 350
Trp 315Trp 320
Asn 314Asn 319
Glu 307Glu 312
Tyr 277Tyr 266
Asp 275Asp 264
Asn 252Asn 241
Glu 150Glu 141
Asn 149Asn 140
Arg 111Arg 102
Phe 45Phe 36
Q9K6M71KWK
Struttura 3D: ricerca conservazioni
• Delimitate regioni a diversa conservazione
0
2
4
6
8
10
12
14
50 100 150 200 250 300 350 400 450 500 550 600 650
posizione
aa
C
S
P
indice
Indice= (0.5C+0.3S+0.2P)/3
Struttura 3D: regioni conservate
• La proteina è stata divisa in 4 sezioni in base alla conservazione:– [1, 250] [301, 500] alta conservazione– [251, 300] [501, 644] scarsa conservazione
• La regione maggiormente conservata circonda il β-barrel intorno al sito attivo.
• Tale motivo strutturale è parecchio conservato nelle glicosil-idrosilasi ed è omologo al TIM-barrel dell’enzima triosofosfato-isomerasi
Henrissat B et al.Conserved catalytic machinery and the prediction of a common fold for several families of glycosyl hydrolases. Proc. Natl. Acad. Sci. USA, 92:7090-7094
Comparazione conservazioniβ-galattosidasi (1KWK)
Triosofosfato isomerasi (8TIM)
Sito di legame cofattore metallico
• Esiste un sito di legame per uno ione Zn2+
• Tale sito, prevalentemente composto da residui di cisteina, sembra essere poco conservato nell’allineamento multiplo
tr|Q9K6M7 110 GRHNSCPNSPTYRKYAERMADRLGERYKDHPGVLIWHVSNEYG----GYCYCDNCAASFR 165sp|P19668|BGAL_BACST 108 SRQHYCPNHPQLITHIKRLVRAIAERYKNHPALKMWHVNNEYACH-VSKCFCENCAVAFR 166tr|Q9F4C8 121 ARQHWRPTSPVFREYALRLCRAMAEHYRDNPYVVAWHVSNEYGCH-NRFDYSEDAERAFR 179tn|AAN24973 120 ARQHWRATSPVFLDYALSLCRKMAEHYKDNPYVVSWHVSNEYGCH-NRFDYSEDAERAFQ 178tr|Q9X0S2 101 SRRHYCFSSPVYREEVKRIVTIIVKRYGKHPAVAGWQTDNEYGCHDTVRCYCPRCKKAFQ 160tr|Q9X6C6 101 GRRHYCFSSPVYHEETRRIVTLLGERYGKHPAVAGFQTDNEYGCHGTVRCYCERCQDAFR 160tr|O31529 105 SRQHACTNNPYFRKKAAIITTAIAKELGRLPGLIGWQLDNEFKCH-VAECMCETCLRLWH 1631KWK 101 GRRHYCFSSPVYREEARRIVTLLAERYGGLEAVAGFQTDNEYGCHDTVRCYCPRCQEAFR 160
.*:: . * : : :. : :: .**: . . ::
Sito di legame cofattore metallico
Sito di legame cofattore metallico
• Il sito di legame di Zn2+ ha il 79% di similarità con un dominio di legame ai metalli pesanti
[LIVNS]-x(2)-[LIVMFA]-x-C-x-[STAGCDNH]-C-x(3)-[LIVFG]-x(3)-[LIV]-(9,11)-[IVA]-x-[LVFYS]
Prosite accession number: PS01047
O-glicosil-idrolasi
• Gruppo di enzimi assai vasto (circa 90 famiglie)• Enzimi praticamente ubiquitari• Partecipano a svariati processi vitali per gli
organismi– Idrolisi di polisaccaridi di struttura o di riserva– Difesa contro patogeni– Ricambio di carboidrati sulla superficie
cellulare– …
O-glicosil-idrolasi: famiglieFamiglie compreseFoldClan
8 48(α/α)6GH-M
15 65(α/α)6GH-L
18 20(β/α)8GH-K
32 68-GH-J
24 46 80α+βGH-I
13 70 77(β/α)8GH-H
37 63-GH-G
43 62-GH-F
33 34 83β-propellerGH-E
27 36(β/α)8GH-D
11 12β-jelly rollGH-C
7 16β-jelly rollGH-B
1 2 5 10 17 26 30 35 39 42 51 53 59 72 79 86(β/α)8GH-A
Descrizione attività catalitica
• Elevata specificità di substrato• Rottura del legame per catalisi
acida.• Donatore di protoni e
nucleofilo• Due meccanismi di azione
– Mantenimento della configurazione anomerica
– Inversione della configurazione anomerica
Tipologie di sito attivo
Cratere
Tunnel
Fenditura
Davies G, Henrissat B. Structures and mechanisms of glycosyl hydrolases. Structure 1995, 3:583-859
β-galattosidasi• Idrolisi del residuo terminale, non riducente
di β-D-galattosiolattosio
β-D-galattosio glucosio
Sito attivo 1KWK
• La struttura del sito attivo è del tipo a “cratere”, tipica per il riconoscimento dell’estremità non riducente di un polisaccaride
• La distanza tra i residui E141 ed E312 è di circa 5.5 Å, indicando che l’idrolisi del lattosio mantiene la conformazione anomerica β del galattosio
β-galattosidasi