L / / 6 THÈSE PRÉSENTÉE DU GRADE DE MAÎTRE ES SCIENCES … · POUR L'OBTENTION DU GRADE DE...
Transcript of L / / 6 THÈSE PRÉSENTÉE DU GRADE DE MAÎTRE ES SCIENCES … · POUR L'OBTENTION DU GRADE DE...
FACULTÉ DE MÉDECINE
L
L / / 6THÈSE
PRÉSENTÉE
A L'ÉCOLE DES GRADUÉS
DE L'UNIVERSITÉ LAVAL
POUR L'OBTENTION
DU GRADE DE MAÎTRE ES SCIENCES (M.SC.)
PAR
DIANE LABBÉ
BACHELIÈRE ES SCIENCES
DE L'UNIVERSITÉ LAVAL
CARACTÉRISATION DE SÉQUENCES SIMPLES,
FAIBLEMENT RÉPÉTÉES CHEZ LE POULET
ET D'AUTRES ESPÈCES
JUIN 1985
AVANT-PROPOS
Je voudrais remercier mon directeur de thèse, le Dr. Adolfo
Ruiz-Carrillo pour m'avoir guidée tout au long de ce projet. Sa grande
disponibilité, ses conseils judicieux issus de sa vaste expérience en ont
fait un conseiller précieux.
Je tiens aussi à souligner la contribution de Jean Renaud,
notre assistant de recherche dans le laboratoire, d'une part pour la partie
du travail qu'il a effectuée et ses conseils techniques, ainsi que pour sa
bonne humeur communicative qui a agrémenté mes longues heures d'expéri
mentation .
Un merci également à Mamdouh Mikhail de 1 ' Institut de
Recherches Cliniques de Montréal et au Dr. Paul H. Roy du département de
biochimie de l'Université Laval pour la patience et la disponibilité qu'ils
ont démontré 1 ors de mon apprentissage de l'utilisation des programmes
d'ordinateur pour 1‘analyse des séquences.
Je tiens aussi à remercier Francine Samson qui a fait preuve
de beaucoup de patience et de minutie pour la dactylographie de cette
thèse.
Finalement, je remercie le Conseil de Recherches Médicales du
Canada de m'avoir soutenue financièrement pendant ces deux années.
RESUME
Le présent travail porte sur la caractérisation de séquences
simples, composées des tri nucléotides (GGC). Elles ont d'abord été identi
fiées dans le génome de poulet avec une sonde d'ADN complémentaire cloné de
1'histone H5 de poulet lors du criblage d'une librairie d'ADN génomique.
Plusieurs clones donnant un signal indiquant une homologie partielle avec
cette sonde ont été étudiés. Par la séquence de deux d'entre eux, il a été
établi que de courtes séquences contenant des répétitions consécutives d'un
petit nombre de (GGC) (5 ou 6) en étaient responsables.
L'organisation de ces séquences simples dans le génome a été
étudiée par des hybridations sur de 1'ADN génomique. Il s'avère que ce
type de séquences simples forment une famille de séquences faiblement répé
tées chez le poulet (cent cinquante fois) et également chez toutes les autres
espèces eucaryotiques étudiées à savoir le saumon, le canard, le pigeon, la
souris et l'humain.
Un polymorphisme dans le nombre de (GGC) consécutifs a été
rencontré dans le gêne de 11 histone H5 de poulet par rapport à 1 ‘ADN
complémentaire cloné utilisé comme sonde. Ce polymorphisme ainsi que la
génération proprement dite de ces séquences pourraient être expliqués par
un mécanisme de glissement et de mauvais appariements des répétitions
("slipped mispairing"), lors de la réplication de 1'ADN.
Une étude de la transcription de ce type de séquences a été
réalisée chez l'embryon de six jours et les globules rouges immatures de
poulet. Dans ces cas, ces séquences simples seraient surtout présentes
dans les ARN nucléaires.
Finalement, une recherche par ordinateur dans des banques de
séquences d'ADN a permis l'identification de plusieurs gènes porteurs de
(GGC) , pouvant suggérer une variété de rôles biologiques pour ces séquences.
Dr. Adolfo Ruiz-Carrillo Diane Labbé
TABLE DES MATIÈRES
Page
AVANT-PROPOS .................................................................................................................. i
RÉSUMÉ ............................................................................................................................... ü
TABLE DES MATIÈRES..................................................................................................... i i i
LISTE DES SYMBOLES ET ABRÉVIATIONS.................................................................. vi
LISTE DES TABLEAUX..................................................................................................... vi i i
LISTE DES FIGURES......................................................................................................... ix
CHAPITRE 1 INTRODUCTION GÉNÉRALE................................................................... 1
1.1 Les séquences répétées dans le génome d'eucaryote. . 3
1.1.1 Séquences fortement répétées : ADN satellites. . 31.1.2 Séquences modérément et faiblement répétées,
dispersées dans le génome.......................................... 3
1.1.2.1 Séquences courtes (de type "SINES"). ... 4- Séquences simples ...................................... 4- Famille de séquences Alu.................................. 5- Autres familles ................................................ 6
1.1.2.2 Séquences longues (de type "LINES"). ... 6
1.1.3 Séquences répétées dans le génome de poulet-, . . 7
1.1.4 Rôles proposés ...................................................................... 8
CHAPITRE 2 IDENTIFICATION DE SÉQUENCES SIMPLES CHEZ DESCLONES GÉNOMIQUES AYANT UNE HOMOLOGIE PARTIELLEAVEC UN ADN COMPLÉMENTAIRE CLONÉ DE L'HISTONE H5 . . 11
2.1 Introduction................................................................................... 12
2.2 Matériel et méthodes.................................................................. 13
2.2.1 Matériel............................................................................ 132.2.2 Méthodes............................................................................ 13
- Di gestion de 1'ADN avec des enzymesde restriction............................................. 13
- Séparation de 11 ADN par électrophorèseet préparation de fragments.................. 13
- Transfert de 1 1 ADN..................................... 14- Marquage de 1 'ADN..................................... 14- Hybridation ......................................................... 15
Page
iv
- Criblage de la librairie d'ADNgénomique.............................................................. 15
- Cartographie......................................................... 16- Sous-clonage......................................................... 16- Séquence.................................................................. 17- Analyse de séquence par ordinateur. . . 18
2.3. Résultats............................................................................................ 20
2.3.1 Criblage de la librairie d'ADN génomique depoulet avec 1'ADN complémentaire cloné de H5 . . 20
2.3.2 Cartographie des clones génomiques xCHVIIet XCHIX................................................................................... 21
2.3.3 Détermination des régions d'homologie des clonesXCHVII et xCHIX avec le p541........................................ 21
2.3.4 Séquence des régions d'homologie ................................ 242.3.5 Identification de (GGC)n dans d'autres clones
génomiques............................................................................... 282.3.6 Analyse de séquence.............................................................. 32
2.4 Discussion....................................................................................... 33
CHAPITRE 3 ORGANISATION DES SÉQUENCES SIMPLES DE (GGC)n CHEZLE POULET ET D'AUTRES ORGANISMES ........................................ 35
3.1 Introduction................................................................................... 36
3.2 Matériel et méthodes.................................................................. 39
3.3.1 Matériel................................................................................... 393.3.2 Méthodes................................................................................... 39
- Courbe de fusion................................................ 39- Isolement de 11 ADN génomique...................... 40- Digestion et hybridation d'ADN
génomique............................................................. 41- "Dots" pour les ADN génomiques .... 41- Recherche de séquences (GGC)n dans
la littérature..................................................... 43- Calculs statistiques........................................ 43
3.3 Résultats............................................................................................ 44
3.3.1 Calcul de la probabilité de retrouver au hasard des séquences simples de (GGC)n dans le génomede poulet................................................................................... 44
3.3.2 Détermination du Tm de l'hybride de 20 pb forméentre le pCHIX0.6H/S et le p541................................... 44
3.3.3 Organisation et réitération des séquences de(GGC)n dans différents génomes .................................... 47
Page
3.3.4 Quantification des séquences de (GGC)n dansdifférents génomes .............................................................. 51
3.3.5 Identification de gènes ayant des séquencesde (GGC)n................................................................................... 55
3.4 Discussion....................................................................................... 58
CHAPITRE 4 TRANSCRIPTION DES SÉQUENCES SIMPLES DE (GGC)n• ... 64
4.1 Introduction................................................................................... 65
4.2 Matériel et méthodes.................................................................. 67
4.2.1 Matériel................................................................................... 674.2.2 Méthodes.................................................................................... 67
- Isolement d1 ARN total...................................... 67- Electrophorèse et transfert d1 ARN ... 68- Marquage de 1 1 ARN .................. .... . 69- Hybridation des transferts d'ADN
et d'ARN.................................................................. 70
4.3 Résultats. . .................................................. 71
4.3.1 Transcription dans les embryons de pouletsde 6 jours............................................................................... 71
4.3.2 Transcription dans les érythrocytes immaturesde poulet.................................................................................... 74
4.4 Discussion........................................................................................ 78
CHAPITRE 5 DISCUSSION GÉNÉRALE........................................................................ 80
LISTE DES RÉFÉRENCES.................................................................................................... 85
LISTE DES SYMBOLES ET ABRÉVIATIONS
BSA
DTT
2-ME
SDS
DABA
PEG
NP-40
LB
EDTA
EGTA
Tri s
ampr
tets
D
TE
albumine de sérum de boeuf
dithiothréitol
2-mercaptoëthanol
sodium dodécyle sulfate
acide diaminobenzoïque dihydrochlorure
polyéthylène glycol
Noni det P-40
milieu de Luria-Bertani (par litre : 10 g bacto-tryptone, 5 g d'extrait bacto-1evure, 10 g NaCl, pH 7.5)
éthylène diamine tëtraacëtate
1,2-di(2-aminoëthoxy)ëthane-N,N,N',N'tëtra acide acétique
trishydroxymëthylaminomëthane
résistance à l'ampicilline
sensibilité à la tétracycline
solution de Denhardt (IX D = 0.02% BSA - 0.02% Fi col 1 400 -
0.02% polyvinyl pyrrolidone)
tampon 10 mM Tris-HCl pH 7.5 - 0.1 mM EDTA
TBE :
TA
SSCPE :
SSC :
(p/v) :
(v/v) :
"I'm
pb :
kb :
d .1 . :
U :
vol . :
temp. :
tampon 89 mM Tris-HCl pH 8.3 - 89 mM acide borique - 2 mM NagEDTA
tampon 40 mM Tris-HCl pH 7.8 - 20 mM CHgCOONa - 2 mM NagEDTA
solution sodium-citrate-phosphate-EDTA (IX SSCPE = 0.12 M NaCl - 0.015 M citrate de sodium - 1 mM NagEDTA - 0.013 M NagHPOz;., pH 7.4)
solution sodium-citrate(IX SSC = 0.15 M NaCl - 0.015 M citrate de sodium, pH 7.4)
(poids/volume)
(volume/volume)
température de fusion (température où 50% des hybrides sont dissociés)
paire de bases
ki1obase
diamètre interne
Unité enzymatique
volume
température
LISTE DES TABLEAUX
Page
TABLEAU 1 Calcul de la probatilité de retrouver au hasard des séquences simples de (GGC)n dans le génome de poulet............................................................................................ 45
TABLEAU 2 Nombre de copies des séquences de (GGC)n dansdifférents organismes.................................................................. 54
LISTE DES FIGURES
Page
FIGURE 1 Cartes de restriction des insertions des clonesgénomiques xCHVII et xCHIX ................................................... 22
FIGURE 2 Détermination de la région d'homologie des clonesgénomiques a CH VII et xCHIX avec le p541........................... 23
FIGURE 3 Cartes de restriction des sous-clones pCHVIII.8H/Bet pCHIX0.6H/S............................................................................... 25
FIGURE 4 Séquence de 11 insertion de pCHIX0.6H/S............................ 26
FIGURE 5 Séquence de la région de 247 pb de pCHVII1.8H/Bcontenant 11 homologie avec le p541............................... - . 27
FIGURE 6 Détermination de la région d'homologie de xCHVIIavec le pCHIX0.6H/S....................................................................... 29
FIGURE 7 Caractérisation de clones génomiques porteurs deséquences simples de (GGC)n.......................................... 30
FIGURE 8 Courbe de fusion de 1'ADN complémentaire cloné deH5 (p541) avec 1 ‘insertion de pCHIX0.6H/S...................... 46
FIGURE 9 Organisation de l'insertion de pCHIX0.6H/S dans legénome de poulet........................................................................... 48
FIGURE 10 Organisation des séquences simples de (GGC)n dansdifférents génomes ...................................................................... 50
FIGURE 11 Quantification des séquences (GGC)n dans différentsgénomes par hybridation de "dots".......................................... 52
FIGURE 12 Séquences de (GGC)n dans des gènes et desADN clonés.................................................... 56
FIGURE 13 Modèle pour la génération de délétions à partir d'un mécanisme de glissement et de mauvais appariement lors de la réplication de 11 ADN............................................ 62
FIGURE 14 Transcription dans les embryons de poulets de6 jours................................................................................................. 73
FIGURE 15 Transcription dans les érythrocytes immaturesde poulet............................................................................................ 75
FIGURE 16 Hybridation d'un transfert d'ARN d'embryons de 6 jours et d'érythrocytes immatures de poulets avec pCHVI II. 8H/B........................................................................... 76
CHAPITRE 1
INTRODUCTION GÉNÉRALE
2
De façon générale, la taille du génome des organismes, ou la
quantité d'ADN par cellule, augmente avec la complexité de l'échelle évolu
tive. Ainsi, une cellule de mammifère contient-elle plusieurs milliers de
fois plus d'ADN qu'une bactérie. Chez les organismes supérieurs, une très
grande partie de 1'ADN ne code pour aucune protéine ni n'est transcrit en
ARN. Par exemple, chez l'humain, le nombre estimé de gênes, approxima
tivement de 50 000 à 100 000, apparaît trop faible pour rendre compte des
3 x 1q9 pb (cellule haploïde) existant dans son génome. De plus, une grande
partie de 11 ADN du génome des organismes supérieurs apparaît comme une
mosaïque de fragments répétés, quasi identiques à eux-mêmes, jusqu'à des
centaines de milliers de fois. Pourquoi tout cet ADN non codant? Pourquoi
tant de répétitions?
Britten et Kohne (1965, 1968) ont été les premiers à démontrer
1'existence des séquences répétées chez les organismes supérieurs. C'est à
la suite d'expériences portant sur la renaturation de 1'ADN qu'ils furent
menés à cette découverte. Ils constatèrent, contrairement à leurs atten
tes, que les brins dissociés rencontraient leurs partenaires plus rapide
ment dans 1'ADN de vertébré que dans 1'ADN bactérien. Pour expliquer ce
paradoxe, une seule explication semblait plausible. L'hypothèse de 1'exis
tence de séquences répétées fur alors proposée. L'ADN répétitif représente
de 20 à 80% de tout 1'ADN génomique selon 1'espèce considérée.
Grâce aux résultats obtenus suite à 1'utilisation des techni
ques de 1'ADN recombinant en génétique moléculaire, 1'organisation des
séquences d'ADN répétées dans le génome d'eucaryote est aujourd'hui un peu
mieux connue. Aux pages suivantes, un résumé de l'état des connaissances
est proposé.
1.1 Les séquences répétées dans le génome d'eucaryote
On peut classer les séquences répétées d'après leur fréquence
de réitération dans le génome : fortement (1 x 106 et plus), modérément
(— 103 - 105) et faiblement répétées (Britten et Khone, 1968; Jelinek,
1982). Alors que les séquences fortement répétées consistent surtout en
groupements ("clusters") de répétitions, les séquences modérément et fai
blement répétées sont généralement dispersées dans le génome.
1.1.1 Séquences fortement répétées : ADN satellites
Les ADN satellites sont généralement composés de répétitions
en tandem soit de quelques paires de bases (séquences simples) ou soit d'u
nités formées de sous-répétitions constituant des domaines. Lorsque ces
répétitions s'étalent sur de longues distances, cela en fait des séquences
hautement répétées. Elles peuvent l'être un million de fois et plus dans
le génome. On peut alors généralement les récupérer du reste de 11 ADN d'a
près leur séparation caractéristique dans un gradient de densité à l'équi
libre, d'où leur nom de satellites. Ces ADN satellites qui peuvent être
retrouvés à différents endroits dans le génome sont présents chez les plan
tes, les vertébrés et les invertébrés mais ils sont absents chez la levu
re. Quelques-unes de leurs caractéristiques sont 1'association avec l'hë-
térochromatine et la réplication tardive dans la phase S du cycle cellulai
re. Pour expliquer 1'amplification ou la délétion de ces séquences, des
mécanismes de crossing-over inégaux ont été proposés (Smith, 1976).
1.1.2 Séquences modérément et faiblement répétées, dispersées dans le génome
Du point de vue de 1'organisation générale des séquences répé
tées dispersées dans le génome, les études de réassociation de 1‘ADN ont
indiqué qu'il existe surtout deux types contrastants: Xenopus et Droso
phila. Alors que le type Xenopus est caractérisé par un patron de disper
sion des séquences répétées au travers de courtes séquences uniques, le mo
de Drosophila se rencontre dans les génomes où les répétitions se situent
entre de longs segments d'ADN.
Chez Xenopus, la majorité des séquences uniques de 1 à 2 kb de
longueur sont entremêlées de séquences répétées de 0.2 - 0.4 kb. Toute
fois, il y a en minorité des séquences uniques plus longues, de 4 kb ou
plus, entrecoupées de courts éléments répétés et des séquences réitérées de
plus de 1 kb qui n'apparaissent que dans moins de 10% de 1'ADN génomique
(Davidson et al., 1975).
Le génome de Drosophila, au contraire, ne contient pas en
quantité appréciable de courtes séquences répétées alternant avec des sé
quences uniques mais on retrouve plutôt des séquences répétées d'au moins
5.6 kb au travers de séquences uniques de plus de 13 kb (Manning et al.,
1975).
L'arrangement de type Xenopus est retrouvé dans la majorité
des groupes taxonomiques des animaux et des plantes, à la fois chez les
vertébrés et les invertébrés alors que le type Drosophi1 a semble beaucoup
moins répandu.
1.1.2.1 Séquences courtes (de type "SINES")
- Séquences simples
Des séquences simples peuvent être retrouvées dispersées dans
le génome. Le nombre de répétitions en tandem de l'unité de base peut
varier de quelques fois à quelques centaines de fois. Elles se différen
cient alors des ADN satellites. En outre, un même type de séquences sim
ples (c'est-à-dire des séquences composées-de la même unité) peut exister
en plusieurs exemplaires dans le génome. Plusieurs exemples ont été cités
dans la littérature. Il ne sera fait mention ici que de quelques-uns afin
d'illustrer le propos.
Dans la famille multigénique des gènes d'hi stones chez 1'our
sin de mer (S. purpuratus), Sures et collaborateurs (1978) ont trouvé la
séquence (CT/GA)27 dans un "spacer" entre les gènes H2A et Kl.
5
Chez la souris, Nishioka et Leder (1980) ont retrouvé la
séquence (CA)3] dans deux gênes d'immunoglobulines de cellules embryon
naires et de plasmacytomes. Un fragment génique contenant cette séquence a
donné un fort bruit de fond lors de 1'hybridation de transferts d'ADN géno
mique.
Chez l'humain, des séquences simples de (TG)n ont été trouvées
dans des gènes de globi nés foetales (Slightom et al., 1980) ainsi que dans
le gène de 1'actine du muscle cardiaque (Hamada et Kakunaga, 1982). Il y au
rait environ cent mille copies de ce type de séquences dans le génome humain.
- Famille de séquences Alu
Parmi les séquences courtes, modérément répétées et dispersées
dans le génome, les séquences Alu sont sans aucun doute les mieux caracté
risées. Elles ont d'abord été observées par Houck et al. (1979) chez 1'hu
main, qui a un patron de dispersion des séquences répétées dans le génome
du type Xenopus. La famille Alu de l'humain est composée de dimères de 165
et 135 pb qui sont mis en évidence lorsqu'on coupe avec 11 enzyme de res
triction Alu1. Chaque monomère se termine par une séquence de poly (dA) et
contient une séquence semblable à 1'origine de réplication du papovavirus
(Jelinek et al., 1980). De courtes répétitions directes de 9 à 20 pb bor
dent la séquence de 300 pb.
Les séquences Alu sont présentes environ 500 000 fois dans le
génome humain (Houck et al., 1979; Rinehart et al., 1981). Lorsqu'on crible
une librairie d'ADN génomique avec une sonde Alu, environ 95% des phages
hybrident (Tashima et al., 1981), ce qui signifie que les séquences Alu sont
effectivement dispersées parmi les séquences uniques. Elles sont conservées
chez d'autres espèces c'est-à-dire que l'on a pu dériver une séquence consen
sus. On a retrouvé d'autres membres de cette famille entre autres chez les
primates et les rongeurs.
Les séquences Alu sont retrouvées environ dix fois plus dans les
produits de transcription au niveau nucléaire que cytoplasmique (revue de
M. F. Singer, 1982). On retrouve de petits ARNs, c'est le cas du 4.5S
chez la souris et le hamster (Jelinek, 1978b), qui ont de 1'homologie
partielle avec les séquences Alu. On retrouve également chez la souris
des ARN messagers qui contiennent des séquences de type Alu (Georgiev et
al., 1982).
- Autres familles
Beaucoup d'autres types de séquences courtes répétées, se
distinguant de la séquence consensus de la famille Alu, commencent à être
caractérisés. Qu'il suffise de mentionner qu'il existe chez l'humain la
famille Hinf composée d'une unité de 319 pb bordée de répétitions directes
de 1.36 pb et de répétitions inversées de 2 pb. Il existerait un faible
nombre de copies, soit de cinquante à cent par génome haploïde (Shimizu,
1983). Chez la souris, il existe environ cent mille copies de séquences
de type R faite d'une unité de 475 pb. Certaines d'entre elles ont été
identifiées dans le voisinage des gênes d'immunoglobulines (Gebhard et
al., 1982).
1.1.2.2 Séquences longues (de type "LINES")
Il y a des séquences longues et répétées qui ont des proprié
tés analogues aux éléments transposables bactériens. On retrouve ainsi les
éléments Copia chez Drosophila et Ty chez la levure qui ont de 5 à 7 kb de
longueur. Ils sont bordés par des répétitions directes longues de 300 à
600 pb et par des plus courtes, de quelques paires de bases (Levis et al.,
1980; Dunsmuir et al., 1980).
Les familles Kpnl chez les primates et EcoRI chez la souris
regroupent des séquences répétées longues. Les éléments de la famille
Kpnl affichent un polymorphisme de longueur et ont été observés près des
gênes. Quelques-uns d'entre eux sont transcrits (Lerman et al., 1983).
Finalement, un élément d'une famille inconnue de séquences
répétées ayant environ 6.4 kb et réitéré de 3 000 à 5 000 fois dans le
génome humain a été repéré à 3 kb en aval de l'extrémité 3' du gêne de
g-globine humaine (Adams et al., 1980).
7
1.1.3 Séquences répétées dans le génome de poulet
Le génome de poulet contient seulement 10% de séquences
répétées dispersées et 3% d'ADN satellites (Ologsson et Bernardi, 1983a).
Seulement quelques génomes étudiés jusqu'à présent n'ont que si peu de
séquences répétées: Drosophila, Chironomus ainsi que 1'abeille A. mellifera
en sont des exemples (Manning et al., 1975; Wells et al., 1976; Crain
et al., 1976).
Les travaux du groupe de F. Eden (1978a, b) ont finalement
fait la lumière sur des interprétations contradictoires qui avaient été
présentées pour 1'organisation générale des séquences dans le génome de
poulet. De Jimenez et al. (1974) avaient d'abord proposé un mode de dis
persion à courte périodicité. Par la suite, Arthur et Straus (1978) ont
estimé la longueur des éléments répétés à 3.4 kb et ont opté pour une orga
nisation se rapprochant de celle de Drosophila. . Les résultats des études
de réassociation de 1'ADN du groupe de F. Eden démontrèrent qu'environ 40%
du génome consiste en séquences modérément répétées d'au moins 2 kb de lon
gueur au travers de séquences uniques d'environ 4.5 kb. L'autre moitié du
génome comprend des segments d'au moins 17.5 kb qui ne sont interrompus par
aucune séquence répétée. Le génome de poulet contient donc des éléments
caractéristiques de chacun des types extrêmes d'organisation décrits précé
demment à savoir Xenopus et Drosophila. Ces résultats ont d'ailleurs fina
lement été confirmés par Arthur et Straus (1983).
Le clonage d'une fraction d'ADN génomique enrichie en séquen
ces modérément répétées (Eden, 1980) a permis de retrouver dans un clone
deux séquences répétées de longueur et de fréquence de réitération complè
tement différentes. Ainsi, l'une a 1.75 kb alors que l'autre a 2.3 kb de
longueur. Le fait que des séquences répétées soient voisines démontre
qu'en plus d'un mode de dispersion des séquences répétées parmi les séquen
ces uniques, il peut y avoir dispersion au travers de d'autres séquences
répétées ayant des caractéristiques structurales différentes.
8
Plusieurs types de séquences simples répétées ont été retrou
vés au voisinage ou dans les gênes codant pour des protéines de l'oeuf chez
le poulet: ovotransferrine, ovalbumine-X (Maroteaux et al., 1983).
D'autre part, Dybvig et collaborateurs (1983) ont rapporté la séquence
simple (AGAGG)g2 qui est répétée 2 000 fois dans le génome.
De courtes séquences répétées ayant un certain degré d'homolo
gie avec les séquences Alu ont été rapportées et sont appelées CRI (Stumph
et al., 1981). Des représentants de la famille CRI ont été retrouvés dans
le voisinage d'un gêne codant pour 1'ARN Ul et dans celui du gêne de l'o
valbumine. Ces séquences sont formées de 180 pb et le nombre de copies a
été estimé à environ 7 000 (Stumph et al., 1981 ; Olofsson et Bernard!, 1983b),
ce qui correspond à 0.1% du génome. L‘homologie avec la séquence consensus
de la famille Alu des mammifères est de 70% dans certaines régions. Cela
indique qu'au moins quelques portions de séquences existaient avant la
séparation entre les espèces aviaires et de mammifères. Ce niveau d'homo
logie est celui que l'on doit espérer en se basant du point de vue évolutif
(Stumph et al., 1981).
1.1.4 Rôles proposés
Pour les ADN satellites, on pense entre autres qu'ils pour
raient être des composants structuraux des chromosomes, étant donné qu'ils
résident principalement dans leurs portions centromériques et télomériques
(Mattoccia et Comings, 1971).
Plusieurs hypothèses d'un rôle général des séquences répétées
dispersées ont été formulées pour expliquer leur accumulation et leur per
sistance dans le génome d'eucaryote. Ainsi, Britten et Davidson (1969) ont
proposé que les séquences répétées puissent agir comme éléments régulateurs
de l'expression des gênes étant donné leur dispersion à travers le génome.
La quantité d'ADN supplémentaire des organismes supérieurs, par rapport par
exemple aux uni cellulaires, comblerait le besoin d'une régulation spéci
fique. Ils suggèrent également un rôle évolutif aux séquences répétées
comme réservoir de séquences pour créer de nouveaux gênes (Britten et
Davidson, 1971) et un rôle dans la régulation de la maturation spécifique
des ARN précurseurs (Davidson et Britten, 1979).
Les hypothèses d'Orgel et Crick (1980) ainsi que de Doolittle
et Sapienza (1980) proviennent quant à elles d'un point de vue opposé. De
façon globale, ils incluent, outre les séquences répétées, les introns et
les "spacers" dans un modèle d'ADN inutile ("égoïste"). Ils proposent que
la réplication de 1'ADN puisse permettre l'accumulation dans le génome de
séquences qui n'apportent aucune contribution à l'expression du phénotype
mais dont la présence favorise conséquemment 1'accumulation de séquences du
même type. Ces séquences pourraient ou non, être transcrites. Cependant,
en se basant sur les coûts énergétiques, 1‘ADN inutile s1 accumulerait
davantage dans les régions non transcrites du génome que dans celles qui le
sont.
Le modèle de régulation de 1'expression des gênes par les
séquences répétées était basé à 1'époque sur un mode d'organisation des
séquences de type Xenopus. On sait maintenant que ce type d'arrangement
n'est pas unique. Ce modèle dans sa conception originale semble donc être
maintenant devenu inadéquat. Quant à celui de 1'ADN inutile, il apparaît
lui aussi contestable au fur et à mesure que des rôles sont suggérés pour
des séquences qui, à priori ne semblaient apporter aucune contribution à
1'expression du phénotype. D'ailleurs, l'étude des séquences répétées
connaît maintenant un regain d'intérêt justifié par ces indications.
Récemment, Hess et collaborateurs (1983) ont suggéré d'après
leurs résultats que des séquences Alu présentes dans des gênes de type
g - globi ne chez l'humain puissent affecter le processus de conversion de
ces gènes. Plusieurs autres rôles ont été suggérés pour les séquences de
type Alu (revu par Jelinek, 1982; Bouchard, 1982) à savoir la régulation de
la transcription par de petits ARN: nucléaires qui ont des séquences homo
logues à la séquence consensus Alu et un rôle dans la réplication de l'ADN
en tant qu'origines de réplication. D'autre part, selon une hypothèse
intéressante de Jagadeeswaran et collaborateurs (1981), les séquences Alu
pourraient s'insérer au travers des séquences du génome par un mécanisme de
rétro transcription, à la manière des éléments transposables. On sait déjà
que, du fait de leur mobilité, les éléments transposables sont susceptibles
de générer des mutations à leur site d'insertion, pouvant provoquer soit
une perte, soit une augmentation d'activité des gênes adjacents.
10
Dans la littérature, il a été fait mention de plusieurs rôles
possibles pour les séquences simples. Ainsi, dans certains cas, elles
seraient impliquées dans des événements de recombinaison (Sures et al.,
1978; Slightom et al., 1980). Certaines séquences semblent modifier loca
lement la structure de 1'ADN d'après les résultats obtenus avec la nuclëase
SI (Hentschel. 1982; Glikin et al., 1983; Dybvig et al., 1983). Des séquences
simples de (TG)n peuvent, d'après des études réalisées in vitro, adopter
une conformation Z dans 1'ADN (Wang et al., 1979; Haniford et Pulleyblank,
1983), nettement différente de la conformation B qui est la plus répandue.
Il ne fait donc aucun doute, compte tenu de l'état des connais
sances actuelles, que l'étude des séquences répétées soit d'un intérêt
certain. C'est d'ailleurs ce qui nous a motivés à réaliser le travail
présenté dans le cadre de cette thèse.
CHAPITRE 2
IDENTIFICATION DE SÉQUENCES SIMPLES CHEZ DES CLONES GÉNOMIQUES
AYANT UNE HOMOLOGIE PARTIELLE AVEC UN ADN COMPLÉMENTAIRE CLONÉ DE L'HISTONE H5
12
2.1 Introduction
L'intérêt de notre laboratoire étant entre autres axé sur
l'étude de la régulation de 1'expression du gène de 1‘histone H5, une
librairie d'ADN génomique de poulet (construite par Dodgson et al., 1979) a
été criblée pour trouver des clones porteurs de ce gène (Ruiz-Carrillo et
al., 1983). A cette fin, on a utilisé un ADN complémentaire de 1'histone
H5 de poulet, cloné dans pBR322. La taille de 1 ‘insertion du p541 est de
259 pb. Il contient 118 nucléotides dans la portion 5' non traduite de
1‘ARN messager ainsi que les séquences codantes de 46 acides aminés de la
portion N-terminale des 189 acides aminés de la protéine (Ruiz-Vazquez et
Ruiz-Carrillo, 1982).
Outre des clones contenant le gêne de 1'histone H5 et caracté
risés en détail (Ruiz-Carrillo et al., 1983), plusieurs autres clones géno
miques ont donné un signal d'hybridation correspondant à une homologie
partielle avec la sonde utilisée. Nous avons donc décidé de déterminer les
séquences portées par deux de ces clones. Par la suite, le caractère répé
titif des séquences trouvées a été illustré avec d'autres clones du même
type.
13
2.2 Matériel et méthodes
2.2.1 Matériel
Toutes les enzymes utilisées proviennent soit de Boëhringer-
Mannheim, BRI, Biolabs ou de Life Sciences. Les [a - 32p] dNTPs
(4 x 103 à 6 x 103 Ci /mmole) et [y - 32P] ATP (5 x 103 à 7 x 103 Ci /mmole)
ont été achetés de NEN (New England Nuclear) ou d1Amersham. L1 agarose à
faible point de fusion vient de BRL. Les filtres de nitrocellulose
(BA 85, 0.45 ym) sont de Schleicher & Schüll.
Pour les réactions de séquence, le dimëthyl sulfate (99%)
provient de chez Aldrich Chemical Co., 1'hydrazine (95%) d1Eastman Organic
Chemicals, la piperidine de Fisher Scientific, la formamide, la pyridine et
l'acide formique de BDH (Analar), l'urée de BRL et le BSA de Miles Labora
tories. La résine AG501-X8 servant à dëioniser la formamide ainsi que le
bisacrylamide et 1'acrylamide ont été achetés chez Bio-Rad.
2.2.2 Méthodes
- Di gestion de 1‘ADN avec des enzymes de restriction
Les digestions de 1'ADN avec des enzymes de restriction sont
faites en présence d'un excès de trois fois d'enzyme dans les conditions
recommandées par les fabricants. Dans le cas des doubles digestions, 1'ADN
est précipité entre chacune d'elles par 1'addition de NaCl en concentration
finale de 300 mM et de 2.5 vol. d'éthanol à 95%.
-Séparation de 1'ADN par électrophorèse et préparation de fragments
L'ADN est séparé par électrophorèse sur gel d'agarose variant
de 0.5% (p/v) â 1.8% dépendant de la taille des molécules. L'électro
phorèse est faite dans le tampon TBE.
14
Les fragments d'ADN servant à la fabrication des sondes sont
purifiés sur gel d1 agarose à faible point de fusion, dans le tampon TA.
Ces fragments sont ensuite prélevés et extraits par phénolisations suivies
de précipitations à 11 éthanol.
Pour la séquence, les fragments marqués radioactivement aux
extrémités 3' ou 5' sont préparés sur gel de polyacrylamide à 4% (p/v)
acrylamide - 0.14% (p/v) bisacrylamide. Les bandes d'ADN désirées sont
excisées et éluëes par agitation à 37°C dans 400 yl du mélange 1 M NaCl -
10 mM EDTA - 2 yg d'ADN d'E. coli sonifië - 3 yg d'ARN-t d'E. coli, de 16 à
20 h.
Pour la séquence, on s'est servi de gels minces (0.4 cm
d'épaisseur) (Sanger et Cou!son, 1978) et on a utilisé des concentrations
d'acrylamide / bisacrylamide de 5.7%/0.3% et 7.6%/0.4% avec 8.3 M urée.
- Transfert de 1 ‘ADN
Après électrophorèse, les fragments d'ADN sont transférés sur
filtre de nitrocellulose selon la méthode de Southern (1975), 1'ADN ayant
préalablement été dégradé par dépurination partielle et hydrolyse alcaline
(Wahl et al., 1979).
- Marquage de 1 'ADN
Le marquage des extrémités 3' de 1'ADN est réalisé par
l'activité 5‘-3' polymérase de .l'ADN polymérase de T4 selon le protocole
adapté de 0'Farrell (1981) en présence de 1 dNTP marqué et des autres dëso-
xyribonuclëotides froids. Dans le cas des extrémités franches de 1'ADN, un
traitement préalable avec la même enzyme, en l'absence de précurseurs est
effectué.
Le marquage des extrémités 5' de 1'ADN par la polynuclëotide
kinase de T4 (réaction 5B) est réalisé selon le protocole de Maxam et Gil
bert (1980). Dans le cas de l'étape préliminaire de déphosphorylation, le
traitement de 1'ADN est effectué dans 45 yl de TE pH 8.0 et 5 yl de 50 mM
15
Tris-HCl pH 8.0 avec 0.1 U de phosphatase alcaline d'intestin de veau
(CIP) par 10 pmoles durant 45 min S 37°C.
Le marquage de 1'ADN par la technique de "nick-translation"
avec l'ADN polymérase I d'_E. coli est fait selon Rigby et al. (1977). L'ADN
est purifié par passage dans une colonne de Sephadex G-50 (Pharmacia). On
obtient généralement une activité spécifique de 1-2 x 10® cpm/yg.
- Hybridation
Les pré-hybridations d'ADN se font dans 3X SSCPE - 10X D
(Denhardt, 1966) - 0.1% (p/v) SDS en présence de 50 ug/ml d'ADN d'E. coli
sonifié et dénaturé par chauffage dans TE pH 7.5 à 100°C/5 min. Les
hybridations se font dans un milieu de composition identique auquel on
rajoute la sonde en excès (1 x 10® cpm/ml de mélange d'hybridation). Les
pré-hybridations (2 à 4 h) et les hybridations (16 à 20 h) se font à 67°C.
Les filtres sont ensuite lavés, sauf indication contraire, dans les condi
tions suivantes: 3X SSCPE - IX D - 0.1% SDS/temp. ambiante/15 min/4 fois;
IX SSCPE - 0.1% SDS/65°C/15 min/2 fois; 0.5X SSCPE - 0.1% SDS/65°C/15 min/2
fois ; 0.2X SSCPE - 0.1% SDS/65°C/15 min/1 fois. Les films Kodak XAR5 et
les écrans Dupont Cronex Lightening Plus sont utilisés pour 1‘autoradiogra
phie a -80°C.
- Criblage de la librairie d'ADN génomique
L'ADN complémentaire cloné de H5, le p541 (Ruiz-Vazquez et
Ruiz-Carri 11o, 1982), a été utilisé pour cribler environ 2 x 105 phages de
la librairie d'ADN génomique de poulet construite par Dodgson et al.
(1979). Ils ont été criblés selon la méthode de Benton et Davies (1977) et
ce, à 0.5X SSC - 0.1% SDS/65°C, en présence de poly G (50 yg/ml). Des
phages positifs des trois classes de signaux d'hybridation (A,B,C; voir p.20)
ont été préparés (Ruiz-Carrillo et al., 1983).
L'insertion du pCHIX0.6 H/S (voir p.24) marquée par "nick-
translation" a été utilisée pour cribler à 0.5X SSCPE - 0.1% SDS/65°C, des
phages ayant donné un signal de type B lors du criblage initial de la librairie.
Cette partie du travail a été réalisée par notre assistant de recherche
dans le laboratoire, Jean Renaud. L'ADN des phages positifs avec le
pCHIX0.6H/S a été préparé, digéré avec EcoRI, transféré sur filtre de
nitrocellulose et hybridé avec les insertions de pCHIX0.6H/S et du p541
marquées par "nick-translation". Les hybrides ont été lavés jusqu'à 0.IX
SSCPE - 0.1% SDS/65°C/7 min dans le cas du pCHIX0.6H/S et jusqu'à 0.2X
SSCPE - 0.1% SDS/65°C/15 min pour le p541.-
- Cartographie
Essentiellement, deux méthodes ont été utilisées. Des diges
tions simples et doubles avec différentes enzymes de restriction ont été
faites de manière à déduire la carte de restriction recherchée d'après la
longueur des fragments obtenus. On s'est aussi servi de la méthode des
digestions partielles de Smith et Birnstiel (1976) qui permet d'ordonner,
après autoradiographie, la position des sites de restriction à partir d'une
extrémité marquée.
- Sous-clonage
Les régions d'intérêt des recombinants ACHVII et ACHIX ont été
sous-clonées dans pAT153, un dérivé de pBR322 se répliquant à un nombre
élevé de copies (Twigg et Sherratt, 1980). Les ligations ont été faites
avec 1 U d'ADN ligase de T4 avec 150 ng des fragments Hind III - Sal I de
644 pb de ACHIX ou HindlII - BamHI de 1 800 pb de ACHVII en utilisant
450 ng de pAT153 amputé des fragments correspondants et purifié. Les
réactions ont été faites à 4°C dans 20 yl (vol. final), de 16 à 20 h puis à
14°C 1 h, avec 10 mM DÎT - 0.4 mM ATP - 60 mM Tris-HCl pH 7.5 - 6.6 mM
MgCl2* La souche E. coli C600 (rec A") a été transformée par la méthode au
chlorure de calcium (Mande! et Higa, 1970). La sélection des clones
positifs ampr et tets a été réalisée sur des milieux LB avec ampicilline
(100 yg/ml) ou tétracycline (20 yg/ml) selon le cas. L'identification a
été complétée par un criblage de l'ensemble des recombinants selon la
méthode de Grunstein et Hogness (1975). Les fragments Sali - EcoRI
(6 200 pb) de ACHIX ainsi que Smal - Smal (900 pb) de ACHVII couvrant les
17
régions d'intérêt ont été marqués par "nick-translation" et utilisés comme
sondes.
Les ADN plasmidiques de plusieurs sous-clones ont été isolés
par une méthode rapide mise au point dans notre laboratoire. Le culot de
cellules bactériennes en suspension dans 25% sucrose - 50 mM Tris-HCl pH 8.0
est lysé par l'addition, en concentration finale, de 0.6 mg/ml de lysozyme -
0.060 M EDTA - 25 mM Tris-HCl pH 8.0 - 0.05% Triton X-100 à 0°C/10 min. Le
mélange est ensuite chauffé à 70°C/15 min. Après centrifugation
(12 000 g/15 min), le surnageant contenant les acides nucléiques est préci
pité par l'addition d'un vol. de 20% PEG (6 000) - 20 mM Tris-HCl pH 8.0 -
1 M NaCl â temp, ambiante pendant 30 min. Le culot est dissout dans du TE
(10/0.1) pH 8.0 puis traité â la RNase (0.15 mg/ml) S 37°C/30 min. L'ADN
est finalement obtenu par précipitation dans de 1'acétate d'ammonium 2 M
et 3 vol. d'éthanol â 95% (rendement d'environ 2.5 yg). La taille des
insertions a été vérifiée par digestion avec les enzymes appropriées et mi
gration sur gel d'agarose.
Les plasmides pCHIX0.6H/S et pCHVIII.8H/B amplifiés ont été
isolés en grande quantité selon la procédure des lysats clairs, mise au
point dans notre laboratoire (lyse bactérienne contrôlée, effectuée dans
60 mM EDTA - 25 mM Tris-HCl pH 8.0 - 1% (v/v) Triton X-100 avec 0.3 mg/ml
de lysozyme) suivi de deux centrifugations consécutives, à 1'équilibre,
du culot d'acides nucléiques dans 4.7 M CsCl contenant 0.4 mg/ml de bromure
d'ëthidium à 62 000 rpm/4 h (rotor VTi 65). La concentration d'ADN est
déterminée par fluorimétrie après réaction avec DABA selon le protocole de
Kapp et al. (1974).
- Séquence
La méthode de clivage chimique partiel de 1'ADN ainsi que les
techniques s'y rattachant, mises au point par Maxam et Gilbert (1977, 1980)
ont été employées. On a utilisé les réactions spécifiques aux guanines,
purines, pyrimidines et cytosines. Les stratégies choisies pour sêquencer
18
les 644 pb de 11 insertion de pCHIX0.6H/S ainsi que les 247 pb du fragment
Smal - BamHI de pCHVII1.8H/B sont illustrées à la figure 3. Pour 11 inser
tion de pCHIX0.6H/S, 89% des 315 pb autour de la région homologue au p541
ont été séquencées deux fois alors que pour le fragment de pCHVIII.8H/B,
72% des 2 brins ont été séquencés 2 fois.
- Analyse de séquence par ordinateur
L'analyse des séquences a été effectuée grâce aux programmes
mis au point par Staden (1977, 1978) (BDOVRL, OVRLAP, TRANMT) et ceux du
groupe UWGCG ("University of Wisconsin Genetics Computer Group"), principa
lement le groupe de J. Devereux (1984) (FIND). Les banques de séquences
"GenBank" (Fickett et al., 1982) et EMBL ("European Molecular Biology
Laboratory") ont été analysées.
Le programme BDOVRL permet de chercher des homologies pour une
séquence donnée avec 11 ensemble des séquences d'une sous-division de la li
brairie "GenBank". La séquence recherchée est traitée par l'ordinateur en
blocs de comparaison de N nucléotides. On définit également un nombre mi
nimal de nucléotides homologues. Il est souhaitable de commencer la re
cherche d'une séquence inconnue avec des blocs de séquence de 3 nucléotides
et un minimum de 9 pb appariées. Le résultat global de 1‘homologie trouvée
avec chacune des séquences d'intérêt dans la banque est donné en pourcen
tage. On peut ensuite faire une analyse plus précise d'homologie avec le
programme OVRLAP.
Le programme OVRLAP est utilisé pour comparer des séquences
afin de trouver des régions homologues avec ou sans mauvais appariement.
Il peut être utilisé pour trouver des répétitions internes (directes ou
inversées) dans une séquence ou pour comparer deux séquences. Une longueur
minimale d'homologie ainsi qu'un nombre de mauvais appariements sont
spécifiés par l'utilisateur et toute homologie satisfaisant ces paramètres
est rapportée. Le programme calcule aussi automatiquement le complément
19
d'une des séquences et le compare à l'autre par la même occasion. Pour les
fins de recherche d'identité de pCHIX0.6H/S et pCHVIII.8H/B avec certaines
séquences des librairies, on a généralement donné un minimum de 9 pb homo
logues et aucun mauvais appariement.
Le programme FIND recherche une chaîne de caractères dans
d'autres séquences, par exemple dans certaines portions définies de
"GenBank", d'EMBL ou dans toute autre séquence. Ce programme recherche
aussi le complémentaire si la chaîne de caractères est formée de nucléo
tides. En donnant plusieurs chaînes d'une dizaine de caractères, issues
d'une séquence inconnue et en les cherchant dans les banques de séquences,
on peut retracer la séquence homologue, si elle existe.
Le programme TRANMT détermine les codons correspondants aux
trois cadres de lecture possibles dans la séquence proposée. Il exécute
aussi la même opération sur la séquence du brin complémentaire.
2.3 Résultats
2.3.1 Criblage de la librairie d'ADN génomique de poulet avec 11 ADN complémentaire cloné de H5
Environ 2 x 10$ phages représentant environ 2 fois la taille
du génome de poulet ont été criblés avec 1 1 ADN complémentaire cloné de H5,
le p541. Trois types de signaux ont été obtenus après hybridation puis
lavage de la sonde dans des conditions de lavage de 0.5X SSC - 0.1% SDS
/65°C. Neuf clones donnant un signal très fort (A), 77 un signal intermé
diaire (B) et 516 faibles (C) ont été observés. Les signaux faibles ne
provenaient pas d'une hybridation non spécifique puisque, dans les mêmes
conditions, des clones recombinants Xgt d'une librairie d'E. coli n'ont
donné aucune réponse avec la sonde. Ces résultats ont été obtenus par
A. Ruiz-Carrillo.
Par la suite, une analyse par hybridation de "dots", de 1'ADN
de recombinants de chacun des 3 types de signaux obtenus a montré qu'après
lavage des hybrides dans des conditions de 0.IX SSC - 0.1% SDS/65°C, seuls
les signaux de types A et B sont demeurés (A. Ruiz-Carrillo, résultats non
pub!iës).
Deux clones de type A ont été caractérisés en détail et se
sont avérés contenir des fragments chevauchants du gêne de 1'histone H5
dont la séquence a été déterminée. L'hybridation du p541 avec de l'ADN
génomique a permis de conclure qu'il n'y a qu'une copie de ce gêne par
génome haploïde (Ruiz-Carrillo et al., 1983). Les clones de type B et C
semblaient, quant à eux, contenir des séquences ayant des homologies
partielles avec la sonde utilisée, ceux de type B davantage que le type C.
Nous avons d'abord décidé d'identifier la nature des homo
logies portées par des clones de type B en sëquençant deux d'entre eux
choisis au hasard, les ACHVII et ACHIX.
21
2.3.2 Cartographie des clones génomiques ACHVII et ACHIX
Les emplacements des divers sites de restriction des clones
ACHVII et ACHIX ont été déduits d'après la taille des fragments obtenus par
des digestions simples et doubles avec différentes enzymes de restriction.
La technique des digestions partielles de Smith et Birnstiel (1976) a servi
à compléter ces informations. Les ACHVII et ACHIX comportent respective
ment des insertions de 12.8 kb et 18.0 kb de différents morceaux d'ADN à en
juger d'après la position des sites de restriction. Ces résultats sont il
lustrés à la figure 1.
2.3.3 Détermination des régions d'homologie des clones ACHVII et ACHIX avec le p541
Afin de cerner précisément les régions de ACHVII et ACHIX
homologues à 1'ADN complémentaire cloné de H5, ces recombinants ont été
digérés avec plusieurs enzymes de restriction dont les sites d'action
étaient connus. Les fragments d'ADN séparés par électrophorèse sur gel
d'agarose ont été transférés sur filtre de nitrocellulose et hybridés avec
l'insertion du p541, marquée par "nick-translation". D'après la figure 2,
on observe sur les deux autoradiogrammes qu'une seule bande par canal a
hybridé avec la sonde; dans les cas où il y a deux bandes, la bande la plus
faible serait due à une digestion partielle. Cela signifie donc que les
régions d'homologie ne couvrent qu'une portion de chacun des clones géno
miques .
On a ainsi pu déduire que 1'homologie du p541 avec ACHVII
était au maximum de 247 pb (fragment Smal - BamHI) et de 644 pb (fragment
HindIII - Sal I) avec ACHIX (les longueurs précises ont été déterminées par
séquence). Ces régions d'homologie sont montrées sur les cartes de res
triction de la figure 1.
# eg o□ • a • g
i------- 1
1 kb
g a / a g g g gg □ □ g 1/ A ga ■ •
B
I------- 1
1 kb
Figure 1. Cartes de restriction des insertions des clones génomiques XCHVII et XCHIX. Le rectangle noir représente les régions de XCHVII (A) et XCHIX (B) sous-clonées, contenant les portions homologues â l'ADN complémentaire cloné de H5 (p541). Les symboles utilisés sont: HindiII (□), Smal (O),BamHI (•), EcoRI (A), Kpnl (■), Sali (y), jonctions synthétiques EcoRI (a).L'enzyme Sali ne coupe pas XCHVII alors que XCHIX n'est pas coupé par Smal.
roIX)
abcdefghi j k I abcdefghijkl m n o p q m n o p q
Figure 2. Détermination de la région d'homologie des clones génomiques XCHVII et ACHIX avec le p541.A) Coloration^au bromure d'éthidium des fragments d'ADN séparés par électrophorèse sur gel d'agarose a 0.5%. (a) & (i) 0.5 yg d'ADN de ACHIX digéré respectivement avec EcoRI, EcoRI+SalI, Sali, EcoRI+Hindl11, HindiII, EcoRI+Kpnl, Kpnl, EcoRI+BamHI, BamHI; (j) à (1) 0.5 yg, (m) à (q) 0.75 yg d'ADN de ACHVII digéré respectivement avec EcoRI, EcoRI+BamHI, BamHI, Smal, EcoRI+Hindl11, Hindl11, EcoRI+KpnI, KpnI. B) Autoradiogrammes des transferts des gels montrés en (A) hybridés avec 1'insertion du p541 marquée par "nick-translation". La longueur des fragments de l'ADN de A digéré avec Hindi 11 utilisé comme marqueur de migration est donnée en kb. ♦quantité moindre, indéterminée, dans le cas des doubles digestions.
rx)co
2.3.4. Séquence des régions d'homologie
Les fragments contenant les régions d'homologie ont par la
suite été sous-clonés dans pAT153. Dans le cas de aCHVII, c'est le
fragment HindIII - BamHI de 1.8 kb (figure 1) qui a été sous-cloné pour
former le plasmide pCHVIII.8H/B. Le pCHIX0.6H/S a été obtenu par sous-
clonage du fragment Hind 111 - Sal I de 0.6 kb issu de ACHIX.
Des cartes de restriction détaillées de ces deux sous-clones
apparaissent à la figure 3. Les stratégies de séquence par la méthode de
dégradation chimique de Maxam et Gilbert (1977, 1980) y sont également
i 11ustrées.
Les séquences des brins porteurs de 1‘homologie avec l'ARN
messager de H5 dans l'insertion du pCHIXO.6H/S (644 pb) et dans le fragment
BamHI - Smal (247 pb) de pCHVIII.8H/B sont respectivement données aux figu
res 4 et 5. Il est à noter que la séquence du fragment de pCHVIII.8H/B est
riche en bases G+C par rapport à 1'ensemble du génome qui a une composition
moyenne en guanines et en cytosines de 44% d'après Shapiro (Handbook of
Biochemistry, 1976, p. 269).
La figure 12 (voir chapitre 3) illustre entre autres la compa
raison d'une partie des séquences de pCHIX0.6H/S, de p541 (brin homologue à
l'ARN-m) et de pCHVIIl.8H/B. On observe que dans le cas des 2 sous-clones,
la région d'homologie avec le p541 ne correspond qu'à 20 pb et qu'elle est
majoritairement formée d'une séquence simple de 5 tri nucléotides (GGC). De
plus, le triplet (AGC) borde de chaque côté la séquence simple pour
pCHIXO.6H/S et le p541 alors qu'il ne manque qu'un A du côté droit (figure
12) pour observer la même chose avec pCHVIII.8H/B. Dans le cas du
pCHIX0.6H/S, on peut également observer un sixième (GGC) qui se rajoute aux
autres de façon consécutive.
La séquence d'homologie de 20 pb est située dans la partie 5'
non traduite de l'ARN messager de H5 et plus précisément à la position -113
en amont du codon d'initiation de la traduction d'après le p541 (Ruiz-Carrill
et al., 1983).
A0.1 kb
g f 1 IT
B H-H
50 pb
Figure 3. Cartes de restriction des sous-clones pCHVIIl .8H/B et pCHIX0.6H/S. Les stratégies pour séquencer le fragment, Smal - BamHI de pCHVIIl.8H/B (A) et l'insertion de pCHIXO.6H/S (B) sont données (-►). Les symboles utilisés sont: HindiII (□), Smal (O), BamHI (•), Sali (▼), Alul (♦), Hpall (v), HaelII (◄), Hinfl (<), Sau3A (x).
roen
10 20 30 40 50 60TCGACGGGAT CAGGGACTGG AGCCTTTTCA GCTGCCTCGG GGTCTGGCTG GACTGCTGTC
70 80 90 100 110 120CCAAGGAACC CAAGACGGAC ACCGGGGGAC GGAAGATGGC TGTCGGGAGG CGCGGCGTGG
130 140 150 160 170 180TGGGTCAGGG CTATAGCAAC AGAAGTGGTG •GCGGCTGCGG CTTGCAGGGG GGCCTGGATG
190 200 210 220 230 240AGCGGGGTCC AAATGACGGG GGTGGGGGTG GATGCGGCAG CGGCGGCGGC GGCGGCGGCA
250 260 270 280 290 300GCCTGGACGT TGTGAGCACA GTGTGCCATC TCCCTGTCGT GCTGCACGAT CTGCTGGATG
310 320 330 340 350 360ATCTCATTCT CTTGGTAGTT GAAAACCCCC GAATTGAGGT CATGCTGGAC TTTATGCAGC
370 380 390 400 410 420AGAATGGAAT TTTTCTTACC TGTAGAGAAA GTGAAGAGAG AAGAGTCATT CTCATGTGTC
430 440 450 460 470 480AAAGCAGGGG AGGCTGCCTG CCGAACCTTC CTCAAATTGT TGGCACCGTC TCCGCTGTCA
490 500 510 520 530 540TTATGGGATC TGGGTACAGT CTCTCTGCTC CAGCAACAAG ATGATAAACA TTATATCTTC
550 560 570 580 590 600TGCTTTTGTG GTATGATCAG CGGACTTTGA GATCCCAGAG AACACAGTCC TAGTTAGACG
610 620 630 640GTGGAGTCAG TTTTGTGAAG TGGGGCGGAC TGGTAGCAAA GCTT
Figure 4. Séquence de l'insertion de pCHIX0.6H/S. Elle débute au site SalI et se termine au site Hindlll. Le trait continu représente 1'homologie avec le p541 alors que le trait discontinu illustre les répétitions de (GGC). C'est la séquence du brin porteur de 1‘homologie avec l'ARN messager de H5 qui est donnée.
10 20 30 40 50 60GATCCGGCGC CGCCCCGCAG CCCCGCCCGG AAGCGGGGGG GGAGCAGCGG CGGCGGCGGC
70 80 90 100 110 120GGCGCGGACG TCGCGGCGGG GAGGAGCCGG GCCGGGCCGG GGCGGATCGG CGCTCGGCGG
130 140 150 160 170 180GCGGGCAGGG CACGGCGCGG CGCGATGGCG GGGCCCCGCG GCGGCGCTGC AGCGCGGGGT
190 200 210 220 230 240CCCACGGAGG ATGTGAGGCG GCGGCCGCGG ACGGCCCCAC CGGGCTCGGA GGGCGGAGAG
GGGTCCC
Figure 5. Sequence de la région de 247 pb de pCHVI11.8H/B contenant 1'homologie avec le p541. Elle débute au site BamHI et s'achève au site Smal. Le trait continu représente 1'homologie avec le p541 alors que le trait discontinu illustre les répétitions de (GGC). C'est la séquence du brin porteur de 1'homologie avec l'ARN messager de H5 qui est donnée.
28
Entre ce qui a été séquencé de pCHIX0.6H/S et pCHVII1.8H/B, il
n'y a que 21 pb communes comprenant les 5(GGC) en tandem. Ce résultat est
d'ailleurs corroboré par l'hybridation de 1'insertion du pCHIX0.6H/S avec
des fragments de restriction de ACHVII tel qu'illustré à la figure 6. Les
fragments positifs observés sont les mêmes que pour l'hybridation avec le
p541 (figure 2).
2.3.5 Identification de (GGC)n dans d'autres clones génomiques
En plus des deux clones ACHVII et aCHIX précédemment caracté
risés, on a recherché d'autres clones génomiques porteurs de séquences
simples de (GGC)n. L'insertion du pCHIXO.6H/S a été utilisée pour examiner
par criblage des plages de lyse, d'autres phages ayant donné un signal de
type B lors du criblage initial avec 1'insertion du p541. Cinq phages
positifs ont été obtenus après deux purifications d'un petit nombre de
phages ayant donné un signal avec la sonde de pCHIX0.6H/S.
Les ADN recombinants de AII, V, X, XIV et XIX sont tous
différents à en juger d'après leurs patrons de digestion avec EcoRI tel
qu'ils apparaissent après électrophorèse sur gel d'agarose (figure 7A). On
remarque cependant que le AXIX est identique au ACHVII caractérisé anté
rieurement (voir figure 2A, canal j).
On a hybridé 1'ADN digéré de chacun de ces clones avec
1'insertion du pCHIX0.6H/S (figure 7B) et celle du p541 (figure 7B ' ). On
observe que pour chaque recombinant, c'est le même fragment d'ADN qui
hybride avec les deux sondes. Pour AXIV, un deuxième fragment de plus
grande taille (environ 5.20 kb) apparaît après surexposition des
autoradiogrammes (résultat non montré). Il est à noter que la bande plus
faible qui apparaît dans le canal de AX avec la sonde du p541 (canal c' ) ne
correspond à aucune bande sur le gel et serait plutôt issue d'une
contamination; d'ailleurs une expérience analogue a été réalisée et cette
bande n'est pas apparue.
29
a b c d e f g abc d e f g
A B
Figure 6. Détermination de la région d'homologie de XCHVII avec le pCHIX0.6H/S. A) Coloration au bromure d'éthidium des fragments de XCHVII séparés par électrophorèse sur gel d'agarose à 0.5%. (a) à (g) 0.75 wgd'ADN digéré respectivement avec Hi ndl 11, Hi ndl I I+BamHI, BamHI, Kpnl, KpnI+EcoRI, Smal, Smal+EcoRI. B) Autoradiogramme du transfert du gel montré en (A) hybridé avec l'insertion de pCHIX0.6H/S marquée par "nick- translation". La longueur des fragments de 1'ADN de X digéré avec Hindl11, utilisé comme marqueur de migration est donnée en kb.
30
a b c d e a b c d e a' b' c" d' e' a' b' c* d' e‘
2 3.1
9.4
6.6
4.4
2.32.0
A B A' B'
Figure 7. Caractérisation de dones génomiques porteurs de séquences simples de (GGC)n . A,A') Coloration au bromure d'éthidium des fragments d'ADN de clones génomiques digérés avec EcoRI et séparés par électrophorèse sur gel d'agarose à 0.5%. (a) à (e) Ail (0.5 ug); AV, AX (0.3 pg); AXIV (0.7 pg); AXIX (0.6 pg). (a1) à (e1) Ail, AV, AX, AXIV, AXIX (0.5 pg). B,B') Autoradiogrammes des transferts des gels montrés en (A,A') hybridés avec les insertions de pCHIXO.6H/S (B) et p541 (B1) marquées par "nick-translation". Les flèches indiquent la position sur les gels des bandes correspondantes ayant hybridé avec les sondes. La longueur des fragments de 1'ADN de A digéré avec HindiII utilisé comme marqueur de migration est donnée en kb.
31
Étant donné qu'il n'y a que 20 pb homologues, dont (GGC)g,
entre les insertions de pCHIX0.6H/S et du p541, le fait d'observer un
signal avec chacune de ces sondes pour le même fragment d'ADN révèle la
présence d'une séquence similaire, sans toutefois qu'elle soit nécessai
rement identique. Cependant, on ne peut pas comparer les intensités de la
même bande avec les 2 sondes car les gels ne sont pas identiques. Il faut
aussi noter que les hybrides n'ont pas subi les mêmes conditions de lavage
(lavage jusqu'à 0.1X SSCPE - 0.1% SDS/65°C (figure 7B, pCHIX0.6H/S) et
jusqu'à 0.2X SSCPE - 0.1% SDS/65°C (figure 7B', p541) ).
En examinant chacun des 2 autoradiogrammes (figure 7B, B'), on
se rend compte que les intensités des différentes bandes ne sont pas les
mêmes. Les intensités relatives des bandes examinées les unes par rapport
aux autres varient dans certains cas selon la sonde utilisée. On voit par
exemple que 1'ADN de AX (c) donne un signal d'intensité comparable à celui de
àV (b) avec la sonde du p541 (fig. 7B‘) alors qu'avec l'autre sonde (fig. 7B),
il donne un signal plus faible par rapport à xV (b). Cela signifie donc des
homologies différentes avec chacune des sondes. D'autre part, dans le cas
de aXIV (canaux d, d'), les signaux sont nettement plus faibles dans les
2 cas et pourraient donc provenir d'une séquence moins riche en (GGC).
Les résultats de ces hybridations différentielles suggèrent
la présence de séquences simples de (GGC)n dans les recombinants analysés.
Il est cependant impossible de déterminer le nombre de répétitions consécu
tives seulement d'après ces résultats car la méthode de détection est limi
tée en raison des sondes utilisées: il y a 5 (GGC) chez le p541 et 6 chez
le pCHIX0.6H/S. Lors de 1'hybridation avec ces sondes, un nombre plus
grand de répétitions consécutives de (GGC) dans une séquence engendre de
mauvais appariements et n'est pas détecté comme tel. Par exemple, une sé
quence de (GGC)g ne pourra apparier que 6 de ses (GGC) avec le pCHIX0.6H/S
et 5 avec le p541. En outre, un changement d'une base au milieu d'une sé
quence de (GGC)g engendrerait de mauvais appariements qui la rendrait plus
difficilement détectable avec les sondes utilisées.
32
2.3.6 Analyse de séquence
On a d'abord essayé de déterminer des cadres de lecture ou
verts dans les séquences trouvées. On a assigné par ordinateur des codons
de traduction correspondant aux trois phases de lecture possibles pour cha
cun des deux brins. Dans la séquence d'un des brins de pCHVII1.8H/B, il
existe trois cadres de lecture ouverts alors que chez le pCHIX0.6H/S, plu
sieurs codons de terminai son ont été rencontrés dans chacun des cadres de
lecture et ce, sur les deux brins.
Par la suite, on a regardé si ces séquences pouvaient par ha
sard correspondre à quelque chose de connu en effectuant une recherche ex
haustive dans les banques de séquences de "GenBank" et EMBL ainsi que dans
la littérature. Cependant, elles ne correspondent à aucune séquence connue
jusqu'à présent.
2.4 Discussion
Les clones Ail, XV, xCHVII, XCHIX, xX et xXIV qui ont donné le
signal de type B à l'hybridation avec le p541 sont différents d'après les
patrons des digestions enzymatiques obtenus, visibles par électrophorèse
sur gel (XXIX est identique à XCHVII). Ils correspondent par conséquent à
des portions distinctes du génome de poulet.
Les régions d'homologie de 20 pb des XCHVII et XCHIX avec le
p541 comprennent une séquence simple de trinuclëotides (GGC). En outre,
les séquences de ces régions sont les mêmes chez les deux clones, ce qui
est en accord avec les intensités d'hybridation des fragments d'ADN posi
tifs qui sont du même ordre de grandeur (comparer les canaux (a-i) pour
XCHIX avec (j-1) pour XCHVII sur le même autoradiogramme à la figure 2).
Des séquences simples formées de (GGC) semblent être répétées
plusieurs fois dans le génome de poulet 5 en juger par les hybridations
différentielles des sondes de pCHIX0.6H/S et p541 avec d'autres clones de
type B provenant du criblage initial de la librairie. On peut dire que le
nombre suggéré de répétitions de séquences (GGC)n comme celles portées par
les clones de type B pourrait être de 39 puisque les 77 clones de type B
obtenus proviennent du criblage de la librairie représentant environ deux
fois la taille du génome. De même, il pourrait y avoir 516 * 2 d'où 258
répétitions de séquences de (GGC)n de type C où par rapport à celles des
clones de type B, il y aurait moins de (GGC) consécutifs détectables avec
la sonde utilisée. Cependant, ces chiffres donnés à partir du criblage de
la librairie demeurent très approximatifs. D'abord la représentation géné
rale des séquences dans la librairie, surtout si elle a été amplifiée, peut
être fort différente de celle du génome. Certaines séquences peuvent être
sous ou sur-représentées dépendant de leurs effets sur la viabilité des
34
phages. D'autre part, 11 intensité des signaux observés peut dépendre aussi
du nombre de phages présents dans 1 es plages de lyse qui ont donné un si
gnal avec la sonde. Cela pourrait donc fausser quelque peu le décompte des
clones pour chacun des 3 types de signaux (A, B, C) obtenus lors du cribla
ge de la librairie avec 11 insertion du p541. Une meilleure évaluation du
nombre d'éléments de la famille (GGC)n dans différents génomes sera faite
au chapitre suivant.
Une homologie de 14 pb comprenant (GGC)g (provenant du gène de
H5; discuté au chapitre suivant) avec le pCHIX0.6H/S et le pCHVIII.8H/B
n'est pas détectable par hybridation dans les conditions habituelles et
lavage jusqu'à 0.2X SSCPE - 0.1% SDS/65°C (résultats non montrés). On a vu
par contre que les hybridations différentielles avec le pCHIX0.6H/S et le
p541 détectent bien une séquence de 20 pb homologues comprenant (GGC)g;
c'est le cas de ACHVII. Par conséquent, nous pouvons dire qu'il faut au
moins plus qu'une séquence homologue de 14 pb avec (GGC)] pour être détec
table dans ces conditions. Les signaux d'hybridation des clones de type B
obtenus lors du criblage initial de la librairie et résistant à des condi
tions de lavage de 0.IX SSC - 0.1% SDS/65°C répondraient apparemment à ces
exigences. Cependant, on ne sait pas si les clones porteurs d'une homolo
gie intermédiaire, soit entre 14 et 20 pb auraient donné un signal avec la
méthode de détection utilisée. La limite inférieure où on commence à dé
tecter un signal d'homologie n'a pas été déterminée.
CHAPITRE 3
ORGANISATION DES SÉQUENCES SIMPLES DE (GGC)
CHEZ LE POULET ET D'AUTRES ORGANISMES
3.1 Introduction
Parmi les séquences simples rapportées dans la littérature, il
y en a qui ont été caractérisées soit à cause de leur présence dans le voi
sinage ou dans les introns de certains gènes, soit aussi par leur fréquence
de répétition dans des génomes homologues ou hétérologues. Nous décrirons
ici quelques exemples.
Plusieurs types de séquences simples ont été découverts dans
le voisinage ou à 11 intérieur d'une variété de gènes. Ainsi, Slightom et
al. (1980) ont trouvé des séquences de 13 à 19 (TG) consécutifs dans le
deuxième intron des gènes foetaux G et A de type g-globine chez 11 humain.
Apparemment, ces séquences joueraient un rôle dans la conversion intergé
nique afin de contrôler l'évolution de ces gènes qui sont des produits de
duplication d'un ADN ancestral . Des trinuclêotides (TCC)n et (TCA)n ont
été trouvés par Cohen et collaborateurs (1982) à des positions analogues,
en amont de 5 gènes d'immunoglobulines Vy apparentés, chez la souris. Ils
auraient eux aussi un rôle dans la conversion puisqu'en amont de ces sé
quences, ces gènes divergent. Chez l'oursin de mer (S. purpuratus), Sures
et al. (1978) ont trouvé dans un "spacer" entre les gènes H2A et Kl, une
séquence de (CT/GA)27. En parlant de cette séquence, Kedes (1979) suggère
qu'elle pourrait, à cause de son homogénéité, se comporter comme une ferme
ture éclair lors de sa dissociation-réassociation. Elle pourrait de ce
fait minimiser les crossing-over inégaux hors phase mais permettre ceux qui
sont en phase. Ce serait un mécanisme pour la correction et l'amplifica
tion des gênes.
D'autres auteurs ont étudié le caractère répétitif des séquen
ces simples. Hamada et Kakunaga (1982) ont observé la séquence (TG)25 dans
le quatrième intron d'un gêne d'actine du muscle cardiaque humain. Cette
séquence est située près de la frontière intron/exon. Avec une sonde
synthétique de (dT-dG)n, ils ont déterminé qu'il y avait environ cent
mille copies de ce motif dans le génome humain. Ces séquences fortement
37
répétées pourraient, selon ces auteurs, être importantes dans la mutagënê-
se, la recombinaison ou le contrôle de 1'expression génique. À 329 pb de
la partie 3' codante de deux gènes d'immunoglobulines V provenant de
cellules embryonnaires et de plasmacytomes de souris, Nishioka et Leder
(1980) ont trouvé la séquence (CA)3i. Une séquence de composition asymé
trique en purines-pyrimidines, (AGAGG)32, a été identifiée quant à elle par
Dybvig et al. (1983) dans un clone génomique de poulet de nature inconnue.
Ce clone a été obtenu par hybridation avec des sondes d'ADN complémentai
res enrichis pour les ARN messagers du choc thermique. Ils estiment à au
moins 2 000 le nombre de copies de cette séquence simple d'après la quanti
té de plages provenant du criblage de la librairie.
Il a aussi été démontré que ces séquences étaient répandues
dans des systèmes biologiques hétérologues. La séquence simple (TG)-|y,
présente dans un segment de 251 pb entre les gênes s et g-globines humaines
est détectable chez 20% des clones d'une librairie génomique humaine (Mi es
te! d et al., 1981). Cette séquence, retrouvée dans les génomes de Xenopus,
de saumon, de pigeon, de souris, de levure {S_. cerevisae) et de myxomicête
(JD. discoideum), pourrait avoir été conservée ou simplement avoir été
générée indépendamment durant l'évolution. Gebhard et Zachau (1983) ont
identifié les séquences (TGjgQ, (TTTGCjgQ, (GCCTCT)3q dans le voisinage
des gènes VK et CK codant pour les chaînes de type k dans les immunoglobu
lines de souris. Le caractère répétitif observé chez la souris est conservé
chez le saumon. Finalement, Maroteaux et al. (1983) ont étudié la fréquence
de répétitions de séquences simples trouvées dans le voisinage ou dans les
gènes codant pour des protéines de l'oeuf chez trois espèces aviaires. Ainsi,
les pentanucléotides (GGAAG^y, (GGAAA^g et (GGAGA^g ont été trouvés res
pectivement à 2.5 kb en amont de l'extrémité 5' du gène ovalbumine-X du
poulet. Ces séquences sont réitérées dans trois génomes aviaires (poulet,
faisan, canard) à des degrés qui varient avec le type de séquence et l'espèce
considérée.
38
Nous avons voulu étudier 1'organisation et la réitération des
séquences simples composées du trinuclëotide (GGC), d'abord chez le poulet
puis dans d'autres espèces qui lui sont plus ou moins apparentées afin de
voir si elles sont présentes chez d'autres organismes. Pour ce faire, il a
d'abord fallu établir les conditions optimales de détection de ces
séquences par hybridation différentielle.
Suite à cela, il s'est avéré intéressant d'identifier parmi
les gênes séquencés chez quelques espèces, ceux qui étaient porteurs de ce
type de séquences afin d'étudier leur localisation dans le génome.
39
3.2 Matériel et méthodes
3.2.1 Matériel
Les poulets utilisés sont de type Warren (Québec) et White
Leghorn (Allemagne), le canard est de la variété Pékin et le pigeon de type
voyageur. Les ADN de foie de souris Bal b/c ainsi que de cellules T24 de
carcinomes de vessie humaine ont été généreusement fournis respectivement
par B. Turcotte et C. Parent et isolés par traitement à la protéinase K-SDS
suivi d'extractions au phénol et chloroforme tel que décrit plus bas. Il en
est de même pour 11 ADN de salmonelle (S_. thyphimurium) fournit par A. Ruiz-
Carrillo. Quant à 11 ADN de E. coli, il a été isolé par gradients de CsCl
L'ADN de sperme de saumon ainsi que le poly (G) proviennent de
Boëhringer-Mannheim.
3.2.2 Méthodes
- Courbe de fusion
Pour mesurer le Tm de l'hybride formé entre 11 insertion du
pCHIX0.6H/S et celle du p541, on a d'abord fixé 1'insertion purifiée de
pCHIX0.6H/S sur 2 disques de nitrocellulose de 0.9 mm (d.i.) selon un
protocole adapté de Kafatos et al. (1979): 1.3 yg d'ADN préalablement
dénaturé (0.3 M Na0H/10 min/20°C suivi d'une dilution dans 1 vol. de 2 M
CH3COONH4 froid) est déposé sur un disque humidifié dans 20X SSCPE. Le
filtre est lavé 2 fois avec 50 yl de 20X SSCPE et il est mis à sécher au
four à vide à 80°C/2 h. La pré-hybridation et 1'hybridation des filtres
avec l'insertion du p541 marquée aux extrémités 5' avec la polynucléotide
kinase de T4 ont été réalisées tel que décrit auparavant (section 2.2.2).
On a ensuite fait 4 lavages dans 3X SSCPE - 0.1% SDS - lXD/temp.ambiante/15
min et 2 lavages dans IX SSCPE - 0.1% SDS/65°C/15 min. Les 2 filtres ont
été déposés séparément dans des vials de plastique contenant 5 ml de 0.IX
SSCPE - 0.1% SDS dans un bain à 45°C et stabilisés pendant 5 min. On a
40
alors commencé la dissociation des hybrides par l'augmentation graduelle de
la température. Le liquide de lavage a été prélevé et compté par scintil
lation. On a augmenté de 3°C la température du bain et on a ajouté 5 ml de
la solution de lavage prê-chauffëe qui a été laissée en contact pendant 2
min avec le filtre. On a répété cela jusqu'à 87°C en parallèle avec un
filtre témoin. A la fin, les comptes restants sur le filtre ont également
été déterminés par scintillation. La somme des comptes ëluës à chaque
température et des comptes restants, corrigés avec la valeur du témoin
correspond aux comptes totaux présents sur le filtre avant lavage avec 0.IX
SSCPE - 0.1% SOS. La courbe du pourcentage des hybrides dissociés
comptes ëluës corrigés \_________________________JX 100 en fonction de la température a été tracée.comptes totaux corrigés/
La déviation standard sur la lecture de la température est de ± 0.5°C alors
que la déviation standard moyenne sur le calcul du pourcentage des hybrides
dissociés est de - 0.7°C.
- Isolement de 1'ADN génomique
Les ADN génomiques d'érythrocytes de poulet, de canard et de
pigeon ont été isolés comme suit. Les érythrocytes provenant de sang
hëparinë ont été lavés plusieurs fois dans une solution isotonique (0.15 M
NaCl - 10 mM Tri s-HCl pH 7.3) puis lysés dans un grand volume de solution
0.25 M sucrose - 0.14 M NaCl - 0.02 M Tri s-HCl pH 7.5 - 0.01 M EDTA - 0.5%
(v/v) NP-40. Après centrifugation à 800 g/5 min/4°C, la lyse a été reprise
lorsque nécessaire. Les noyaux ont été lavés dans le même tampon en absen
ce de NP-40, centrifugés à 800 g/5 min/4°C et mis en suspension dans 250
vol. de ce dernier auquel de la protéinase K et du SDS ont été ajoutés pour
avoir respectivement des concentrations finales de 50 yg/ml et 1%. L'incu
bation a été faite à 37°C de 16 à 20 h. L'étape suivante a consisté à
faire plusieurs extractions consécutives, très douces, au phénol/chloro
forme de façon à éliminer les protéines. L'ADN a été précipité et laissé
gonfler dans du TE puis, précipité à nouveau. Un dosage spectrofluorimé
trique au DABA a été réalisé.
41
- Digestion et hybridation d'ADN génomique
Des ADN génomiques (5 yg) de poulets Warren et White Leghorn
(figure 9) ainsi que 3 yg des ADN génomiques de canard, pigeon, poulet
(Warren), souris et humain (figure 10) ont été digérés en concentration de
10 yg/ml avec un excès de trois fois de différentes enzymes de restriction,
pendant 2 à 3 h à 37°C. Les réactions ont été arrêtées avec l'addition
d'EDTA pH 8.0 en concentration finale de 10 mM et chauffage à 65°C/5 min.
Les ADN ont été précipités et digérés à nouveau dans les mêmes conditions
et avec les mêmes enzymes. Il est à noter que ces conditions de digestion
ont été vérifées au préalable avec un contrôle interne de digestion, en
1 'occurence pBR322 (résultat non montré). Les ADN ont ensuite été soumis
à une électrophorèse sur gel d'agarose à 0.5%. La migration sur gel a été
effectuée à 1 V/cm pendant 20 h.
Les hybridations ont été réalisées tel que décrit à la section
2.2.2 avec 10% (concentration finale) de dextran sulfate. On s'est servi
soit d'ADN d'E. coli (figure 9) ou soit d'ADN de sperme de saumon sonifië
(figure 10) comme ADN entraîneur dans les mélanges d'hybridation. Les
lavages des filtres ont été réalisés de la façon décrite à la section 2.2.2
jusqu'à 0.2X SSCPE - 0.1% SDS/65°C (figure 9) ou 0.5X SSCPE - 0.1% SDS/65°C
(figure 10). Les temps d'exposition avec un intensificateur ont été de 3
jours dans le cas des ADN des 2 types de poulets (figure 9) et de 10 jours
dans l'autre cas (figure 10).
- "Dots" pour les ADN génomiques
Les différents ADN ont été déposés en "dots" sur filtre de
nitrocellulose d'après le protocole suivant. L'ADN en solution dans 0.2 M
NaOH est chauffé à 100°C/5 min puis refroidi à 0°C. Un volume égal
d‘acétate d'ammonium 2.4 M est ajouté et le mélange est placé à nouveau à
100°C pendant 5 min et est congelé dans un mélange glace sèche - éthanol .
L'ADN est ensuite déposé sur un filtre de nitrocellulose humidifié dans 20X
SSCE et lavé avec 200 yl d1 acétate d'ammonium 1 M. Le filtre est mis à
sécher au four à vide à 80°C/2 h.
42
Ce sont des quantités identiques d'ADN, soit 4 pg, qui ont été
fixées sur nitrocellulose en se servant au besoin d'ADN simple brin du
phage Ml3mp8 de séquence connue (dont seulement une séquence de (GGC)g) pour
assurer une fixation quantitative. Cet ADN de Ml3mp8 a été isolé après
infection de E. coli JM103 selon le protocole de Zinder et Bueke (1982)
auquel on a ajouté un traitement à la DNAse (0.1 pg DNAse/pg ADN/15 min. à
temp, ambiante) sur la solution de virions afin d'éliminer s'il y a lieu
1'ADN chromosomique bactérien.
Les insertions de pCHV2.5B/H et pCHVIIl.8H/B utilisées comme
standards pour évaluer le nombre de copies de (GGC)n ont été purifiées
2 fois sur gel d'agarose à faible point de fusion. Les sondes utilisées
sont des fragments Hhal des insertions de pCHV2.5B/H (180 pb) et p541 (183 pb)
et marqués par "nick-transiation". La pré-hybridation, 1‘hybridation et
les lavages des filtres jusqu'à 0.2X SSCE - 0.1% SDS/65°C ont été réalisés
tel que décrit auparavant (section 2.2.2) sauf qu'on a utilisé du SSCE au
lieu du SSCPE et que du poly (G) (50 pg/ml) et du dextran sulfate (10% en
conc. finale) ont été ajoutés aux mélanges. En outre, on s'est servi soit
d'ADN de sperme de saumon (figure 11 A) ou soit d'ADN de salmonelle (S. thy-
phimurium) (figure 11B) sonifië comme ADN entraîneur dans les mélanges d'hybridation. On a utilisé 2 X 10® cpm/ml de chacune des sondes.
Après autoradiographie, les filtres ont été découpés en
rondelles et comptés par scintillation. Le calcul du nombre de copies de
(GGC)n (où n > 3) dans chacun des génomes étudiés a été fait de la façon
suivante. Les valeurs des cpms nets obtenus pour les différents ADN ont
été corrigées pour le bruit de fond provenant de 1'ADN de Ml3mp8. On a
ensuite déterminé le nombre de copies correspondantes pour chacune des
sondes d'après les valeurs des standards de copies. S'il y a lieu, la
contribution de pCHV2.5B/H (gêne de H5) a été soustraite du signal prove
nant du p541 afin de nous donner la valeur du signal due aux (GGC)n>g . On
a également tenu compte dans les calculs de la disparité dans la taille des génomes étudiés (Shapiro, 1976): E. coli (6.4 X 10® pb), S. thyphimurium
(1 X 107 pb), pigeon (0.9 X 10^ pb), poulet (1.3 X 10^ pb), souris et
g ghumain (3 X 10 pb), saumon (6 X 10 pb). Finalement, c'est la moyenne des
43
résultats pour les différentes quantités d'ADN pour un génome qui est
donnée au tableau 2.
- Recherche de séquences (GGC)n dans la littérature
On a utilisé les programmes d'analyse de séquence par ordina
teur décrits à la section 2.2.2. Pour chercher des séquences porteuses
d'au moins 3 répétitions consécutives de (GGC) chez la souris, l'humain, le
canard et le poulet, c'est le programme FIND qui a été utilisé dans les
deux librairies ("GenBank", EMBL). De façon complémentaire, on a recherché
des (GGC)n dans les séquences récemment parues dans la littérature et ab
sentes de ces librairies.
- Calculs statistiques
On a calculé la probabilité de retrouver un nombre donné de
répétitions consécutives de (GGC) dans le génome haploïde de poulet d'après
sa taille qui est de 1.3 x 109 pb (Shapiro, 1976, p. 300) et sa composition
en guanines (23.7%) et en cytosines (20.3%) (Shapiro, 1976, p. 269). On a
fait le calcul suivant:
où
(G X G X C)n
3
G: fréquence en guanines dans le génome
C: fréquence en cytosines dans le génome
n : nombre de répétitions en tandem du motif (GGC)
3: constante qui tient compte de l'ordre dans 1'arrangement des 2 G et 1C puisqu'il y a une chance sur trois de retrouver le motif (GGC) en appariant au hasard 2 G et 1C.
On a ensuite multiplié la fréquence obtenue par la taille du
génome afin d'obtenir le nombre de répétitions espérées dans le génome de
poulet.
3.3 Résultats
3.3.1 Calcul de la probabilité de retrouver au hasard des séquences simples de (GGC)n dans le génome de poulet
Des calculs statistiques ont été effectués dans le but de
connaître la probabilité de retrouver au hasard, dans le génome de poulet,
des répétitions consécutives de (GGC). Ces résultats sont donnés au
tableau 1. Ainsi, on s'aperçoit que la probabilité de retrouver un nombre
de plus en plus grand de (GGC) consécutifs diminue grandement à mesure que
l'on passe de 3 à 6 (GGC). En fait, selon ces chiffres, les chances de
retrouver au hasard la séquence (GGC)5 dans le génome de poulet sont très
faibles.
3.3.2 Détermination du Tm de 1'hybride de 20 pb formé entre le pCHIX0.6H/S et le p541
Dans le but de déterminer les conditions optimales de
détection de l'hybride de 20 pb pouvant se former entre le pCHIX0.6H/S (ou
le pCHVII1.8H/B) et le p541, nous avons déterminé son Tm d'après une courbe
de fusion. C'est ainsi que l'insertion du pCHIX0.6H/S a été fixée sur des
disques de nitrocellulose et hybridée avec celle du p541, marquée aux
extrémités 5' de façon à assurer une mesure quantitative précise des
hybrides. On a lavé ces derniers de la façon habituelle jusqu'à IX SSCPE -
0.1% SDS/65°C puis, on a chauffé de façon graduelle dans 0.1X SSCPE - 0.1%
SDS (voir section 3.2.2 méthodes). La courbe du pourcentage des hybrides
dissociés en fonction de la température a été tracée. Ce qui est
observable à la figure 8 est le résultat de 2 séries de détermination. La
température qui correspond à 50% des hybrides dissociés dans 0.IX SSCPE -
0.1% SDS est de 65.6 t 0.6°C. La détermination du Tm a permis de choisir
des conditions de lavage qui conviennent à 1'observation de ces courts
hybrides de façon à s'assurer de la nature de ce qui est observé. Ainsi,
des conditions de lavage de 0.2X SSCPE - 0.1% SDS/65°C sont assez sévères.
Ce sont d'ailleurs les conditions qui ont été généralement employées pour
la plupart des lavages d'hybrides.
TABLEAU 1
CALCUL DE LA PROBABILITE DE RETROUVER AU HASARD
DES SEQUENCES SIMPLES DE (GGC) DANS LE GENOME DE POULET
Nombre de (GGC)
3
4
5
6
Fréquence espérée
1/(2.04 X 106)
1/(1.78 X 108)
1/(1.56 X 1010)
1/(1.37 X 1012)
Nombre espéré d'après
la taille du génome* *
637
7
0.083
0.00095
*d'après Shapiro, 1976.
46
y 40
TEMPERATURE (°C)
Figure 8. Courbe de fusion de 1'ADN complementaire cloné de H5 (p541) avec l'insertion de pCHIXO.6H/S. Elle a été réalisée dans 0.1X SSCPE-
0.1% SDS.
47
3.3.3 Organisation et réitération des séquences de (GGC)n dans différents génomes
On a d'abord voulu démontrer clairement le caractère non répé
titif de l'insertion du pCHIX0.6H/S dans le génome de poulet, utilisée par
la suite avec celle du p541 pour des hybridations différentielles avec
plusieurs ADN génomiques. On se rappellera en ce qui a trait au p541 que
le gène de H5 est unique.
La figure 9 illustre les résultats obtenus après digestion des
ADN génomiques de poulets (Warren, White Leghorn) avec plusieurs enzymes
de restriction (EcoRI, Hindi II, BamHI, Hindi 11+EcoRI, BamHI+EcoRI), hybri
dation avec 1'insertion du pCHIX0.6H/S et lavage des hybrides à 0.2X SSCPE
- 0.1% SDS/65°C. Les tailles des fragments positifs attendus selon la
carte de restriction de XCHIX (figure IB) sont les suivantes: 9.3 kb
(EcoRI), 5.1 kb (HindiII), 9.8 kb (BamHI), 4.1 kb (Hindi11 - EcoRI) et
6.4 kb (BamHI - EcoRI). Sur 1'autoradiogramme présenté à la figure 9B, des
bandes de forte intensité correspondent effectivement à celles qui sont
attendues, sauf dans le cas de 1'ADN du poulet White Leghorn digéré avec
EcoRI, HindlII+EcoRI et BamHI+EcoRI (canaux a', d', e'). Ces différences
pour le poulet White Leghorn illustrent un polymorphisme pour le site
EcoRI. Ces résultats suggèrent donc qu'il y aurait une copie de l'inser
tion de pCHIX0.6H/S dans le génome haploïde de poulet.
D'autre part, on remarque sur la même figure qu'il y a un pa
tron de bandes de plus faible intensité, indiquant l'existence de séquences
ayant des homologies partielles avec le pCHIX0.6H/S. Ces bandes pourraient
provenir des séquences de (GGC)n et seront mieux identifiables par les
hybridations différentielles réalisées ci-après. En outre, dans tous les
canaux, il y a des bandes de forte intensité dans les hauts poids molécu
laires. On ne pense pas qu'elles soient dues à des digestions incomplètes
mais elles pourraient plutôt provenir de séquences (GGC)n dans des régions
du génome où il n'existe que très peu de sites pour les enzymes de restric
tion utilisées. Ces fragments de hauts poids moléculaires ne seraient pas
bien résolus dans les conditions d'électrophorèse employées.
aa'bb'cc'dd'ee'm a a' b b' c c'd d' e e
A B
Figure 9. Organisation de l'insertion de pCHIX0.6H/S dans le génome de poulet. A) Coloration au bromure d'éthidium des fragments d'ADN séparés par électrophorèse sur gel d1agarose à 0.5%. 5 yg d'ADN génomiquede poulets Warren (a) â (e) et White Leghorn (a') à (e') digérés respectivement avec EcoRI, HindlII, BamHI, HindlII+EcoRI, BamHI+EcoRI. B) Autoradiogramme du transfert du gel montré en (A) hybridé avec l'insertion de pCHIXO.6H/S marquée par "nick-translation". (m) marqueurs de migration ADN de X digéré avec Hindl11 et xdVl digéré avec Hael11; la longueur des fragments est donnée en kb.
-P»00
49
Par la suite, les ADN génomiques de plusieurs espèces à
savoir, de canard, de pigeon, de poulet (Warren), de souris et de l'humain
ont été digérés avec les enzymes de restriction EcoRI et HindiII puis
hybridés de façon différentielle avec les insertions du pCHIX0.6H/S et du
p541 (figure 10). Sur les deux autoradiogrammes obtenus, on observe un
patron de bandes communes qui identifie des fragments d'ADN porteurs de
séquences simples de (GGC)n tel que discuté au chapitre précédent (comparer
les canaux correspondants, figure 10B, B'). On voit qu'il y a, outre le
poulet, présence de ces séquences dans tous les génomes étudiés et qu'en
outre, elles ont une fréquence de réitération faible d'après le petit nom
bre de bandes discrètes obtenues.
Les autoradiogrammes présentés à la figure 10 sont issus de
l'exposition des filtres lavés à 0.5X SSCPE - 0.1% SDS/65°C. Des lavages à
0.2X SSCPE - 0.1% SDS/65°C ont également été réalisés avec ces memes fil
tres. On obtient alors le même patron de bandes communes (résultat non
montré), ce qui signifie que les bandes observées à 0.5X SSCPE proviennent
d'hybrides spécifiques aux sondes.
Certaines des bandes positives aux 2 sondes sont beaucoup plus
intenses que d'autres. On en retrouve des exemples chez l'humain. On peut
ainsi envisager qu'il y ait soit plus d'un fragment de même taille porteur
de (GGC)n ou soit plusieurs de ces séquences présentes dans le même frag
ment. Les résultats obtenus ne permettent pas de choisir l'une ou l'autre
de ces possibilités.
abcdefgh
A B B'
Figure 10. Organisation des séquences simples de (GGC)n dans différents génomes. A) Coloration au bromure d'éthidium des fragments d'ADN séparés par électrophorèse sur gel d'agarose à o.5%. 3 yg d'ADN génomique de
a canard, b pigeon, (c) poulet (Warren), (e) souris, (g) humain digérés avec HindlII; (d) poulet (Warren), (f) souris, (h) humain digérés avec EcoRI. B,B') Autoradiogrammes des transferts de 2 gels identiques à (A) hybridés avec les insertions de pCHIX0.6H/S (B) et p541 (B') marquées par "nick-translati on", (m) marqueurs de migration ADN de A digéré avec HindlII et AdVl digéré avec HaelII; la longueur des fragments est donnée en kb.
U1o
51
3.3.4 Quantification des séquences de (GGC)n dans différents génomes
Afin de mesurer plus précisément le nombre de séquences de
(GGC)n dans différents génomes, on a effectué des hybridations sur des
"dots" d'ADN génomiques. Comme sondes, on a utilisé les insertions de
pCHV2.5B/H et de p541 coupées avec Hhal, ce qui donne dans leurs portions
5' des fragments respectifs de 180 et 183 pb. La différence de taille
entre les deux fragments est due à la présence dans 1'ADN complémentaire
(p541) d'une séquence supplémentaire de 9 pb comprenant (GGC)2 (voir sec
tion 3.3.5) et à 1'existence d'un site Hhal dans le gène (pCHV2.5B/H) à
6 pb en amont du début de 1'ADN complémentaire.
Différentes quantités des ADN génomiques d'E. coli, de salmo
nelle (S_. thyphimurium), de sperme de saumon, de pigeon, de poulet Warren, de
souris et de 1'humain fixés sur filtre de nitrocellulose ont été hybridées
dans les mêmes conditions avec chacune des sondes. Les insertions de
pCHV2.5B/H, qui contient (GGC)g et celle du pCHVIII.8H/B ((GGC)5) ont été
utilisées comme standards d'hybridation.
La figure 11 illustre les résultats obtenus. On observe pour
les ADN génomiques que les signaux d'hybridation sont relativement forts
avec la sonde du p541 alors qu'ils sont très faibles ou inexistants avec
celle du pCHV2.5H/B. Cela signifie donc que les signaux observés avec ce
type d'hybridation différentielle sont dus à des séquences de (GGC)n.
Il faut souligner que la sonde du p541 donne un signal relati
vement fort avec l'insertion du pCHVIII.8H/B où il n'y a que 20 pb homolo
gues, dont (GGC)5, comparativement au pCHV2.5B/H qui lui est presque tota
lement homologue. En outre, la sonde de pCHV2.5B/H n'a que très peu d'af
finité pour l‘insertion de pCHVIII.8H/B d'après les signaux obtenus ; de
fait, il n'y a que 14 pb homologues dont (GGC)g. On peut donc supposer que
les séquences de (GGC)n détectées par ces hybridations comprennent plus que
(GGC)3.
52
pCHV p541 pCHV
a
Ml 3 e <*
pCHV p541
M13 e #
B
p541 pCHV p541
pCHV p541
1 e# 10 e# 100 #
1 #
10 e100 #
pCHV p541 pCHV
1 • # 1
10 S • 10
#30 # • 30
I / I I
pCHVins. pCHVIIins.
- pCHVins.
-pCHVIIins.
Figure 11. Quantification des séquences (GGC) dans différents génomes par hybridation de "dots". 0.2 pg (a), 0.5 pg (b)? 1.0 pg (c), 2.5 pg (d) et4.0 pg (e) des ADN génomiques d'E. coli (E), S_. thyphimurium (St), sperme de saumon (Ss), pigeon (Pi), poulet Warren (Po), souris "(S') et humain (H) ont été hybridés de façon comparative avec les fragments Hhal des insertions de pCHV2.5B/H (pCHV, 180 pb) et p541 (183 pb) marqués par "nick-translation".De l'ADN simple brin de M13mp8 a servi au besoin à compléter à 4 pg d'ADN total et à mesurer le bruit de fond. Les standards d'hybridation sont les insertions de pCHV2.5B/H (pCHVins.) et pCHVII1.8H/B (pCHVIIins.) à 1, 10,30, 60, 100, 200 et 500 copies (calculées par rapport au génome humain).L'ADN entraîneur utilisé dans les mélanges d'hybridation est celui de sDerme de saumon (A) ou de S_. thyphimuri um (B). Le temps d'exposition est de 2 jours avec 2 intensi ficateurs.
53
Afin de les quantifier dans chacun des génomes étudiés d'après
l'intensité des standards d'hybridation, il a fallu tenir compte de la
quantité d'ADN déposée par rapport à la taille du génome. Par exemple,
alors que l'on observe un très fort signal avec 1 yg d'ADN d'E. coli, cela
correspond en fait à 1 copie après correction pour la faible taille de son
génome (facteur de mille par rapport à l'humain). Ces déterminations ap
paraissent au tableau 2.
On constate que tel qu'il était apparu avec les hybridations
des transferts d'ADN génomiques digérés, que la fréquence des séquences de
(GGC)n dans les génomes étudiés est du type faiblement répété. En outre,
il semble y avoir de façon générale une relation entre le nombre de séquen
ces de (GGC)n et la taille du génome qui se traduirait par une augmentation
du nombre de copies avec celui du nombre de paires de bases (tableau 2).
TABLEAU 2
NOMBRE DE COPIES DES SEQUENCES DE (GGC)
DANS DIFFERENTS ORGANISMES
Organisme Taille du génome
haploïde*
Nombre de copies
de (GGC)^
|m o 6.4 X 106 pb
S. thyphimurium 1.0 X 107 pb
pigeon (érythrocytes) 0.9 X 109 pb
poulet (érythrocytes) 1.3 X 109 pb
souris (foie) 3.0 X 109 pb
saumon (sperme) 6.0 X 109 pb
humain (vessie) 3.0 X 109 pb
1
1
64
153
170
272
312
*d'après Shapiro, 1976
55
3.3.5 Identification de gènes ayant des séquences de (GGC)n
On a comparé les séquences de l'insertion de pCHIXO.6H/S et du
fragment Smal - BamHI de pCHVIII.8H/B avec celle d'un allèle du gêne de H5
(Ruiz-Carrillo et col!., 1983). On a alors déterminé que tout comme le
p541, il n'y a homologie qu'au niveau de la séquence simple de (GGC)n dans
la région 5' transcrite mais non traduite de 1'ARN messager. Toutefois, on
a remarqué un nombre différent de trinuclëotides (GGC) dans le gène par
rapport à l'ADN complémentaire cloné. Ainsi, dans le p541 il y a présence
d'une séquence supplémentaire (5'-GGCGGCAGC-3') qui comprend 2 (GGC) (voir
figure 12). Cette différence existe aussi avec la séquence de l'autre
allèle du gène, déterminée par Krieg et col 1 . (1983).
Il y a 14 pb homologues entre les séquences des 2 allèles du
gène de H5 et celles de pCHIX0.6H/S et pCHVIII.8H/B. Fait intéressant,
c'est une population de poulets qui a été utilisée pour la synthèse du p541
alors que la librairie d'ADN génomique dont sont issues les séquences des 2
allèles provient d'un seul individu. Il existe donc du polymorphisme quant
au nombre de (GGC) présents dans la portion transcrite mais non traduite
d'ARN messagers de H5. Il est impossible de dire si 1'individu qui
possède moins de (GGC) consécutifs représente un cas général ou est une
exception.
La recherche de séquences simples formées de (GGC/CCG)n dans
les banques de séquences ("GenBank", EMBL) accessibles par ordinateur ainsi
que dans la littérature a été fructueuse. Ces séquences ont été retrouvées
dans des gênes variés, chez différentes espèces. La figure 12 illustre
des portions de séquences des gènes identifiés comme étant porteurs de
séquences (GGC)n.
Ainsi, la séquence (GGC)4 est présente à la fois dans les
portions 5' -et 3' transcrites mais non traduites de l'ARN messager de H2A.F
(Harvey et col!., 1983) chez le poulet. Elle est située d'une part à
-15 pb du codon d'initiation de la traduction et d'autre part à 127 pb
après le codon de terminai son. La séquence (51-CÀGC-3') borde d'un côté la
PCHIX0.6H/S
p541
pCHVin .8H/B
A T G C G G Cl A G Cl G G C GGC GGC GGC GGC G 6 CIA G ClC TGGACGTTGTGAGC
********************
CAGACGCAGC GGC GGC GGC GGCGGCAGCAGCAGGAGCAGCCCCACA
********************GGGGAGCAGCGGCGGCGGCGGCGGCGCGGACGTCGCGGCGGGGAGG
gêne de H5 C A G A C G C A G C G G C G G C G G C------------------------------A G C A GGAGCAGCCCCACA
ARN-m H2A.Fportion 5' CCGGGGCTCG GGCGGCGGCGGCA CCATGGCAGGTGGGAAGGCTGGG
portion 3' C G C C G C C G T G GGC GGC GGC GGC C A G C|G CTGATTGGCTGAGGTTTCT
gêne 3-actine TTTATGGCGA GGC GGC GGC GGC GGC GGC CCTATAAAAAGCGAAGCG
oncogène des T24 G G G C G T A A G C|G G C GGC GGC GGC GGC GGC GGC GGGTGGGTGGGGCCG
Figure 12. Séquences de (GGC)n dans des gênes et des ADN clonés. Des séquences de (GGC)n sont présentes dans les sous-clones génomiques de poulet pCHIXO.6H/S et pCHVIIl.8H/B; le gêne (Ruiz-Carri11o et col!., 1983) et 11 ADN complémentaire cloné de H5 de poulet (p541, Ruiz-Vazquez et Ruiz-Carrillo, 1982); l'ARN-m de H2A.F de poulet (Harvey et col!., 1983); le gêne de 3-actine de poulet (Kost et col!., 1983); 1'oncogène des cellules T24 de carcinome de vessie humaine (Reddy , 1983). Le trait souligné illustre les répétitions consécutives de (GGC). Le symbole (*) démontre les homologies entre pCHIXO.6H/S, pCHVIIl.8H/B et le p541. Les triplets (AGC) en bordure des séquences simples sont encadrés. Sauf pour pCHIXO.6H/S et pCHVIIl.8H/B de nature inconnue, ce sont les séquences 51-3' correspondant aux brins non codants pour les gènes ou homologue à 1'ARN-m dans le cas du p541 qui sont données.
57
séquence (GGC)4 présente dans la partie 3' transcrite mais non traduite
alors qu'il n'y a aucun (AGC) en bordure de la séquence simple dans la
partie 5'.
Dans la partie 5' non transcrite du gène de g-actine cytoplas
mique chez le poulet, la séquence (GGC)g (Kost et col! ., 1983) est située
dans la région comprise entre les séquences consensus de types "CCAAT"
(Benoist et col!., 1980; Efstradiatis et col! ., 1980) et "TATA" (Goldberg,
1979). Cette séquence n'est bordée d'aucun (AGC). D'autre part les au
teurs, Kost et collaborateurs, ont comparé cette région avec son homologue
chez le rat. Il appert que cette séquence n'est pas présente chez ce der
nier: on ne retrouve que 2 triplets (GGC) séparés l'un de l'autre par 6
nucléotides.
L'oncogène des cellules 124 d'un carcinome de la vessie
chez l'humain a récemment été séquencé (Reddy, 1983). A 989 pb en
amont du début de la traduction, il y a la séquence (GGC)y encadrée d'un
triplet (AGC) du côté 5'. Cette séquence est située dans une région impor
tante pour l'activité transformante de l'oncogène puisque lorsqu'une délé
tion d'un segment de 305 pb comprenant cette séquence est effectuée,
1'activité transformante de 1'oncogène diminue fortement (Reddy, 1983).
En outre, dans le gêne normal c-has/bas, le triplet (AGC) en bordure
est absent et il n'y a que 5 des 7 (GGC). Ce cas illustre une fois de plus,
le potentiel de variabilité de ces séquences.
Des gènes contenant des séquences (GGC)3 ont aussi été trou
vés. Dans beaucoup de cas, c'est dans leurs parties codantes qu'elles ont
été trouvées, la pression sélective étant plus forte pour les conserver.
D'autre part, on a vu que du seul point de vue statistique, on a beaucoup
plus de chances de trouver des séquences (GGC)3 que (GGC)5 par exemple
(voir tableau 1). On a donc choisi de ne pas les inclure dans notre analy
se de la localisation des séquences simples de (GGC)n.
58
3.4 Discussion
On a d'abord effectué des calculs statistiques afin de connaî
tre les chances d'obtenir au hasard des séquences simples de (GGC)n. On a
alors vu que statistiquement, il n'existait à peu près pas de chance de
retrouver une séquence (GGC)g dans le génome de poulet. Pourtant, on en a
trouvé deux: une dans pCHIX0.6H/S et l'autre dans le gène de e-actine. On
voit donc qu'il y a nettement un biais dans 1'arrangement des nucléotides
dans le génome qui ne peut pas être traduit statistiquement de la même ma
nière que le lancement des dés.
La valeur de 65.6 ± 0.6°C dans 0.1X SSCPE - 0.1% SDS du point
de fusion de l'hybride de 20 pb pouvant se former entre le pCHIXO.6H/S et
le p541 est relativement élevée pour un hybride si court. Cela est sans
doute dû au fait qu'il est composé à 95% en bases G+C, augmentant ainsi sa
stabilité. De fait, dans la littérature Roberts et collaborateurs (1983)
ont rapporté 1'identification d'un court hybride de 15 pb entre une sonde
couvrant une portion 5' adjacente du gène de 6-globine de souris et un pe
tit ARN de 4.5S, également chez la souris. L'hybride formé qui possédait
une composition en G+C de 60% a été identifié par 1'hybridation d'un trans
fert d'ARN avec lavage dans 0.IX SSC - 0.1% SDS entre 40 et 50°C. Cela
illustre donc que l'on peut détecter de courtes homologies dans des condi
tions appropriées. Dans ce cas, les conditions de lavage sont moins as
tringentes car la composition en G+C est beaucoup plus faible.
Cette mesure du Tm a permis de déterminer des conditions
strictes, en quelque sorte un seuil pour observer les hybrides dus aux
séquences de (GGC)n. Sans doute, que de cette façon on élimine un certain
nombre de séquences possédant moins d'homologie avec les sondes mais fai
sant tout de meme partie de la famille des (GGC)n. Une illustration de
cela est donnée par l'existence d'un grand nombre de signaux plus faibles
(type C) obtenus lors du criblage initial de la librairie d'ADN génomique
avec le p541 dans des conditions moins sévères (chapitre 2).
59
Pour mesurer le nombre de répétitions de (GGC)n dans diffé
rents génomes, on a utilisé le principe des hybridations différentielles
avec le pCHIX0.6H/S (ou le pCHVIII.8H/B) et le p541 en sachant que la seule
région d'homologie entre ces sondes résidait au niveau des (GGC)n. Cela
permettait donc de s'assurer de la nature de ce qui était observé.
Dans un premier temps, on a démontré par les hybridations sur
des transferts d'ADN génomiques digérés avec différentes enzymes de res
triction que les séquences de (GGC) étaient faiblement répétées dans dif
férents génomes. On a par la suite constaté que ce taux de répétition chez
les espèces supérieures étudiées (saumon, pigeon, poulet, souris, humain)
variait autour de quelques centaines de copies seulement. Pour le poulet,
cela corrobore 1'estimation du nombre de répétitions des séquences de
(GGC) , du type de celles portées par les clones de type B, tel que discuté
au chapitre 2. D'autre part, il semble y avoir une corrélation entre la
taille du génome étudié et le nombre de séquences simples trouvées (d'après
le tableau 2).
Dans la littérature, les travaux de Tautz et Renz (1984) ont
fait état de séquences simples, présentes dans le génome de drosophile
(D. virilis) et conservées au cours de 1 'évolution. Les auteurs se sont
servis d'ARN poly A+ de glandes salivaires de D. virilis pour cribler des
librairies d'ADN génomique de cette même espèce. Pour 5 des clones posi
tifs lors du criblage et de nature inconnue, ils ont déterminé par séquence
que 1'homologie était due à différents types de séquences simples de compo
sition et de longueur variées qui étaient présentes dans ces clones ((CA)n,
(TA)n, (CAA)n, (CT)n, (AA)n, (TG)n). Par la suite, en hybridant des "dots"
d'ADN génomiques de levure, de blé, d'oursin de mer, de Xenopus et de
1‘humain avec plusieurs sondes d'oligodësoxyribonucléotides de séquences
simples (GT/CA, GA/CT, AA/TT, GG/CC, AT/TA, GC/CG, CAG/GTC), ils ont trouvé
que les ADN de tous les eucaryotes étudiés donnaient un signal sauf ceux
du blé et de la levure avec (GC/CG)n. On voit donc que ces types de
séquences simples sont répandus dans une variété d'organismes qui sont fort
éloignés du point de vue évolutif, ce qui pourrait être aussi le cas pour
les (GGC)n.
60
Il apparaît fort intéressant d'examiner la localisation des
séquences (GGC)n afin de tenter d'expliquer leur génération et leur main
tien dans différents génomes. Elles ont été trouvées dans le voisinage ou
à 1'intérieur de plusieurs gènes. Ainsi, des séquences (GGC)n sont présen
tes dans des parties transcrites mais non traduites d'ARN messagers (H5,
H2A.F) et dans des segments importants pour la promotion de 1‘expression
génique (oncogène des T24, g-actine). La localisation variée de ces sé
quences pourrait illustrer un éventail de rôles biologiques possibles. Cet
aspect sera davantage discuté au chapitre 5.
Dans le cas du gène de H5, on constate que le nombre de (GGC)
consécutifs est différent dans le gêne séquencé provenant de 1'ADN d'un
individu par rapport à 1‘ADN complémentaire synthétisé à partir d'un mélan
ge d'ARN d'une population de poulets. Le fait qu'un individu ait moins de
(GGC), 3 au lieu de 5, suggère que 1'intégrité de la séquence (GGC)5 n'est
pas essentielle pour la transcription du gêne. On ne peut cependant pas
exclure totalement la possibilité d'un effet quelconque sur la transcrip
tion puisque 3 des (GGC) demeurent chez cet individu. De la même façon,
bien que la séquence (GGC)5 du gène g-actine de poulet soit absente dans la
région homologue de ce gêne chez le rat, on ne peut pas exclure la possibi
lité que cette séquence puisse jouer un rôle chez le poulet.
Le polymorphisme rencontré au niveau du nombre de (GGC) dans
le gène de H5 et de l'oncogène des cellules T24 par rapport au gène normal
aide à suggérer un mécanisme pour la génération de ces séquences. Un
mauvais appariement suivi d'un glissement des nucléotides ("slipped
mispairing") sur le brin à copier, avant le passage de 1'ADN polymérase est
un mécanisme qui vaut la peine d'être retenu; cela se produirait lors de la
réplication. Il a été proposé pour la première fois par Streisinger et
col!. en 1966 pour expliquer des mutations dans le cadre de lecture du gène
du lysozyme de phages T4. De plus, il apparaît tel que démontré par
Farabaugh et collaborateurs (1978) et par Galas (1978), que dans le gène
lad, il existe des sites sensibles ("hot spots") qui subissent des
mutations plus rapidement que d'autres. Dans les procaryotes où ces sites
61
ont été clonés et analysés, ils ont été trouvés associés avec des courtes
répétitions directes de nucléotides. Ces insertions peuvent être ampli
fiées (insertion) ou perdues (délétion) à une fréquence élevée. La figure
13 illustre les événements qui se produisent pour engendrer la perte d'une
courte répétition directe selon ce modèle (d'après Moore, 1983).
Chez les eucaryotes, ce mécanisme a été utilisé pour expliquer
1'apparition de délétions à la fois dans des parties codantes et non codan
tes de gènes de globi ne de type & chez l'humain (Efstradiatis et col! .,
1980) ainsi que pour des mutations dans de courts segments des gènes cho
rioniques chez le ver à soie (Jones et Kafatos, 1980, 1982). Dans le cas
des séquences simples, ce mécanisme a également été suggéré à la fois pour
la génération (Tautz et Renz, 1984) et la grande variabilité (Cohen et al.,
1982) des séquences simples. Pour le gène de 1‘histone H5 et 1'oncogène
des cellules T24 par rapport au gène normal, il est impossible de dire si
ce sont des insertions ou des délétions qui se sont produites. Naturelle
ment, afin que la modification soit maintenue, il faut qu'elle s'opère dans
une cellule germinale.
Il faut souligner que le polymorphisme rencontré entre le gêne
de H5 et l'ADN complémentaire cloné, le p541, ne provient pas d'un artefact
de clonage lors de la réplication du plasmide p541 dans la bactérie. En
effet, le produit obtenu pour déterminer le site d'initiation de la trans
cription de 1 'ARN messager de H5 et ce, par la technique d'extension d'une
amorce contenait bien 5 (GGC) (Ruiz-Carrillo et col!., 1983). Pour ce
faire, le même mélange d'ARN ayant servi à la synthèse du p541 a été utili
sé. Cela signifie donc que ce polymorphisme existait bel et bien in vivo.
On a vu la présence de répétitions directes du triplet (AGC)
de chaque côté des séquences simples et ce, dans certains cas (pCHIX0.6H/S,
p541, gêne de H5). Ceci pourrait suggérer un mode de dispersion de ces sé
quences par insertion à la manière des éléments génétiques mobiles puisqu'à
ce moment-là, on observe une duplication de quelques paires de bases
présentes au site d'insertion et ce, sous la forme de répétitions directes
en bordure de la séquence insérée. Cependant, la présence de répétitions
62
D
ék
Figure 13. Modèle pour la génération de délétions à partir d'un mécanisme de glissement et de mauvais appariement lors de la réplication de 1'ADN. RI, R2 représentent de courtes répétitions directes sur un brin d'ADN et RI', R2' les séquences complémentaires sur l'autre brin. A) fourche de réplication. B) les brins se séparent. C) mauvais appariement et glissement des répétitions, ce qui engendre une boucle dont la longueur est fonction de la distance séparant RI et R2. D) excision de la boucle. E) produits de la réplication: un des ADN a perdu RI, RI' et des séquences adjacentes.
63
directes en bordure des séquences simples de (GGC)n n1 est pas une constante
pour toutes les séquences trouvées bien que certaines bases en bordure
aient pu être modifiées suite à des mutations de transition, d'adénine en
guanine. Le fait que ces séquences soient très courtes par rapport à la
taille des éléments génétiques mobiles connus dans la littérature rend
difficile toutefois, de conclure à un mode de dispersion de ces séquences
par insertion.
CHAPITRE 4
TRANSCRIPTION DES SÉQUENCES SIMPLES DE (GGC)
4.1 Introduction
L'identification d'une famille de séquences répétées dans le
génome humain, en 1'occurence la famille Alu (Houck et col!., 1979), a sup
porté les observations antérieures de Jelinek (1977, 1978b) qui démon
traient que les ARN hétérogènes nucléaires des cellules HeLa contenaient
des transcrits d'une famille de séquences répétées. Les membres de la
famille Alu sont fortement représentés dans ces ARN , comprenant de 18 à
25% de leur masse totale (Jelinek et col!., 1978a). Par exemple, des sé
quences de type Alu sont présentes dans des introns des gènes de 1'hormone
de croissance de rat (Page et col! ., 1981) et de l'oncogène humain c-sis
(Dal 1a-Favera et col!., 1981).
Plusieurs gènes ont d'autres types d'éléments répétés dans
leurs introns : la vitellogënine chez Xenopus (Ryffel et col!., 1981, 1983),
la corti cotropi ne £3-1 i potropi ne de boeuf (Watanebe et col!., 1982), l'ovo-
transferrine de poulet (Cochet et col 1 ., 1979) pour n'en nommer que quel
ques-uns. En ce qui a trait à la famille Knpl des séquences longues, répé
tées chez l'humain, la fréquence des transcrits retrouvés dans les ARN
hétérogènes nucléaires est également plus grande que dans 1'ARN cytoplas
mique (Kole et col!., 1983).
Il semble que la plupart des transcrits contenant des éléments
répétés soient restreints au noyau. Cependant, dans quelques espèces, un
petit nombre d'ARN messagers contiennent des éléments répétés. Ainsi, des
ARN messagers matures embryonnaires d'oursin de mer (S. purpuratus) con
tiennent de courts éléments répétés (Costantini et col!., 1980; Carpenter
et col!., 1982). Chez la drosophile (D. melanogaster), une courte séquence
répétée est présente à 1'extrémité de plusieurs ARN messagers différents,
caractéristique qui lui a valu le nom de suffixe (Tchurikov et col!.,
1982). Des ARN messagers contenant des séquences de la famille Alu ont
été retrouvés chez la souris (Georgiev et col 1 ., 1982).
Jusqu'à présent, 1'hypothèse de Britten et Davidson (1969) sur
la régulation de l‘expression des gènes par de courtes séquences répétées
66
disséminées dans le génome n'a pas été démontrée. Dans certains cas, il y
a présence de séquences répétées dans plusieurs ARN messagers exprimés,
puis réprimés au cours du développement (revu par Davidson et Posakony, 1982).
On en retrouve des exemples chez EL discoideum (Kimmel et Firtel, 1979;
Zuker et Lodish, 1981; Chung et co11-, 1983). Il y a aussi des observations
qui vont à 1'encontre de cette hypothèse. Ainsi, Ryffel et col 1. (1981,
1983) ont déterminé 1'existence de différentes séquences répétées dans
6 introns du gêne A-j de la vitellogënine chez Xenopus. Ils ont observé
que ces séquences n'étaient pas présentes dans l'autre gêne Ag, A-j et Ag
étant des produits de duplication d'un gêne ancestral. Selon les auteurs,
ces séquences répétées auraient donc été introduites dans A-| plus tard
au cours de 1'évolution ou auraient divergé rapidement dans ces 2 gênes.
En outre, Ryffel et collaborateurs ont trouvé de ces séquences répétées
dans des unités transcriptionnelles actives en 1'absence d'oestrogène.
Selon eux, cette observation va à 11 encontre d'un modèle de régulation
dans lequel les séquences répétées trouvées dans les introns seraient des
éléments régulateurs impliqués dans 1'expression de la vitellogënine induc
tible par les oestrogènes.
Après avoir identifié plusieurs séquences de (GGC)n dans des
portions transcrites de gènes, nous avons voulu examiner l'état de leur
transcription chez le poulet. Notre étude a porté sur 1'embryon de six
jours dans lequel une grande proportion du génome est exprimée et sur des
érythrocytes immatures où une plus faible partie du génome l'est.
67
4.2 Matériel et méthodes
4.2.1 Matériel
Les embryons de poulets de six jours (poulets à chair issus de
croisements de plusieurs lignées) ont été achetés au Couvoir Dësy
(St-Romuald, P.Q.). L'ARN polysomal, poly A+ ou non d'érythrocytes immatu
res de poulets (White Leghorn) a été fourni par A. Ruiz-Carrillo.
Le chlorure de guanidine ainsi que le thiocyanate de guanidine
proviennent de chez Fluka, la formamide et la formaldéhyde de Bio-Rad, le
Sephadex G-50 fin de chez Pharmacia, l'actinomycine D de Calbiochem,
l'oligo-dT de Miles Laboratories et le poly A de Boëhringer-Mannheim. Les
[a_32p] aï P (2 900 Ci /mmole) et [y-32p] dCTP (800 Ci /mmole) proviennent de
NEN.
Le matériel et les solutions ayant servi à 11 isolement d1 ARN
ont été autoclavés de façon à travailler en 11 absence d'activité RNase.
4.2.2 Méthodes
- Isolement d'ARN total
La purification chez le poulet d'ARN total d'embryons de six
jours ainsi que d'érythrocytes immatures a été réalisée selon un protocole
dérivé principalement de Chirgwin et col 1 .(1979) avec des modifications
mineures d'après Lamers et coll. (1982). Des embryons de six jours sont
prélevés, dêbarassës de la majorité du réseau sanguin extraembryonnaire et
congelés aussitôt dans l'azote liquide. Les globules rouges immatures
proviennent du sang d'un poulet rendu anémique par injection sous-cutanée
d'une solution à 2.5% (p/v) de phénylhydrazine pendant plusieurs jours. La
proportion de globules rouges immatures était égale à celle des matures.
Les érythrocytes sont lavés dans une solution isotonique (0.15 M NaCl - 1 M
Tris-HCl pH 7.4 - 0.005 M EDTA - 0.001 M EGTA) et récoltés par centrifu
gation à 800 g/10 min à 4°C. Les embryons et les globules rouges sont
68
respectivement mis en présence de 10 et 60 vol. de solution froide de 4 M
thiocyanate de guanidine - 0.5% (p/v) sarkosyl - 20 mM EDTA - 0.2 M BME -
50 mM Tris-HCl pH 7.5 et homogénéisés par passages à vitesse moyenne du
piston d'un Potter Elvehjem. Pour diminuer la viscosité, on passe
plusieurs fois le mélange au travers d'une aiguille #18. Par la suite, on
centrifuge à 10 000 g/10 min à 4°C. On ajoute au surnageant contenant les
acides nucléiques 0.025 vol . d'acide acétique 1 N et 0.75 vol. d'éthanol à
95%. La précipitation a lieu durant de 16 à 20 h à -20°C. On recueille
les acides nucléiques par centrifugation à 6 000 g/10 min à 4°C. Le culot
est solubilisé par agitation forte dans 0.5 vol. de solution froide de
7.5 M chlorure de guanidine - 50 mM Tri s-HCl pH 7.5 - 10 mM EDTA - 0.1 M
BME. L'ARN est précipité de façon différentielle avec 0.025 vol. d'acide
acétique 1 N et 0.5 vol. d'éthanol à 95%, 3 h à -20°C. On centrifuge à
6 000 g/10 min et on répète la précipitation différentielle deux autres
fois en diminuant à chaque fois de moitié le volume de la solution de chlo
rure de guanidine. Le culot final est lavé dans un grand volume d'éthanol
à 95% à temp, ambiante pour enlever la guanidine résiduelle. On solubilise
le culot dans 1% SDS - 10 mM Tris-HCl pH 7.5 - 5 mM EDTA et on centrifuge à
10 000 g/10 min à 20°C pour éliminer le matériel insoluble. On extrait
avec 1 vol. de chl oroforme : i sobutanol (4:1) et la phase aqueuse contenant
1‘ARN est finalement précipitée. On dose 1'ARN par la mesure de son
absorption à 260 nm (1 AggQnm = 40 pg ARN/ml). On vérifie s'il y a conta
mination d'ADN par un dosage au DABA. On a généralement moins de 1% d'ADN.
L'intégrité de l'ARN est vérifiée par électrophorèse sur gel d'agarose dans
des conditions dénaturantes.
- Électrophorèse et transfert d'ARN
La chambre à électrophorèse est préalablement traitée par
trempage dans une solution de formaldéhyde à 4% (v/v) afin d'enlever toute
trace d'activité RNAse. Les gels d'agarose sont faits dans le tampon
18 mM NagHPOg. - 2 mM NaHgPO^ pH 7.5 - 6% formaldéhyde. Le tampon de migra
tion a la même composition que le tampon précédent sauf qu'il contient 3%
formaldéhyde. L'échantillon d'ARN est dénaturé dans 6% formaldéhyde - 50%(v/v)
formamide - 18 mM Na^HPO^ - 2 mM NaH^PO^ pH 7.5 à 60°C/5 min (Rave ét al., 1979).
69
On lui ajoute 0.3 vol. de solution de coloration à 50% (v/v) glycërol - 50%
(v/v) formamide - 0.2% (p/v) bleu de bromophênol. L'ARN est visualisé à
l'UV après 45 min de trempage dans une solution de bromure d'éthidium à
1 ug/ml.
Pour le transfert d'ARN sur filtre de nitrocellulose, le gel
est agité dans 1 vol. de 10X SSCPE stérile pendant 20 min. Le montage pour
le transfert est identique à celui pour l'ADN (Southern, 1975) sauf que le
filtre de nitrocellulose est préalablement trempé dans de l'eau stérile et
équilibré dans du 10X SSCPE stérile. Ensuite, le filtre est séché sous une
lampe infra-rouge jusqu'à ce que l'odeur de la formaldéhyde soit disparue.
Finalement, il est chauffé au four à vide à 80°C/2 h pour fixer l'ARN.
- Marquage de l'ARN
Le protocole de marquage des extrémités 5' par la polynuclëo-
tide kinase de T4 est dérivé de celui d'Engel et Dodgson (1978). L'ARN est
d'abord hydrolyse en fragments de 100 à 200 nucléotides (taille vérifiée
par électrophorèse sur gel d'agarose en conditions dénaturantes) par incu
bation à 70°C/10 min dans une solution de 17 mM NaOH. Il est précipité et
repris dans une solution de 30 yl composée de 250 yCi de [y-^p] ATP, du
tampon kinase 58 (Maxam et Gilbert, 1980) et de 20 U de l'enzyme. La réac
tion est faite à 37°C/30 min puis arrêtée en rendant la solution à 10 mM
EDTA pH 8.0. Les molécules marquées sont séparées des nucléotides libres
par passage dans une colonne de Sephadex G-50 fin et élution avec du TE.
On a habituellement une activité spécifique de 3 x 10? cpm/yg ARN. On peut
hydrolyser cet ARN en conditions spécifiques en vue de contrôler pour la
présence éventuelle d'ADN marqué en le plaçant dans 0.15 M NaOH de 16 à
20 h à 37°C.
70
Hybridation des transferts d'ADN et d1 ARN
Les pré-hybridations et les hybridations avec ARN ont été
faites dans 50% formamide - 5X SSCPE - 10X D - 0.1% SDS - 50 y g/ml de
poly A, d'ARN de transfert de E. coli (dans le cas des sondes d1ARN) ou
d'ADN de sperme de saumon sonifié (avec les sondes d'ADN). On a laissé 3 h
(pré-hybridation) et de 16 à 20 h (hybridation) à 42°C. Les pré-hybrida
tions et les hybridations avec les ADN complémentaires ont été réalisées
selon la procédure décrite à la section 2.2.2 sauf qu'on a ajouté aux mé
langes 50 yg/ml de poly A et 10% (conc. finale) de dextran sulfate. Les
filtres ont été lavés jusqu'à 0.2X SSCPE - 0.1% SDS/65°C dans tous les cas.
Après exposition, les sondes ont été enlevées au besoin
par lavage selon la procédure de Thomas (1980). Il faut agiter les fil
tres dans une solution de 5 mM Tris-HCl pH 8.0 - 0.2 mM EDTA - 0.05% (p/v)
sodium pyrophosphate - 0.1X D pendant 1 3 2 h 5 65°C. L'efficacité des
lavages a été contrôlée par exposition des filtres pendant plusieurs
jours. Alors que 1'hybridation d'ARN total d'embryons de poulets hydro
lyse ou non (figure 14B, C) a été faite avec les deux filtres non lavés,
celle d'ARN total de globules rouges immatures hydrolysë ou non (figure
15B, C) a été faite avec les deux filtres lavés 2 fois.
4.3 Résultats
Les ARN totaux provenant d'embryons de 6 jours et d'érythro
cytes immatures de poulets ont été isolés de manière à étudier la trans
cription des séquences provenant des différents clones génomiques caracté
risés jusqu'à présent. Les mêmes quantités d'ADN des clones a 11 » XCHVII
(identique à XXIX), XCHIX, XX et xXIV ont été digérées avec EcoRI♦ Une
quantité équivalente du plasmide pCHVS.SHR coupé avec BamHI, porteur du
gène de H5 et de séquences adjacentes (environ 1 kb en amont et 6.5 kb en
aval; Ruiz-Carrillo, 1984) ainsi que le pCHIX0.6H/S linéarisé avec HindlII
(en quantité 5 fois moindre par erreur) ont été ajoutés. Ces ADN ont été
digérés en duplicata, séparés par électrophorèse et transférés sur 2 fil
tres de nitrocellulose. Ces 2 filtres ont servi à l'hybridation avec les
différentes sondes décrites ci-après (voir section 4.2.2 méthodes). Dans
tous les cas, les lavages ont été réalisés selon la procédure habituelle
jusqu'à 0.2X SSCPE - 0.1% SDS/65°C.
4.3.1 Transcription dans les embryons de poulets de 6 jours
D'abord donnons quelques renseignements sur le développement
embryonnaire du poulet (tirés de Rugh, 1964). Sa durée est de 21 jours. À
6 jours, l'embryon a la majorité de ses organes et il est en voie d'acqué
rir ses systèmes nerveux et olfactif. Il est également reconnaissable
comme un oiseau mais pas encore comme un poulet.
Dans l'embryon, l'hémoglobine peut être détectée dans les cel
lules des ilôts sanguins 35 heures après la fertilisation (Wilt, 1965).
Ces cellules produiront une lignée primitive d'ërythroblastes synthétisant
la g-globine de type embryonnaire. À 6 jours, la plupart d'entre eux
seront devenus des érythrocytes et contiendront 1'histone H5 (Neelin et
col!., 1964). La première série définitive (synthèse de B-globine de type
adulte) n'apparaît dans le compartiment sanguin qu'entre 6 et 7 jours et
leur maturation en érythrocytes inactifs a lieu entre 11 et 13 jours.
72
L1 ARN total des embryons de 6 jours a été marqué au 3%p et
hybridé avec les différents ADN recombinants décrits plus haut. On a
alors observé des signaux d'hybridation dans tous les cas (figure 14B).
Les ADN des clones génomiques donnent des bandes d1intensités comparables
sauf celui de AC H V11 qui donne un signal plus fort. En outre, les bandes
positives sont les mêmes qui avaient été obtenues précédemment pour les
hybridations différentielles avec le p541 et le pCHIX0.6H/S (chap. 2) et
qui démontraient la présence de séquences de (GGC)n. Ainsi, on observe les
bandes de tailles suivantes: 5.5 kb (XII, canal a), 9.7 kb (ACHVII, b),
9.3 kb (xCHIX, c), 3.7 kb ( AX, d) et 4.0, 5.2 kb (XXIV, e). Il est à noter
que 11 ADN de ACHVII (ou XXIX) avait également donné un signal plus fort que
les autres dans le cas de l'hybridation avec le p541 (figure 7, canal e').
Pour le XXIV, seul clone où il y a 2 fragments positifs, ces derniers cor
respondraient à deux régions d'homologie avec les sondes.
En ce qui a trait au pCHIX0.6H/S (figure 14B, g), il donne un
signal dont l'intensité est environ 5 fois moindre que le clone génomique
dont il origine, le xCHIX. Cependant, dans ce cas, il a été déposé par
erreur 5 fois moins de molécules comparativement aux autres ADN . Cela
signifie donc que la région transcrite dans XCHIX serait de dimension voi
sine à celle dans pCHIX0.6H/S.
On observe mieux dans le canal de pCHV8.8HR (figure 14B) après
surexposition de 1'autoradiogramme (résultat non montré), 2 bandes dont
l'une proviendrait du gène de H5 (fragment de 5.7 kb) et l'autre (fragment
de 4.3 kb) correspondrait à des séquences hautement répétées, situées en
aval du gène et présentes dans des transcrits nucléaires (M. Affolter, com
munication personnelle). Ce résultat est attendu car Col man et collabora
teurs (1983) ont déjà détecté l'ARN messager de H5 dans des embryons de
poulets de 6 jours.
Les hybrides observés sont spécifiques à l'ARN puisqu'après
hydrolyse de la sonde d'ARN en conditions douces (de manière à laisser in
tact un éventuel ADN) et hybridation, on n'a détecté aucun fragment positif
(figure 14C).
a b c d e f gabcdefgm a b c d e f g
A B C
Figure 14. Transcription dans les embryons de poulets de 6 jours. A) Coloration au bromure d'éthidium des fragments d'ADN séparés par électrophorèse sur gel d1agarose à 0.5%. (a) â (e) 1.5 yg d'ADN de Ail,ACHVII, ACHIX, AX, AXIV digérés avec EcoRI. (f) 0.3 yg d'ADN de pCHV8.8HR digéré avec BamHI. (g) 20 ngd'ADN de pCHIXO.6H/S linéarisé avec HindlII. B,C) Autoradiogrammes des transferts de 2 gels identiques à (A) hybridés avec TARN total marqué au 32P (B) et la même quantité hydrolysée (C) (15 X 106 cpm; filtres non lavés). Les temps d'exposition avec 1 intensificateur sont de 18 jours. Les flèches indiquent la position sur le gel des bandes correspondantes ayant hybridé avec les sondes, (m) marqueurs de migration ADN de A digéré avec Hindl11 et AdVl digéré avec HaeIII; la longueur des fragments est donnée en kb.
CO
74
4.3.2 Transcription dans 1 es érythrocytes immatures de poulet
L1 ARN total isolé de globules rouges immatures et marqué au
32p a à son tour été hybridé avec les différents ADN recombinants. Le but
était de voir si les homologies avec des transcrits provenant de 1'embryon
de 6 jours sont également présentes pour des cellules dont la différentia
tion est en voie de parachèvement et par conséquent où moins de gènes sont
exprimés. Le résultat est montré 3 la figure 15B. On a obtenu une réponse
comparable à 1'embryon sauf dans le cas de pCHVS.SHR (canal f) où seulement
les transcrits du gène de H5 sont détectés sur 1'autoradiogramme montré. Le
contrôle pour la présence d'ADN dans la sonde d'ARN, réalisé tel que décrit
à la section précédente, est également négatif (figure 15C).
On a voulu par la suite tenter d'indenti fier sommairement des
transcrits pouvant contenir des séquences simples de (GGC)n. L'ARN total
des embryons de 6 jours ainsi que 1'ARN total cellulaire, le polysomal et
le polysomal poly A+ d'érythrocytes immatures ont été séparés par électro
phorèse sur gel d'agarose dans des conditions dénaturantes et transférés
sur filtre de nitrocellulose. Ils ont été hybridés avec l'insertion du
pCHVIIl.8H/B puisque précédemment, c'est le àCHVII qui a donné le signal le
plus fort avec les différents types d'ARN totaux. Les hybrides ont été
lavés jusqu'à 0.2X SSCPE - 0.1% SDS/65°C. Après une exposition de 4 jours
avec deux intensi ficateurs, on n'a détecté aucun transcrit avec la sonde
utilisée (résultat non montré). Pour une exposition de 12 jours (figure
16), on distingue dans le canal de l'ARN polysomal poly A+ de globules
rouges immatures (d), une faible bande dont la taille pourrait correspondre
3 l'ARN messager de H5 qui a 1 000 nucléotides (Ruiz-Carrillo et col!.,
1983). Cet ARN provient de poulets White Leghorn qui possèdent la séquence
(GGC)g dans le gène de H5 tel que décrit précédemment. Puisqu'il existe
une homologie de 20 pb entre les 247 pb séquencées de pCHVIIl.8H/B et l'ARN
messager de H5 contenant la séquence (GGC)5, cette homologie est par consé
quent détectable dans la fraction enrichie pour cet ARN en 1'occurence
l'ARN polysomal poly A+ de globules rouges immatures.
a b c d e f g a b c d e f gabcdefgm
2 3.1
9.4 6.6
4.4
2.3
1.7
1.3
0.9
0.5
♦
A B C
Figure 15. Transcription dans les érythrocytes immatures de poulet. A) Coloration au bromure d'éthidium des fragments d'ADN séparés par électrophorèse sur gel d'agarose à 0.5%. (a) à (e) 1.5 yg d'ADN de Ail,XCHVII, xCHIX, XX, XXIV digérés avec EçoRI. (f) 0.3 yg d'ADN de pCHVS.SHR digéré avec BamHI. (g) 20 ng d'ADN de pCHIX0.6H/S linéarisé avec HindlII. B,C) Autoradiogrammes des transferts de 2 gels identiques à (A) hybridés avec l'ARN total marqué au 32p (B) et la même quantité hydrolysée (C) (25 X 10° cpm; filtres préalablement lavés 2 fois). Les temps d'exposition avec 2 intensi ficateurs sont de 12 jours. Les flèches indiquent la position sur le gel des bandes correspondantes ayant hybridé avec les sondes, (m) marqueurs de migration ADN de X digéré avec HindlII et XdVl digéré avec HaellI ; la longueur des fragments est donnée en kb.
"-4
en
76
abed
Figure 16. Hybridation d'un transfert d'ARN d'embryons de 6 jours et d'érythrocytes de poulets avec pCHVIIl.8H/B. 30 yg d'ARN total d'embryonsde 6 jours (a) et d'érythrocytes immatures (b), 30 yg d'ARN polysomal (c) et 6 yg de polysomal poly A+ (d) d'érythrocytes immatures ont été séparés par électrophorèse sur gel d'agarose S 1% dans des conditions dénaturantes, transférés sur filtre de nitrocellulose et hybridés avec l'insertion du pCHVIIl.8H/B marquée par "nick-translati on". L'autoradiogramme montré provient d'une exposition de 12 jours avec 2 intensi ficateurs. La longueur des fragments d'ADN de A digéré avec HindlII et AdVl digéré avec HaelII utilisés comme marqueurs de migration, est donnée en kb.
D'autre part, bien qu'aucune bande définie n'apparaisse pour
1 es autres échantillons, on remarque tout de même un signal étendu (une
traînée), assez important pour l'ARN total d'embryons et d'érythrocytes
immatures (figure 16, canaux a et b). Cela pourrait correspondre à une
population d'ARN hétérogènes nucléaires puisque par rapport à l'ARN total
dans le cas des érythrocytes immatures, ce signal est beaucoup plus faible
pour l'ARN polysomal (c) et absent pour l'ARN poly A+ (d).
4.4 Discussion
Pour l'embryon de 6 jours et les érythrocytes- immatures de
poulets, on a observé une hybridation entre 1 1 ARN total et tous les frag
ments de clones génomiques étudiés contenant des séquences simples de
(GGC)n. On se rappellera que ces séquences ont été identifiées par hybri
dations différentielles avec les sondes de pCHIX0.6H/S et p541 (chapi
tre 2). Puisque les signaux observés ont des intensités comparables, cela
suggère que les homologies des différents ADN vis-à-vis de ces ARN pour
raient être de tailles voisines en supposant que ces derniers soient en
même abondance dans les sondes utilisées. Ces résultats indiquent donc que
les séquences de (GGC)n seraient effectivement transcrites.
Lors de 1'hybridation d'un transfert d'ARN, on n'a détecté
aucune bande définie entre l'ARN total d'embryons de 6 jours et 1'insertion
de p CHVI II.8H/B contenant la séquence (GGC)g. Nous avons vu au chapitre 3
que l'ARN messager de 1'histone H2A.F possédait dans ses parties 5' et 3'
non traduites la séquence (GGC)4. Cet ARN messager qui est polyadënylë a
déjà été identifié par Harvey et collaborateurs (1983) dans des embryons de
poulets de 6 jours. Cependant, 1'homologie avec le pCHVIII.8H/B au niveau
des séquences de (GGC)n n'est que de 12 pb, ce qui n'est pas détectable
dans les conditions de lavage utilisées et ce, sans doute même en présence
d'ARN poly A+.
En réalisant 1'hybridation avec la sonde de (GGC)n sur un
transfert de différentes sortes d'ARN, on a tenté d'identifier la taille
des transcrits mais en vain puisque sauf pour H5, on n'a pu identifier la
taille d'aucun transcrit de (GGC)n. Les signaux observés semblent plutôt
provenir de plusieurs transcrits de tailles différentes et ce, davantage
avec les fractions d'ARN total comparativement aux fractions enrichies.
Ces transcrits hétérogènes pourraient donc être surtout nucléaires sans
exclure la possibilité qu'il y ait en faible abondance, des transcrits dans
le cytoplasme. Quant à leur nature, on peut formuler plusieurs hypothè
ses. Il pourrait s'agir de transcrits de gènes structuraux ou encore de
transcrits quelconques (ex. "sn RNAs") non exportés vers le cytoplasme. On
a d'ailleurs identifié au chapitre 3 plusieurs gènes structuraux porteurs
79
de (GGC)n. Les séquences simples de (GGC)n pourraient entre autres être
transcrites dans les portions excisées des ARN précurseurs. D'autre part,
le fait d1 observer des signaux comparables pour 11 embryon de 6 jours et les
érythrocytes immatures indique qu'il pourrait s'agir d'ARN nécessaires aux
fonctions de maintien dans la cellule et transcrits de façon constitutive.
Les hybridations avec le fragment de restriction contenant le
gène de 1'histone H5 servent en quelque sorte de contrôle pour l'étude de
la transcription. On a vu que les produits de transcription de ce gène
étaient, tel qu'attendu, présents en plus grand nombre dans les érythrocy
tes immatures par rapport à 1'embryon total (figures 14, 15). Cependant,
on peut difficilement se servir de ces signaux pour quantifier les trans
crits contenant des séquences simples de (GGC)n car on ne connaît pas la
taille des homologies détectées.
La transcription des séquences simples de (GGC)n semble suivre
celle de d'autres séquences. Dans la littérature, on a rapporté la trans
cription de séquences simples répandues chez des espèces et des tissus dif
férents. Ainsi, Tautz et Renz (1984) ont noté l'hybridation de polynucléo-
tides synthétiques de (GT/CA)n, (GA/CT)n, (AA/TT)n avec l'ARN total issu de
différents eucaryotes : 1'humain (fibroblastes), Xenopus (foie), Drosophila
(cellules Kc), l'oursin de mer (oeufs non fertilisés), le blé (feuilles
vertes) et la levure. Cependant, ces séquences ne sont pas présentes en
même abondance dans les transcrits. Chez certains organismes, elles sont
fortement répandues dans un large éventail d'ARN totaux alors que dans
d'autres, elles sont présentes dans seulement quelques ARN . Les résultats
d'hybridations de "dots" d'ADN génomiques ont cependant indiqué qu'elles
étaient fortement représentées dans les génomes étudiés. Tautz et Renz ont
suggéré que ces séquences simples puissent être co-transcrites avec des
gênes ou des séquences répétées transcrites. D'autre part, Santoro et
Costanzo (1983) ont quant à eux observé des séquences (GT/CA)n dans l'ARN
poly A+ de foie humain.-
CHAPITRE 5
DISCUSSION GÉNÉRALE
81
Des séquences simples composées du motif (GGC) ont d'abord été
trouvées dans quelques clones génomiques de poulet donnant un signal d1 ho
mologie partielle avec un ADN complémentaire cloné de 1‘histone H5. On a
par la suite déterminé que ces séquences formaient une famille de séquences
faiblement répétées, chez le poulet et d1 autres organismes chez les oi
seaux, les poissons et les mammifères. Quelques gènes ont été identifiés
comme étant porteurs de ce type de séquences, particulièrement dans leurs
portions non codantes pour plus de trois répétitions consécutives des tri-
nucléotides. Par la suite, il s1 est avéré que ces séquences étaient trans
crites, probablement surtout en ARN nucléaires dans l'embryon de 6 jours
et les érythrocytes immatures de poulet. Je ferai ici brièvement quelques
hypothèses sur 1'origine de ces séquences et les rôles qu'elles pourraient
être susceptibles de jouer.
On a vu qu'un mécanisme de mauvais appariement et glissement
des courtes répétitions directes lors de la réplication de 1'ADN pourrait
expliquer la génération du polymorphisme dans le nombre de (GGC) tel que
rencontré dans les cas du gène de H5 et de l'oncogène des cellules T24 (par
rapport au gène normal). On pourrait dire de façon générale que la généra
tion de ces séquences pourrait d'abord être soumise à l'existence préalable
d'au moins 2 répétitions directes de (GGC) puis de l'action de ce mécanis
me. Les chances que ces séquences soient retrouvées dans le génome se
raient fonction de sa taille (les résultats des hybridations des "dots"
d'ADN génomiques semblent en accord avec cette hypothèse) et de sa compo
sition en G+C. A ce propos, il est intéressant de souligner qu'une défi
cience en dinucléotides CpG est commune aux génomes des vertébrés supé
rieurs puisque les cytosines méthylées ont tendance à muter spontanément en
thymines (Bird, 1980). Etant donné que ce dinucléotide fait partie des sé
quences (GGC)n, on pourrait peut-être relier la faible représentation de
ces dernières dans les génomes des vertébrés étudiés avec la faible propor
tion de CpG par rapport aux autres dinucléotides, rendant ainsi la présence
de 2 répétitions directes de (GGC) moins fréquente. Par la suite, le main
tien de ces séquences dépendrait de la sélection naturelle exercée sur
elles. Dans certains cas, elles apporteraient une contribution à l'expres
sion du phénotype et dans d'autres, elles n'auraient aucun rôle en soi dé
pendant de leur localisation dans le génome (séquences adjacentes).
La présence de ces séquences riches en G+C à motif répété
pourrait contribuer à la formation locale de structures particulières dans
11 ADN, inconnues et différentes de la structure B qui est la plus répan
due. D'ailleurs, plusieurs exemples ont été rapportés dans la littérature
où des séquences simples sont sensibles à certaines nuclëases spécifiques
et par conséquent peuvent engendrer des modifications locales dans la
structure de 1'ADN (Hentschel , 1982; Glikin et al., 1983).
Ces structures pourraient également être reconnues lors d'évé
nements de recombinaison génique. Plusieurs exemples de l'implication des
séquences simples dans des mécanismes de conversion ont déjà été cités dans
la littérature (Sures et col!., 1978; SIightom et col!., 1980; Cohen et
col!., 1982). On connaît peu de choses sur la structure que ces séquences
peuvent avoir dans 1'ADN alors qu'on sait par exemple d'après des expérien
ces in vitro, que la structure Z est observée en conditions appropriées
avec des séquences ayant une composition alternée en purines-pyrimidines,
ce sujet, il a été rapporté dans la littérature que de courtes séquences de
8 pb pouvant adopter cette conformation étaient contenues dans des séquen
ces ayant une activité amplificatrice d'un promoteur chez SV-40 (Nordheim
et Rich, 1983). Les auteurs ont ainsi proposé un modèle de régulation
transcriptionnelle impliquant des changements dans la superhëlici té de
T ADN.
Du point de vue de la transcription de ces séquences, il est
étonnant de constater que bien qu'elles soient faiblement répétées dans le
génome de poulet, on a pu détecter des transcrits. On peut se demander si
la présence de ces séquences pourrait affecter 1‘efficacité de la trans
cription d'un gène de par des modifications dans la structure de 1'ADN. On
a vu que ces séquences étaient retrouvées à des positions variées dans des
gènes. On se rappellera qu'il y a présence de la séquence (GGC)5 entre les
séquences consensus de type "CCAAT" et "TATA" dans le gène de g-actine de
poulet et de (GGC)7 dans une portion importante pour 1'activité transfor
mante de l'oncogène des cellules T24 de carcinome de vessie humaine.
Dans le cas du gêne de H5, on ne sait pas si l'efficacité de
la transcription est différente chez l'individu porteur de moins de (GGC)n
(clone génomique) par rapport à la population de poulets dont est issu
11 ADN complémentaire cloné (p541). Il n'en demeure pas moins que ce poly
morphisme dans le nombre de (GGC) n'est pas une mutation léthale.
On peut souligner que chez le poulet deux ARN messagers
d'histones, H5 et H2A.F ont une séquence simple de (GGC)n dans leurs por
tions 5' transcrites mais non traduites. Est-ce que cela signifie un méca
nisme commun de régulation ou Ta t-il déjà signifié par le passé? Il est
à noter que tous deux possèdent de façon exceptionnelle par rapport aux
autres messagers d'hi stones connus, des extrémités 3' polyadënylëes (Harvey
et al, 1983; Ruiz-Carrillo et al., 1983).
Il apparaîtrait simpliste de vouloir à tout prix attribuer ou
non un rôle général à ces séquences. Il semble que le rôle de ces séquen
ces s'il en est, pourrait être fonction de l'endroit où elles se trouvent
et être dévoilé par divers types d'études. Ainsi, des expériences de recons
titution de la chromatine en présence d'oligonucléotides synthétiques, utili
sés seuls ou en association avec des séquences dites "conventionnelles"
seraient un premier type d'approche pour examiner s'il se produit des chan
gements dans la chromatine. En outre, on pourrait poursuivre 1'analyse des
séquences géniques amorcée dans le présent travail afin de déterminer où
elles apparaissent,, si elles sont associées avec des séquences adjacentes
d'un type particulier et si elles ont été conservées chez des gènes homolo
gues de différentes espèces. Au niveau de l'étude directe de la régulation
de l'expression des gênes, on identifierait, par exemple pour H5, les élé
ments régulateurs par des techniques de mutagënêse et d'expression en vi
tro. Nous verrions si ces séquences simples sont impliquées. Il faudrait
également regarder l'état de la méthylation dans les séquences (GGC) iden
tifiées en amont de certains gênes étant donné leur composition riche en
cytosines mëthylabies.
84
Une variété de rôles ont été suggérés pour de nombreux
exemples de séquences simples rapportés dans la littérature. L'intérêt de
ce type de séquences réside dans les répétitions consécutives d'un motif de
quelques paires de bases.
Pour le moment, il reste beaucoup de travail à accomplir pour
justifier 1'existence de ces séquences et par extension du grand nombre de
séquences non géniques des génomes d'eucaryotes. Cela rend le défi
d'autant plus grand pour progresser dans la voie de cette connaissance. Le
présent travail fournit quelques éléments qui espérons-le, pourront
peut-être y contribuer.
LISTE DES RÉFÉRENCES
Adams, J.W., Kaufman, R.E., Kristchmer, P.J., Harrison, M., Nienhuis, A.W.
1980. A family of long reiterated DNA sequences, one copy of which
is next to the human beta globin gene. Nucl. Acids Res.
8: 6113-6128.
Arthur, R.R., Straus, N.A. 1978. DNA-sequence organization in the genome
of the domestic chicken. Can. J. Biochem. 65: 257-263.
Arthur, R.R., Straus, N.A. 1983. DNA sequence organization and
transcription of the chicken genome. Biochim. Biophys. Acta,
741: 171-179.
Benoist, C., O'Hare, K., Breathnach, R., Chambon, P. 1980. The ovalbumin
gene - sequence of putative control regions. Nucl. Acids Res.
8: 127-142.
Benton, W.D., Davis, R.W. 1977. Screening Agt recombinant clones by
hybridization to single plaques in situ. Science, 196: 180-182.
Bird, A.P. 1980. DNA méthylation and the frequency of CpG in animal DNA.
Nucl. Acids Res. 8: 1499-1504.
Bouchard, R.A. 1982. Moderately repetitive DNA in evolution. Int. Rev.
Cytol. 76: 113-193.
Britten, R.J., Kohne, D.E. 1965. Nucleotide sequence repetition in DNA.
Carnegie Inst. Wash. Year Book, 65: 78.
Britten, R.J., Kohne, D.E. 1968. Repeated sequences in DNA. Science,
161: 529-540.
Britten, R.J., Davidson, E.H. 1969. Gene regulation for higher cells: a
theory. Science, 165: 349-358.
86
Britten, R.J., Davidson, E.H. 1971. Repetitive and non repetitive DNA
sequences and a speculation on the origins of evolutionary novelty.
Quant. Rev. Biol . 46: 111-138.
Carpenter, C.D., Bruskin, A.M., Spain, L.M., Eldon, E.D., Klein, W.H.
1982. The 3' untranslated regions of two related mRNAs contain an
element highly repeated in the sea urchin genome. Nucl. Acids Res.
10: 7829-7842.
Chirgwin, J.M., Przybyla, A.E., Mac Donald, R.J., Rutter, W.J. 1979.
Isolation of biologically active ribonucleic acid from sources
enriched in ribonucléase. Biochemistry, 18: 5294-5299.
Chung, S., Zuker, C., Lodish, H.F. 1983. A repetitive and apparently
transposable DNA sequence in Dictyostelium discoideum associated with
developmentally regulated RNAs. Nucl . Acids Res. 11: 4835-4852.
Cochet, M., Gannon, F., Hen, R., Maroteaux, L., Perrin, F., Chambon, P.
1979. Organization and sequence studies of the 17-piece chicken
conalbumin gene. Nature, 282: 567-574.
Cohen, J.B., Effron, K., Rechavi, G., Ben-Neriah, Y., Zakut, R., Givol, D.
1982. Simple DNA sequences in homologous flanking regions near
immunoglobulin Vy genes : a role in gene interaction? Nucl. Acids
Res. 10: 3353-3370.
Colman, A., Krieg, P., Wells, J.R.E. 1983. Analysis of histone H5 and
globin mRNAs in chick-embryo development. Eur. J. Biochem.
131: 551-554.
Costantini, F.D., Britten, R.J., Davidson, E.H. 1980. Message sequences
and short repetitive sequences are interspersed in sea urchin egg
poly(A)+ RNAs. Nature, 287: 111-117.
87
Crain, W.R., Davidson, E.H., Britten, R. J. 1976. Contrasting patterns of
DNA sequence arrangement in Apis mellifera (honeybee) and Musca domes
tica (housefly). Chromosoma, 59: 1-12.
Dalla-Favera, R., Gelmann, E.P., Gallo, R.C., Wong-Staal, 1981. A human
one gene homologous to the transforming gene (v-sis) of simian sar
coma virus. Nature, 292: 31-35.
Davidson, E.H., Galau, G.A., Angerer, R.C., Britten, R.J. 1975. Compa
rative aspects of DNA organization in metazoa. Chromosoma, 51: 253-
259.
Davidson, E.H., Britten, R.J. 1979. Regulation of gene expression:
possible role of repetitive sequences. Science, 204: 1052-1059.
Davidson, E.H., Posakony, J.W. 1982. Repetitive sequences transcripts
in development. Nature, 297: 633-635.
De Jimenez, E.S., Gonzalez, J.L., Dominguez, J.L., Saloma, E.S. 1974.
Caracterization of DNA from differentiated cells. Analysis of the
chicken genomic complexity. Eur. J. Biochem. 45: 25-29.
Denhardt, D.T. 1966. A membrane filter technique for the detection of
complementary DNA. Biochem. Biophys. Res. Commun. 23: 641-646.
Devereux, J., Haeberli, P., Smithies, 0. 1984. A comprehensive set of
sequence analysis programs for the VAX. Nucl. Acids Res.
12: 387-395.
Dodgson, J.B., Strommer, J., Engel, J.D. 1979. Isolation of the chicken
g-globin gene and a linked embryonic e-like globin gene from a
chicken DNA recombinant library. Cell, 17: 879-887.
Doolittle, W.F., Sapienza, C. 1980. Selfish gene, the phenotype para
digm and genome evolution. Nature, 284: 601-603.
88
Dunsmuir, P., Brorein, W.J., Simon, M.A., Rubin, G.M. 1980. Insertion of
the Drosophila transposable element Copia generates a 5 base pair
duplication. Cell, 21: 575-580.
Dybvig, K., Clark, C.D., Aliperti, G., Schlesinger, J. 1983. A chicken
repetitive DNA that is highly sensitive to single-strand specific
endonucleases. Nucl. Acids Res. 11: 8495-8508.
Eden, F.C., Hendrick, J.P. 1978a. Unusual organization of DNA sequences
in the chicken. Biochemistry, 17: 5838-5844.
Eden, F.C., Hendrick, J.P., Gotlieb, S.S. 1978b. Homology of single copy
and repeated sequences in chicken, duck, Japanese quail and ostrich
DNA. Biochemistry, 17: 5113-5121.
Eden, F.C. 1980. A cloned chicken DNA fragment includes two repeated DNA
sequences with remarkably different genomic organization. J. Biol .
Chem. 255: 4854-4863.
Efstradiatis, A., Posakony, J.W., Maniatis, T., Lawn, R.M., O'Connell, C.,
Spritz, R.A., De Riel, J.K., Forget, B.G., Weissman, S.M., Slightom,
J.L., Blech!, A.E., Smithies, 0., Baralle, F.E., Shoulders, C.C.,
Proudfoot, N.J. 1980. The structure and evolution of the human
3-globin gene family. Cell, 21: 653-668.
Engel, J.D., Dodgson, J.B. 1978. Analysis of the adult and embryonic
chicken globin genes in chromosomal DNA. J. Biol . Chem.
253: 8239-8246.
Farabaugh, P.J., Schmeissner, U., Hofer, M., Miller, J.H. 1978. Genetic
studies of the lac repressor. VII. On the molecular nature of
spontaneous hotspots in the lacl gene of Escherichia coli. J. Mol.
Biol ., 126: 847-857.
Fickett, J., Goad, W., Kanehisa, M. 1982. Los Alamos sequence library: A
database and analysis system for nucleic acid sequences, LA-9274-MS,
Los Alamos National Laboratory.
Galas, D.J. 1978. An analysis of sequence repeats in the lad gene of
Escherichia coli. J. Mol. Biol. 126: 858-863.
Gebhard, W., Meitinger, T., Hochtl, J., Zachau, H.G. 1982. A new family
of interspersed repetitive DNA sequences in the mouse genome. J. Mol.
Biol . 157: 453-471.
Gebhard, W., Zachau, H.G. 1983. Simple DNA sequences and dispersed
repetitive elements in the vicinity of mouse immunoglobulin < light
chain genes. J. Mol. Biol. 170: 567-573.
Georgiev, G.P., Kramerov, D.A., Ryskov, A.P., Skryabin, K.G., Lukanidin,
E.M. 1982. Dispersed repetitive sequences in eukaryotic genomes and
their possible biological significance. Cold Spring Harbor Symp.
Quant. Biol. 47: 1109-1121.
Glikin, G.C., Garguilo, G., Rena-Descalzi, 1., Worcel, A. 1983.
Escherichia coli single-strand binding protein stabilizes specific
denatured sites in superhelical DNA. Nature, 303: 770-774.
Goldberg, M. 1979. Ph. D. thesis, Stanford University, Stanford,
Cal i forni a.
Grunstein, M., Hogness, D. 1975. Colony hybridization: a method for the
isolation of cloned DMAs that contain a specific gene. Proc. Nat.
Acad. Sci., U.S.A. 72: 3961-3965.
Hamada, H., Kakunaga, T. 1982. Potential Z-DNA forming sequences are
highly dispersed in the human genome. Nature, 298: 396-398.
Haniford, D.B., Pulleyblank, D.E. 1983. Facile transition of poly
[d(TG)-d(CA)] into a left handed helix in physiological conditions.
Nature, 302: 632-634.
90
Harvey, R.P., Whiting, J.A., Coles, L.S., Krieg, P.A., Wells, J.R.E. 1983.
H2A.F: An extremely variant histone H2A sequence expressed in the
chicken embryo. Proc. Nat. Acad. Sci., U.S.A. 80: 2819-2823.
Hentschel, C. 1982. Homocopolymer sequences in the spacer of sea urchin
histone gene repeat are sensitive to S\ nuclease. Nature,
295: 714-716.
Hess, J.F., Fox, M., Schmid, C., Shen, C.-K.J. 1983. Molecular evolution
of the human adult a-globin-like gene region : Insertion and deletion
of Alu family repeats and non-Alu DNA sequences. Proc. Natl. Acad.
Sci ., U.S.A. 80: 5970-5974.
Houck, C.M., Rinehart, F.P., Schmid, C.W. 1979. A ubiquitous family of
repeated DNA sequences in the human genome. J. Mol. Biol.
132: 289-306.
Jagadeeswaran, P., Forget, B.G., Weissman, S.M. 1981. Short interspersed
repetitive DNA elements in eucaryotes : Transposable DNA elements
generated by reverse transcription of RNA pol III transcripts? Cell,
26: 141-142.
Jelinek, W.R. 1977. Specific nucleotide sequences in HeLa cell inverted
repeated DNA: enrichment for sequences found in double-stranded
regions of heterogeneous nuclear RNA. J. Mol. Biol. 115: 591-601.
Jelinek, W.R., Evans, R., Wilson, M., Salditt-Georgieff, M., Darnel 1, J.E.
1978a. Oligonucleotides in heterogeneous nuclear RNA: similarity of
inverted repeats and RNA from repetitions DNA sites. Biochemistry,
17: 2776-2783.
91
Jelinek, VJ.R. 1978b. Inverted repeated DNA from Chinese hamster ovary
cells studied with cloned DMA fragments. Proc. Nat. Acad. Sci.,
U.S.A. 75: 2679-2683.
Jelinek, W.R., Toomey, T.P., Leinwand, L., Duncan, C.H., Biro, P.A.,
Choudary, P.V., Weissman, S.M., Rubin, C.M., Houck, C.M., Deininger,
P.L., Schmid, C.W. 1980. Ubiquitous, interspersed repeated sequences
in mammalian genomes. Proc. Nat. Acad. Sci., U.S.A. 77: 1398-1402.
Jelinek, W.R. 1982. Repetitive sequences in eukaryotic DNA and their
expression. Ann. Rev. Biochem. 51: 813-844.
Jones, C.W., Kafatos, F.C. 1980. Structure, organization and evolution of
developmentally regulated chorion genes in silkmoth. Cell,
22: 855-867.
Jones, C.W., Kafatos, F.C. 1982. Accepted mutations in a gene family:
evolutionary diversification of duplicated DNA. J. Mol. Evol .
19: 87-103.
Kafatos, F.C., Jones, C.W., Efstradiatis, A. 1979. Determination of
nucleic acid sequence homologies and relative concentrations by a dot
hybridization procedure. Nucl. Acids Res. 7: 1541-1552.
Kapp, L.N., Brown, S.L., Klevecz, R.R. 1974. Detecting small quantities
of DNA on CsCl gradients. Biochim. Biophys. Acta, 361: 140-143.
Kedes, L.H. 1979. Histone genes and histone messengers. Ann. Rev.
Biochem. 48: 837-870.
Kimmel , A.R., Firtel, R.A. 1979. A family of short, interspersed repeat
sequences at the 5' end-of a set of Dictyostelium single-copy mRNAs.
Cell, 16: 787-796.
92
Ko!e, L.B., Haynes, S.R., Jelinek, W.R. 1983. Deserite and heterogeneous
high molecular weight RNAs complementary to a long dispersed repeat
family (a possible transposon) of human DNA. J. Mol. Biol. 165: 257-286.
Kost, T.A., Theodorakis, N., Hughes, S.H. 1983. The nucleotide sequence
of the chick g-actin gene. Nucl. Acids Res. 11: 8287-8301.
Krieg, P.A., Robins, A.J., D'Andrea, R., Wells, J.R.E. 1983. The chicken
H5 is unlinked to core and HI histone genes. Nucl. Acids Res. 11: 619-627.
Earners, W.H., Hanson, R.W., Meisner, H.M. 1982. cAMP stimulates trans
cription of the gene for cytosolic phosphoenolpyruvate carboxykinase
in rat liver nuclei. Proc. Nat. Acad. Sci. U.S.A. 79: 5137-5141.
Lerman, M.I., Thayer, R.E., Singer, M.F. 1983. Kpnl family of long inter
spersed repeated DNA sequences in primates : polymorphism of family
members and evidence for transcription. Proc. Nat. Acad. Sci., U.S.A.
80: 3966-3970.
Levis, R., Dunsmuir, P., Rubin, 6. 1980. Terminal repeats of the
Drosophila transposable element Copia : nucleotide sequence and
genomic organization. Cell, 21: 581-588.
Mande!, M., Higa, A. 1970. Calcium dependent bacteriophage DNA injec
tion. J. Mol. Biol. 53: 154.
Manning, J.E., Schmid, C.W., Davidson, N. 1975. Interspersion of
repetitive and non-repetitive DNA in the Drosophila melanogaster
genome. Cell, 4: 141-155.
Maroteaux, L. Heilig, R., Dupret, D., Mande!, J.L. 1983. Repetitive
satellite-like sequences are present within or upstream from 3 avian
protein coding genes. Nucl. Acids Res, 11: 1227-1243.
Mattoccia, E., Comings, D.E. 1971. Buoyant density and satellite composi
tion of DNA of mouse heterochromatin. Nature New Biol. 229: 175-176.
Maxam, A.M. Gilbert, W. 1977. A new method for sequencing DNA. Proc.
Nat. Acad. Sci., U.S.A. 74: 560-564.
Maxam, A.M., Gilbert, W. 1980. Sequencing end-labeled DNA with
base-specific chemical cleavages. Methods in Enzymology, vol. 65,
pp. 499-560, Grossman, L., Moldave, K., ed., Academic Press, New-York
Miesfeld, R., Krystal, M., Arnheim, N. 1981. A member of a new repeated
sequence family which is conserved throughout eucaryotic evolution is
found between the human <5 and 3 globin genes. Nucl. Acids Res.
9: 5931-5947.
Moore, G.P. 1983. SIipped-mispairing and the evolution of introns.
Trends in Biochemical Sciences, 8: 411-414.
Neel in, J.M., Callahan, P.X., Lamb, D.C., Murray, K. 1964. The hi stones
of chicken erythrocyte nuclei. Can. J. Biochem. 42: 1743-1752.
Nishioka, Y., Leder, P. 1980. Organization and complete sequence of
identical embryonic and plasmacytoma k V-region genes. J. Biol. Chem
255: 3691-3694.
Nordheim, A., Rich, A. 1983. Negatively supercoiled simian virus 40 DNA
contains Z-DNA sequence within transcriptional enhancer sequences.
Nature, 303: 674-679.
0'Farrell, P. 1981. Replacement synthesis method of labeling DNA
fragments. Bethesda Research Labs Focus, 3 (3): 1.
Olofsson, B., Bernardi, G. 1983a. Organization of nucleotide sequences
in the chicken genome. Eur. J. Biochem. 130: 241-245.
Olofsson, B., Bernard!, G. 1983b. The distribution of CR1, an Alu-like
family of interspersed repeats in the chicken genome. Biochim.
Biophys. Acta, 740: 339-341.
Orgel, L.E., Crick, F.H.C. 1980. Selfish DNA: the ultimate parasite.
Nature, 284: 604-607.
94
Page, G.S., Smith, S., Goodman, H.M. 1981. DNA sequence of the rat growth
hormone gene: location of the 5' terminus of the growth hormone mRNA
and identification of an internal transposon-1ike element. Nucl.
Acids Res. 9: 2087-2104.
Rave, N., Crkvenjakov, R., Boedtker, H. 1979. Nucl. Acids Res. 6: 3559-3567.
Reddy, P.E. 1983. Nucleotide sequence analysis of the T24 human bladder
carcinoma oncogene. Science, 220: 1061-1063.
Rigby, P.W.J., Dieckmann, M., Rhodes, C., Berg, P. 1977. Labeling deoxy
ribonucleic acid to high specific activity in vitro by nick-trans
lation with DNA polymerase I. J. Mol. Biol. 113: 237-251.
Rinehart, F.P., Rich, T., Deininger, P.L., Schmid, C.W. 1981. Renatu
ration rate studies of a single family of interspersed repeated
sequences in human deoxyribonucleic acid. Biochemistry, 20: 3003-3010.
Roberts, M.P., FaIvey, E., Calvet, J.P., Pederson, T. 1983. A sequence
related to 4.5S RNA and the B1 family of repeated DNA in the 5' flan
king region of the mouse g-globin gene. J. Mol. Biol. 169: 975-982.
Rugh, R. 1964. Vertebrate embryology, pp. 105-231, Harcourt, Brace &
World Inc., ed., New-York.
Ruiz-Carrillo, A. 1984. The histone H5 gene is flanked by SI hypersensi
tive structures. Nucl. Acids Res. 12: 6473-6492.
Ruiz-Carrillo, A., Affolter, M., Renaud, J. 1983. Genomic organization of
the genes coding for the six main histones of the chicken: complete
sequence of the H5 gene. J. Mol. Biol. 170: 843-859.
Ruiz-Vazquez, R., Ruiz-Carrillo, A. 1982. Construction of chimeric
plasmids containing histone H5 cDNA from hen erythrocyte. DNA
sequence of a fragment derived from the 5' region of H5 mRNA. Nucl.
Acids Res. 10: 2093-2108.
95
Ryffel , G.U., Muellener, D.B., Wyler, T., Wahli, W., Weber, R. 1981.
Transcription of single-copy vitellogenin gene of Xenopus involves
expression of middle repetitive DNA. Nature, 291: 429-431.
Ryffel, G.U., Muellener, D.B., Gerber-Huber, S., Wyler, T., Wahli, W.
1983. Scattering of repetitive DNA sequences in the albumin and
vitellogenin gene loci of Xenopus laevis. Nucl. Acids Res.
11: 7701-7716.
Sanger, F., Coulson, A.R. 1978. The use of thin acrylamide gels for DNA
sequencing. FEBS Lett., 87: 107-110.
Santoro, C., Costanzo, F. 1983. Stretches of alternating poly (T-dG),
with the capacity to form Z-DNA, are present in human liver
transcripts. FEBS Letters, 155: 69-72.
Shapiro, H.S. 1976. Handbook of biochemistry and molecular biology,
vol . 2, 3rd ed., G.D. Fasman, ed., CRC Press, Cleveland, 923 p.
Shimizu, Y. 1983. Hinf family: a novel repeated DNA family of the human
genome. Nature, 302: 587-590.
Singer, M.F. 1982. Highly repeated sequences in mammalian genomes.
Int. Rev. Cytol. 76: 67-111.
Slightom, J.L., Blech!, A.E., Smithies, 0. 1980. Human fetal G and
A -globin genes : complete nucleotide sequences suggest that DNA can
be exchanged between these duplicated genes. Cell, 21: 627-638.
Smith, G.P. 1976. Evolution of repeated DNA sequences by unequal
crossing-over. Science, 191: 528-535.
Smith, H.O., Birnstiel, M.L. 1976. A simple method for DNA restriction
site mapping. Nucl. Acids Res. 3: 2387-2399.
Southern, E.M. 1975. Detection of specific sequences among DNA fragments
separated by gel electrophoresis. J. Mol. Biol. 98: 503-517.
Staden, R. 1977. Sequence data handling by computer. Nucl. Acids Res.
4: 4037-4051.
Staden, R. 1978. Further procedures for sequence analysis by computer.
Nucl. Acids Res. 5: 1013-1015.
Streisinger, G., Okada, Y., Emrich, J., Newton, J., Tsugita, A., Terzaghi,
E., Inouye, M. 1966. Frameshift mutations and the genetic code.
Cold Spring Harbor Symp. Quant. Biol. 31: 77-84.
Stumph, W.E., Kristo, P., Tsai, M.-J., O'Malley, B.W. 1981. A chicken
middle-repetitive DNA sequence which shares homology with mammalian
ubiquitous repeats. Nucl. Acids Res. 9: 5383-5397.
Sures, I., Lowry, J., Kedes, L.H. 1978. The DNA sequence of sea urchin
(S. purpuratus) H2A, H2B and H3 histone coding and spacer regions.
Cell, 15: 1033-1044.
Tashima, M., Calabretta, B., Torelli, G., Scofield, M., Maize! , A.,
Saunders, G. 1981. Presence of a highly repetitive and widely
dispersed DNA sequence in the human genome. Proc. Nat. Acad. Sci.,
U.S.A. 78: 1508-1512.
Tautz, D., Renz, M. 1984. Simple DNA sequences of Drosophi 1 a vinil is
isolated by screening with RNA. J. Mol. Biol. 172: 229-235.
Tchurikov, N.A., Naumova, A.K., Zelentsova, E.S., Georgiev, G.P. 1982. A
cloned unique gene of Drosophila melanogaster contains a repetitive 3
exon whose sequence is present at the 3' ends of many different mRNAs
Cell, 28: 365-373.
97
Thomas, P.S. 1980. Hybridization of denatured RNA and small DNA fragments
transferred to nitrocellulose. Proc. Nat. Acad. Sci., U.S.A.
77: 5201-5205.
Twigg, A.J., Sherratt, D. 1980. Trans-complementable copy-number mutants
of plasmid Col El. Nature, 283: 216-218.
Wahl, G.M., Stern, M., Stark, G.R. 1979. Efficient transfer of large DNA
fragments from agarose gels to diazobenzyloxymethyl-paper and rapid
hybridization by using dextran sulfate. Proc. Nat. Acad. Sci., U.S.A.
76: 3683-3687.
Wang, A.H.J., Quigley, G.J., Kolpak, F.J., Crawford, J.L., van Boom, J.H.,
van der Marel, G., Rich, A. 1979. Molecular structure of a
left-handed double helical DNA fragment at atomic resolution. Nature,
282: 680-686.
Watanebe, Y., Tsukada, T., Notake, M., Nakanishi, S., Numa, S. 1982.
Structural analysis of repetitive DNA sequences in the bovine
corticotropin-g-1ipotropin precursor gene region. Nucl . Acids Res.
10: 1459-1469.
Wells, R.W., Royer, H., Hollenberg, C.P. 1976. Non-Xenopus like DNA
sequence organization in the Chironomus tentans genome. Mol. Gen.
Genet. 147: 45-51.
Wilt, F.H. 1965. Regulation of the initiation of chick embryo hemoglobin
synthesis. J. Mol . Biol. 12: 331-341.
Zinder, N.D. Bueke, J.D. 1982. The filamentous phage (Ff) as vectors for
for recombinant DNA - a review. Gene, 19: 1 - 10.
Zuker, C., Lodish, H.F. 1981. Repetitive DNA sequences cotranscribed with
developmentally regulated Dictyosteliurn discoideum mRNAs. Proc. Nat.
Acad. Sci., U.S.A. 78: 5386-5390.