L / / 6 THÈSE PRÉSENTÉE DU GRADE DE MAÎTRE ES SCIENCES … · POUR L'OBTENTION DU GRADE DE...

FACULTÉ DE MÉDECINE

L

L / / 6THÈSE

PRÉSENTÉE

A L'ÉCOLE DES GRADUÉS

DE L'UNIVERSITÉ LAVAL

POUR L'OBTENTION

DU GRADE DE MAÎTRE ES SCIENCES (M.SC.)

PAR

DIANE LABBÉ

BACHELIÈRE ES SCIENCES

DE L'UNIVERSITÉ LAVAL

CARACTÉRISATION DE SÉQUENCES SIMPLES,

FAIBLEMENT RÉPÉTÉES CHEZ LE POULET

ET D'AUTRES ESPÈCES

JUIN 1985

AVANT-PROPOS

Je voudrais remercier mon directeur de thèse, le Dr. Adolfo

Ruiz-Carrillo pour m'avoir guidée tout au long de ce projet. Sa grande

disponibilité, ses conseils judicieux issus de sa vaste expérience en ont

fait un conseiller précieux.

Je tiens aussi à souligner la contribution de Jean Renaud,

notre assistant de recherche dans le laboratoire, d'une part pour la partie

du travail qu'il a effectuée et ses conseils techniques, ainsi que pour sa

bonne humeur communicative qui a agrémenté mes longues heures d'expéri

mentation .

Un merci également à Mamdouh Mikhail de 1 ' Institut de

Recherches Cliniques de Montréal et au Dr. Paul H. Roy du département de

biochimie de l'Université Laval pour la patience et la disponibilité qu'ils

ont démontré 1 ors de mon apprentissage de l'utilisation des programmes

d'ordinateur pour 1‘analyse des séquences.

Je tiens aussi à remercier Francine Samson qui a fait preuve

de beaucoup de patience et de minutie pour la dactylographie de cette

thèse.

Finalement, je remercie le Conseil de Recherches Médicales du

Canada de m'avoir soutenue financièrement pendant ces deux années.

RESUME

Le présent travail porte sur la caractérisation de séquences

simples, composées des tri nucléotides (GGC). Elles ont d'abord été identi

fiées dans le génome de poulet avec une sonde d'ADN complémentaire cloné de

1'histone H5 de poulet lors du criblage d'une librairie d'ADN génomique.

Plusieurs clones donnant un signal indiquant une homologie partielle avec

cette sonde ont été étudiés. Par la séquence de deux d'entre eux, il a été

établi que de courtes séquences contenant des répétitions consécutives d'un

petit nombre de (GGC) (5 ou 6) en étaient responsables.

L'organisation de ces séquences simples dans le génome a été

étudiée par des hybridations sur de 1'ADN génomique. Il s'avère que ce

type de séquences simples forment une famille de séquences faiblement répé

tées chez le poulet (cent cinquante fois) et également chez toutes les autres

espèces eucaryotiques étudiées à savoir le saumon, le canard, le pigeon, la

souris et l'humain.

Un polymorphisme dans le nombre de (GGC) consécutifs a été

rencontré dans le gêne de 11 histone H5 de poulet par rapport à 1 ‘ADN

complémentaire cloné utilisé comme sonde. Ce polymorphisme ainsi que la

génération proprement dite de ces séquences pourraient être expliqués par

un mécanisme de glissement et de mauvais appariements des répétitions

("slipped mispairing"), lors de la réplication de 1'ADN.

Une étude de la transcription de ce type de séquences a été

réalisée chez l'embryon de six jours et les globules rouges immatures de

poulet. Dans ces cas, ces séquences simples seraient surtout présentes

dans les ARN nucléaires.

Finalement, une recherche par ordinateur dans des banques de

séquences d'ADN a permis l'identification de plusieurs gènes porteurs de

(GGC) , pouvant suggérer une variété de rôles biologiques pour ces séquences.

Dr. Adolfo Ruiz-Carrillo Diane Labbé

TABLE DES MATIÈRES

Page

AVANT-PROPOS .................................................................................................................. i

RÉSUMÉ ............................................................................................................................... ü

TABLE DES MATIÈRES..................................................................................................... i i i

LISTE DES SYMBOLES ET ABRÉVIATIONS.................................................................. vi

LISTE DES TABLEAUX..................................................................................................... vi i i

LISTE DES FIGURES......................................................................................................... ix

CHAPITRE 1 INTRODUCTION GÉNÉRALE................................................................... 1

1.1 Les séquences répétées dans le génome d'eucaryote. . 3

1.1.1 Séquences fortement répétées : ADN satellites. . 31.1.2 Séquences modérément et faiblement répétées,

dispersées dans le génome.......................................... 3

1.1.2.1 Séquences courtes (de type "SINES"). ... 4- Séquences simples ...................................... 4- Famille de séquences Alu.................................. 5- Autres familles ................................................ 6

1.1.2.2 Séquences longues (de type "LINES"). ... 6

1.1.3 Séquences répétées dans le génome de poulet-, . . 7

1.1.4 Rôles proposés ...................................................................... 8

CHAPITRE 2 IDENTIFICATION DE SÉQUENCES SIMPLES CHEZ DESCLONES GÉNOMIQUES AYANT UNE HOMOLOGIE PARTIELLEAVEC UN ADN COMPLÉMENTAIRE CLONÉ DE L'HISTONE H5 . . 11

2.1 Introduction................................................................................... 12

2.2 Matériel et méthodes.................................................................. 13

2.2.1 Matériel............................................................................ 132.2.2 Méthodes............................................................................ 13

- Di gestion de 1'ADN avec des enzymesde restriction............................................. 13

- Séparation de 11 ADN par électrophorèseet préparation de fragments.................. 13

- Transfert de 1 1 ADN..................................... 14- Marquage de 1 'ADN..................................... 14- Hybridation ......................................................... 15

Page

iv

- Criblage de la librairie d'ADNgénomique.............................................................. 15

- Cartographie......................................................... 16- Sous-clonage......................................................... 16- Séquence.................................................................. 17- Analyse de séquence par ordinateur. . . 18

2.3. Résultats............................................................................................ 20

2.3.1 Criblage de la librairie d'ADN génomique depoulet avec 1'ADN complémentaire cloné de H5 . . 20

2.3.2 Cartographie des clones génomiques xCHVIIet XCHIX................................................................................... 21

2.3.3 Détermination des régions d'homologie des clonesXCHVII et xCHIX avec le p541........................................ 21

2.3.4 Séquence des régions d'homologie ................................ 242.3.5 Identification de (GGC)n dans d'autres clones

génomiques............................................................................... 282.3.6 Analyse de séquence.............................................................. 32

2.4 Discussion....................................................................................... 33

CHAPITRE 3 ORGANISATION DES SÉQUENCES SIMPLES DE (GGC)n CHEZLE POULET ET D'AUTRES ORGANISMES ........................................ 35

3.1 Introduction................................................................................... 36


3.3.1 Matériel................................................................................... 393.3.2 Méthodes................................................................................... 39

- Courbe de fusion................................................ 39- Isolement de 11 ADN génomique...................... 40- Digestion et hybridation d'ADN

génomique............................................................. 41- "Dots" pour les ADN génomiques .... 41- Recherche de séquences (GGC)n dans

la littérature..................................................... 43- Calculs statistiques........................................ 43

3.3 Résultats............................................................................................ 44

3.3.1 Calcul de la probabilité de retrouver au hasard des séquences simples de (GGC)n dans le génomede poulet................................................................................... 44

3.3.2 Détermination du Tm de l'hybride de 20 pb forméentre le pCHIX0.6H/S et le p541................................... 44

3.3.3 Organisation et réitération des séquences de(GGC)n dans différents génomes .................................... 47

3.4 Quantification des séquences de (GGC)n dansdifférents génomes .............................................................. 51

3.3.5 Identification de gènes ayant des séquencesde (GGC)n................................................................................... 55

3.4 Discussion....................................................................................... 58

CHAPITRE 4 TRANSCRIPTION DES SÉQUENCES SIMPLES DE (GGC)n• ... 64

4.1 Introduction................................................................................... 65


4.2.1 Matériel................................................................................... 674.2.2 Méthodes.................................................................................... 67

- Isolement d1 ARN total...................................... 67- Electrophorèse et transfert d1 ARN ... 68- Marquage de 1 1 ARN .................. .... . 69- Hybridation des transferts d'ADN

et d'ARN.................................................................. 70

4.3 Résultats. . .................................................. 71

4.3.1 Transcription dans les embryons de pouletsde 6 jours............................................................................... 71

4.3.2 Transcription dans les érythrocytes immaturesde poulet.................................................................................... 74

4.4 Discussion........................................................................................ 78

CHAPITRE 5 DISCUSSION GÉNÉRALE........................................................................ 80

LISTE DES RÉFÉRENCES.................................................................................................... 85

LISTE DES SYMBOLES ET ABRÉVIATIONS

BSA

DTT

2-ME

SDS

DABA

PEG

NP-40

LB

EDTA

EGTA

Tri s

ampr

tets

D

TE

albumine de sérum de boeuf

dithiothréitol

2-mercaptoëthanol

sodium dodécyle sulfate

acide diaminobenzoïque dihydrochlorure

polyéthylène glycol

Noni det P-40

milieu de Luria-Bertani (par litre : 10 g bacto-tryptone, 5 g d'extrait bacto-1evure, 10 g NaCl, pH 7.5)

éthylène diamine tëtraacëtate

1,2-di(2-aminoëthoxy)ëthane-N,N,N',N'tëtra acide acétique

trishydroxymëthylaminomëthane

résistance à l'ampicilline

sensibilité à la tétracycline

solution de Denhardt (IX D = 0.02% BSA - 0.02% Fi col 1 400 -

0.02% polyvinyl pyrrolidone)

tampon 10 mM Tris-HCl pH 7.5 - 0.1 mM EDTA

TBE :

TA

SSCPE :

SSC :

(p/v) :

(v/v) :

"I'm

pb :

kb :

d .1 . :

U :

vol . :

temp. :

tampon 89 mM Tris-HCl pH 8.3 - 89 mM acide borique - 2 mM NagEDTA

tampon 40 mM Tris-HCl pH 7.8 - 20 mM CHgCOONa - 2 mM NagEDTA

solution sodium-citrate-phosphate-EDTA (IX SSCPE = 0.12 M NaCl - 0.015 M citrate de sodium - 1 mM NagEDTA - 0.013 M NagHPOz;., pH 7.4)

solution sodium-citrate(IX SSC = 0.15 M NaCl - 0.015 M citrate de sodium, pH 7.4)

(poids/volume)

(volume/volume)

température de fusion (température où 50% des hybrides sont dissociés)

paire de bases

ki1obase

diamètre interne

Unité enzymatique

volume

température

LISTE DES TABLEAUX

Page

TABLEAU 1 Calcul de la probatilité de retrouver au hasard des séquences simples de (GGC)n dans le génome de poulet............................................................................................ 45

TABLEAU 2 Nombre de copies des séquences de (GGC)n dansdifférents organismes.................................................................. 54

LISTE DES FIGURES

Page

FIGURE 1 Cartes de restriction des insertions des clonesgénomiques xCHVII et xCHIX ................................................... 22

FIGURE 2 Détermination de la région d'homologie des clonesgénomiques a CH VII et xCHIX avec le p541........................... 23

FIGURE 3 Cartes de restriction des sous-clones pCHVIII.8H/Bet pCHIX0.6H/S............................................................................... 25

FIGURE 4 Séquence de 11 insertion de pCHIX0.6H/S............................ 26

FIGURE 5 Séquence de la région de 247 pb de pCHVII1.8H/Bcontenant 11 homologie avec le p541............................... - . 27

FIGURE 6 Détermination de la région d'homologie de xCHVIIavec le pCHIX0.6H/S....................................................................... 29

FIGURE 7 Caractérisation de clones génomiques porteurs deséquences simples de (GGC)n.......................................... 30

FIGURE 8 Courbe de fusion de 1'ADN complémentaire cloné deH5 (p541) avec 1 ‘insertion de pCHIX0.6H/S...................... 46

FIGURE 9 Organisation de l'insertion de pCHIX0.6H/S dans legénome de poulet........................................................................... 48

FIGURE 10 Organisation des séquences simples de (GGC)n dansdifférents génomes ...................................................................... 50

FIGURE 11 Quantification des séquences (GGC)n dans différentsgénomes par hybridation de "dots".......................................... 52

FIGURE 12 Séquences de (GGC)n dans des gènes et desADN clonés.................................................... 56

FIGURE 13 Modèle pour la génération de délétions à partir d'un mécanisme de glissement et de mauvais appariement lors de la réplication de 11 ADN............................................ 62

FIGURE 14 Transcription dans les embryons de poulets de6 jours................................................................................................. 73

FIGURE 15 Transcription dans les érythrocytes immaturesde poulet............................................................................................ 75

FIGURE 16 Hybridation d'un transfert d'ARN d'embryons de 6 jours et d'érythrocytes immatures de poulets avec pCHVI II. 8H/B........................................................................... 76

CHAPITRE 1

INTRODUCTION GÉNÉRALE

2

De façon générale, la taille du génome des organismes, ou la

quantité d'ADN par cellule, augmente avec la complexité de l'échelle évolu

tive. Ainsi, une cellule de mammifère contient-elle plusieurs milliers de

fois plus d'ADN qu'une bactérie. Chez les organismes supérieurs, une très

grande partie de 1'ADN ne code pour aucune protéine ni n'est transcrit en

ARN. Par exemple, chez l'humain, le nombre estimé de gênes, approxima

tivement de 50 000 à 100 000, apparaît trop faible pour rendre compte des

3 x 1q9 pb (cellule haploïde) existant dans son génome. De plus, une grande

partie de 11 ADN du génome des organismes supérieurs apparaît comme une

mosaïque de fragments répétés, quasi identiques à eux-mêmes, jusqu'à des

centaines de milliers de fois. Pourquoi tout cet ADN non codant? Pourquoi

tant de répétitions?

Britten et Kohne (1965, 1968) ont été les premiers à démontrer

1'existence des séquences répétées chez les organismes supérieurs. C'est à

la suite d'expériences portant sur la renaturation de 1'ADN qu'ils furent

menés à cette découverte. Ils constatèrent, contrairement à leurs atten

tes, que les brins dissociés rencontraient leurs partenaires plus rapide

ment dans 1'ADN de vertébré que dans 1'ADN bactérien. Pour expliquer ce

paradoxe, une seule explication semblait plausible. L'hypothèse de 1'exis

tence de séquences répétées fur alors proposée. L'ADN répétitif représente

de 20 à 80% de tout 1'ADN génomique selon 1'espèce considérée.

Grâce aux résultats obtenus suite à 1'utilisation des techni

ques de 1'ADN recombinant en génétique moléculaire, 1'organisation des

séquences d'ADN répétées dans le génome d'eucaryote est aujourd'hui un peu

mieux connue. Aux pages suivantes, un résumé de l'état des connaissances

est proposé.

1.1 Les séquences répétées dans le génome d'eucaryote

On peut classer les séquences répétées d'après leur fréquence

de réitération dans le génome : fortement (1 x 106 et plus), modérément

(— 103 - 105) et faiblement répétées (Britten et Khone, 1968; Jelinek,

1982). Alors que les séquences fortement répétées consistent surtout en

groupements ("clusters") de répétitions, les séquences modérément et fai

blement répétées sont généralement dispersées dans le génome.

1.1.1 Séquences fortement répétées : ADN satellites

Les ADN satellites sont généralement composés de répétitions

en tandem soit de quelques paires de bases (séquences simples) ou soit d'u

nités formées de sous-répétitions constituant des domaines. Lorsque ces

répétitions s'étalent sur de longues distances, cela en fait des séquences

hautement répétées. Elles peuvent l'être un million de fois et plus dans

le génome. On peut alors généralement les récupérer du reste de 11 ADN d'a

près leur séparation caractéristique dans un gradient de densité à l'équi

libre, d'où leur nom de satellites. Ces ADN satellites qui peuvent être

retrouvés à différents endroits dans le génome sont présents chez les plan

tes, les vertébrés et les invertébrés mais ils sont absents chez la levu

re. Quelques-unes de leurs caractéristiques sont 1'association avec l'hë-

térochromatine et la réplication tardive dans la phase S du cycle cellulai

re. Pour expliquer 1'amplification ou la délétion de ces séquences, des

mécanismes de crossing-over inégaux ont été proposés (Smith, 1976).

1.1.2 Séquences modérément et faiblement répétées, dispersées dans le génome

Du point de vue de 1'organisation générale des séquences répé

tées dispersées dans le génome, les études de réassociation de 1‘ADN ont

indiqué qu'il existe surtout deux types contrastants: Xenopus et Droso

phila. Alors que le type Xenopus est caractérisé par un patron de disper

sion des séquences répétées au travers de courtes séquences uniques, le mo

de Drosophila se rencontre dans les génomes où les répétitions se situent

entre de longs segments d'ADN.

Chez Xenopus, la majorité des séquences uniques de 1 à 2 kb de

longueur sont entremêlées de séquences répétées de 0.2 - 0.4 kb. Toute

fois, il y a en minorité des séquences uniques plus longues, de 4 kb ou

plus, entrecoupées de courts éléments répétés et des séquences réitérées de

plus de 1 kb qui n'apparaissent que dans moins de 10% de 1'ADN génomique

(Davidson et al., 1975).

Le génome de Drosophila, au contraire, ne contient pas en

quantité appréciable de courtes séquences répétées alternant avec des sé

quences uniques mais on retrouve plutôt des séquences répétées d'au moins

5.6 kb au travers de séquences uniques de plus de 13 kb (Manning et al.,

1975).

L'arrangement de type Xenopus est retrouvé dans la majorité

des groupes taxonomiques des animaux et des plantes, à la fois chez les

vertébrés et les invertébrés alors que le type Drosophi1 a semble beaucoup

moins répandu.

1.1.2.1 Séquences courtes (de type "SINES")

- Séquences simples

Des séquences simples peuvent être retrouvées dispersées dans

le génome. Le nombre de répétitions en tandem de l'unité de base peut

varier de quelques fois à quelques centaines de fois. Elles se différen

cient alors des ADN satellites. En outre, un même type de séquences sim

ples (c'est-à-dire des séquences composées-de la même unité) peut exister

en plusieurs exemplaires dans le génome. Plusieurs exemples ont été cités

dans la littérature. Il ne sera fait mention ici que de quelques-uns afin

d'illustrer le propos.

Dans la famille multigénique des gènes d'hi stones chez 1'our

sin de mer (S. purpuratus), Sures et collaborateurs (1978) ont trouvé la

séquence (CT/GA)27 dans un "spacer" entre les gènes H2A et Kl.

5

Chez la souris, Nishioka et Leder (1980) ont retrouvé la

séquence (CA)3] dans deux gênes d'immunoglobulines de cellules embryon

naires et de plasmacytomes. Un fragment génique contenant cette séquence a

donné un fort bruit de fond lors de 1'hybridation de transferts d'ADN géno

mique.

Chez l'humain, des séquences simples de (TG)n ont été trouvées

dans des gènes de globi nés foetales (Slightom et al., 1980) ainsi que dans

le gène de 1'actine du muscle cardiaque (Hamada et Kakunaga, 1982). Il y au

rait environ cent mille copies de ce type de séquences dans le génome humain.

- Famille de séquences Alu

Parmi les séquences courtes, modérément répétées et dispersées

dans le génome, les séquences Alu sont sans aucun doute les mieux caracté

risées. Elles ont d'abord été observées par Houck et al. (1979) chez 1'hu

main, qui a un patron de dispersion des séquences répétées dans le génome

du type Xenopus. La famille Alu de l'humain est composée de dimères de 165

et 135 pb qui sont mis en évidence lorsqu'on coupe avec 11 enzyme de res

triction Alu1. Chaque monomère se termine par une séquence de poly (dA) et

contient une séquence semblable à 1'origine de réplication du papovavirus

(Jelinek et al., 1980). De courtes répétitions directes de 9 à 20 pb bor

dent la séquence de 300 pb.

Les séquences Alu sont présentes environ 500 000 fois dans le

génome humain (Houck et al., 1979; Rinehart et al., 1981). Lorsqu'on crible

une librairie d'ADN génomique avec une sonde Alu, environ 95% des phages

hybrident (Tashima et al., 1981), ce qui signifie que les séquences Alu sont

effectivement dispersées parmi les séquences uniques. Elles sont conservées

chez d'autres espèces c'est-à-dire que l'on a pu dériver une séquence consen

sus. On a retrouvé d'autres membres de cette famille entre autres chez les

primates et les rongeurs.

Les séquences Alu sont retrouvées environ dix fois plus dans les

produits de transcription au niveau nucléaire que cytoplasmique (revue de

M. F. Singer, 1982). On retrouve de petits ARNs, c'est le cas du 4.5S

chez la souris et le hamster (Jelinek, 1978b), qui ont de 1'homologie

partielle avec les séquences Alu. On retrouve également chez la souris

des ARN messagers qui contiennent des séquences de type Alu (Georgiev et

al., 1982).

- Autres familles

Beaucoup d'autres types de séquences courtes répétées, se

distinguant de la séquence consensus de la famille Alu, commencent à être

caractérisés. Qu'il suffise de mentionner qu'il existe chez l'humain la

famille Hinf composée d'une unité de 319 pb bordée de répétitions directes

de 1.36 pb et de répétitions inversées de 2 pb. Il existerait un faible

nombre de copies, soit de cinquante à cent par génome haploïde (Shimizu,

1983). Chez la souris, il existe environ cent mille copies de séquences

de type R faite d'une unité de 475 pb. Certaines d'entre elles ont été

identifiées dans le voisinage des gênes d'immunoglobulines (Gebhard et

al., 1982).

1.1.2.2 Séquences longues (de type "LINES")

Il y a des séquences longues et répétées qui ont des proprié

tés analogues aux éléments transposables bactériens. On retrouve ainsi les

éléments Copia chez Drosophila et Ty chez la levure qui ont de 5 à 7 kb de

longueur. Ils sont bordés par des répétitions directes longues de 300 à

600 pb et par des plus courtes, de quelques paires de bases (Levis et al.,

1980; Dunsmuir et al., 1980).

Les familles Kpnl chez les primates et EcoRI chez la souris

regroupent des séquences répétées longues. Les éléments de la famille

Kpnl affichent un polymorphisme de longueur et ont été observés près des

gênes. Quelques-uns d'entre eux sont transcrits (Lerman et al., 1983).

Finalement, un élément d'une famille inconnue de séquences

répétées ayant environ 6.4 kb et réitéré de 3 000 à 5 000 fois dans le

génome humain a été repéré à 3 kb en aval de l'extrémité 3' du gêne de

g-globine humaine (Adams et al., 1980).

7

1.1.3 Séquences répétées dans le génome de poulet

Le génome de poulet contient seulement 10% de séquences

répétées dispersées et 3% d'ADN satellites (Ologsson et Bernardi, 1983a).

Seulement quelques génomes étudiés jusqu'à présent n'ont que si peu de

séquences répétées: Drosophila, Chironomus ainsi que 1'abeille A. mellifera

en sont des exemples (Manning et al., 1975; Wells et al., 1976; Crain

et al., 1976).

Les travaux du groupe de F. Eden (1978a, b) ont finalement

fait la lumière sur des interprétations contradictoires qui avaient été

présentées pour 1'organisation générale des séquences dans le génome de

poulet. De Jimenez et al. (1974) avaient d'abord proposé un mode de dis

persion à courte périodicité. Par la suite, Arthur et Straus (1978) ont

estimé la longueur des éléments répétés à 3.4 kb et ont opté pour une orga

nisation se rapprochant de celle de Drosophila. . Les résultats des études

de réassociation de 1'ADN du groupe de F. Eden démontrèrent qu'environ 40%

du génome consiste en séquences modérément répétées d'au moins 2 kb de lon

gueur au travers de séquences uniques d'environ 4.5 kb. L'autre moitié du

génome comprend des segments d'au moins 17.5 kb qui ne sont interrompus par

aucune séquence répétée. Le génome de poulet contient donc des éléments

caractéristiques de chacun des types extrêmes d'organisation décrits précé

demment à savoir Xenopus et Drosophila. Ces résultats ont d'ailleurs fina

lement été confirmés par Arthur et Straus (1983).

Le clonage d'une fraction d'ADN génomique enrichie en séquen

ces modérément répétées (Eden, 1980) a permis de retrouver dans un clone

deux séquences répétées de longueur et de fréquence de réitération complè

tement différentes. Ainsi, l'une a 1.75 kb alors que l'autre a 2.3 kb de

longueur. Le fait que des séquences répétées soient voisines démontre

qu'en plus d'un mode de dispersion des séquences répétées parmi les séquen

ces uniques, il peut y avoir dispersion au travers de d'autres séquences

répétées ayant des caractéristiques structurales différentes.

8

Plusieurs types de séquences simples répétées ont été retrou

vés au voisinage ou dans les gênes codant pour des protéines de l'oeuf chez

le poulet: ovotransferrine, ovalbumine-X (Maroteaux et al., 1983).

D'autre part, Dybvig et collaborateurs (1983) ont rapporté la séquence

simple (AGAGG)g2 qui est répétée 2 000 fois dans le génome.

De courtes séquences répétées ayant un certain degré d'homolo

gie avec les séquences Alu ont été rapportées et sont appelées CRI (Stumph

et al., 1981). Des représentants de la famille CRI ont été retrouvés dans

le voisinage d'un gêne codant pour 1'ARN Ul et dans celui du gêne de l'o

valbumine. Ces séquences sont formées de 180 pb et le nombre de copies a

été estimé à environ 7 000 (Stumph et al., 1981 ; Olofsson et Bernard!, 1983b),

ce qui correspond à 0.1% du génome. L‘homologie avec la séquence consensus

de la famille Alu des mammifères est de 70% dans certaines régions. Cela

indique qu'au moins quelques portions de séquences existaient avant la

séparation entre les espèces aviaires et de mammifères. Ce niveau d'homo

logie est celui que l'on doit espérer en se basant du point de vue évolutif

(Stumph et al., 1981).

1.1.4 Rôles proposés

Pour les ADN satellites, on pense entre autres qu'ils pour

raient être des composants structuraux des chromosomes, étant donné qu'ils

résident principalement dans leurs portions centromériques et télomériques

(Mattoccia et Comings, 1971).

Plusieurs hypothèses d'un rôle général des séquences répétées

dispersées ont été formulées pour expliquer leur accumulation et leur per

sistance dans le génome d'eucaryote. Ainsi, Britten et Davidson (1969) ont

proposé que les séquences répétées puissent agir comme éléments régulateurs

de l'expression des gênes étant donné leur dispersion à travers le génome.

La quantité d'ADN supplémentaire des organismes supérieurs, par rapport par

exemple aux uni cellulaires, comblerait le besoin d'une régulation spéci

fique. Ils suggèrent également un rôle évolutif aux séquences répétées

comme réservoir de séquences pour créer de nouveaux gênes (Britten et

Davidson, 1971) et un rôle dans la régulation de la maturation spécifique

des ARN précurseurs (Davidson et Britten, 1979).

Les hypothèses d'Orgel et Crick (1980) ainsi que de Doolittle

et Sapienza (1980) proviennent quant à elles d'un point de vue opposé. De

façon globale, ils incluent, outre les séquences répétées, les introns et

les "spacers" dans un modèle d'ADN inutile ("égoïste"). Ils proposent que

la réplication de 1'ADN puisse permettre l'accumulation dans le génome de

séquences qui n'apportent aucune contribution à l'expression du phénotype

mais dont la présence favorise conséquemment 1'accumulation de séquences du

même type. Ces séquences pourraient ou non, être transcrites. Cependant,

en se basant sur les coûts énergétiques, 1‘ADN inutile s1 accumulerait

davantage dans les régions non transcrites du génome que dans celles qui le

sont.

Le modèle de régulation de 1'expression des gênes par les

séquences répétées était basé à 1'époque sur un mode d'organisation des

séquences de type Xenopus. On sait maintenant que ce type d'arrangement

n'est pas unique. Ce modèle dans sa conception originale semble donc être

maintenant devenu inadéquat. Quant à celui de 1'ADN inutile, il apparaît

lui aussi contestable au fur et à mesure que des rôles sont suggérés pour

des séquences qui, à priori ne semblaient apporter aucune contribution à

1'expression du phénotype. D'ailleurs, l'étude des séquences répétées

connaît maintenant un regain d'intérêt justifié par ces indications.

Récemment, Hess et collaborateurs (1983) ont suggéré d'après

leurs résultats que des séquences Alu présentes dans des gênes de type

g - globi ne chez l'humain puissent affecter le processus de conversion de

ces gènes. Plusieurs autres rôles ont été suggérés pour les séquences de

type Alu (revu par Jelinek, 1982; Bouchard, 1982) à savoir la régulation de

la transcription par de petits ARN: nucléaires qui ont des séquences homo

logues à la séquence consensus Alu et un rôle dans la réplication de l'ADN

en tant qu'origines de réplication. D'autre part, selon une hypothèse

intéressante de Jagadeeswaran et collaborateurs (1981), les séquences Alu

pourraient s'insérer au travers des séquences du génome par un mécanisme de

rétro transcription, à la manière des éléments transposables. On sait déjà

que, du fait de leur mobilité, les éléments transposables sont susceptibles

de générer des mutations à leur site d'insertion, pouvant provoquer soit

une perte, soit une augmentation d'activité des gênes adjacents.

10

Dans la littérature, il a été fait mention de plusieurs rôles

possibles pour les séquences simples. Ainsi, dans certains cas, elles

seraient impliquées dans des événements de recombinaison (Sures et al.,

1978; Slightom et al., 1980). Certaines séquences semblent modifier loca

lement la structure de 1'ADN d'après les résultats obtenus avec la nuclëase

SI (Hentschel. 1982; Glikin et al., 1983; Dybvig et al., 1983). Des séquences

simples de (TG)n peuvent, d'après des études réalisées in vitro, adopter

une conformation Z dans 1'ADN (Wang et al., 1979; Haniford et Pulleyblank,

1983), nettement différente de la conformation B qui est la plus répandue.

Il ne fait donc aucun doute, compte tenu de l'état des connais

sances actuelles, que l'étude des séquences répétées soit d'un intérêt

certain. C'est d'ailleurs ce qui nous a motivés à réaliser le travail

présenté dans le cadre de cette thèse.

CHAPITRE 2

IDENTIFICATION DE SÉQUENCES SIMPLES CHEZ DES CLONES GÉNOMIQUES

AYANT UNE HOMOLOGIE PARTIELLE AVEC UN ADN COMPLÉMENTAIRE CLONÉ DE L'HISTONE H5

12

2.1 Introduction

L'intérêt de notre laboratoire étant entre autres axé sur

l'étude de la régulation de 1'expression du gène de 1‘histone H5, une

librairie d'ADN génomique de poulet (construite par Dodgson et al., 1979) a

été criblée pour trouver des clones porteurs de ce gène (Ruiz-Carrillo et

al., 1983). A cette fin, on a utilisé un ADN complémentaire de 1'histone

H5 de poulet, cloné dans pBR322. La taille de 1 ‘insertion du p541 est de

259 pb. Il contient 118 nucléotides dans la portion 5' non traduite de

1‘ARN messager ainsi que les séquences codantes de 46 acides aminés de la

portion N-terminale des 189 acides aminés de la protéine (Ruiz-Vazquez et

Ruiz-Carrillo, 1982).

Outre des clones contenant le gêne de 1'histone H5 et caracté

risés en détail (Ruiz-Carrillo et al., 1983), plusieurs autres clones géno

miques ont donné un signal d'hybridation correspondant à une homologie

partielle avec la sonde utilisée. Nous avons donc décidé de déterminer les

séquences portées par deux de ces clones. Par la suite, le caractère répé

titif des séquences trouvées a été illustré avec d'autres clones du même

type.

13

2.2 Matériel et méthodes

2.2.1 Matériel

Toutes les enzymes utilisées proviennent soit de Boëhringer-

Mannheim, BRI, Biolabs ou de Life Sciences. Les [a - 32p] dNTPs

(4 x 103 à 6 x 103 Ci /mmole) et [y - 32P] ATP (5 x 103 à 7 x 103 Ci /mmole)

ont été achetés de NEN (New England Nuclear) ou d1Amersham. L1 agarose à

faible point de fusion vient de BRL. Les filtres de nitrocellulose

(BA 85, 0.45 ym) sont de Schleicher & Schüll.

Pour les réactions de séquence, le dimëthyl sulfate (99%)

provient de chez Aldrich Chemical Co., 1'hydrazine (95%) d1Eastman Organic

Chemicals, la piperidine de Fisher Scientific, la formamide, la pyridine et

l'acide formique de BDH (Analar), l'urée de BRL et le BSA de Miles Labora

tories. La résine AG501-X8 servant à dëioniser la formamide ainsi que le

bisacrylamide et 1'acrylamide ont été achetés chez Bio-Rad.

2.2.2 Méthodes

- Di gestion de 1‘ADN avec des enzymes de restriction

Les digestions de 1'ADN avec des enzymes de restriction sont

faites en présence d'un excès de trois fois d'enzyme dans les conditions

recommandées par les fabricants. Dans le cas des doubles digestions, 1'ADN

est précipité entre chacune d'elles par 1'addition de NaCl en concentration

finale de 300 mM et de 2.5 vol. d'éthanol à 95%.

-Séparation de 1'ADN par électrophorèse et préparation de fragments

L'ADN est séparé par électrophorèse sur gel d'agarose variant

de 0.5% (p/v) â 1.8% dépendant de la taille des molécules. L'électro

phorèse est faite dans le tampon TBE.

14

Les fragments d'ADN servant à la fabrication des sondes sont

purifiés sur gel d1 agarose à faible point de fusion, dans le tampon TA.

Ces fragments sont ensuite prélevés et extraits par phénolisations suivies

de précipitations à 11 éthanol.

Pour la séquence, les fragments marqués radioactivement aux

extrémités 3' ou 5' sont préparés sur gel de polyacrylamide à 4% (p/v)

acrylamide - 0.14% (p/v) bisacrylamide. Les bandes d'ADN désirées sont

excisées et éluëes par agitation à 37°C dans 400 yl du mélange 1 M NaCl -

10 mM EDTA - 2 yg d'ADN d'E. coli sonifië - 3 yg d'ARN-t d'E. coli, de 16 à

20 h.

Pour la séquence, on s'est servi de gels minces (0.4 cm

d'épaisseur) (Sanger et Cou!son, 1978) et on a utilisé des concentrations

d'acrylamide / bisacrylamide de 5.7%/0.3% et 7.6%/0.4% avec 8.3 M urée.

- Transfert de 1 ‘ADN

Après électrophorèse, les fragments d'ADN sont transférés sur

filtre de nitrocellulose selon la méthode de Southern (1975), 1'ADN ayant

préalablement été dégradé par dépurination partielle et hydrolyse alcaline

(Wahl et al., 1979).

- Marquage de 1 'ADN

Le marquage des extrémités 3' de 1'ADN est réalisé par

l'activité 5‘-3' polymérase de .l'ADN polymérase de T4 selon le protocole

adapté de 0'Farrell (1981) en présence de 1 dNTP marqué et des autres dëso-

xyribonuclëotides froids. Dans le cas des extrémités franches de 1'ADN, un

traitement préalable avec la même enzyme, en l'absence de précurseurs est

effectué.

Le marquage des extrémités 5' de 1'ADN par la polynuclëotide

kinase de T4 (réaction 5B) est réalisé selon le protocole de Maxam et Gil

bert (1980). Dans le cas de l'étape préliminaire de déphosphorylation, le

traitement de 1'ADN est effectué dans 45 yl de TE pH 8.0 et 5 yl de 50 mM

15

Tris-HCl pH 8.0 avec 0.1 U de phosphatase alcaline d'intestin de veau

(CIP) par 10 pmoles durant 45 min S 37°C.

Le marquage de 1'ADN par la technique de "nick-translation"

avec l'ADN polymérase I d'_E. coli est fait selon Rigby et al. (1977). L'ADN

est purifié par passage dans une colonne de Sephadex G-50 (Pharmacia). On

obtient généralement une activité spécifique de 1-2 x 10® cpm/yg.

- Hybridation

Les pré-hybridations d'ADN se font dans 3X SSCPE - 10X D

(Denhardt, 1966) - 0.1% (p/v) SDS en présence de 50 ug/ml d'ADN d'E. coli

sonifié et dénaturé par chauffage dans TE pH 7.5 à 100°C/5 min. Les

hybridations se font dans un milieu de composition identique auquel on

rajoute la sonde en excès (1 x 10® cpm/ml de mélange d'hybridation). Les

pré-hybridations (2 à 4 h) et les hybridations (16 à 20 h) se font à 67°C.

Les filtres sont ensuite lavés, sauf indication contraire, dans les condi

tions suivantes: 3X SSCPE - IX D - 0.1% SDS/temp. ambiante/15 min/4 fois;

IX SSCPE - 0.1% SDS/65°C/15 min/2 fois; 0.5X SSCPE - 0.1% SDS/65°C/15 min/2

fois ; 0.2X SSCPE - 0.1% SDS/65°C/15 min/1 fois. Les films Kodak XAR5 et

les écrans Dupont Cronex Lightening Plus sont utilisés pour 1‘autoradiogra

phie a -80°C.

- Criblage de la librairie d'ADN génomique

L'ADN complémentaire cloné de H5, le p541 (Ruiz-Vazquez et

Ruiz-Carri 11o, 1982), a été utilisé pour cribler environ 2 x 105 phages de

la librairie d'ADN génomique de poulet construite par Dodgson et al.

(1979). Ils ont été criblés selon la méthode de Benton et Davies (1977) et

ce, à 0.5X SSC - 0.1% SDS/65°C, en présence de poly G (50 yg/ml). Des

phages positifs des trois classes de signaux d'hybridation (A,B,C; voir p.20)

ont été préparés (Ruiz-Carrillo et al., 1983).

L'insertion du pCHIX0.6 H/S (voir p.24) marquée par "nick-

translation" a été utilisée pour cribler à 0.5X SSCPE - 0.1% SDS/65°C, des

phages ayant donné un signal de type B lors du criblage initial de la librairie.

Cette partie du travail a été réalisée par notre assistant de recherche

dans le laboratoire, Jean Renaud. L'ADN des phages positifs avec le

pCHIX0.6H/S a été préparé, digéré avec EcoRI, transféré sur filtre de

nitrocellulose et hybridé avec les insertions de pCHIX0.6H/S et du p541

marquées par "nick-translation". Les hybrides ont été lavés jusqu'à 0.IX

SSCPE - 0.1% SDS/65°C/7 min dans le cas du pCHIX0.6H/S et jusqu'à 0.2X

SSCPE - 0.1% SDS/65°C/15 min pour le p541.-

- Cartographie

Essentiellement, deux méthodes ont été utilisées. Des diges

tions simples et doubles avec différentes enzymes de restriction ont été

faites de manière à déduire la carte de restriction recherchée d'après la

longueur des fragments obtenus. On s'est aussi servi de la méthode des

digestions partielles de Smith et Birnstiel (1976) qui permet d'ordonner,

après autoradiographie, la position des sites de restriction à partir d'une

extrémité marquée.

- Sous-clonage

Les régions d'intérêt des recombinants ACHVII et ACHIX ont été

sous-clonées dans pAT153, un dérivé de pBR322 se répliquant à un nombre

élevé de copies (Twigg et Sherratt, 1980). Les ligations ont été faites

avec 1 U d'ADN ligase de T4 avec 150 ng des fragments Hind III - Sal I de

644 pb de ACHIX ou HindlII - BamHI de 1 800 pb de ACHVII en utilisant

450 ng de pAT153 amputé des fragments correspondants et purifié. Les

réactions ont été faites à 4°C dans 20 yl (vol. final), de 16 à 20 h puis à

14°C 1 h, avec 10 mM DÎT - 0.4 mM ATP - 60 mM Tris-HCl pH 7.5 - 6.6 mM

MgCl2* La souche E. coli C600 (rec A") a été transformée par la méthode au

chlorure de calcium (Mande! et Higa, 1970). La sélection des clones

positifs ampr et tets a été réalisée sur des milieux LB avec ampicilline

(100 yg/ml) ou tétracycline (20 yg/ml) selon le cas. L'identification a

été complétée par un criblage de l'ensemble des recombinants selon la

méthode de Grunstein et Hogness (1975). Les fragments Sali - EcoRI

(6 200 pb) de ACHIX ainsi que Smal - Smal (900 pb) de ACHVII couvrant les

17

régions d'intérêt ont été marqués par "nick-translation" et utilisés comme

sondes.

Les ADN plasmidiques de plusieurs sous-clones ont été isolés

par une méthode rapide mise au point dans notre laboratoire. Le culot de

cellules bactériennes en suspension dans 25% sucrose - 50 mM Tris-HCl pH 8.0

est lysé par l'addition, en concentration finale, de 0.6 mg/ml de lysozyme -

0.060 M EDTA - 25 mM Tris-HCl pH 8.0 - 0.05% Triton X-100 à 0°C/10 min. Le

mélange est ensuite chauffé à 70°C/15 min. Après centrifugation

(12 000 g/15 min), le surnageant contenant les acides nucléiques est préci

pité par l'addition d'un vol. de 20% PEG (6 000) - 20 mM Tris-HCl pH 8.0 -

1 M NaCl â temp, ambiante pendant 30 min. Le culot est dissout dans du TE

(10/0.1) pH 8.0 puis traité â la RNase (0.15 mg/ml) S 37°C/30 min. L'ADN

est finalement obtenu par précipitation dans de 1'acétate d'ammonium 2 M

et 3 vol. d'éthanol â 95% (rendement d'environ 2.5 yg). La taille des

insertions a été vérifiée par digestion avec les enzymes appropriées et mi

gration sur gel d'agarose.

Les plasmides pCHIX0.6H/S et pCHVIII.8H/B amplifiés ont été

isolés en grande quantité selon la procédure des lysats clairs, mise au

point dans notre laboratoire (lyse bactérienne contrôlée, effectuée dans

60 mM EDTA - 25 mM Tris-HCl pH 8.0 - 1% (v/v) Triton X-100 avec 0.3 mg/ml

de lysozyme) suivi de deux centrifugations consécutives, à 1'équilibre,

du culot d'acides nucléiques dans 4.7 M CsCl contenant 0.4 mg/ml de bromure

d'ëthidium à 62 000 rpm/4 h (rotor VTi 65). La concentration d'ADN est

déterminée par fluorimétrie après réaction avec DABA selon le protocole de

Kapp et al. (1974).

- Séquence

La méthode de clivage chimique partiel de 1'ADN ainsi que les

techniques s'y rattachant, mises au point par Maxam et Gilbert (1977, 1980)

ont été employées. On a utilisé les réactions spécifiques aux guanines,

purines, pyrimidines et cytosines. Les stratégies choisies pour sêquencer

18

les 644 pb de 11 insertion de pCHIX0.6H/S ainsi que les 247 pb du fragment

Smal - BamHI de pCHVII1.8H/B sont illustrées à la figure 3. Pour 11 inser

tion de pCHIX0.6H/S, 89% des 315 pb autour de la région homologue au p541

ont été séquencées deux fois alors que pour le fragment de pCHVIII.8H/B,

72% des 2 brins ont été séquencés 2 fois.

- Analyse de séquence par ordinateur

L'analyse des séquences a été effectuée grâce aux programmes

mis au point par Staden (1977, 1978) (BDOVRL, OVRLAP, TRANMT) et ceux du

groupe UWGCG ("University of Wisconsin Genetics Computer Group"), principa

lement le groupe de J. Devereux (1984) (FIND). Les banques de séquences

"GenBank" (Fickett et al., 1982) et EMBL ("European Molecular Biology

Laboratory") ont été analysées.

Le programme BDOVRL permet de chercher des homologies pour une

séquence donnée avec 11 ensemble des séquences d'une sous-division de la li

brairie "GenBank". La séquence recherchée est traitée par l'ordinateur en

blocs de comparaison de N nucléotides. On définit également un nombre mi

nimal de nucléotides homologues. Il est souhaitable de commencer la re

cherche d'une séquence inconnue avec des blocs de séquence de 3 nucléotides

et un minimum de 9 pb appariées. Le résultat global de 1‘homologie trouvée

avec chacune des séquences d'intérêt dans la banque est donné en pourcen

tage. On peut ensuite faire une analyse plus précise d'homologie avec le

programme OVRLAP.

Le programme OVRLAP est utilisé pour comparer des séquences

afin de trouver des régions homologues avec ou sans mauvais appariement.

Il peut être utilisé pour trouver des répétitions internes (directes ou

inversées) dans une séquence ou pour comparer deux séquences. Une longueur

minimale d'homologie ainsi qu'un nombre de mauvais appariements sont

spécifiés par l'utilisateur et toute homologie satisfaisant ces paramètres

est rapportée. Le programme calcule aussi automatiquement le complément

19

d'une des séquences et le compare à l'autre par la même occasion. Pour les

fins de recherche d'identité de pCHIX0.6H/S et pCHVIII.8H/B avec certaines

séquences des librairies, on a généralement donné un minimum de 9 pb homo

logues et aucun mauvais appariement.

Le programme FIND recherche une chaîne de caractères dans

d'autres séquences, par exemple dans certaines portions définies de

"GenBank", d'EMBL ou dans toute autre séquence. Ce programme recherche

aussi le complémentaire si la chaîne de caractères est formée de nucléo

tides. En donnant plusieurs chaînes d'une dizaine de caractères, issues

d'une séquence inconnue et en les cherchant dans les banques de séquences,

on peut retracer la séquence homologue, si elle existe.

Le programme TRANMT détermine les codons correspondants aux

trois cadres de lecture possibles dans la séquence proposée. Il exécute

aussi la même opération sur la séquence du brin complémentaire.

2.3 Résultats

2.3.1 Criblage de la librairie d'ADN génomique de poulet avec 11 ADN complémentaire cloné de H5

Environ 2 x 10$ phages représentant environ 2 fois la taille

du génome de poulet ont été criblés avec 1 1 ADN complémentaire cloné de H5,

le p541. Trois types de signaux ont été obtenus après hybridation puis

lavage de la sonde dans des conditions de lavage de 0.5X SSC - 0.1% SDS

/65°C. Neuf clones donnant un signal très fort (A), 77 un signal intermé

diaire (B) et 516 faibles (C) ont été observés. Les signaux faibles ne

provenaient pas d'une hybridation non spécifique puisque, dans les mêmes

conditions, des clones recombinants Xgt d'une librairie d'E. coli n'ont

donné aucune réponse avec la sonde. Ces résultats ont été obtenus par

A. Ruiz-Carrillo.

Par la suite, une analyse par hybridation de "dots", de 1'ADN

de recombinants de chacun des 3 types de signaux obtenus a montré qu'après

lavage des hybrides dans des conditions de 0.IX SSC - 0.1% SDS/65°C, seuls

les signaux de types A et B sont demeurés (A. Ruiz-Carrillo, résultats non

pub!iës).

Deux clones de type A ont été caractérisés en détail et se

sont avérés contenir des fragments chevauchants du gêne de 1'histone H5

dont la séquence a été déterminée. L'hybridation du p541 avec de l'ADN

génomique a permis de conclure qu'il n'y a qu'une copie de ce gêne par

génome haploïde (Ruiz-Carrillo et al., 1983). Les clones de type B et C

semblaient, quant à eux, contenir des séquences ayant des homologies

partielles avec la sonde utilisée, ceux de type B davantage que le type C.

Nous avons d'abord décidé d'identifier la nature des homo

logies portées par des clones de type B en sëquençant deux d'entre eux

choisis au hasard, les ACHVII et ACHIX.

21

2.3.2 Cartographie des clones génomiques ACHVII et ACHIX

Les emplacements des divers sites de restriction des clones

ACHVII et ACHIX ont été déduits d'après la taille des fragments obtenus par

des digestions simples et doubles avec différentes enzymes de restriction.

La technique des digestions partielles de Smith et Birnstiel (1976) a servi

à compléter ces informations. Les ACHVII et ACHIX comportent respective

ment des insertions de 12.8 kb et 18.0 kb de différents morceaux d'ADN à en

juger d'après la position des sites de restriction. Ces résultats sont il

lustrés à la figure 1.

2.3.3 Détermination des régions d'homologie des clones ACHVII et ACHIX avec le p541

Afin de cerner précisément les régions de ACHVII et ACHIX

homologues à 1'ADN complémentaire cloné de H5, ces recombinants ont été

digérés avec plusieurs enzymes de restriction dont les sites d'action

étaient connus. Les fragments d'ADN séparés par électrophorèse sur gel

d'agarose ont été transférés sur filtre de nitrocellulose et hybridés avec

l'insertion du p541, marquée par "nick-translation". D'après la figure 2,

on observe sur les deux autoradiogrammes qu'une seule bande par canal a

hybridé avec la sonde; dans les cas où il y a deux bandes, la bande la plus

faible serait due à une digestion partielle. Cela signifie donc que les

régions d'homologie ne couvrent qu'une portion de chacun des clones géno

miques .

On a ainsi pu déduire que 1'homologie du p541 avec ACHVII

était au maximum de 247 pb (fragment Smal - BamHI) et de 644 pb (fragment

HindIII - Sal I) avec ACHIX (les longueurs précises ont été déterminées par

séquence). Ces régions d'homologie sont montrées sur les cartes de res

triction de la figure 1.

# eg o□ • a • g

i------- 1

1 kb

g a / a g g g gg □ □ g 1/ A ga ■ •

B

I------- 1

1 kb

Figure 1. Cartes de restriction des insertions des clones génomiques XCHVII et XCHIX. Le rectangle noir représente les régions de XCHVII (A) et XCHIX (B) sous-clonées, contenant les portions homologues â l'ADN complémentaire cloné de H5 (p541). Les symboles utilisés sont: HindiII (□), Smal (O),BamHI (•), EcoRI (A), Kpnl (■), Sali (y), jonctions synthétiques EcoRI (a).L'enzyme Sali ne coupe pas XCHVII alors que XCHIX n'est pas coupé par Smal.

roIX)

abcdefghi j k I abcdefghijkl m n o p q m n o p q

Figure 2. Détermination de la région d'homologie des clones génomiques XCHVII et ACHIX avec le p541.A) Coloration^au bromure d'éthidium des fragments d'ADN séparés par électrophorèse sur gel d'agarose a 0.5%. (a) & (i) 0.5 yg d'ADN de ACHIX digéré respectivement avec EcoRI, EcoRI+SalI, Sali, EcoRI+Hindl11, HindiII, EcoRI+Kpnl, Kpnl, EcoRI+BamHI, BamHI; (j) à (1) 0.5 yg, (m) à (q) 0.75 yg d'ADN de ACHVII digéré respectivement avec EcoRI, EcoRI+BamHI, BamHI, Smal, EcoRI+Hindl11, Hindl11, EcoRI+KpnI, KpnI. B) Autoradiogrammes des transferts des gels montrés en (A) hybridés avec 1'insertion du p541 marquée par "nick-translation". La longueur des fragments de l'ADN de A digéré avec Hindi 11 utilisé comme marqueur de migration est donnée en kb. ♦quantité moindre, indéterminée, dans le cas des doubles digestions.

rx)co

2.3.4. Séquence des régions d'homologie

Les fragments contenant les régions d'homologie ont par la

suite été sous-clonés dans pAT153. Dans le cas de aCHVII, c'est le

fragment HindIII - BamHI de 1.8 kb (figure 1) qui a été sous-cloné pour

former le plasmide pCHVIII.8H/B. Le pCHIX0.6H/S a été obtenu par sous-

clonage du fragment Hind 111 - Sal I de 0.6 kb issu de ACHIX.

Des cartes de restriction détaillées de ces deux sous-clones

apparaissent à la figure 3. Les stratégies de séquence par la méthode de

dégradation chimique de Maxam et Gilbert (1977, 1980) y sont également

i 11ustrées.

Les séquences des brins porteurs de 1‘homologie avec l'ARN

messager de H5 dans l'insertion du pCHIXO.6H/S (644 pb) et dans le fragment

BamHI - Smal (247 pb) de pCHVIII.8H/B sont respectivement données aux figu

res 4 et 5. Il est à noter que la séquence du fragment de pCHVIII.8H/B est

riche en bases G+C par rapport à 1'ensemble du génome qui a une composition

moyenne en guanines et en cytosines de 44% d'après Shapiro (Handbook of

Biochemistry, 1976, p. 269).

La figure 12 (voir chapitre 3) illustre entre autres la compa

raison d'une partie des séquences de pCHIX0.6H/S, de p541 (brin homologue à

l'ARN-m) et de pCHVIIl.8H/B. On observe que dans le cas des 2 sous-clones,

la région d'homologie avec le p541 ne correspond qu'à 20 pb et qu'elle est

majoritairement formée d'une séquence simple de 5 tri nucléotides (GGC). De

plus, le triplet (AGC) borde de chaque côté la séquence simple pour

pCHIXO.6H/S et le p541 alors qu'il ne manque qu'un A du côté droit (figure

12) pour observer la même chose avec pCHVIII.8H/B. Dans le cas du

pCHIX0.6H/S, on peut également observer un sixième (GGC) qui se rajoute aux

autres de façon consécutive.

La séquence d'homologie de 20 pb est située dans la partie 5'

non traduite de l'ARN messager de H5 et plus précisément à la position -113

en amont du codon d'initiation de la traduction d'après le p541 (Ruiz-Carrill

et al., 1983).

A0.1 kb

g f 1 IT

B H-H

50 pb

Figure 3. Cartes de restriction des sous-clones pCHVIIl .8H/B et pCHIX0.6H/S. Les stratégies pour séquencer le fragment, Smal - BamHI de pCHVIIl.8H/B (A) et l'insertion de pCHIXO.6H/S (B) sont données (-►). Les symboles utilisés sont: HindiII (□), Smal (O), BamHI (•), Sali (▼), Alul (♦), Hpall (v), HaelII (◄), Hinfl (<), Sau3A (x).

roen

10 20 30 40 50 60TCGACGGGAT CAGGGACTGG AGCCTTTTCA GCTGCCTCGG GGTCTGGCTG GACTGCTGTC

70 80 90 100 110 120CCAAGGAACC CAAGACGGAC ACCGGGGGAC GGAAGATGGC TGTCGGGAGG CGCGGCGTGG

130 140 150 160 170 180TGGGTCAGGG CTATAGCAAC AGAAGTGGTG •GCGGCTGCGG CTTGCAGGGG GGCCTGGATG

190 200 210 220 230 240AGCGGGGTCC AAATGACGGG GGTGGGGGTG GATGCGGCAG CGGCGGCGGC GGCGGCGGCA

250 260 270 280 290 300GCCTGGACGT TGTGAGCACA GTGTGCCATC TCCCTGTCGT GCTGCACGAT CTGCTGGATG

310 320 330 340 350 360ATCTCATTCT CTTGGTAGTT GAAAACCCCC GAATTGAGGT CATGCTGGAC TTTATGCAGC

370 380 390 400 410 420AGAATGGAAT TTTTCTTACC TGTAGAGAAA GTGAAGAGAG AAGAGTCATT CTCATGTGTC

430 440 450 460 470 480AAAGCAGGGG AGGCTGCCTG CCGAACCTTC CTCAAATTGT TGGCACCGTC TCCGCTGTCA

490 500 510 520 530 540TTATGGGATC TGGGTACAGT CTCTCTGCTC CAGCAACAAG ATGATAAACA TTATATCTTC

550 560 570 580 590 600TGCTTTTGTG GTATGATCAG CGGACTTTGA GATCCCAGAG AACACAGTCC TAGTTAGACG

610 620 630 640GTGGAGTCAG TTTTGTGAAG TGGGGCGGAC TGGTAGCAAA GCTT

Figure 4. Séquence de l'insertion de pCHIX0.6H/S. Elle débute au site SalI et se termine au site Hindlll. Le trait continu représente 1'homologie avec le p541 alors que le trait discontinu illustre les répétitions de (GGC). C'est la séquence du brin porteur de 1‘homologie avec l'ARN messager de H5 qui est donnée.

10 20 30 40 50 60GATCCGGCGC CGCCCCGCAG CCCCGCCCGG AAGCGGGGGG GGAGCAGCGG CGGCGGCGGC

70 80 90 100 110 120GGCGCGGACG TCGCGGCGGG GAGGAGCCGG GCCGGGCCGG GGCGGATCGG CGCTCGGCGG

130 140 150 160 170 180GCGGGCAGGG CACGGCGCGG CGCGATGGCG GGGCCCCGCG GCGGCGCTGC AGCGCGGGGT

190 200 210 220 230 240CCCACGGAGG ATGTGAGGCG GCGGCCGCGG ACGGCCCCAC CGGGCTCGGA GGGCGGAGAG

GGGTCCC

Figure 5. Sequence de la région de 247 pb de pCHVI11.8H/B contenant 1'homologie avec le p541. Elle débute au site BamHI et s'achève au site Smal. Le trait continu représente 1'homologie avec le p541 alors que le trait discontinu illustre les répétitions de (GGC). C'est la séquence du brin porteur de 1'homologie avec l'ARN messager de H5 qui est donnée.

28

Entre ce qui a été séquencé de pCHIX0.6H/S et pCHVII1.8H/B, il

n'y a que 21 pb communes comprenant les 5(GGC) en tandem. Ce résultat est

d'ailleurs corroboré par l'hybridation de 1'insertion du pCHIX0.6H/S avec

des fragments de restriction de ACHVII tel qu'illustré à la figure 6. Les

fragments positifs observés sont les mêmes que pour l'hybridation avec le

p541 (figure 2).

2.3.5 Identification de (GGC)n dans d'autres clones génomiques

En plus des deux clones ACHVII et aCHIX précédemment caracté

risés, on a recherché d'autres clones génomiques porteurs de séquences

simples de (GGC)n. L'insertion du pCHIXO.6H/S a été utilisée pour examiner

par criblage des plages de lyse, d'autres phages ayant donné un signal de

type B lors du criblage initial avec 1'insertion du p541. Cinq phages

positifs ont été obtenus après deux purifications d'un petit nombre de

phages ayant donné un signal avec la sonde de pCHIX0.6H/S.

Les ADN recombinants de AII, V, X, XIV et XIX sont tous

différents à en juger d'après leurs patrons de digestion avec EcoRI tel

qu'ils apparaissent après électrophorèse sur gel d'agarose (figure 7A). On

remarque cependant que le AXIX est identique au ACHVII caractérisé anté

rieurement (voir figure 2A, canal j).

On a hybridé 1'ADN digéré de chacun de ces clones avec

1'insertion du pCHIX0.6H/S (figure 7B) et celle du p541 (figure 7B ' ). On

observe que pour chaque recombinant, c'est le même fragment d'ADN qui

hybride avec les deux sondes. Pour AXIV, un deuxième fragment de plus

grande taille (environ 5.20 kb) apparaît après surexposition des

autoradiogrammes (résultat non montré). Il est à noter que la bande plus

faible qui apparaît dans le canal de AX avec la sonde du p541 (canal c' ) ne

correspond à aucune bande sur le gel et serait plutôt issue d'une

contamination; d'ailleurs une expérience analogue a été réalisée et cette

bande n'est pas apparue.

29

a b c d e f g abc d e f g

A B

Figure 6. Détermination de la région d'homologie de XCHVII avec le pCHIX0.6H/S. A) Coloration au bromure d'éthidium des fragments de XCHVII séparés par électrophorèse sur gel d'agarose à 0.5%. (a) à (g) 0.75 wgd'ADN digéré respectivement avec Hi ndl 11, Hi ndl I I+BamHI, BamHI, Kpnl, KpnI+EcoRI, Smal, Smal+EcoRI. B) Autoradiogramme du transfert du gel montré en (A) hybridé avec l'insertion de pCHIX0.6H/S marquée par "nick- translation". La longueur des fragments de 1'ADN de X digéré avec Hindl11, utilisé comme marqueur de migration est donnée en kb.

30

a b c d e a b c d e a' b' c" d' e' a' b' c* d' e‘

2 3.1

9.4

6.6

4.4

2.32.0

A B A' B'

Figure 7. Caractérisation de dones génomiques porteurs de séquences simples de (GGC)n . A,A') Coloration au bromure d'éthidium des fragments d'ADN de clones génomiques digérés avec EcoRI et séparés par électrophorèse sur gel d'agarose à 0.5%. (a) à (e) Ail (0.5 ug); AV, AX (0.3 pg); AXIV (0.7 pg); AXIX (0.6 pg). (a1) à (e1) Ail, AV, AX, AXIV, AXIX (0.5 pg). B,B') Autoradiogrammes des transferts des gels montrés en (A,A') hybridés avec les insertions de pCHIXO.6H/S (B) et p541 (B1) marquées par "nick-translation". Les flèches indiquent la position sur les gels des bandes correspondantes ayant hybridé avec les sondes. La longueur des fragments de 1'ADN de A digéré avec HindiII utilisé comme marqueur de migration est donnée en kb.

31

Étant donné qu'il n'y a que 20 pb homologues, dont (GGC)g,

entre les insertions de pCHIX0.6H/S et du p541, le fait d'observer un

signal avec chacune de ces sondes pour le même fragment d'ADN révèle la

présence d'une séquence similaire, sans toutefois qu'elle soit nécessai

rement identique. Cependant, on ne peut pas comparer les intensités de la

même bande avec les 2 sondes car les gels ne sont pas identiques. Il faut

aussi noter que les hybrides n'ont pas subi les mêmes conditions de lavage

(lavage jusqu'à 0.1X SSCPE - 0.1% SDS/65°C (figure 7B, pCHIX0.6H/S) et

jusqu'à 0.2X SSCPE - 0.1% SDS/65°C (figure 7B', p541) ).

En examinant chacun des 2 autoradiogrammes (figure 7B, B'), on

se rend compte que les intensités des différentes bandes ne sont pas les

mêmes. Les intensités relatives des bandes examinées les unes par rapport

aux autres varient dans certains cas selon la sonde utilisée. On voit par

exemple que 1'ADN de AX (c) donne un signal d'intensité comparable à celui de

àV (b) avec la sonde du p541 (fig. 7B‘) alors qu'avec l'autre sonde (fig. 7B),

il donne un signal plus faible par rapport à xV (b). Cela signifie donc des

homologies différentes avec chacune des sondes. D'autre part, dans le cas

de aXIV (canaux d, d'), les signaux sont nettement plus faibles dans les

2 cas et pourraient donc provenir d'une séquence moins riche en (GGC).

Les résultats de ces hybridations différentielles suggèrent

la présence de séquences simples de (GGC)n dans les recombinants analysés.

Il est cependant impossible de déterminer le nombre de répétitions consécu

tives seulement d'après ces résultats car la méthode de détection est limi

tée en raison des sondes utilisées: il y a 5 (GGC) chez le p541 et 6 chez

le pCHIX0.6H/S. Lors de 1'hybridation avec ces sondes, un nombre plus

grand de répétitions consécutives de (GGC) dans une séquence engendre de

mauvais appariements et n'est pas détecté comme tel. Par exemple, une sé

quence de (GGC)g ne pourra apparier que 6 de ses (GGC) avec le pCHIX0.6H/S

et 5 avec le p541. En outre, un changement d'une base au milieu d'une sé

quence de (GGC)g engendrerait de mauvais appariements qui la rendrait plus

difficilement détectable avec les sondes utilisées.

32

2.3.6 Analyse de séquence

On a d'abord essayé de déterminer des cadres de lecture ou

verts dans les séquences trouvées. On a assigné par ordinateur des codons

de traduction correspondant aux trois phases de lecture possibles pour cha

cun des deux brins. Dans la séquence d'un des brins de pCHVII1.8H/B, il

existe trois cadres de lecture ouverts alors que chez le pCHIX0.6H/S, plu

sieurs codons de terminai son ont été rencontrés dans chacun des cadres de

lecture et ce, sur les deux brins.

Par la suite, on a regardé si ces séquences pouvaient par ha

sard correspondre à quelque chose de connu en effectuant une recherche ex

haustive dans les banques de séquences de "GenBank" et EMBL ainsi que dans

la littérature. Cependant, elles ne correspondent à aucune séquence connue

jusqu'à présent.

2.4 Discussion

Les clones Ail, XV, xCHVII, XCHIX, xX et xXIV qui ont donné le

signal de type B à l'hybridation avec le p541 sont différents d'après les

patrons des digestions enzymatiques obtenus, visibles par électrophorèse

sur gel (XXIX est identique à XCHVII). Ils correspondent par conséquent à

des portions distinctes du génome de poulet.

Les régions d'homologie de 20 pb des XCHVII et XCHIX avec le

p541 comprennent une séquence simple de trinuclëotides (GGC). En outre,

les séquences de ces régions sont les mêmes chez les deux clones, ce qui

est en accord avec les intensités d'hybridation des fragments d'ADN posi

tifs qui sont du même ordre de grandeur (comparer les canaux (a-i) pour

XCHIX avec (j-1) pour XCHVII sur le même autoradiogramme à la figure 2).

Des séquences simples formées de (GGC) semblent être répétées

plusieurs fois dans le génome de poulet 5 en juger par les hybridations

différentielles des sondes de pCHIX0.6H/S et p541 avec d'autres clones de

type B provenant du criblage initial de la librairie. On peut dire que le

nombre suggéré de répétitions de séquences (GGC)n comme celles portées par

les clones de type B pourrait être de 39 puisque les 77 clones de type B

obtenus proviennent du criblage de la librairie représentant environ deux

fois la taille du génome. De même, il pourrait y avoir 516 * 2 d'où 258

répétitions de séquences de (GGC)n de type C où par rapport à celles des

clones de type B, il y aurait moins de (GGC) consécutifs détectables avec

la sonde utilisée. Cependant, ces chiffres donnés à partir du criblage de

la librairie demeurent très approximatifs. D'abord la représentation géné

rale des séquences dans la librairie, surtout si elle a été amplifiée, peut

être fort différente de celle du génome. Certaines séquences peuvent être

sous ou sur-représentées dépendant de leurs effets sur la viabilité des

34

phages. D'autre part, 11 intensité des signaux observés peut dépendre aussi

du nombre de phages présents dans 1 es plages de lyse qui ont donné un si

gnal avec la sonde. Cela pourrait donc fausser quelque peu le décompte des

clones pour chacun des 3 types de signaux (A, B, C) obtenus lors du cribla

ge de la librairie avec 11 insertion du p541. Une meilleure évaluation du

nombre d'éléments de la famille (GGC)n dans différents génomes sera faite

au chapitre suivant.

Une homologie de 14 pb comprenant (GGC)g (provenant du gène de

H5; discuté au chapitre suivant) avec le pCHIX0.6H/S et le pCHVIII.8H/B

n'est pas détectable par hybridation dans les conditions habituelles et

lavage jusqu'à 0.2X SSCPE - 0.1% SDS/65°C (résultats non montrés). On a vu

par contre que les hybridations différentielles avec le pCHIX0.6H/S et le

p541 détectent bien une séquence de 20 pb homologues comprenant (GGC)g;

c'est le cas de ACHVII. Par conséquent, nous pouvons dire qu'il faut au

moins plus qu'une séquence homologue de 14 pb avec (GGC)] pour être détec

table dans ces conditions. Les signaux d'hybridation des clones de type B

obtenus lors du criblage initial de la librairie et résistant à des condi

tions de lavage de 0.IX SSC - 0.1% SDS/65°C répondraient apparemment à ces

exigences. Cependant, on ne sait pas si les clones porteurs d'une homolo

gie intermédiaire, soit entre 14 et 20 pb auraient donné un signal avec la

méthode de détection utilisée. La limite inférieure où on commence à dé

tecter un signal d'homologie n'a pas été déterminée.

CHAPITRE 3

ORGANISATION DES SÉQUENCES SIMPLES DE (GGC)

CHEZ LE POULET ET D'AUTRES ORGANISMES

3.1 Introduction

Parmi les séquences simples rapportées dans la littérature, il

y en a qui ont été caractérisées soit à cause de leur présence dans le voi

sinage ou dans les introns de certains gènes, soit aussi par leur fréquence

de répétition dans des génomes homologues ou hétérologues. Nous décrirons

ici quelques exemples.

Plusieurs types de séquences simples ont été découverts dans

le voisinage ou à 11 intérieur d'une variété de gènes. Ainsi, Slightom et

al. (1980) ont trouvé des séquences de 13 à 19 (TG) consécutifs dans le

deuxième intron des gènes foetaux G et A de type g-globine chez 11 humain.

Apparemment, ces séquences joueraient un rôle dans la conversion intergé

nique afin de contrôler l'évolution de ces gènes qui sont des produits de

duplication d'un ADN ancestral . Des trinuclêotides (TCC)n et (TCA)n ont

été trouvés par Cohen et collaborateurs (1982) à des positions analogues,

en amont de 5 gènes d'immunoglobulines Vy apparentés, chez la souris. Ils

auraient eux aussi un rôle dans la conversion puisqu'en amont de ces sé

quences, ces gènes divergent. Chez l'oursin de mer (S. purpuratus), Sures

et al. (1978) ont trouvé dans un "spacer" entre les gènes H2A et Kl, une

séquence de (CT/GA)27. En parlant de cette séquence, Kedes (1979) suggère

qu'elle pourrait, à cause de son homogénéité, se comporter comme une ferme

ture éclair lors de sa dissociation-réassociation. Elle pourrait de ce

fait minimiser les crossing-over inégaux hors phase mais permettre ceux qui

sont en phase. Ce serait un mécanisme pour la correction et l'amplifica

tion des gênes.

D'autres auteurs ont étudié le caractère répétitif des séquen

ces simples. Hamada et Kakunaga (1982) ont observé la séquence (TG)25 dans

le quatrième intron d'un gêne d'actine du muscle cardiaque humain. Cette

séquence est située près de la frontière intron/exon. Avec une sonde

synthétique de (dT-dG)n, ils ont déterminé qu'il y avait environ cent

mille copies de ce motif dans le génome humain. Ces séquences fortement

37

répétées pourraient, selon ces auteurs, être importantes dans la mutagënê-

se, la recombinaison ou le contrôle de 1'expression génique. À 329 pb de

la partie 3' codante de deux gènes d'immunoglobulines V provenant de

cellules embryonnaires et de plasmacytomes de souris, Nishioka et Leder

(1980) ont trouvé la séquence (CA)3i. Une séquence de composition asymé

trique en purines-pyrimidines, (AGAGG)32, a été identifiée quant à elle par

Dybvig et al. (1983) dans un clone génomique de poulet de nature inconnue.

Ce clone a été obtenu par hybridation avec des sondes d'ADN complémentai

res enrichis pour les ARN messagers du choc thermique. Ils estiment à au

moins 2 000 le nombre de copies de cette séquence simple d'après la quanti

té de plages provenant du criblage de la librairie.

Il a aussi été démontré que ces séquences étaient répandues

dans des systèmes biologiques hétérologues. La séquence simple (TG)-|y,

présente dans un segment de 251 pb entre les gênes s et g-globines humaines

est détectable chez 20% des clones d'une librairie génomique humaine (Mi es

te! d et al., 1981). Cette séquence, retrouvée dans les génomes de Xenopus,

de saumon, de pigeon, de souris, de levure {S_. cerevisae) et de myxomicête

(JD. discoideum), pourrait avoir été conservée ou simplement avoir été

générée indépendamment durant l'évolution. Gebhard et Zachau (1983) ont

identifié les séquences (TGjgQ, (TTTGCjgQ, (GCCTCT)3q dans le voisinage

des gènes VK et CK codant pour les chaînes de type k dans les immunoglobu

lines de souris. Le caractère répétitif observé chez la souris est conservé

chez le saumon. Finalement, Maroteaux et al. (1983) ont étudié la fréquence

de répétitions de séquences simples trouvées dans le voisinage ou dans les

gènes codant pour des protéines de l'oeuf chez trois espèces aviaires. Ainsi,

les pentanucléotides (GGAAG^y, (GGAAA^g et (GGAGA^g ont été trouvés res

pectivement à 2.5 kb en amont de l'extrémité 5' du gène ovalbumine-X du

poulet. Ces séquences sont réitérées dans trois génomes aviaires (poulet,

faisan, canard) à des degrés qui varient avec le type de séquence et l'espèce

considérée.

38

Nous avons voulu étudier 1'organisation et la réitération des

séquences simples composées du trinuclëotide (GGC), d'abord chez le poulet

puis dans d'autres espèces qui lui sont plus ou moins apparentées afin de

voir si elles sont présentes chez d'autres organismes. Pour ce faire, il a

d'abord fallu établir les conditions optimales de détection de ces

séquences par hybridation différentielle.

Suite à cela, il s'est avéré intéressant d'identifier parmi

les gênes séquencés chez quelques espèces, ceux qui étaient porteurs de ce

type de séquences afin d'étudier leur localisation dans le génome.

39


3.2.1 Matériel

Les poulets utilisés sont de type Warren (Québec) et White

Leghorn (Allemagne), le canard est de la variété Pékin et le pigeon de type

voyageur. Les ADN de foie de souris Bal b/c ainsi que de cellules T24 de

carcinomes de vessie humaine ont été généreusement fournis respectivement

par B. Turcotte et C. Parent et isolés par traitement à la protéinase K-SDS

suivi d'extractions au phénol et chloroforme tel que décrit plus bas. Il en

est de même pour 11 ADN de salmonelle (S_. thyphimurium) fournit par A. Ruiz-

Carrillo. Quant à 11 ADN de E. coli, il a été isolé par gradients de CsCl

L'ADN de sperme de saumon ainsi que le poly (G) proviennent de

Boëhringer-Mannheim.

3.2.2 Méthodes

- Courbe de fusion

Pour mesurer le Tm de l'hybride formé entre 11 insertion du

pCHIX0.6H/S et celle du p541, on a d'abord fixé 1'insertion purifiée de

pCHIX0.6H/S sur 2 disques de nitrocellulose de 0.9 mm (d.i.) selon un

protocole adapté de Kafatos et al. (1979): 1.3 yg d'ADN préalablement

dénaturé (0.3 M Na0H/10 min/20°C suivi d'une dilution dans 1 vol. de 2 M

CH3COONH4 froid) est déposé sur un disque humidifié dans 20X SSCPE. Le

filtre est lavé 2 fois avec 50 yl de 20X SSCPE et il est mis à sécher au

four à vide à 80°C/2 h. La pré-hybridation et 1'hybridation des filtres

avec l'insertion du p541 marquée aux extrémités 5' avec la polynucléotide

kinase de T4 ont été réalisées tel que décrit auparavant (section 2.2.2).

On a ensuite fait 4 lavages dans 3X SSCPE - 0.1% SDS - lXD/temp.ambiante/15

min et 2 lavages dans IX SSCPE - 0.1% SDS/65°C/15 min. Les 2 filtres ont

été déposés séparément dans des vials de plastique contenant 5 ml de 0.IX

SSCPE - 0.1% SDS dans un bain à 45°C et stabilisés pendant 5 min. On a

40

alors commencé la dissociation des hybrides par l'augmentation graduelle de

la température. Le liquide de lavage a été prélevé et compté par scintil

lation. On a augmenté de 3°C la température du bain et on a ajouté 5 ml de

la solution de lavage prê-chauffëe qui a été laissée en contact pendant 2

min avec le filtre. On a répété cela jusqu'à 87°C en parallèle avec un

filtre témoin. A la fin, les comptes restants sur le filtre ont également

été déterminés par scintillation. La somme des comptes ëluës à chaque

température et des comptes restants, corrigés avec la valeur du témoin

correspond aux comptes totaux présents sur le filtre avant lavage avec 0.IX

SSCPE - 0.1% SOS. La courbe du pourcentage des hybrides dissociés

comptes ëluës corrigés \_________________________JX 100 en fonction de la température a été tracée.comptes totaux corrigés/

La déviation standard sur la lecture de la température est de ± 0.5°C alors

que la déviation standard moyenne sur le calcul du pourcentage des hybrides

dissociés est de - 0.7°C.

- Isolement de 1'ADN génomique

Les ADN génomiques d'érythrocytes de poulet, de canard et de

pigeon ont été isolés comme suit. Les érythrocytes provenant de sang

hëparinë ont été lavés plusieurs fois dans une solution isotonique (0.15 M

NaCl - 10 mM Tri s-HCl pH 7.3) puis lysés dans un grand volume de solution

0.25 M sucrose - 0.14 M NaCl - 0.02 M Tri s-HCl pH 7.5 - 0.01 M EDTA - 0.5%

(v/v) NP-40. Après centrifugation à 800 g/5 min/4°C, la lyse a été reprise

lorsque nécessaire. Les noyaux ont été lavés dans le même tampon en absen

ce de NP-40, centrifugés à 800 g/5 min/4°C et mis en suspension dans 250

vol. de ce dernier auquel de la protéinase K et du SDS ont été ajoutés pour

avoir respectivement des concentrations finales de 50 yg/ml et 1%. L'incu

bation a été faite à 37°C de 16 à 20 h. L'étape suivante a consisté à

faire plusieurs extractions consécutives, très douces, au phénol/chloro

forme de façon à éliminer les protéines. L'ADN a été précipité et laissé

gonfler dans du TE puis, précipité à nouveau. Un dosage spectrofluorimé

trique au DABA a été réalisé.

41

- Digestion et hybridation d'ADN génomique

Des ADN génomiques (5 yg) de poulets Warren et White Leghorn

(figure 9) ainsi que 3 yg des ADN génomiques de canard, pigeon, poulet

(Warren), souris et humain (figure 10) ont été digérés en concentration de

10 yg/ml avec un excès de trois fois de différentes enzymes de restriction,

pendant 2 à 3 h à 37°C. Les réactions ont été arrêtées avec l'addition

d'EDTA pH 8.0 en concentration finale de 10 mM et chauffage à 65°C/5 min.

Les ADN ont été précipités et digérés à nouveau dans les mêmes conditions

et avec les mêmes enzymes. Il est à noter que ces conditions de digestion

ont été vérifées au préalable avec un contrôle interne de digestion, en

1 'occurence pBR322 (résultat non montré). Les ADN ont ensuite été soumis

à une électrophorèse sur gel d'agarose à 0.5%. La migration sur gel a été

effectuée à 1 V/cm pendant 20 h.

Les hybridations ont été réalisées tel que décrit à la section

2.2.2 avec 10% (concentration finale) de dextran sulfate. On s'est servi

soit d'ADN d'E. coli (figure 9) ou soit d'ADN de sperme de saumon sonifië

(figure 10) comme ADN entraîneur dans les mélanges d'hybridation. Les

lavages des filtres ont été réalisés de la façon décrite à la section 2.2.2

jusqu'à 0.2X SSCPE - 0.1% SDS/65°C (figure 9) ou 0.5X SSCPE - 0.1% SDS/65°C

(figure 10). Les temps d'exposition avec un intensificateur ont été de 3

jours dans le cas des ADN des 2 types de poulets (figure 9) et de 10 jours

dans l'autre cas (figure 10).

- "Dots" pour les ADN génomiques

Les différents ADN ont été déposés en "dots" sur filtre de

nitrocellulose d'après le protocole suivant. L'ADN en solution dans 0.2 M

NaOH est chauffé à 100°C/5 min puis refroidi à 0°C. Un volume égal

d‘acétate d'ammonium 2.4 M est ajouté et le mélange est placé à nouveau à

100°C pendant 5 min et est congelé dans un mélange glace sèche - éthanol .

L'ADN est ensuite déposé sur un filtre de nitrocellulose humidifié dans 20X

SSCE et lavé avec 200 yl d1 acétate d'ammonium 1 M. Le filtre est mis à

sécher au four à vide à 80°C/2 h.

42

Ce sont des quantités identiques d'ADN, soit 4 pg, qui ont été

fixées sur nitrocellulose en se servant au besoin d'ADN simple brin du

phage Ml3mp8 de séquence connue (dont seulement une séquence de (GGC)g) pour

assurer une fixation quantitative. Cet ADN de Ml3mp8 a été isolé après

infection de E. coli JM103 selon le protocole de Zinder et Bueke (1982)

auquel on a ajouté un traitement à la DNAse (0.1 pg DNAse/pg ADN/15 min. à

temp, ambiante) sur la solution de virions afin d'éliminer s'il y a lieu

1'ADN chromosomique bactérien.

Les insertions de pCHV2.5B/H et pCHVIIl.8H/B utilisées comme

standards pour évaluer le nombre de copies de (GGC)n ont été purifiées

2 fois sur gel d'agarose à faible point de fusion. Les sondes utilisées

sont des fragments Hhal des insertions de pCHV2.5B/H (180 pb) et p541 (183 pb)

et marqués par "nick-transiation". La pré-hybridation, 1‘hybridation et

les lavages des filtres jusqu'à 0.2X SSCE - 0.1% SDS/65°C ont été réalisés

tel que décrit auparavant (section 2.2.2) sauf qu'on a utilisé du SSCE au

lieu du SSCPE et que du poly (G) (50 pg/ml) et du dextran sulfate (10% en

conc. finale) ont été ajoutés aux mélanges. En outre, on s'est servi soit

d'ADN de sperme de saumon (figure 11 A) ou soit d'ADN de salmonelle (S. thy-

phimurium) (figure 11B) sonifië comme ADN entraîneur dans les mélanges d'hybridation. On a utilisé 2 X 10® cpm/ml de chacune des sondes.

Après autoradiographie, les filtres ont été découpés en

rondelles et comptés par scintillation. Le calcul du nombre de copies de

(GGC)n (où n > 3) dans chacun des génomes étudiés a été fait de la façon

suivante. Les valeurs des cpms nets obtenus pour les différents ADN ont

été corrigées pour le bruit de fond provenant de 1'ADN de Ml3mp8. On a

ensuite déterminé le nombre de copies correspondantes pour chacune des

sondes d'après les valeurs des standards de copies. S'il y a lieu, la

contribution de pCHV2.5B/H (gêne de H5) a été soustraite du signal prove

nant du p541 afin de nous donner la valeur du signal due aux (GGC)n>g . On

a également tenu compte dans les calculs de la disparité dans la taille des génomes étudiés (Shapiro, 1976): E. coli (6.4 X 10® pb), S. thyphimurium

(1 X 107 pb), pigeon (0.9 X 10^ pb), poulet (1.3 X 10^ pb), souris et

g ghumain (3 X 10 pb), saumon (6 X 10 pb). Finalement, c'est la moyenne des

43

résultats pour les différentes quantités d'ADN pour un génome qui est

donnée au tableau 2.

- Recherche de séquences (GGC)n dans la littérature

On a utilisé les programmes d'analyse de séquence par ordina

teur décrits à la section 2.2.2. Pour chercher des séquences porteuses

d'au moins 3 répétitions consécutives de (GGC) chez la souris, l'humain, le

canard et le poulet, c'est le programme FIND qui a été utilisé dans les

deux librairies ("GenBank", EMBL). De façon complémentaire, on a recherché

des (GGC)n dans les séquences récemment parues dans la littérature et ab

sentes de ces librairies.

- Calculs statistiques

On a calculé la probabilité de retrouver un nombre donné de

répétitions consécutives de (GGC) dans le génome haploïde de poulet d'après

sa taille qui est de 1.3 x 109 pb (Shapiro, 1976, p. 300) et sa composition

en guanines (23.7%) et en cytosines (20.3%) (Shapiro, 1976, p. 269). On a

fait le calcul suivant:

où

(G X G X C)n

3

G: fréquence en guanines dans le génome

C: fréquence en cytosines dans le génome

n : nombre de répétitions en tandem du motif (GGC)

3: constante qui tient compte de l'ordre dans 1'arrangement des 2 G et 1C puisqu'il y a une chance sur trois de retrouver le motif (GGC) en appariant au hasard 2 G et 1C.

On a ensuite multiplié la fréquence obtenue par la taille du

génome afin d'obtenir le nombre de répétitions espérées dans le génome de

poulet.

3.3 Résultats

3.3.1 Calcul de la probabilité de retrouver au hasard des séquences simples de (GGC)n dans le génome de poulet

Des calculs statistiques ont été effectués dans le but de

connaître la probabilité de retrouver au hasard, dans le génome de poulet,

des répétitions consécutives de (GGC). Ces résultats sont donnés au

tableau 1. Ainsi, on s'aperçoit que la probabilité de retrouver un nombre

de plus en plus grand de (GGC) consécutifs diminue grandement à mesure que

l'on passe de 3 à 6 (GGC). En fait, selon ces chiffres, les chances de

retrouver au hasard la séquence (GGC)5 dans le génome de poulet sont très

faibles.

3.3.2 Détermination du Tm de 1'hybride de 20 pb formé entre le pCHIX0.6H/S et le p541

Dans le but de déterminer les conditions optimales de

détection de l'hybride de 20 pb pouvant se former entre le pCHIX0.6H/S (ou

le pCHVII1.8H/B) et le p541, nous avons déterminé son Tm d'après une courbe

de fusion. C'est ainsi que l'insertion du pCHIX0.6H/S a été fixée sur des

disques de nitrocellulose et hybridée avec celle du p541, marquée aux

extrémités 5' de façon à assurer une mesure quantitative précise des

hybrides. On a lavé ces derniers de la façon habituelle jusqu'à IX SSCPE -

0.1% SDS/65°C puis, on a chauffé de façon graduelle dans 0.1X SSCPE - 0.1%

SDS (voir section 3.2.2 méthodes). La courbe du pourcentage des hybrides

dissociés en fonction de la température a été tracée. Ce qui est

observable à la figure 8 est le résultat de 2 séries de détermination. La

température qui correspond à 50% des hybrides dissociés dans 0.IX SSCPE -

0.1% SDS est de 65.6 t 0.6°C. La détermination du Tm a permis de choisir

des conditions de lavage qui conviennent à 1'observation de ces courts

hybrides de façon à s'assurer de la nature de ce qui est observé. Ainsi,

des conditions de lavage de 0.2X SSCPE - 0.1% SDS/65°C sont assez sévères.

Ce sont d'ailleurs les conditions qui ont été généralement employées pour

la plupart des lavages d'hybrides.

TABLEAU 1

CALCUL DE LA PROBABILITE DE RETROUVER AU HASARD

DES SEQUENCES SIMPLES DE (GGC) DANS LE GENOME DE POULET

Nombre de (GGC)

3

4

5

6

Fréquence espérée

1/(2.04 X 106)

1/(1.78 X 108)

1/(1.56 X 1010)

1/(1.37 X 1012)

Nombre espéré d'après

la taille du génome* *

637

7

0.083

0.00095

*d'après Shapiro, 1976.

46

y 40

TEMPERATURE (°C)

Figure 8. Courbe de fusion de 1'ADN complementaire cloné de H5 (p541) avec l'insertion de pCHIXO.6H/S. Elle a été réalisée dans 0.1X SSCPE-

0.1% SDS.

47

3.3.3 Organisation et réitération des séquences de (GGC)n dans différents génomes

On a d'abord voulu démontrer clairement le caractère non répé

titif de l'insertion du pCHIX0.6H/S dans le génome de poulet, utilisée par

la suite avec celle du p541 pour des hybridations différentielles avec

plusieurs ADN génomiques. On se rappellera en ce qui a trait au p541 que

le gène de H5 est unique.

La figure 9 illustre les résultats obtenus après digestion des

ADN génomiques de poulets (Warren, White Leghorn) avec plusieurs enzymes

de restriction (EcoRI, Hindi II, BamHI, Hindi 11+EcoRI, BamHI+EcoRI), hybri

dation avec 1'insertion du pCHIX0.6H/S et lavage des hybrides à 0.2X SSCPE

- 0.1% SDS/65°C. Les tailles des fragments positifs attendus selon la

carte de restriction de XCHIX (figure IB) sont les suivantes: 9.3 kb

(EcoRI), 5.1 kb (HindiII), 9.8 kb (BamHI), 4.1 kb (Hindi11 - EcoRI) et

6.4 kb (BamHI - EcoRI). Sur 1'autoradiogramme présenté à la figure 9B, des

bandes de forte intensité correspondent effectivement à celles qui sont

attendues, sauf dans le cas de 1'ADN du poulet White Leghorn digéré avec

EcoRI, HindlII+EcoRI et BamHI+EcoRI (canaux a', d', e'). Ces différences

pour le poulet White Leghorn illustrent un polymorphisme pour le site

EcoRI. Ces résultats suggèrent donc qu'il y aurait une copie de l'inser

tion de pCHIX0.6H/S dans le génome haploïde de poulet.

D'autre part, on remarque sur la même figure qu'il y a un pa

tron de bandes de plus faible intensité, indiquant l'existence de séquences

ayant des homologies partielles avec le pCHIX0.6H/S. Ces bandes pourraient

provenir des séquences de (GGC)n et seront mieux identifiables par les

hybridations différentielles réalisées ci-après. En outre, dans tous les

canaux, il y a des bandes de forte intensité dans les hauts poids molécu

laires. On ne pense pas qu'elles soient dues à des digestions incomplètes

mais elles pourraient plutôt provenir de séquences (GGC)n dans des régions

du génome où il n'existe que très peu de sites pour les enzymes de restric

tion utilisées. Ces fragments de hauts poids moléculaires ne seraient pas

bien résolus dans les conditions d'électrophorèse employées.

aa'bb'cc'dd'ee'm a a' b b' c c'd d' e e

A B

Figure 9. Organisation de l'insertion de pCHIX0.6H/S dans le génome de poulet. A) Coloration au bromure d'éthidium des fragments d'ADN séparés par électrophorèse sur gel d1agarose à 0.5%. 5 yg d'ADN génomiquede poulets Warren (a) â (e) et White Leghorn (a') à (e') digérés respectivement avec EcoRI, HindlII, BamHI, HindlII+EcoRI, BamHI+EcoRI. B) Autoradiogramme du transfert du gel montré en (A) hybridé avec l'insertion de pCHIXO.6H/S marquée par "nick-translation". (m) marqueurs de migration ADN de X digéré avec Hindl11 et xdVl digéré avec Hael11; la longueur des fragments est donnée en kb.

-P»00

49

Par la suite, les ADN génomiques de plusieurs espèces à

savoir, de canard, de pigeon, de poulet (Warren), de souris et de l'humain

ont été digérés avec les enzymes de restriction EcoRI et HindiII puis

hybridés de façon différentielle avec les insertions du pCHIX0.6H/S et du

p541 (figure 10). Sur les deux autoradiogrammes obtenus, on observe un

patron de bandes communes qui identifie des fragments d'ADN porteurs de

séquences simples de (GGC)n tel que discuté au chapitre précédent (comparer

les canaux correspondants, figure 10B, B'). On voit qu'il y a, outre le

poulet, présence de ces séquences dans tous les génomes étudiés et qu'en

outre, elles ont une fréquence de réitération faible d'après le petit nom

bre de bandes discrètes obtenues.

Les autoradiogrammes présentés à la figure 10 sont issus de

l'exposition des filtres lavés à 0.5X SSCPE - 0.1% SDS/65°C. Des lavages à

0.2X SSCPE - 0.1% SDS/65°C ont également été réalisés avec ces memes fil

tres. On obtient alors le même patron de bandes communes (résultat non

montré), ce qui signifie que les bandes observées à 0.5X SSCPE proviennent

d'hybrides spécifiques aux sondes.

Certaines des bandes positives aux 2 sondes sont beaucoup plus

intenses que d'autres. On en retrouve des exemples chez l'humain. On peut

ainsi envisager qu'il y ait soit plus d'un fragment de même taille porteur

de (GGC)n ou soit plusieurs de ces séquences présentes dans le même frag

ment. Les résultats obtenus ne permettent pas de choisir l'une ou l'autre

de ces possibilités.

abcdefgh

A B B'

Figure 10. Organisation des séquences simples de (GGC)n dans différents génomes. A) Coloration au bromure d'éthidium des fragments d'ADN séparés par électrophorèse sur gel d'agarose à o.5%. 3 yg d'ADN génomique de

a canard, b pigeon, (c) poulet (Warren), (e) souris, (g) humain digérés avec HindlII; (d) poulet (Warren), (f) souris, (h) humain digérés avec EcoRI. B,B') Autoradiogrammes des transferts de 2 gels identiques à (A) hybridés avec les insertions de pCHIX0.6H/S (B) et p541 (B') marquées par "nick-translati on", (m) marqueurs de migration ADN de A digéré avec HindlII et AdVl digéré avec HaelII; la longueur des fragments est donnée en kb.

U1o

51

3.3.4 Quantification des séquences de (GGC)n dans différents génomes

Afin de mesurer plus précisément le nombre de séquences de

(GGC)n dans différents génomes, on a effectué des hybridations sur des

"dots" d'ADN génomiques. Comme sondes, on a utilisé les insertions de

pCHV2.5B/H et de p541 coupées avec Hhal, ce qui donne dans leurs portions

5' des fragments respectifs de 180 et 183 pb. La différence de taille

entre les deux fragments est due à la présence dans 1'ADN complémentaire

(p541) d'une séquence supplémentaire de 9 pb comprenant (GGC)2 (voir sec

tion 3.3.5) et à 1'existence d'un site Hhal dans le gène (pCHV2.5B/H) à

6 pb en amont du début de 1'ADN complémentaire.

Différentes quantités des ADN génomiques d'E. coli, de salmo

nelle (S_. thyphimurium), de sperme de saumon, de pigeon, de poulet Warren, de

souris et de 1'humain fixés sur filtre de nitrocellulose ont été hybridées

dans les mêmes conditions avec chacune des sondes. Les insertions de

pCHV2.5B/H, qui contient (GGC)g et celle du pCHVIII.8H/B ((GGC)5) ont été

utilisées comme standards d'hybridation.

La figure 11 illustre les résultats obtenus. On observe pour

les ADN génomiques que les signaux d'hybridation sont relativement forts

avec la sonde du p541 alors qu'ils sont très faibles ou inexistants avec

celle du pCHV2.5H/B. Cela signifie donc que les signaux observés avec ce

type d'hybridation différentielle sont dus à des séquences de (GGC)n.

Il faut souligner que la sonde du p541 donne un signal relati

vement fort avec l'insertion du pCHVIII.8H/B où il n'y a que 20 pb homolo

gues, dont (GGC)5, comparativement au pCHV2.5B/H qui lui est presque tota

lement homologue. En outre, la sonde de pCHV2.5B/H n'a que très peu d'af

finité pour l‘insertion de pCHVIII.8H/B d'après les signaux obtenus ; de

fait, il n'y a que 14 pb homologues dont (GGC)g. On peut donc supposer que

les séquences de (GGC)n détectées par ces hybridations comprennent plus que

(GGC)3.

52

pCHV p541 pCHV

a

Ml 3 e <*

pCHV p541

M13 e #

B

p541 pCHV p541

pCHV p541

1 e# 10 e# 100 #

1 #

10 e100 #

pCHV p541 pCHV

1 • # 1

10 S • 10

#30 # • 30

I / I I

pCHVins. pCHVIIins.

- pCHVins.

-pCHVIIins.

Figure 11. Quantification des séquences (GGC) dans différents génomes par hybridation de "dots". 0.2 pg (a), 0.5 pg (b)? 1.0 pg (c), 2.5 pg (d) et4.0 pg (e) des ADN génomiques d'E. coli (E), S_. thyphimurium (St), sperme de saumon (Ss), pigeon (Pi), poulet Warren (Po), souris "(S') et humain (H) ont été hybridés de façon comparative avec les fragments Hhal des insertions de pCHV2.5B/H (pCHV, 180 pb) et p541 (183 pb) marqués par "nick-translation".De l'ADN simple brin de M13mp8 a servi au besoin à compléter à 4 pg d'ADN total et à mesurer le bruit de fond. Les standards d'hybridation sont les insertions de pCHV2.5B/H (pCHVins.) et pCHVII1.8H/B (pCHVIIins.) à 1, 10,30, 60, 100, 200 et 500 copies (calculées par rapport au génome humain).L'ADN entraîneur utilisé dans les mélanges d'hybridation est celui de sDerme de saumon (A) ou de S_. thyphimuri um (B). Le temps d'exposition est de 2 jours avec 2 intensi ficateurs.

53

Afin de les quantifier dans chacun des génomes étudiés d'après

l'intensité des standards d'hybridation, il a fallu tenir compte de la

quantité d'ADN déposée par rapport à la taille du génome. Par exemple,

alors que l'on observe un très fort signal avec 1 yg d'ADN d'E. coli, cela

correspond en fait à 1 copie après correction pour la faible taille de son

génome (facteur de mille par rapport à l'humain). Ces déterminations ap

paraissent au tableau 2.

On constate que tel qu'il était apparu avec les hybridations

des transferts d'ADN génomiques digérés, que la fréquence des séquences de

(GGC)n dans les génomes étudiés est du type faiblement répété. En outre,

il semble y avoir de façon générale une relation entre le nombre de séquen

ces de (GGC)n et la taille du génome qui se traduirait par une augmentation

du nombre de copies avec celui du nombre de paires de bases (tableau 2).

TABLEAU 2

NOMBRE DE COPIES DES SEQUENCES DE (GGC)

DANS DIFFERENTS ORGANISMES

Organisme Taille du génome

haploïde*

Nombre de copies

de (GGC)^

|m o 6.4 X 106 pb

S. thyphimurium 1.0 X 107 pb

pigeon (érythrocytes) 0.9 X 109 pb

poulet (érythrocytes) 1.3 X 109 pb

souris (foie) 3.0 X 109 pb

saumon (sperme) 6.0 X 109 pb

humain (vessie) 3.0 X 109 pb

1

1

64

153

170

272

312

*d'après Shapiro, 1976

55

3.3.5 Identification de gènes ayant des séquences de (GGC)n

On a comparé les séquences de l'insertion de pCHIXO.6H/S et du

fragment Smal - BamHI de pCHVIII.8H/B avec celle d'un allèle du gêne de H5

(Ruiz-Carrillo et col!., 1983). On a alors déterminé que tout comme le

p541, il n'y a homologie qu'au niveau de la séquence simple de (GGC)n dans

la région 5' transcrite mais non traduite de 1'ARN messager. Toutefois, on

a remarqué un nombre différent de trinuclëotides (GGC) dans le gène par

rapport à l'ADN complémentaire cloné. Ainsi, dans le p541 il y a présence

d'une séquence supplémentaire (5'-GGCGGCAGC-3') qui comprend 2 (GGC) (voir

figure 12). Cette différence existe aussi avec la séquence de l'autre

allèle du gène, déterminée par Krieg et col 1 . (1983).

Il y a 14 pb homologues entre les séquences des 2 allèles du

gène de H5 et celles de pCHIX0.6H/S et pCHVIII.8H/B. Fait intéressant,

c'est une population de poulets qui a été utilisée pour la synthèse du p541

alors que la librairie d'ADN génomique dont sont issues les séquences des 2

allèles provient d'un seul individu. Il existe donc du polymorphisme quant

au nombre de (GGC) présents dans la portion transcrite mais non traduite

d'ARN messagers de H5. Il est impossible de dire si 1'individu qui

possède moins de (GGC) consécutifs représente un cas général ou est une

exception.

La recherche de séquences simples formées de (GGC/CCG)n dans

les banques de séquences ("GenBank", EMBL) accessibles par ordinateur ainsi

que dans la littérature a été fructueuse. Ces séquences ont été retrouvées

dans des gênes variés, chez différentes espèces. La figure 12 illustre

des portions de séquences des gènes identifiés comme étant porteurs de

séquences (GGC)n.

Ainsi, la séquence (GGC)4 est présente à la fois dans les

portions 5' -et 3' transcrites mais non traduites de l'ARN messager de H2A.F

(Harvey et col!., 1983) chez le poulet. Elle est située d'une part à

-15 pb du codon d'initiation de la traduction et d'autre part à 127 pb

après le codon de terminai son. La séquence (51-CÀGC-3') borde d'un côté la

PCHIX0.6H/S

p541

pCHVin .8H/B

A T G C G G Cl A G Cl G G C GGC GGC GGC GGC G 6 CIA G ClC TGGACGTTGTGAGC

********************

CAGACGCAGC GGC GGC GGC GGCGGCAGCAGCAGGAGCAGCCCCACA

********************GGGGAGCAGCGGCGGCGGCGGCGGCGCGGACGTCGCGGCGGGGAGG

gêne de H5 C A G A C G C A G C G G C G G C G G C------------------------------A G C A GGAGCAGCCCCACA

ARN-m H2A.Fportion 5' CCGGGGCTCG GGCGGCGGCGGCA CCATGGCAGGTGGGAAGGCTGGG

portion 3' C G C C G C C G T G GGC GGC GGC GGC C A G C|G CTGATTGGCTGAGGTTTCT

gêne 3-actine TTTATGGCGA GGC GGC GGC GGC GGC GGC CCTATAAAAAGCGAAGCG

oncogène des T24 G G G C G T A A G C|G G C GGC GGC GGC GGC GGC GGC GGGTGGGTGGGGCCG

Figure 12. Séquences de (GGC)n dans des gênes et des ADN clonés. Des séquences de (GGC)n sont présentes dans les sous-clones génomiques de poulet pCHIXO.6H/S et pCHVIIl.8H/B; le gêne (Ruiz-Carri11o et col!., 1983) et 11 ADN complémentaire cloné de H5 de poulet (p541, Ruiz-Vazquez et Ruiz-Carrillo, 1982); l'ARN-m de H2A.F de poulet (Harvey et col!., 1983); le gêne de 3-actine de poulet (Kost et col!., 1983); 1'oncogène des cellules T24 de carcinome de vessie humaine (Reddy , 1983). Le trait souligné illustre les répétitions consécutives de (GGC). Le symbole (*) démontre les homologies entre pCHIXO.6H/S, pCHVIIl.8H/B et le p541. Les triplets (AGC) en bordure des séquences simples sont encadrés. Sauf pour pCHIXO.6H/S et pCHVIIl.8H/B de nature inconnue, ce sont les séquences 51-3' correspondant aux brins non codants pour les gènes ou homologue à 1'ARN-m dans le cas du p541 qui sont données.

57

séquence (GGC)4 présente dans la partie 3' transcrite mais non traduite

alors qu'il n'y a aucun (AGC) en bordure de la séquence simple dans la

partie 5'.

Dans la partie 5' non transcrite du gène de g-actine cytoplas

mique chez le poulet, la séquence (GGC)g (Kost et col! ., 1983) est située

dans la région comprise entre les séquences consensus de types "CCAAT"

(Benoist et col!., 1980; Efstradiatis et col! ., 1980) et "TATA" (Goldberg,

1979). Cette séquence n'est bordée d'aucun (AGC). D'autre part les au

teurs, Kost et collaborateurs, ont comparé cette région avec son homologue

chez le rat. Il appert que cette séquence n'est pas présente chez ce der

nier: on ne retrouve que 2 triplets (GGC) séparés l'un de l'autre par 6

nucléotides.

L'oncogène des cellules 124 d'un carcinome de la vessie

chez l'humain a récemment été séquencé (Reddy, 1983). A 989 pb en

amont du début de la traduction, il y a la séquence (GGC)y encadrée d'un

triplet (AGC) du côté 5'. Cette séquence est située dans une région impor

tante pour l'activité transformante de l'oncogène puisque lorsqu'une délé

tion d'un segment de 305 pb comprenant cette séquence est effectuée,

1'activité transformante de 1'oncogène diminue fortement (Reddy, 1983).

En outre, dans le gêne normal c-has/bas, le triplet (AGC) en bordure

est absent et il n'y a que 5 des 7 (GGC). Ce cas illustre une fois de plus,

le potentiel de variabilité de ces séquences.

Des gènes contenant des séquences (GGC)3 ont aussi été trou

vés. Dans beaucoup de cas, c'est dans leurs parties codantes qu'elles ont

été trouvées, la pression sélective étant plus forte pour les conserver.

D'autre part, on a vu que du seul point de vue statistique, on a beaucoup

plus de chances de trouver des séquences (GGC)3 que (GGC)5 par exemple

(voir tableau 1). On a donc choisi de ne pas les inclure dans notre analy

se de la localisation des séquences simples de (GGC)n.

58

3.4 Discussion

On a d'abord effectué des calculs statistiques afin de connaî

tre les chances d'obtenir au hasard des séquences simples de (GGC)n. On a

alors vu que statistiquement, il n'existait à peu près pas de chance de

retrouver une séquence (GGC)g dans le génome de poulet. Pourtant, on en a

trouvé deux: une dans pCHIX0.6H/S et l'autre dans le gène de e-actine. On

voit donc qu'il y a nettement un biais dans 1'arrangement des nucléotides

dans le génome qui ne peut pas être traduit statistiquement de la même ma

nière que le lancement des dés.

La valeur de 65.6 ± 0.6°C dans 0.1X SSCPE - 0.1% SDS du point

de fusion de l'hybride de 20 pb pouvant se former entre le pCHIXO.6H/S et

le p541 est relativement élevée pour un hybride si court. Cela est sans

doute dû au fait qu'il est composé à 95% en bases G+C, augmentant ainsi sa

stabilité. De fait, dans la littérature Roberts et collaborateurs (1983)

ont rapporté 1'identification d'un court hybride de 15 pb entre une sonde

couvrant une portion 5' adjacente du gène de 6-globine de souris et un pe

tit ARN de 4.5S, également chez la souris. L'hybride formé qui possédait

une composition en G+C de 60% a été identifié par 1'hybridation d'un trans

fert d'ARN avec lavage dans 0.IX SSC - 0.1% SDS entre 40 et 50°C. Cela

illustre donc que l'on peut détecter de courtes homologies dans des condi

tions appropriées. Dans ce cas, les conditions de lavage sont moins as

tringentes car la composition en G+C est beaucoup plus faible.

Cette mesure du Tm a permis de déterminer des conditions

strictes, en quelque sorte un seuil pour observer les hybrides dus aux

séquences de (GGC)n. Sans doute, que de cette façon on élimine un certain

nombre de séquences possédant moins d'homologie avec les sondes mais fai

sant tout de meme partie de la famille des (GGC)n. Une illustration de

cela est donnée par l'existence d'un grand nombre de signaux plus faibles

(type C) obtenus lors du criblage initial de la librairie d'ADN génomique

avec le p541 dans des conditions moins sévères (chapitre 2).

59

Pour mesurer le nombre de répétitions de (GGC)n dans diffé

rents génomes, on a utilisé le principe des hybridations différentielles

avec le pCHIX0.6H/S (ou le pCHVIII.8H/B) et le p541 en sachant que la seule

région d'homologie entre ces sondes résidait au niveau des (GGC)n. Cela

permettait donc de s'assurer de la nature de ce qui était observé.

Dans un premier temps, on a démontré par les hybridations sur

des transferts d'ADN génomiques digérés avec différentes enzymes de res

triction que les séquences de (GGC) étaient faiblement répétées dans dif

férents génomes. On a par la suite constaté que ce taux de répétition chez

les espèces supérieures étudiées (saumon, pigeon, poulet, souris, humain)

variait autour de quelques centaines de copies seulement. Pour le poulet,

cela corrobore 1'estimation du nombre de répétitions des séquences de

(GGC) , du type de celles portées par les clones de type B, tel que discuté

au chapitre 2. D'autre part, il semble y avoir une corrélation entre la

taille du génome étudié et le nombre de séquences simples trouvées (d'après

le tableau 2).

Dans la littérature, les travaux de Tautz et Renz (1984) ont

fait état de séquences simples, présentes dans le génome de drosophile

(D. virilis) et conservées au cours de 1 'évolution. Les auteurs se sont

servis d'ARN poly A+ de glandes salivaires de D. virilis pour cribler des

librairies d'ADN génomique de cette même espèce. Pour 5 des clones posi

tifs lors du criblage et de nature inconnue, ils ont déterminé par séquence

que 1'homologie était due à différents types de séquences simples de compo

sition et de longueur variées qui étaient présentes dans ces clones ((CA)n,

(TA)n, (CAA)n, (CT)n, (AA)n, (TG)n). Par la suite, en hybridant des "dots"

d'ADN génomiques de levure, de blé, d'oursin de mer, de Xenopus et de

1‘humain avec plusieurs sondes d'oligodësoxyribonucléotides de séquences

simples (GT/CA, GA/CT, AA/TT, GG/CC, AT/TA, GC/CG, CAG/GTC), ils ont trouvé

que les ADN de tous les eucaryotes étudiés donnaient un signal sauf ceux

du blé et de la levure avec (GC/CG)n. On voit donc que ces types de

séquences simples sont répandus dans une variété d'organismes qui sont fort

éloignés du point de vue évolutif, ce qui pourrait être aussi le cas pour

les (GGC)n.

60

Il apparaît fort intéressant d'examiner la localisation des

séquences (GGC)n afin de tenter d'expliquer leur génération et leur main

tien dans différents génomes. Elles ont été trouvées dans le voisinage ou

à 1'intérieur de plusieurs gènes. Ainsi, des séquences (GGC)n sont présen

tes dans des parties transcrites mais non traduites d'ARN messagers (H5,

H2A.F) et dans des segments importants pour la promotion de 1‘expression

génique (oncogène des T24, g-actine). La localisation variée de ces sé

quences pourrait illustrer un éventail de rôles biologiques possibles. Cet

aspect sera davantage discuté au chapitre 5.

Dans le cas du gène de H5, on constate que le nombre de (GGC)

consécutifs est différent dans le gêne séquencé provenant de 1'ADN d'un

individu par rapport à 1‘ADN complémentaire synthétisé à partir d'un mélan

ge d'ARN d'une population de poulets. Le fait qu'un individu ait moins de

(GGC), 3 au lieu de 5, suggère que 1'intégrité de la séquence (GGC)5 n'est

pas essentielle pour la transcription du gêne. On ne peut cependant pas

exclure totalement la possibilité d'un effet quelconque sur la transcrip

tion puisque 3 des (GGC) demeurent chez cet individu. De la même façon,

bien que la séquence (GGC)5 du gène g-actine de poulet soit absente dans la

région homologue de ce gêne chez le rat, on ne peut pas exclure la possibi

lité que cette séquence puisse jouer un rôle chez le poulet.

Le polymorphisme rencontré au niveau du nombre de (GGC) dans

le gène de H5 et de l'oncogène des cellules T24 par rapport au gène normal

aide à suggérer un mécanisme pour la génération de ces séquences. Un

mauvais appariement suivi d'un glissement des nucléotides ("slipped

mispairing") sur le brin à copier, avant le passage de 1'ADN polymérase est

un mécanisme qui vaut la peine d'être retenu; cela se produirait lors de la

réplication. Il a été proposé pour la première fois par Streisinger et

col!. en 1966 pour expliquer des mutations dans le cadre de lecture du gène

du lysozyme de phages T4. De plus, il apparaît tel que démontré par

Farabaugh et collaborateurs (1978) et par Galas (1978), que dans le gène

lad, il existe des sites sensibles ("hot spots") qui subissent des

mutations plus rapidement que d'autres. Dans les procaryotes où ces sites

61

ont été clonés et analysés, ils ont été trouvés associés avec des courtes

répétitions directes de nucléotides. Ces insertions peuvent être ampli

fiées (insertion) ou perdues (délétion) à une fréquence élevée. La figure

13 illustre les événements qui se produisent pour engendrer la perte d'une

courte répétition directe selon ce modèle (d'après Moore, 1983).

Chez les eucaryotes, ce mécanisme a été utilisé pour expliquer

1'apparition de délétions à la fois dans des parties codantes et non codan

tes de gènes de globi ne de type & chez l'humain (Efstradiatis et col! .,

1980) ainsi que pour des mutations dans de courts segments des gènes cho

rioniques chez le ver à soie (Jones et Kafatos, 1980, 1982). Dans le cas

des séquences simples, ce mécanisme a également été suggéré à la fois pour

la génération (Tautz et Renz, 1984) et la grande variabilité (Cohen et al.,

1982) des séquences simples. Pour le gène de 1‘histone H5 et 1'oncogène

des cellules T24 par rapport au gène normal, il est impossible de dire si

ce sont des insertions ou des délétions qui se sont produites. Naturelle

ment, afin que la modification soit maintenue, il faut qu'elle s'opère dans

une cellule germinale.

Il faut souligner que le polymorphisme rencontré entre le gêne

de H5 et l'ADN complémentaire cloné, le p541, ne provient pas d'un artefact

de clonage lors de la réplication du plasmide p541 dans la bactérie. En

effet, le produit obtenu pour déterminer le site d'initiation de la trans

cription de 1 'ARN messager de H5 et ce, par la technique d'extension d'une

amorce contenait bien 5 (GGC) (Ruiz-Carrillo et col!., 1983). Pour ce

faire, le même mélange d'ARN ayant servi à la synthèse du p541 a été utili

sé. Cela signifie donc que ce polymorphisme existait bel et bien in vivo.

On a vu la présence de répétitions directes du triplet (AGC)

de chaque côté des séquences simples et ce, dans certains cas (pCHIX0.6H/S,

p541, gêne de H5). Ceci pourrait suggérer un mode de dispersion de ces sé

quences par insertion à la manière des éléments génétiques mobiles puisqu'à

ce moment-là, on observe une duplication de quelques paires de bases

présentes au site d'insertion et ce, sous la forme de répétitions directes

en bordure de la séquence insérée. Cependant, la présence de répétitions

62

D

ék

Figure 13. Modèle pour la génération de délétions à partir d'un mécanisme de glissement et de mauvais appariement lors de la réplication de 1'ADN. RI, R2 représentent de courtes répétitions directes sur un brin d'ADN et RI', R2' les séquences complémentaires sur l'autre brin. A) fourche de réplication. B) les brins se séparent. C) mauvais appariement et glissement des répétitions, ce qui engendre une boucle dont la longueur est fonction de la distance séparant RI et R2. D) excision de la boucle. E) produits de la réplication: un des ADN a perdu RI, RI' et des séquences adjacentes.

63

directes en bordure des séquences simples de (GGC)n n1 est pas une constante

pour toutes les séquences trouvées bien que certaines bases en bordure

aient pu être modifiées suite à des mutations de transition, d'adénine en

guanine. Le fait que ces séquences soient très courtes par rapport à la

taille des éléments génétiques mobiles connus dans la littérature rend

difficile toutefois, de conclure à un mode de dispersion de ces séquences

par insertion.

CHAPITRE 4

TRANSCRIPTION DES SÉQUENCES SIMPLES DE (GGC)

4.1 Introduction

L'identification d'une famille de séquences répétées dans le

génome humain, en 1'occurence la famille Alu (Houck et col!., 1979), a sup

porté les observations antérieures de Jelinek (1977, 1978b) qui démon

traient que les ARN hétérogènes nucléaires des cellules HeLa contenaient

des transcrits d'une famille de séquences répétées. Les membres de la

famille Alu sont fortement représentés dans ces ARN , comprenant de 18 à

25% de leur masse totale (Jelinek et col!., 1978a). Par exemple, des sé

quences de type Alu sont présentes dans des introns des gènes de 1'hormone

de croissance de rat (Page et col! ., 1981) et de l'oncogène humain c-sis

(Dal 1a-Favera et col!., 1981).

Plusieurs gènes ont d'autres types d'éléments répétés dans

leurs introns : la vitellogënine chez Xenopus (Ryffel et col!., 1981, 1983),

la corti cotropi ne £3-1 i potropi ne de boeuf (Watanebe et col!., 1982), l'ovo-

transferrine de poulet (Cochet et col 1 ., 1979) pour n'en nommer que quel

ques-uns. En ce qui a trait à la famille Knpl des séquences longues, répé

tées chez l'humain, la fréquence des transcrits retrouvés dans les ARN

hétérogènes nucléaires est également plus grande que dans 1'ARN cytoplas

mique (Kole et col!., 1983).

Il semble que la plupart des transcrits contenant des éléments

répétés soient restreints au noyau. Cependant, dans quelques espèces, un

petit nombre d'ARN messagers contiennent des éléments répétés. Ainsi, des

ARN messagers matures embryonnaires d'oursin de mer (S. purpuratus) con

tiennent de courts éléments répétés (Costantini et col!., 1980; Carpenter

et col!., 1982). Chez la drosophile (D. melanogaster), une courte séquence

répétée est présente à 1'extrémité de plusieurs ARN messagers différents,

caractéristique qui lui a valu le nom de suffixe (Tchurikov et col!.,

1982). Des ARN messagers contenant des séquences de la famille Alu ont

été retrouvés chez la souris (Georgiev et col 1 ., 1982).

Jusqu'à présent, 1'hypothèse de Britten et Davidson (1969) sur

la régulation de l‘expression des gènes par de courtes séquences répétées

66

disséminées dans le génome n'a pas été démontrée. Dans certains cas, il y

a présence de séquences répétées dans plusieurs ARN messagers exprimés,

puis réprimés au cours du développement (revu par Davidson et Posakony, 1982).

On en retrouve des exemples chez EL discoideum (Kimmel et Firtel, 1979;

Zuker et Lodish, 1981; Chung et co11-, 1983). Il y a aussi des observations

qui vont à 1'encontre de cette hypothèse. Ainsi, Ryffel et col 1. (1981,

1983) ont déterminé 1'existence de différentes séquences répétées dans

6 introns du gêne A-j de la vitellogënine chez Xenopus. Ils ont observé

que ces séquences n'étaient pas présentes dans l'autre gêne Ag, A-j et Ag

étant des produits de duplication d'un gêne ancestral. Selon les auteurs,

ces séquences répétées auraient donc été introduites dans A-| plus tard

au cours de 1'évolution ou auraient divergé rapidement dans ces 2 gênes.

En outre, Ryffel et collaborateurs ont trouvé de ces séquences répétées

dans des unités transcriptionnelles actives en 1'absence d'oestrogène.

Selon eux, cette observation va à 11 encontre d'un modèle de régulation

dans lequel les séquences répétées trouvées dans les introns seraient des

éléments régulateurs impliqués dans 1'expression de la vitellogënine induc

tible par les oestrogènes.

Après avoir identifié plusieurs séquences de (GGC)n dans des

portions transcrites de gènes, nous avons voulu examiner l'état de leur

transcription chez le poulet. Notre étude a porté sur 1'embryon de six

jours dans lequel une grande proportion du génome est exprimée et sur des

érythrocytes immatures où une plus faible partie du génome l'est.

67


4.2.1 Matériel

Les embryons de poulets de six jours (poulets à chair issus de

croisements de plusieurs lignées) ont été achetés au Couvoir Dësy

(St-Romuald, P.Q.). L'ARN polysomal, poly A+ ou non d'érythrocytes immatu

res de poulets (White Leghorn) a été fourni par A. Ruiz-Carrillo.

Le chlorure de guanidine ainsi que le thiocyanate de guanidine

proviennent de chez Fluka, la formamide et la formaldéhyde de Bio-Rad, le

Sephadex G-50 fin de chez Pharmacia, l'actinomycine D de Calbiochem,

l'oligo-dT de Miles Laboratories et le poly A de Boëhringer-Mannheim. Les

[a_32p] aï P (2 900 Ci /mmole) et [y-32p] dCTP (800 Ci /mmole) proviennent de

NEN.

Le matériel et les solutions ayant servi à 11 isolement d1 ARN

ont été autoclavés de façon à travailler en 11 absence d'activité RNase.

4.2.2 Méthodes

- Isolement d'ARN total

La purification chez le poulet d'ARN total d'embryons de six

jours ainsi que d'érythrocytes immatures a été réalisée selon un protocole

dérivé principalement de Chirgwin et col 1 .(1979) avec des modifications

mineures d'après Lamers et coll. (1982). Des embryons de six jours sont

prélevés, dêbarassës de la majorité du réseau sanguin extraembryonnaire et

congelés aussitôt dans l'azote liquide. Les globules rouges immatures

proviennent du sang d'un poulet rendu anémique par injection sous-cutanée

d'une solution à 2.5% (p/v) de phénylhydrazine pendant plusieurs jours. La

proportion de globules rouges immatures était égale à celle des matures.

Les érythrocytes sont lavés dans une solution isotonique (0.15 M NaCl - 1 M

Tris-HCl pH 7.4 - 0.005 M EDTA - 0.001 M EGTA) et récoltés par centrifu

gation à 800 g/10 min à 4°C. Les embryons et les globules rouges sont

68

respectivement mis en présence de 10 et 60 vol. de solution froide de 4 M

thiocyanate de guanidine - 0.5% (p/v) sarkosyl - 20 mM EDTA - 0.2 M BME -

50 mM Tris-HCl pH 7.5 et homogénéisés par passages à vitesse moyenne du

piston d'un Potter Elvehjem. Pour diminuer la viscosité, on passe

plusieurs fois le mélange au travers d'une aiguille #18. Par la suite, on

centrifuge à 10 000 g/10 min à 4°C. On ajoute au surnageant contenant les

acides nucléiques 0.025 vol . d'acide acétique 1 N et 0.75 vol. d'éthanol à

95%. La précipitation a lieu durant de 16 à 20 h à -20°C. On recueille

les acides nucléiques par centrifugation à 6 000 g/10 min à 4°C. Le culot

est solubilisé par agitation forte dans 0.5 vol. de solution froide de

7.5 M chlorure de guanidine - 50 mM Tri s-HCl pH 7.5 - 10 mM EDTA - 0.1 M

BME. L'ARN est précipité de façon différentielle avec 0.025 vol. d'acide

acétique 1 N et 0.5 vol. d'éthanol à 95%, 3 h à -20°C. On centrifuge à

6 000 g/10 min et on répète la précipitation différentielle deux autres

fois en diminuant à chaque fois de moitié le volume de la solution de chlo

rure de guanidine. Le culot final est lavé dans un grand volume d'éthanol

à 95% à temp, ambiante pour enlever la guanidine résiduelle. On solubilise

le culot dans 1% SDS - 10 mM Tris-HCl pH 7.5 - 5 mM EDTA et on centrifuge à

10 000 g/10 min à 20°C pour éliminer le matériel insoluble. On extrait

avec 1 vol. de chl oroforme : i sobutanol (4:1) et la phase aqueuse contenant

1‘ARN est finalement précipitée. On dose 1'ARN par la mesure de son

absorption à 260 nm (1 AggQnm = 40 pg ARN/ml). On vérifie s'il y a conta

mination d'ADN par un dosage au DABA. On a généralement moins de 1% d'ADN.

L'intégrité de l'ARN est vérifiée par électrophorèse sur gel d'agarose dans

des conditions dénaturantes.

- Électrophorèse et transfert d'ARN

La chambre à électrophorèse est préalablement traitée par

trempage dans une solution de formaldéhyde à 4% (v/v) afin d'enlever toute

trace d'activité RNAse. Les gels d'agarose sont faits dans le tampon

18 mM NagHPOg. - 2 mM NaHgPO^ pH 7.5 - 6% formaldéhyde. Le tampon de migra

tion a la même composition que le tampon précédent sauf qu'il contient 3%

formaldéhyde. L'échantillon d'ARN est dénaturé dans 6% formaldéhyde - 50%(v/v)

formamide - 18 mM Na^HPO^ - 2 mM NaH^PO^ pH 7.5 à 60°C/5 min (Rave ét al., 1979).

69

On lui ajoute 0.3 vol. de solution de coloration à 50% (v/v) glycërol - 50%

(v/v) formamide - 0.2% (p/v) bleu de bromophênol. L'ARN est visualisé à

l'UV après 45 min de trempage dans une solution de bromure d'éthidium à

1 ug/ml.

Pour le transfert d'ARN sur filtre de nitrocellulose, le gel

est agité dans 1 vol. de 10X SSCPE stérile pendant 20 min. Le montage pour

le transfert est identique à celui pour l'ADN (Southern, 1975) sauf que le

filtre de nitrocellulose est préalablement trempé dans de l'eau stérile et

équilibré dans du 10X SSCPE stérile. Ensuite, le filtre est séché sous une

lampe infra-rouge jusqu'à ce que l'odeur de la formaldéhyde soit disparue.

Finalement, il est chauffé au four à vide à 80°C/2 h pour fixer l'ARN.

- Marquage de l'ARN

Le protocole de marquage des extrémités 5' par la polynuclëo-

tide kinase de T4 est dérivé de celui d'Engel et Dodgson (1978). L'ARN est

d'abord hydrolyse en fragments de 100 à 200 nucléotides (taille vérifiée

par électrophorèse sur gel d'agarose en conditions dénaturantes) par incu

bation à 70°C/10 min dans une solution de 17 mM NaOH. Il est précipité et

repris dans une solution de 30 yl composée de 250 yCi de [y-^p] ATP, du

tampon kinase 58 (Maxam et Gilbert, 1980) et de 20 U de l'enzyme. La réac

tion est faite à 37°C/30 min puis arrêtée en rendant la solution à 10 mM

EDTA pH 8.0. Les molécules marquées sont séparées des nucléotides libres

par passage dans une colonne de Sephadex G-50 fin et élution avec du TE.

On a habituellement une activité spécifique de 3 x 10? cpm/yg ARN. On peut

hydrolyser cet ARN en conditions spécifiques en vue de contrôler pour la

présence éventuelle d'ADN marqué en le plaçant dans 0.15 M NaOH de 16 à

20 h à 37°C.

70

Hybridation des transferts d'ADN et d1 ARN

Les pré-hybridations et les hybridations avec ARN ont été

faites dans 50% formamide - 5X SSCPE - 10X D - 0.1% SDS - 50 y g/ml de

poly A, d'ARN de transfert de E. coli (dans le cas des sondes d1ARN) ou

d'ADN de sperme de saumon sonifié (avec les sondes d'ADN). On a laissé 3 h

(pré-hybridation) et de 16 à 20 h (hybridation) à 42°C. Les pré-hybrida

tions et les hybridations avec les ADN complémentaires ont été réalisées

selon la procédure décrite à la section 2.2.2 sauf qu'on a ajouté aux mé

langes 50 yg/ml de poly A et 10% (conc. finale) de dextran sulfate. Les

filtres ont été lavés jusqu'à 0.2X SSCPE - 0.1% SDS/65°C dans tous les cas.

Après exposition, les sondes ont été enlevées au besoin

par lavage selon la procédure de Thomas (1980). Il faut agiter les fil

tres dans une solution de 5 mM Tris-HCl pH 8.0 - 0.2 mM EDTA - 0.05% (p/v)

sodium pyrophosphate - 0.1X D pendant 1 3 2 h 5 65°C. L'efficacité des

lavages a été contrôlée par exposition des filtres pendant plusieurs

jours. Alors que 1'hybridation d'ARN total d'embryons de poulets hydro

lyse ou non (figure 14B, C) a été faite avec les deux filtres non lavés,

celle d'ARN total de globules rouges immatures hydrolysë ou non (figure

15B, C) a été faite avec les deux filtres lavés 2 fois.

4.3 Résultats

Les ARN totaux provenant d'embryons de 6 jours et d'érythro

cytes immatures de poulets ont été isolés de manière à étudier la trans

cription des séquences provenant des différents clones génomiques caracté

risés jusqu'à présent. Les mêmes quantités d'ADN des clones a 11 » XCHVII

(identique à XXIX), XCHIX, XX et xXIV ont été digérées avec EcoRI♦ Une

quantité équivalente du plasmide pCHVS.SHR coupé avec BamHI, porteur du

gène de H5 et de séquences adjacentes (environ 1 kb en amont et 6.5 kb en

aval; Ruiz-Carrillo, 1984) ainsi que le pCHIX0.6H/S linéarisé avec HindlII

(en quantité 5 fois moindre par erreur) ont été ajoutés. Ces ADN ont été

digérés en duplicata, séparés par électrophorèse et transférés sur 2 fil

tres de nitrocellulose. Ces 2 filtres ont servi à l'hybridation avec les

différentes sondes décrites ci-après (voir section 4.2.2 méthodes). Dans

tous les cas, les lavages ont été réalisés selon la procédure habituelle

jusqu'à 0.2X SSCPE - 0.1% SDS/65°C.

4.3.1 Transcription dans les embryons de poulets de 6 jours

D'abord donnons quelques renseignements sur le développement

embryonnaire du poulet (tirés de Rugh, 1964). Sa durée est de 21 jours. À

6 jours, l'embryon a la majorité de ses organes et il est en voie d'acqué

rir ses systèmes nerveux et olfactif. Il est également reconnaissable

comme un oiseau mais pas encore comme un poulet.

Dans l'embryon, l'hémoglobine peut être détectée dans les cel

lules des ilôts sanguins 35 heures après la fertilisation (Wilt, 1965).

Ces cellules produiront une lignée primitive d'ërythroblastes synthétisant

la g-globine de type embryonnaire. À 6 jours, la plupart d'entre eux

seront devenus des érythrocytes et contiendront 1'histone H5 (Neelin et

col!., 1964). La première série définitive (synthèse de B-globine de type

adulte) n'apparaît dans le compartiment sanguin qu'entre 6 et 7 jours et

leur maturation en érythrocytes inactifs a lieu entre 11 et 13 jours.

72

L1 ARN total des embryons de 6 jours a été marqué au 3%p et

hybridé avec les différents ADN recombinants décrits plus haut. On a

alors observé des signaux d'hybridation dans tous les cas (figure 14B).

Les ADN des clones génomiques donnent des bandes d1intensités comparables

sauf celui de AC H V11 qui donne un signal plus fort. En outre, les bandes

positives sont les mêmes qui avaient été obtenues précédemment pour les

hybridations différentielles avec le p541 et le pCHIX0.6H/S (chap. 2) et

qui démontraient la présence de séquences de (GGC)n. Ainsi, on observe les

bandes de tailles suivantes: 5.5 kb (XII, canal a), 9.7 kb (ACHVII, b),

9.3 kb (xCHIX, c), 3.7 kb ( AX, d) et 4.0, 5.2 kb (XXIV, e). Il est à noter

que 11 ADN de ACHVII (ou XXIX) avait également donné un signal plus fort que

les autres dans le cas de l'hybridation avec le p541 (figure 7, canal e').

Pour le XXIV, seul clone où il y a 2 fragments positifs, ces derniers cor

respondraient à deux régions d'homologie avec les sondes.

En ce qui a trait au pCHIX0.6H/S (figure 14B, g), il donne un

signal dont l'intensité est environ 5 fois moindre que le clone génomique

dont il origine, le xCHIX. Cependant, dans ce cas, il a été déposé par

erreur 5 fois moins de molécules comparativement aux autres ADN . Cela

signifie donc que la région transcrite dans XCHIX serait de dimension voi

sine à celle dans pCHIX0.6H/S.

On observe mieux dans le canal de pCHV8.8HR (figure 14B) après

surexposition de 1'autoradiogramme (résultat non montré), 2 bandes dont

l'une proviendrait du gène de H5 (fragment de 5.7 kb) et l'autre (fragment

de 4.3 kb) correspondrait à des séquences hautement répétées, situées en

aval du gène et présentes dans des transcrits nucléaires (M. Affolter, com

munication personnelle). Ce résultat est attendu car Col man et collabora

teurs (1983) ont déjà détecté l'ARN messager de H5 dans des embryons de

poulets de 6 jours.

Les hybrides observés sont spécifiques à l'ARN puisqu'après

hydrolyse de la sonde d'ARN en conditions douces (de manière à laisser in

tact un éventuel ADN) et hybridation, on n'a détecté aucun fragment positif

(figure 14C).

a b c d e f gabcdefgm a b c d e f g

A B C

Figure 14. Transcription dans les embryons de poulets de 6 jours. A) Coloration au bromure d'éthidium des fragments d'ADN séparés par électrophorèse sur gel d1agarose à 0.5%. (a) â (e) 1.5 yg d'ADN de Ail,ACHVII, ACHIX, AX, AXIV digérés avec EcoRI. (f) 0.3 yg d'ADN de pCHV8.8HR digéré avec BamHI. (g) 20 ngd'ADN de pCHIXO.6H/S linéarisé avec HindlII. B,C) Autoradiogrammes des transferts de 2 gels identiques à (A) hybridés avec TARN total marqué au 32P (B) et la même quantité hydrolysée (C) (15 X 106 cpm; filtres non lavés). Les temps d'exposition avec 1 intensificateur sont de 18 jours. Les flèches indiquent la position sur le gel des bandes correspondantes ayant hybridé avec les sondes, (m) marqueurs de migration ADN de A digéré avec Hindl11 et AdVl digéré avec HaeIII; la longueur des fragments est donnée en kb.

CO

74

4.3.2 Transcription dans 1 es érythrocytes immatures de poulet

L1 ARN total isolé de globules rouges immatures et marqué au

32p a à son tour été hybridé avec les différents ADN recombinants. Le but

était de voir si les homologies avec des transcrits provenant de 1'embryon

de 6 jours sont également présentes pour des cellules dont la différentia

tion est en voie de parachèvement et par conséquent où moins de gènes sont

exprimés. Le résultat est montré 3 la figure 15B. On a obtenu une réponse

comparable à 1'embryon sauf dans le cas de pCHVS.SHR (canal f) où seulement

les transcrits du gène de H5 sont détectés sur 1'autoradiogramme montré. Le

contrôle pour la présence d'ADN dans la sonde d'ARN, réalisé tel que décrit

à la section précédente, est également négatif (figure 15C).

On a voulu par la suite tenter d'indenti fier sommairement des

transcrits pouvant contenir des séquences simples de (GGC)n. L'ARN total

des embryons de 6 jours ainsi que 1'ARN total cellulaire, le polysomal et

le polysomal poly A+ d'érythrocytes immatures ont été séparés par électro

phorèse sur gel d'agarose dans des conditions dénaturantes et transférés

sur filtre de nitrocellulose. Ils ont été hybridés avec l'insertion du

pCHVIIl.8H/B puisque précédemment, c'est le àCHVII qui a donné le signal le

plus fort avec les différents types d'ARN totaux. Les hybrides ont été

lavés jusqu'à 0.2X SSCPE - 0.1% SDS/65°C. Après une exposition de 4 jours

avec deux intensi ficateurs, on n'a détecté aucun transcrit avec la sonde

utilisée (résultat non montré). Pour une exposition de 12 jours (figure

16), on distingue dans le canal de l'ARN polysomal poly A+ de globules

rouges immatures (d), une faible bande dont la taille pourrait correspondre

3 l'ARN messager de H5 qui a 1 000 nucléotides (Ruiz-Carrillo et col!.,

1983). Cet ARN provient de poulets White Leghorn qui possèdent la séquence

(GGC)g dans le gène de H5 tel que décrit précédemment. Puisqu'il existe

une homologie de 20 pb entre les 247 pb séquencées de pCHVIIl.8H/B et l'ARN

messager de H5 contenant la séquence (GGC)5, cette homologie est par consé

quent détectable dans la fraction enrichie pour cet ARN en 1'occurence

l'ARN polysomal poly A+ de globules rouges immatures.

a b c d e f g a b c d e f gabcdefgm

2 3.1

9.4 6.6

4.4

2.3

1.7

1.3

0.9

0.5

♦

A B C

Figure 15. Transcription dans les érythrocytes immatures de poulet. A) Coloration au bromure d'éthidium des fragments d'ADN séparés par électrophorèse sur gel d'agarose à 0.5%. (a) à (e) 1.5 yg d'ADN de Ail,XCHVII, xCHIX, XX, XXIV digérés avec EçoRI. (f) 0.3 yg d'ADN de pCHVS.SHR digéré avec BamHI. (g) 20 ng d'ADN de pCHIX0.6H/S linéarisé avec HindlII. B,C) Autoradiogrammes des transferts de 2 gels identiques à (A) hybridés avec l'ARN total marqué au 32p (B) et la même quantité hydrolysée (C) (25 X 10° cpm; filtres préalablement lavés 2 fois). Les temps d'exposition avec 2 intensi ficateurs sont de 12 jours. Les flèches indiquent la position sur le gel des bandes correspondantes ayant hybridé avec les sondes, (m) marqueurs de migration ADN de X digéré avec HindlII et XdVl digéré avec HaellI ; la longueur des fragments est donnée en kb.

"-4

en

76

abed

Figure 16. Hybridation d'un transfert d'ARN d'embryons de 6 jours et d'érythrocytes de poulets avec pCHVIIl.8H/B. 30 yg d'ARN total d'embryonsde 6 jours (a) et d'érythrocytes immatures (b), 30 yg d'ARN polysomal (c) et 6 yg de polysomal poly A+ (d) d'érythrocytes immatures ont été séparés par électrophorèse sur gel d'agarose S 1% dans des conditions dénaturantes, transférés sur filtre de nitrocellulose et hybridés avec l'insertion du pCHVIIl.8H/B marquée par "nick-translati on". L'autoradiogramme montré provient d'une exposition de 12 jours avec 2 intensi ficateurs. La longueur des fragments d'ADN de A digéré avec HindlII et AdVl digéré avec HaelII utilisés comme marqueurs de migration, est donnée en kb.

D'autre part, bien qu'aucune bande définie n'apparaisse pour

1 es autres échantillons, on remarque tout de même un signal étendu (une

traînée), assez important pour l'ARN total d'embryons et d'érythrocytes

immatures (figure 16, canaux a et b). Cela pourrait correspondre à une

population d'ARN hétérogènes nucléaires puisque par rapport à l'ARN total

dans le cas des érythrocytes immatures, ce signal est beaucoup plus faible

pour l'ARN polysomal (c) et absent pour l'ARN poly A+ (d).

4.4 Discussion

Pour l'embryon de 6 jours et les érythrocytes- immatures de

poulets, on a observé une hybridation entre 1 1 ARN total et tous les frag

ments de clones génomiques étudiés contenant des séquences simples de

(GGC)n. On se rappellera que ces séquences ont été identifiées par hybri

dations différentielles avec les sondes de pCHIX0.6H/S et p541 (chapi

tre 2). Puisque les signaux observés ont des intensités comparables, cela

suggère que les homologies des différents ADN vis-à-vis de ces ARN pour

raient être de tailles voisines en supposant que ces derniers soient en

même abondance dans les sondes utilisées. Ces résultats indiquent donc que

les séquences de (GGC)n seraient effectivement transcrites.

Lors de 1'hybridation d'un transfert d'ARN, on n'a détecté

aucune bande définie entre l'ARN total d'embryons de 6 jours et 1'insertion

de p CHVI II.8H/B contenant la séquence (GGC)g. Nous avons vu au chapitre 3

que l'ARN messager de 1'histone H2A.F possédait dans ses parties 5' et 3'

non traduites la séquence (GGC)4. Cet ARN messager qui est polyadënylë a

déjà été identifié par Harvey et collaborateurs (1983) dans des embryons de

poulets de 6 jours. Cependant, 1'homologie avec le pCHVIII.8H/B au niveau

des séquences de (GGC)n n'est que de 12 pb, ce qui n'est pas détectable

dans les conditions de lavage utilisées et ce, sans doute même en présence

d'ARN poly A+.

En réalisant 1'hybridation avec la sonde de (GGC)n sur un

transfert de différentes sortes d'ARN, on a tenté d'identifier la taille

des transcrits mais en vain puisque sauf pour H5, on n'a pu identifier la

taille d'aucun transcrit de (GGC)n. Les signaux observés semblent plutôt

provenir de plusieurs transcrits de tailles différentes et ce, davantage

avec les fractions d'ARN total comparativement aux fractions enrichies.

Ces transcrits hétérogènes pourraient donc être surtout nucléaires sans

exclure la possibilité qu'il y ait en faible abondance, des transcrits dans

le cytoplasme. Quant à leur nature, on peut formuler plusieurs hypothè

ses. Il pourrait s'agir de transcrits de gènes structuraux ou encore de

transcrits quelconques (ex. "sn RNAs") non exportés vers le cytoplasme. On

a d'ailleurs identifié au chapitre 3 plusieurs gènes structuraux porteurs

79

de (GGC)n. Les séquences simples de (GGC)n pourraient entre autres être

transcrites dans les portions excisées des ARN précurseurs. D'autre part,

le fait d1 observer des signaux comparables pour 11 embryon de 6 jours et les

érythrocytes immatures indique qu'il pourrait s'agir d'ARN nécessaires aux

fonctions de maintien dans la cellule et transcrits de façon constitutive.

Les hybridations avec le fragment de restriction contenant le

gène de 1'histone H5 servent en quelque sorte de contrôle pour l'étude de

la transcription. On a vu que les produits de transcription de ce gène

étaient, tel qu'attendu, présents en plus grand nombre dans les érythrocy

tes immatures par rapport à 1'embryon total (figures 14, 15). Cependant,

on peut difficilement se servir de ces signaux pour quantifier les trans

crits contenant des séquences simples de (GGC)n car on ne connaît pas la

taille des homologies détectées.

La transcription des séquences simples de (GGC)n semble suivre

celle de d'autres séquences. Dans la littérature, on a rapporté la trans

cription de séquences simples répandues chez des espèces et des tissus dif

férents. Ainsi, Tautz et Renz (1984) ont noté l'hybridation de polynucléo-

tides synthétiques de (GT/CA)n, (GA/CT)n, (AA/TT)n avec l'ARN total issu de

différents eucaryotes : 1'humain (fibroblastes), Xenopus (foie), Drosophila

(cellules Kc), l'oursin de mer (oeufs non fertilisés), le blé (feuilles

vertes) et la levure. Cependant, ces séquences ne sont pas présentes en

même abondance dans les transcrits. Chez certains organismes, elles sont

fortement répandues dans un large éventail d'ARN totaux alors que dans

d'autres, elles sont présentes dans seulement quelques ARN . Les résultats

d'hybridations de "dots" d'ADN génomiques ont cependant indiqué qu'elles

étaient fortement représentées dans les génomes étudiés. Tautz et Renz ont

suggéré que ces séquences simples puissent être co-transcrites avec des

gênes ou des séquences répétées transcrites. D'autre part, Santoro et

Costanzo (1983) ont quant à eux observé des séquences (GT/CA)n dans l'ARN

poly A+ de foie humain.-

CHAPITRE 5

DISCUSSION GÉNÉRALE

81

Des séquences simples composées du motif (GGC) ont d'abord été

trouvées dans quelques clones génomiques de poulet donnant un signal d1 ho

mologie partielle avec un ADN complémentaire cloné de 1‘histone H5. On a

par la suite déterminé que ces séquences formaient une famille de séquences

faiblement répétées, chez le poulet et d1 autres organismes chez les oi

seaux, les poissons et les mammifères. Quelques gènes ont été identifiés

comme étant porteurs de ce type de séquences, particulièrement dans leurs

portions non codantes pour plus de trois répétitions consécutives des tri-

nucléotides. Par la suite, il s1 est avéré que ces séquences étaient trans

crites, probablement surtout en ARN nucléaires dans l'embryon de 6 jours

et les érythrocytes immatures de poulet. Je ferai ici brièvement quelques

hypothèses sur 1'origine de ces séquences et les rôles qu'elles pourraient

être susceptibles de jouer.

On a vu qu'un mécanisme de mauvais appariement et glissement

des courtes répétitions directes lors de la réplication de 1'ADN pourrait

expliquer la génération du polymorphisme dans le nombre de (GGC) tel que

rencontré dans les cas du gène de H5 et de l'oncogène des cellules T24 (par

rapport au gène normal). On pourrait dire de façon générale que la généra

tion de ces séquences pourrait d'abord être soumise à l'existence préalable

d'au moins 2 répétitions directes de (GGC) puis de l'action de ce mécanis

me. Les chances que ces séquences soient retrouvées dans le génome se

raient fonction de sa taille (les résultats des hybridations des "dots"

d'ADN génomiques semblent en accord avec cette hypothèse) et de sa compo

sition en G+C. A ce propos, il est intéressant de souligner qu'une défi

cience en dinucléotides CpG est commune aux génomes des vertébrés supé

rieurs puisque les cytosines méthylées ont tendance à muter spontanément en

thymines (Bird, 1980). Etant donné que ce dinucléotide fait partie des sé

quences (GGC)n, on pourrait peut-être relier la faible représentation de

ces dernières dans les génomes des vertébrés étudiés avec la faible propor

tion de CpG par rapport aux autres dinucléotides, rendant ainsi la présence

de 2 répétitions directes de (GGC) moins fréquente. Par la suite, le main

tien de ces séquences dépendrait de la sélection naturelle exercée sur

elles. Dans certains cas, elles apporteraient une contribution à l'expres

sion du phénotype et dans d'autres, elles n'auraient aucun rôle en soi dé

pendant de leur localisation dans le génome (séquences adjacentes).

La présence de ces séquences riches en G+C à motif répété

pourrait contribuer à la formation locale de structures particulières dans

11 ADN, inconnues et différentes de la structure B qui est la plus répan

due. D'ailleurs, plusieurs exemples ont été rapportés dans la littérature

où des séquences simples sont sensibles à certaines nuclëases spécifiques

et par conséquent peuvent engendrer des modifications locales dans la

structure de 1'ADN (Hentschel , 1982; Glikin et al., 1983).

Ces structures pourraient également être reconnues lors d'évé

nements de recombinaison génique. Plusieurs exemples de l'implication des

séquences simples dans des mécanismes de conversion ont déjà été cités dans

la littérature (Sures et col!., 1978; SIightom et col!., 1980; Cohen et

col!., 1982). On connaît peu de choses sur la structure que ces séquences

peuvent avoir dans 1'ADN alors qu'on sait par exemple d'après des expérien

ces in vitro, que la structure Z est observée en conditions appropriées

avec des séquences ayant une composition alternée en purines-pyrimidines,

ce sujet, il a été rapporté dans la littérature que de courtes séquences de

8 pb pouvant adopter cette conformation étaient contenues dans des séquen

ces ayant une activité amplificatrice d'un promoteur chez SV-40 (Nordheim

et Rich, 1983). Les auteurs ont ainsi proposé un modèle de régulation

transcriptionnelle impliquant des changements dans la superhëlici té de

T ADN.

Du point de vue de la transcription de ces séquences, il est

étonnant de constater que bien qu'elles soient faiblement répétées dans le

génome de poulet, on a pu détecter des transcrits. On peut se demander si

la présence de ces séquences pourrait affecter 1‘efficacité de la trans

cription d'un gène de par des modifications dans la structure de 1'ADN. On

a vu que ces séquences étaient retrouvées à des positions variées dans des

gènes. On se rappellera qu'il y a présence de la séquence (GGC)5 entre les

séquences consensus de type "CCAAT" et "TATA" dans le gène de g-actine de

poulet et de (GGC)7 dans une portion importante pour 1'activité transfor

mante de l'oncogène des cellules T24 de carcinome de vessie humaine.

Dans le cas du gêne de H5, on ne sait pas si l'efficacité de

la transcription est différente chez l'individu porteur de moins de (GGC)n

(clone génomique) par rapport à la population de poulets dont est issu

11 ADN complémentaire cloné (p541). Il n'en demeure pas moins que ce poly

morphisme dans le nombre de (GGC) n'est pas une mutation léthale.

On peut souligner que chez le poulet deux ARN messagers

d'histones, H5 et H2A.F ont une séquence simple de (GGC)n dans leurs por

tions 5' transcrites mais non traduites. Est-ce que cela signifie un méca

nisme commun de régulation ou Ta t-il déjà signifié par le passé? Il est

à noter que tous deux possèdent de façon exceptionnelle par rapport aux

autres messagers d'hi stones connus, des extrémités 3' polyadënylëes (Harvey

et al, 1983; Ruiz-Carrillo et al., 1983).

Il apparaîtrait simpliste de vouloir à tout prix attribuer ou

non un rôle général à ces séquences. Il semble que le rôle de ces séquen

ces s'il en est, pourrait être fonction de l'endroit où elles se trouvent

et être dévoilé par divers types d'études. Ainsi, des expériences de recons

titution de la chromatine en présence d'oligonucléotides synthétiques, utili

sés seuls ou en association avec des séquences dites "conventionnelles"

seraient un premier type d'approche pour examiner s'il se produit des chan

gements dans la chromatine. En outre, on pourrait poursuivre 1'analyse des

séquences géniques amorcée dans le présent travail afin de déterminer où

elles apparaissent,, si elles sont associées avec des séquences adjacentes

d'un type particulier et si elles ont été conservées chez des gènes homolo

gues de différentes espèces. Au niveau de l'étude directe de la régulation

de l'expression des gênes, on identifierait, par exemple pour H5, les élé

ments régulateurs par des techniques de mutagënêse et d'expression en vi

tro. Nous verrions si ces séquences simples sont impliquées. Il faudrait

également regarder l'état de la méthylation dans les séquences (GGC) iden

tifiées en amont de certains gênes étant donné leur composition riche en

cytosines mëthylabies.

84

Une variété de rôles ont été suggérés pour de nombreux

exemples de séquences simples rapportés dans la littérature. L'intérêt de

ce type de séquences réside dans les répétitions consécutives d'un motif de

quelques paires de bases.

Pour le moment, il reste beaucoup de travail à accomplir pour

justifier 1'existence de ces séquences et par extension du grand nombre de

séquences non géniques des génomes d'eucaryotes. Cela rend le défi

d'autant plus grand pour progresser dans la voie de cette connaissance. Le

présent travail fournit quelques éléments qui espérons-le, pourront

peut-être y contribuer.

LISTE DES RÉFÉRENCES

Adams, J.W., Kaufman, R.E., Kristchmer, P.J., Harrison, M., Nienhuis, A.W.

1980. A family of long reiterated DNA sequences, one copy of which

is next to the human beta globin gene. Nucl. Acids Res.

8: 6113-6128.

Arthur, R.R., Straus, N.A. 1978. DNA-sequence organization in the genome

of the domestic chicken. Can. J. Biochem. 65: 257-263.

Arthur, R.R., Straus, N.A. 1983. DNA sequence organization and

transcription of the chicken genome. Biochim. Biophys. Acta,

741: 171-179.

Benoist, C., O'Hare, K., Breathnach, R., Chambon, P. 1980. The ovalbumin

gene - sequence of putative control regions. Nucl. Acids Res.

8: 127-142.

Benton, W.D., Davis, R.W. 1977. Screening Agt recombinant clones by

hybridization to single plaques in situ. Science, 196: 180-182.

Bird, A.P. 1980. DNA méthylation and the frequency of CpG in animal DNA.

Nucl. Acids Res. 8: 1499-1504.

Bouchard, R.A. 1982. Moderately repetitive DNA in evolution. Int. Rev.

Cytol. 76: 113-193.

Britten, R.J., Kohne, D.E. 1965. Nucleotide sequence repetition in DNA.

Carnegie Inst. Wash. Year Book, 65: 78.

Britten, R.J., Kohne, D.E. 1968. Repeated sequences in DNA. Science,

161: 529-540.

Britten, R.J., Davidson, E.H. 1969. Gene regulation for higher cells: a

theory. Science, 165: 349-358.

86

Britten, R.J., Davidson, E.H. 1971. Repetitive and non repetitive DNA

sequences and a speculation on the origins of evolutionary novelty.

Quant. Rev. Biol . 46: 111-138.

Carpenter, C.D., Bruskin, A.M., Spain, L.M., Eldon, E.D., Klein, W.H.

1982. The 3' untranslated regions of two related mRNAs contain an

element highly repeated in the sea urchin genome. Nucl. Acids Res.

10: 7829-7842.

Chirgwin, J.M., Przybyla, A.E., Mac Donald, R.J., Rutter, W.J. 1979.

Isolation of biologically active ribonucleic acid from sources

enriched in ribonucléase. Biochemistry, 18: 5294-5299.

Chung, S., Zuker, C., Lodish, H.F. 1983. A repetitive and apparently

transposable DNA sequence in Dictyostelium discoideum associated with

developmentally regulated RNAs. Nucl . Acids Res. 11: 4835-4852.

Cochet, M., Gannon, F., Hen, R., Maroteaux, L., Perrin, F., Chambon, P.

1979. Organization and sequence studies of the 17-piece chicken

conalbumin gene. Nature, 282: 567-574.

Cohen, J.B., Effron, K., Rechavi, G., Ben-Neriah, Y., Zakut, R., Givol, D.

1982. Simple DNA sequences in homologous flanking regions near

immunoglobulin Vy genes : a role in gene interaction? Nucl. Acids

Res. 10: 3353-3370.

Colman, A., Krieg, P., Wells, J.R.E. 1983. Analysis of histone H5 and

globin mRNAs in chick-embryo development. Eur. J. Biochem.

131: 551-554.

Costantini, F.D., Britten, R.J., Davidson, E.H. 1980. Message sequences

and short repetitive sequences are interspersed in sea urchin egg

poly(A)+ RNAs. Nature, 287: 111-117.

87

Crain, W.R., Davidson, E.H., Britten, R. J. 1976. Contrasting patterns of

DNA sequence arrangement in Apis mellifera (honeybee) and Musca domes

tica (housefly). Chromosoma, 59: 1-12.

Dalla-Favera, R., Gelmann, E.P., Gallo, R.C., Wong-Staal, 1981. A human

one gene homologous to the transforming gene (v-sis) of simian sar

coma virus. Nature, 292: 31-35.

Davidson, E.H., Galau, G.A., Angerer, R.C., Britten, R.J. 1975. Compa

rative aspects of DNA organization in metazoa. Chromosoma, 51: 253-

259.

Davidson, E.H., Britten, R.J. 1979. Regulation of gene expression:

possible role of repetitive sequences. Science, 204: 1052-1059.

Davidson, E.H., Posakony, J.W. 1982. Repetitive sequences transcripts

in development. Nature, 297: 633-635.

De Jimenez, E.S., Gonzalez, J.L., Dominguez, J.L., Saloma, E.S. 1974.

Caracterization of DNA from differentiated cells. Analysis of the

chicken genomic complexity. Eur. J. Biochem. 45: 25-29.

Denhardt, D.T. 1966. A membrane filter technique for the detection of

complementary DNA. Biochem. Biophys. Res. Commun. 23: 641-646.

Devereux, J., Haeberli, P., Smithies, 0. 1984. A comprehensive set of

sequence analysis programs for the VAX. Nucl. Acids Res.

12: 387-395.

Dodgson, J.B., Strommer, J., Engel, J.D. 1979. Isolation of the chicken

g-globin gene and a linked embryonic e-like globin gene from a

chicken DNA recombinant library. Cell, 17: 879-887.

Doolittle, W.F., Sapienza, C. 1980. Selfish gene, the phenotype para

digm and genome evolution. Nature, 284: 601-603.

88

Dunsmuir, P., Brorein, W.J., Simon, M.A., Rubin, G.M. 1980. Insertion of

the Drosophila transposable element Copia generates a 5 base pair

duplication. Cell, 21: 575-580.

Dybvig, K., Clark, C.D., Aliperti, G., Schlesinger, J. 1983. A chicken

repetitive DNA that is highly sensitive to single-strand specific

endonucleases. Nucl. Acids Res. 11: 8495-8508.

Eden, F.C., Hendrick, J.P. 1978a. Unusual organization of DNA sequences

in the chicken. Biochemistry, 17: 5838-5844.

Eden, F.C., Hendrick, J.P., Gotlieb, S.S. 1978b. Homology of single copy

and repeated sequences in chicken, duck, Japanese quail and ostrich

DNA. Biochemistry, 17: 5113-5121.

Eden, F.C. 1980. A cloned chicken DNA fragment includes two repeated DNA

sequences with remarkably different genomic organization. J. Biol .

Chem. 255: 4854-4863.

Efstradiatis, A., Posakony, J.W., Maniatis, T., Lawn, R.M., O'Connell, C.,

Spritz, R.A., De Riel, J.K., Forget, B.G., Weissman, S.M., Slightom,

J.L., Blech!, A.E., Smithies, 0., Baralle, F.E., Shoulders, C.C.,

Proudfoot, N.J. 1980. The structure and evolution of the human

3-globin gene family. Cell, 21: 653-668.

Engel, J.D., Dodgson, J.B. 1978. Analysis of the adult and embryonic

chicken globin genes in chromosomal DNA. J. Biol . Chem.

253: 8239-8246.

Farabaugh, P.J., Schmeissner, U., Hofer, M., Miller, J.H. 1978. Genetic

studies of the lac repressor. VII. On the molecular nature of

spontaneous hotspots in the lacl gene of Escherichia coli. J. Mol.

Biol ., 126: 847-857.

Fickett, J., Goad, W., Kanehisa, M. 1982. Los Alamos sequence library: A

database and analysis system for nucleic acid sequences, LA-9274-MS,

Los Alamos National Laboratory.

Galas, D.J. 1978. An analysis of sequence repeats in the lad gene of

Escherichia coli. J. Mol. Biol. 126: 858-863.

Gebhard, W., Meitinger, T., Hochtl, J., Zachau, H.G. 1982. A new family

of interspersed repetitive DNA sequences in the mouse genome. J. Mol.

Biol . 157: 453-471.

Gebhard, W., Zachau, H.G. 1983. Simple DNA sequences and dispersed

repetitive elements in the vicinity of mouse immunoglobulin < light

chain genes. J. Mol. Biol. 170: 567-573.

Georgiev, G.P., Kramerov, D.A., Ryskov, A.P., Skryabin, K.G., Lukanidin,

E.M. 1982. Dispersed repetitive sequences in eukaryotic genomes and

their possible biological significance. Cold Spring Harbor Symp.

Quant. Biol. 47: 1109-1121.

Glikin, G.C., Garguilo, G., Rena-Descalzi, 1., Worcel, A. 1983.

Escherichia coli single-strand binding protein stabilizes specific

denatured sites in superhelical DNA. Nature, 303: 770-774.

Goldberg, M. 1979. Ph. D. thesis, Stanford University, Stanford,

Cal i forni a.

Grunstein, M., Hogness, D. 1975. Colony hybridization: a method for the

isolation of cloned DMAs that contain a specific gene. Proc. Nat.

Acad. Sci., U.S.A. 72: 3961-3965.

Hamada, H., Kakunaga, T. 1982. Potential Z-DNA forming sequences are

highly dispersed in the human genome. Nature, 298: 396-398.

Haniford, D.B., Pulleyblank, D.E. 1983. Facile transition of poly

[d(TG)-d(CA)] into a left handed helix in physiological conditions.

Nature, 302: 632-634.

90

Harvey, R.P., Whiting, J.A., Coles, L.S., Krieg, P.A., Wells, J.R.E. 1983.

H2A.F: An extremely variant histone H2A sequence expressed in the

chicken embryo. Proc. Nat. Acad. Sci., U.S.A. 80: 2819-2823.

Hentschel, C. 1982. Homocopolymer sequences in the spacer of sea urchin

histone gene repeat are sensitive to S\ nuclease. Nature,

295: 714-716.

Hess, J.F., Fox, M., Schmid, C., Shen, C.-K.J. 1983. Molecular evolution

of the human adult a-globin-like gene region : Insertion and deletion

of Alu family repeats and non-Alu DNA sequences. Proc. Natl. Acad.

Sci ., U.S.A. 80: 5970-5974.

Houck, C.M., Rinehart, F.P., Schmid, C.W. 1979. A ubiquitous family of

repeated DNA sequences in the human genome. J. Mol. Biol.

132: 289-306.

Jagadeeswaran, P., Forget, B.G., Weissman, S.M. 1981. Short interspersed

repetitive DNA elements in eucaryotes : Transposable DNA elements

generated by reverse transcription of RNA pol III transcripts? Cell,

26: 141-142.

Jelinek, W.R. 1977. Specific nucleotide sequences in HeLa cell inverted

repeated DNA: enrichment for sequences found in double-stranded

regions of heterogeneous nuclear RNA. J. Mol. Biol. 115: 591-601.

Jelinek, W.R., Evans, R., Wilson, M., Salditt-Georgieff, M., Darnel 1, J.E.

1978a. Oligonucleotides in heterogeneous nuclear RNA: similarity of

inverted repeats and RNA from repetitions DNA sites. Biochemistry,

17: 2776-2783.

91

Jelinek, VJ.R. 1978b. Inverted repeated DNA from Chinese hamster ovary

cells studied with cloned DMA fragments. Proc. Nat. Acad. Sci.,

U.S.A. 75: 2679-2683.

Jelinek, W.R., Toomey, T.P., Leinwand, L., Duncan, C.H., Biro, P.A.,

Choudary, P.V., Weissman, S.M., Rubin, C.M., Houck, C.M., Deininger,

P.L., Schmid, C.W. 1980. Ubiquitous, interspersed repeated sequences

in mammalian genomes. Proc. Nat. Acad. Sci., U.S.A. 77: 1398-1402.

Jelinek, W.R. 1982. Repetitive sequences in eukaryotic DNA and their

expression. Ann. Rev. Biochem. 51: 813-844.

Jones, C.W., Kafatos, F.C. 1980. Structure, organization and evolution of

developmentally regulated chorion genes in silkmoth. Cell,

22: 855-867.

Jones, C.W., Kafatos, F.C. 1982. Accepted mutations in a gene family:

evolutionary diversification of duplicated DNA. J. Mol. Evol .

19: 87-103.

Kafatos, F.C., Jones, C.W., Efstradiatis, A. 1979. Determination of

nucleic acid sequence homologies and relative concentrations by a dot

hybridization procedure. Nucl. Acids Res. 7: 1541-1552.

Kapp, L.N., Brown, S.L., Klevecz, R.R. 1974. Detecting small quantities

of DNA on CsCl gradients. Biochim. Biophys. Acta, 361: 140-143.

Kedes, L.H. 1979. Histone genes and histone messengers. Ann. Rev.

Biochem. 48: 837-870.

Kimmel , A.R., Firtel, R.A. 1979. A family of short, interspersed repeat

sequences at the 5' end-of a set of Dictyostelium single-copy mRNAs.

Cell, 16: 787-796.

92

Ko!e, L.B., Haynes, S.R., Jelinek, W.R. 1983. Deserite and heterogeneous

high molecular weight RNAs complementary to a long dispersed repeat

family (a possible transposon) of human DNA. J. Mol. Biol. 165: 257-286.

Kost, T.A., Theodorakis, N., Hughes, S.H. 1983. The nucleotide sequence

of the chick g-actin gene. Nucl. Acids Res. 11: 8287-8301.

Krieg, P.A., Robins, A.J., D'Andrea, R., Wells, J.R.E. 1983. The chicken

H5 is unlinked to core and HI histone genes. Nucl. Acids Res. 11: 619-627.

Earners, W.H., Hanson, R.W., Meisner, H.M. 1982. cAMP stimulates trans

cription of the gene for cytosolic phosphoenolpyruvate carboxykinase

in rat liver nuclei. Proc. Nat. Acad. Sci. U.S.A. 79: 5137-5141.

Lerman, M.I., Thayer, R.E., Singer, M.F. 1983. Kpnl family of long inter

spersed repeated DNA sequences in primates : polymorphism of family

members and evidence for transcription. Proc. Nat. Acad. Sci., U.S.A.

80: 3966-3970.

Levis, R., Dunsmuir, P., Rubin, 6. 1980. Terminal repeats of the

Drosophila transposable element Copia : nucleotide sequence and

genomic organization. Cell, 21: 581-588.

Mande!, M., Higa, A. 1970. Calcium dependent bacteriophage DNA injec

tion. J. Mol. Biol. 53: 154.

Manning, J.E., Schmid, C.W., Davidson, N. 1975. Interspersion of

repetitive and non-repetitive DNA in the Drosophila melanogaster

genome. Cell, 4: 141-155.

Maroteaux, L. Heilig, R., Dupret, D., Mande!, J.L. 1983. Repetitive

satellite-like sequences are present within or upstream from 3 avian

protein coding genes. Nucl. Acids Res, 11: 1227-1243.

Mattoccia, E., Comings, D.E. 1971. Buoyant density and satellite composi

tion of DNA of mouse heterochromatin. Nature New Biol. 229: 175-176.

Maxam, A.M. Gilbert, W. 1977. A new method for sequencing DNA. Proc.

Nat. Acad. Sci., U.S.A. 74: 560-564.

Maxam, A.M., Gilbert, W. 1980. Sequencing end-labeled DNA with

base-specific chemical cleavages. Methods in Enzymology, vol. 65,

pp. 499-560, Grossman, L., Moldave, K., ed., Academic Press, New-York

Miesfeld, R., Krystal, M., Arnheim, N. 1981. A member of a new repeated

sequence family which is conserved throughout eucaryotic evolution is

found between the human <5 and 3 globin genes. Nucl. Acids Res.

9: 5931-5947.

Moore, G.P. 1983. SIipped-mispairing and the evolution of introns.

Trends in Biochemical Sciences, 8: 411-414.

Neel in, J.M., Callahan, P.X., Lamb, D.C., Murray, K. 1964. The hi stones

of chicken erythrocyte nuclei. Can. J. Biochem. 42: 1743-1752.

Nishioka, Y., Leder, P. 1980. Organization and complete sequence of

identical embryonic and plasmacytoma k V-region genes. J. Biol. Chem

255: 3691-3694.

Nordheim, A., Rich, A. 1983. Negatively supercoiled simian virus 40 DNA

contains Z-DNA sequence within transcriptional enhancer sequences.

Nature, 303: 674-679.

0'Farrell, P. 1981. Replacement synthesis method of labeling DNA

fragments. Bethesda Research Labs Focus, 3 (3): 1.

Olofsson, B., Bernardi, G. 1983a. Organization of nucleotide sequences

in the chicken genome. Eur. J. Biochem. 130: 241-245.

Olofsson, B., Bernard!, G. 1983b. The distribution of CR1, an Alu-like

family of interspersed repeats in the chicken genome. Biochim.

Biophys. Acta, 740: 339-341.

Orgel, L.E., Crick, F.H.C. 1980. Selfish DNA: the ultimate parasite.

Nature, 284: 604-607.

94

Page, G.S., Smith, S., Goodman, H.M. 1981. DNA sequence of the rat growth

hormone gene: location of the 5' terminus of the growth hormone mRNA

and identification of an internal transposon-1ike element. Nucl.

Acids Res. 9: 2087-2104.

Rave, N., Crkvenjakov, R., Boedtker, H. 1979. Nucl. Acids Res. 6: 3559-3567.

Reddy, P.E. 1983. Nucleotide sequence analysis of the T24 human bladder

carcinoma oncogene. Science, 220: 1061-1063.

Rigby, P.W.J., Dieckmann, M., Rhodes, C., Berg, P. 1977. Labeling deoxy

ribonucleic acid to high specific activity in vitro by nick-trans

lation with DNA polymerase I. J. Mol. Biol. 113: 237-251.

Rinehart, F.P., Rich, T., Deininger, P.L., Schmid, C.W. 1981. Renatu

ration rate studies of a single family of interspersed repeated

sequences in human deoxyribonucleic acid. Biochemistry, 20: 3003-3010.

Roberts, M.P., FaIvey, E., Calvet, J.P., Pederson, T. 1983. A sequence

related to 4.5S RNA and the B1 family of repeated DNA in the 5' flan

king region of the mouse g-globin gene. J. Mol. Biol. 169: 975-982.

Rugh, R. 1964. Vertebrate embryology, pp. 105-231, Harcourt, Brace &

World Inc., ed., New-York.

Ruiz-Carrillo, A. 1984. The histone H5 gene is flanked by SI hypersensi

tive structures. Nucl. Acids Res. 12: 6473-6492.

Ruiz-Carrillo, A., Affolter, M., Renaud, J. 1983. Genomic organization of

the genes coding for the six main histones of the chicken: complete

sequence of the H5 gene. J. Mol. Biol. 170: 843-859.

Ruiz-Vazquez, R., Ruiz-Carrillo, A. 1982. Construction of chimeric

plasmids containing histone H5 cDNA from hen erythrocyte. DNA

sequence of a fragment derived from the 5' region of H5 mRNA. Nucl.

Acids Res. 10: 2093-2108.

95

Ryffel , G.U., Muellener, D.B., Wyler, T., Wahli, W., Weber, R. 1981.

Transcription of single-copy vitellogenin gene of Xenopus involves

expression of middle repetitive DNA. Nature, 291: 429-431.

Ryffel, G.U., Muellener, D.B., Gerber-Huber, S., Wyler, T., Wahli, W.

1983. Scattering of repetitive DNA sequences in the albumin and

vitellogenin gene loci of Xenopus laevis. Nucl. Acids Res.

11: 7701-7716.

Sanger, F., Coulson, A.R. 1978. The use of thin acrylamide gels for DNA

sequencing. FEBS Lett., 87: 107-110.

Santoro, C., Costanzo, F. 1983. Stretches of alternating poly (T-dG),

with the capacity to form Z-DNA, are present in human liver

transcripts. FEBS Letters, 155: 69-72.

Shapiro, H.S. 1976. Handbook of biochemistry and molecular biology,

vol . 2, 3rd ed., G.D. Fasman, ed., CRC Press, Cleveland, 923 p.

Shimizu, Y. 1983. Hinf family: a novel repeated DNA family of the human

genome. Nature, 302: 587-590.

Singer, M.F. 1982. Highly repeated sequences in mammalian genomes.

Int. Rev. Cytol. 76: 67-111.

Slightom, J.L., Blech!, A.E., Smithies, 0. 1980. Human fetal G and

A -globin genes : complete nucleotide sequences suggest that DNA can

be exchanged between these duplicated genes. Cell, 21: 627-638.

Smith, G.P. 1976. Evolution of repeated DNA sequences by unequal

crossing-over. Science, 191: 528-535.

Smith, H.O., Birnstiel, M.L. 1976. A simple method for DNA restriction

site mapping. Nucl. Acids Res. 3: 2387-2399.

Southern, E.M. 1975. Detection of specific sequences among DNA fragments

separated by gel electrophoresis. J. Mol. Biol. 98: 503-517.

Staden, R. 1977. Sequence data handling by computer. Nucl. Acids Res.

4: 4037-4051.

Staden, R. 1978. Further procedures for sequence analysis by computer.

Nucl. Acids Res. 5: 1013-1015.

Streisinger, G., Okada, Y., Emrich, J., Newton, J., Tsugita, A., Terzaghi,

E., Inouye, M. 1966. Frameshift mutations and the genetic code.

Cold Spring Harbor Symp. Quant. Biol. 31: 77-84.

Stumph, W.E., Kristo, P., Tsai, M.-J., O'Malley, B.W. 1981. A chicken

middle-repetitive DNA sequence which shares homology with mammalian

ubiquitous repeats. Nucl. Acids Res. 9: 5383-5397.

Sures, I., Lowry, J., Kedes, L.H. 1978. The DNA sequence of sea urchin

(S. purpuratus) H2A, H2B and H3 histone coding and spacer regions.

Cell, 15: 1033-1044.

Tashima, M., Calabretta, B., Torelli, G., Scofield, M., Maize! , A.,

Saunders, G. 1981. Presence of a highly repetitive and widely

dispersed DNA sequence in the human genome. Proc. Nat. Acad. Sci.,

U.S.A. 78: 1508-1512.

Tautz, D., Renz, M. 1984. Simple DNA sequences of Drosophi 1 a vinil is

isolated by screening with RNA. J. Mol. Biol. 172: 229-235.

Tchurikov, N.A., Naumova, A.K., Zelentsova, E.S., Georgiev, G.P. 1982. A

cloned unique gene of Drosophila melanogaster contains a repetitive 3

exon whose sequence is present at the 3' ends of many different mRNAs

Cell, 28: 365-373.

97

Thomas, P.S. 1980. Hybridization of denatured RNA and small DNA fragments

transferred to nitrocellulose. Proc. Nat. Acad. Sci., U.S.A.

77: 5201-5205.

Twigg, A.J., Sherratt, D. 1980. Trans-complementable copy-number mutants

of plasmid Col El. Nature, 283: 216-218.

Wahl, G.M., Stern, M., Stark, G.R. 1979. Efficient transfer of large DNA

fragments from agarose gels to diazobenzyloxymethyl-paper and rapid

hybridization by using dextran sulfate. Proc. Nat. Acad. Sci., U.S.A.

76: 3683-3687.

Wang, A.H.J., Quigley, G.J., Kolpak, F.J., Crawford, J.L., van Boom, J.H.,

van der Marel, G., Rich, A. 1979. Molecular structure of a

left-handed double helical DNA fragment at atomic resolution. Nature,

282: 680-686.

Watanebe, Y., Tsukada, T., Notake, M., Nakanishi, S., Numa, S. 1982.

Structural analysis of repetitive DNA sequences in the bovine

corticotropin-g-1ipotropin precursor gene region. Nucl . Acids Res.

10: 1459-1469.

Wells, R.W., Royer, H., Hollenberg, C.P. 1976. Non-Xenopus like DNA

sequence organization in the Chironomus tentans genome. Mol. Gen.

Genet. 147: 45-51.

Wilt, F.H. 1965. Regulation of the initiation of chick embryo hemoglobin

synthesis. J. Mol . Biol. 12: 331-341.

Zinder, N.D. Bueke, J.D. 1982. The filamentous phage (Ff) as vectors for

for recombinant DNA - a review. Gene, 19: 1 - 10.

Zuker, C., Lodish, H.F. 1981. Repetitive DNA sequences cotranscribed with

developmentally regulated Dictyosteliurn discoideum mRNAs. Proc. Nat.

Acad. Sci., U.S.A. 78: 5386-5390.

L / / 6 THÈSE PRÉSENTÉE DU GRADE DE MAÎTRE ES SCIENCES … · POUR L'OBTENTION DU GRADE DE...

Documents

Transcript of L / / 6 THÈSE PRÉSENTÉE DU GRADE DE MAÎTRE ES SCIENCES … · POUR L'OBTENTION DU GRADE DE...