Post on 08-Oct-2020
HUET Julia
Diversité des communautés microbiennes des
eaux souterraines des aquifères fracturés
Encadrement : Alexis Dufresne et Philippe Vandenkoornhuyse
Université de Rennes 1
UMR 6558 EcoBio et UMR 6118 Géosciences
Equipe Rôle de la Biodiversité dans les Processus Écologiques
Master 2 Écologie Fonctionnelle, Comportementale et Évolutive
Université de Rennes 1
1
Remerciements :
Je tiens tout d‟abord à remercier mes deux maitres de stage, Alexis Dufresne et Philippe
Vandenkoornhuyse, sans qui cette étude n‟aurait pas été possible, et parce que je n‟aurais
probablement pas autant aimé mon stage, sans leurs conseils, leurs idées et leur manière de
supporter avec le sourire mes angoisses et mes bavardages. Cette opportunité que vous m‟avez
donnée m‟est vraiment importante et votre encadrement m‟a soutenu tout au long de mon stage.
Je souhaite également remercier, du fond du cœur, Sophie Coudouel et Flavia Nuñez, qui
ont cadré mes manipulations, de leurs conseils techniques avisés, de leur bienveillance et de leur
bonne humeur à (presque) toute épreuve. Merci pour le temps que vous m‟avez consacré, merci
pour les discussions que nous avons eu et qui m‟ont faite avancer. Une mention spéciale aussi, pour
Stéphane et ses conseils joyeux, sa musique et son rire.
Je tiens aussi à remercier mes camarades de promotions, pour leur bonne humeur, leur
présence et pour tous les moments de détente passés ensemble. Un petit mot particulier pour Pauline
(ma Symbiotique, quand tu te réveilles à 6h00, de l‟autre côté de Rennes, je me réveille aussi. La
vie ne serait aussi drôle sans toi), Camille (ma petite Belette angoissée… Toi et tes pauses cafés
m‟avaient bien souvent remontée), Solène (ma Sauterelle, toi la magnifique complice de mes fous
rires), Quentin (pour le vrai plaisir de discussion construites et des moments d‟échanges, pour la
découverte de toi), et bien sûr tous les autres, Michel, Guillaume, Amaury, Natacha, Pauline,
Thiago et Nico (notre pièce rapportée préférée) avec qui je passe du bon temps et qui sont
importants.
Une pensée, aussi, pour mes amis, particulièrement mes Trois Mousquetaires et mes Colocs,
pour leur soutien, leur patience face à mes sautes d‟humeur et mes doutes. Heureusement que vous
étiez là… Dans le cas contraire, il eut fallu vous inventer (« C‟est pas Faux » me direz-vous, mais
non irons à Montargis, en passant par la forêt de Malcombes).
Enfin, je tiens à remercier ma mère pour son indéfectible soutien, pour sa patience et son
amour, pour tout ce qu‟elle est, pour tout ce qui nous lie, et qui fait que je suis, jour après jour.
Pour finir, une pensée pour une étoile. À toi qui nous a quitté, toi qui aimait énergiquement,
toi qui débordait de vie, toi qui courait, chantait, dansait, toi qui avait cette place particulière dans
notre cœur à tous. À toi ma Mio, toi qui a tant marqué ma vie, tu n‟es plus des nôtres, mais tu es
tellement plus. Vole, Marion, mon Ange, et toujours voyage.
2
SOMMAIRE
Introduction ......................................................................................................... 3
Matériel et Méthodes ........................................................................................... 6
Échantillonnage ...................................................................................................................... 6
Préparation des amplicons ...................................................................................................... 7
Préparation des banques d‟amplicons et pyroséquençage ...................................................... 9
Traitement et analyse des données ....................................................................................... 10
Résultats ............................................................................................................. 12
Analyses préliminaires et filtrage des données ..................................................................... 12
Structure des communautés microbiennes ............................................................................ 15
Composition des communautés microbiennes ...................................................................... 16
Analyse de la composition taxonomique des communautés ................................................ 18
Discussion ........................................................................................................... 20
Annexes ............................................................................................................... 25
Annexe I : Référence des protocoles .................................................................................... 25
Annexe II : Correspondances Amorces fusionnées et échantillons ...................................... 26
Bibliographie ...................................................................................................... 27
3
INTRODUCTION
Les systèmes aquatiques souterrains, quelque soit leur nature (poreux, fracturés, ou
karstiques), sont des écosystèmes présentant un ensemble de caractéristiques fonctionnelles
originales. Particulièrement, l‟absence de lumière dans les aquifères rend impossible la
production primaire par le biais de la photosynthèse et provoque l‟émergence d‟une
allotrophie obligatoire (EC2CO Projet Aquadiv). Ainsi, la matière organique, produite en
surface puis apportée dans les hydrosystèmes par lessivage des sols, présente deux
caractéristiques : sa faible concentration et sa réfractibilité à la biodégradation (Goldscheider
et al., 2006). D‟autre part, le temps de résidence des eaux dans les aquifères varie de manière
importante au sein des hydrosystèmes souterrains, ce qui a pour effet de créer une
hétérogénéité des conditions physico-chimiques au sein d‟un même système. (Goldscheider et
al., 2006). En effet, une augmentation du temps de résidence des eaux dans un aquifère
entraîne une diminution des ressources disponibles, en terme de nutriments et d‟oxygène. Il y
a donc un effet de contrôle des ressources disponibles par la vitesse de renouvellement et le
temps de résidence des eaux dans les aquifères (Griebler & Lueder, 2009).
Par ailleurs, les écosystèmes souterrains hébergent une large gamme d‟organismes.
Particulièrement, la distribution des micro-organismes dans les écosystèmes n‟étant limitée
que par un très petit nombre de facteurs (pH, température, disponibilité en eau) (Griebler &
Lueder, 2009), ils sont présents dans tous les écosystèmes (Ward, 2002) et notamment dans
les aquifères souterrains. De plus, du fait de leur grande quantité (5x1030
individus à échelle
planétaire), ainsi que de leur ubiquité (Fuhrman, 2009), ils représentent un impressionnant
panel d‟activités métaboliques qui leur sont propres. Ces caractéristiques les placent au cœur
des cycles biogéochimiques et font de ce compartiment non visible à l‟œil nu, un important
facteur de régulation des cycles de matières (Johnson, 2004a, Ward, 2002). Or, les micro-
organismes des aquifères, qui représenteraient jusqu‟à 40% de la biomasse procaryotique
totale (Griebler & Lueder, 2009), sont méconnus (Goldscheider et al., 2006). Cette
méconnaissance des communautés microbiennes des aquifères constitue un manque
d‟information pour la compréhension de leur fonctionnement et pour l‟établissement de
critères permettant de déterminer leur état de santé (Griebler & Lueder, 2009). Même si les
biocénoses microbiennes ont été plus étudiées pour leur rôle dans la dépollution des aquifères
contaminés (Johnson et al., 2004a, Wang et al., 2009), la diversité des micro-organismes des
4
écosystèmes aquatiques souterrains reste étudiée de manière très marginale (Balkwill et al.,
1997).
S‟il existe une diversité particulière liée aux caractéristiques fonctionnelles des
aquifères, les variations de flux de nutriments et d'O2 peuvent avoir un impact fort sur la
dynamique des populations de micro-organismes. De plus, dans le contexte actuel de
changement global, il devient nécessaire de pouvoir établir l‟état de santé des écosystèmes, en
particulier dans le cas des aquifères souterrains qui représentent la deuxième plus grande
réserve d‟eau potable planétaire après les glaciers. Par exemple, dans le cas particulier de
contamination des aquifères, il est difficile d‟envisager le rôle de la biodiversité locale sur les
processus de dépollution (Johnson et al., 2004a). Il paraît donc nécessaire d‟étudier et
d‟identifier les communautés de micro-organismes présentes, afin de pouvoir envisager le
fonctionnement des systèmes aquatiques souterrains de manière globale.
L‟émergence de nouvelles approches culture-indépendantes (ciPCR et séquençage en
masse d'amplicons) permet d‟avoir accès à l'ensemble des micro-organismes connus ou
inconnus, cultivables ou non cultivables à partir d'un échantillon d'eau ou de sol. L'application
de ces méthodes moléculaires permet ainsi de caractériser finement les communautés
microbiennes et révolutionne notre vision de la diversité des micro-organismes (e. g. Sogin et
al., 2006) en permettant un accès à l‟ensemble des organismes, connus ou inconnus,
cultivables ou non cultivables. Elles permettent, donc, d‟avoir une vision exhaustive de la
diversité microbienne.
Le projet AQUADIV est un programme de recherche à l‟interface entre écologie
fonctionnelle, hydrologie et géochimie, visant à étudier les relations entre le fonctionnement
des écosystèmes aquatiques souterrains et leur biodiversité. Un des axes d‟études concerne la
relation entre hydrodynamisme (temps de résidence des eaux) et variabilité faunistique
(communautés microbiennes et stygobies). Le projet porte sur deux types d‟écosystèmes
aquatiques souterrains (système granitique fissuré en Bretagne et système karstique de
l‟arrière pays montpelliérain) qui présentent des variations importantes en termes de temps de
résidence de l'eau et de ressources. De plus, le fait qu‟ils appartiennent à deux aires
biogéographiques différentes peut permettre d‟envisager si les liaisons mises en évidence
revêtent un caractère général ou particulier. Le projet vise donc à approcher de manière
5
intégrée les cycles biogéochimiques dans leur ensemble ainsi que les processus liés aux
communautés faunistiques et à leur structure. De même, il permet d‟envisager le rôle des
organismes dans le fonctionnement trophique de ces écosystèmes particuliers. Enfin, il vise à
compléter les connaissances pouvant être utiles à l‟établissement de diagnostiques sur l‟état
de santé des écosystèmes aquatiques souterrains.
C‟est dans ce projet que s‟inscrit cette étude. L‟objectif est, ici, d‟apporter des
connaissances sur les communautés microbiennes des écosystèmes aquatiques souterrains
fissurés. Dans le cadre de ce stage, l‟attention a été portée sur les communautés microbiennes
de la partie superficielle d'un aquifère soumis à de forte contraintes anthropiques (agriculture
et exploitation de la ressource en eau). Les hypothèses de travail testées au cours de cette
étude sont :
(i) une homogénéité de la diversité locale (diversité alpha) entre réplicats
d‟échantillonnage,
(ii) une structuration de la diversité spatiale liée au fait que les puits analysés distant
de quelque dizaines de mètres ne sont pas nécessairement soumis aux mêmes flux
hydrologiques.
Pour tester ces hypothèses, l'amplification et le séquençage massif d'amplicons d‟une région
du gène codant l'ARN de la petite sous-unité ribosomale (ARNr 16S) sont utilisés. Compte
tenu de l'importance de ce gène pour l'activité métabolique de tous les micro-organismes
(synthèse des protéines), la séquence de ce dernier est particulièrement bien conservée. Ainsi,
les mutations de cette séquence renseignent sur l'histoire évolutive des organismes et donc de
la diversité biologique.
6
MATÉRIEL ET MÉTHODES
Échantillonnage :
Cette étude a été conduite sur l‟aquifère fracturé de Betton (Ille-et-Vilaine,
01°39‟18‟‟O, 48°11‟41‟‟N). Ce site fait l'objet d'un suivi régulier par l'équipe EAU de l'UMR
Géosciences Rennes (Luc Aquilina). Il est
ainsi très bien caractérisé d'un point de vue
hydrologique (vitesse de circulation,
datation des eaux) et hydrochimique. Trois
piézomètres de surface Pz2, Pz3 et Pz4 ont
été échantillonnés (profondeur : 12m +/-
5m, temps de recharge inférieur à 10 ans).
Les trois piézomètres (Figure 1) présentent
des caractéristiques physico-chimiques
différentes : des eaux fortement
minéralisées (200 mg/L) et à forte
concentration en nitrates (supérieure à 50
mg/L) pour le piézomètre 3, des eaux
faiblement minéralisées (100 mg/L) et à
faible concentration en nitrates (inférieure à
10 mg/L) pour les autres piézomètres (suivi effectué par l‟équipe de Luc Aquilina).
- Plan d’échantillonnage :
Pour chaque piézomètre, trois échantillons ont été prélevés, soit un total de neuf échantillons,
nommés comme indiqué dans le Tableau 1.
- Filtration :
Les échantillons d‟eau souterraine ont été
prélevés avec une pompe immergée Grundfos MP1.
Pour chaque échantillon, deux litres d'eau ont été
récupérés après stabilisation des paramètres physico-
Figure 1: Carte du site de prélèvement. Les piézomètres 2, 3 et 4
ont été échantillonnés. Les eaux sont fortement minéralisées
(200mg/L) et présentent une concentration en nitrate forte
(50mg/L) pour le piézomètre 3. Les eaux sont faiblement
minéralisées (100mg/L) et faiblement nitratées pour les
piézomètres 2 et 4.
Tableau 1 : Dénomination des neuf
échantillons prélevés. Pour chaque piézomètre,
trois échantillons ont été prélevés.
7
chimiques (pH, température, conductivité) mesuré dans l'eau à la sortie de la pompe. Les
échantillons d'eau ont été stockés dans des bidons nettoyés à l'acide sulfurique 0,5 M et rincés
10 fois avec de l'eau MilliQ. Les échantillons ont ensuite été filtrés avec un dispositif de
filtration en série : préfiltration sur un filtre isoporeTM
10µm (Millipore), dans le but
d‟éliminer les particules grossières, puis filtration sur un filtre StérivexTM
0,22µm (Millipore)
pour récupérer les communautés microbiennes. Les filtrations ont été réalisées
immédiatement après l'échantillonnage (piézomètres 2 et 4) ou après conservation à 4°C
pendant 12 heures (piézomètre 3). Les filtres ont été immédiatement congelés dans l'azote
liquide et conservés à -80°C.
Préparation des d’amplicons :
- Extraction des acides nucléiques :
Les acides nucléiques ont été extraits selon le protocole du Kit PowerSoil-DNA Isolation Kit
(Mobio) (Annexe I). Cette extraction repose sur la combinaison d'une double lyse cellulaire :
une lyse mécanique et une lyse chimique. De plus, le protocole intègre la purification des
extraits, ce qui permet de passer directement à l‟étape d‟amplification par Polymerase Chain
Reaction (PCR).
- Choix des amorces:
Les amorces ont été choisies, dans la littérature pour amplifier une région particulière de
l‟ADN ribosomal 16S, marqueur taxonomique des bactéries et des Archea. Elles ont aussi été
choisies de manière à obtenir une taille d‟amplicon comprise entre 400 et 500 nucléotides, ici
411 nucléotides sans les amorces, taille des molécules permettant d'envisager un
pyroséquençage avec le protocole Titanium (séquençage de molécule d'ADN de grande
taille). L‟amorce anti-sens, P_16_R : CCGTCAATTCCTTTGAGTTT, est identique à celle
du couple utilisé par Yu et Morrison, 2004. L‟amorce sens P_16_F :
GTGCCAGCMGCCGCGGTAATAC, est celle de Yu et Morrison (2004), modifiée par
l'ajout de 3 bases en 3‟ et d'une base dégénérée. Elles répondent à des critères précis
(Température Tm d‟hybridation inférieure à 75°C, séquences non complémentaires entre
elles, particulièrement en 3‟, séquences sans structure secondaire forte (ΔG<-3 kcal/mol).
8
Tableau 2 : Mélange réactionnel et cycle utilisés pour
l‟amplification par PCR. Les proportions du mélange réactionnel
ont été obtenues selon le protocole de InvitroGen Taq TM et le
nombre de cycles ainsi que la température d‟hybridation (64 °C)
ont été optimisés.
De plus, le pourcentage de la diversité procaryote couverte par les couples d‟amorces a
été testé avec le logiciel Primersearch (http://emboss.open-
bio.org/wiki/Appdoc:Primersearch) sur la base de séquences d‟ARN ribosomal 16S du site
Ribosomal Database Project (Cole et al., 2008).
- Choix des marqueurs de multiplexage et conception des amorces de fusion pour le
pyroséquençage
Les amorces de fusion (Figure 2) sont des amorces particulières utilisées pour la constitution
des librairies d‟amplicons destinées au pyroséquençage. Ce sont des amorces constituées des
amorces spécifiques de la séquence cible, d‟un marqueur de multiplexage (ou MIDs), d‟une
clé et d‟un adaptateur spécifique du protocole de pyroséquençage.
Le procédé de multiplexage permet de séquencer des mélanges d'amplicons issus
d'échantillons séparés en ajoutant aux amorces de fusion, des séquences de 5 à 10 nucléotides.
Ces marqueurs de multiplexage (ou MIDs) permettent de reconnaître les séquences obtenues
par pyroséquençage et de les trier en fonction de leur échantillon d‟origine. La sélection des
MIDs de 5 nucléotides s'est faite par l‟analyse de la stabilité des structures secondaires (seuil :
l‟enthalpie (∆G) doit être supérieure à -3 kcal/mole) au sein des amorces fusionnées, grâce au
programme mfold (Zuker M., 2003). Neuf couples de MIDs permettant de séquencer un
mélange d'amplicons issus des neuf échantillons ont été sélectionnées. La liste des neuf
couples d'amorces de fusion est donnée en Annexe II.
- Optimisation du cycle de PCR
L‟ADN ribosomal 16S a été amplifié par
PCR. La température optimale d‟hybridation
(64°C) a été obtenue en réalisant des gradients
de température successivement plus resserrés.
Le volume du mélange réactionnel (Tableau 2,
proportions de réactifs selon le protocole de
Figure 2 : Constitution des amorces fusionnées utilisées pour le pyroséquençage. Chaque amorce est
constitué de l‟amorce spécifique de la zone ciblée fusionnée à un marqueur de multiplexage (ou MID),
une clé de séquençage et un adaptateur spécifique pour le pyroséquençage.
9
InvitroGen TaqTM
) était de 25µL. Chaque échantillon a été amplifié quatre fois de manière
indépendante et les produits d‟amplification regroupés deux à deux, afin d‟avoir deux
réplicats de séquençage indépendants.
Préparation des banques d’amplicons et pyroséquençage
- Purification, dosage, dilution et regroupement des produits de PCR
Les amplicons d'un même échantillon issus de 2 PCR ont été purifiés selon les
recommandations de Roche (Annexe I : Amplicon Library Preparation Method Manual). La
concentration des amplicons a été mesurée par dosage fluorimétrique (Protocole en Annexe I).
Les concentrations ont été ajustées à 109 molécules par µL. Les amplicons issus des neuf
échantillons ont ensuite été regroupés de manière équimoléculaire dans un même tube. Il y a
finalement deux tubes (mélange équimolaire), qui constituent les librairies d‟amplicons
multiplexés soumises au séquençage, la seconde correspondant à un réplicat vrai
d'amplification et de séquençage.
- Réalisation des banques et Amplification clonale par PCR en émulsion
Chaque tube contenant le mélange d'amplicons multiplexés a été utilisé pour la fabrication
d'une banque d'ADN à séquencer. Les banques ont été réalisées et amplifiées par PCR en
émulsion en suivant le protocole du kit lib-A Medium Volume de Roche (Annexe I).
La PCR en émulsion permet l‟amplification clonale de molécules, isolées les unes des
autres dans une émulsion huile/eau. Chaque molécule isolée est amplifiée dans une micro-
goutte de mélange réactionnel. Cette technique permet d‟amplifier clonalement un très grand
nombre de molécules d‟ADN en parallèle Une seule modification a été apportée au protocole.
Dans le cadre de cette étude, il a été choisi de séquencer les amplicons dans un seul sens aussi
un seul type de bille de capture des séquences d'ADN a été utilisé au lieu de deux en raison
des réplicats de séquençage réalisés.
- Pyroséquençage des librairies d’amplicons.
Le pyroséquençage est une technique de séquençage par synthèse, qui se caractérise par la
détection en temps réel de l‟activité de synthèse d'ADN par l‟ADN polymérase. Au cours du
séquençage, les 4 nucléotides sont ajoutés séquentiellement les uns après les autres et de
manière cyclique au mélange réactionnel. Si le nucléotide ajouté correspond à celui attendu
10
Figure 3 : Démarche générale de traitement des séquences. Quatre étapes de
traitement préliminaires ont été nécessaires pour obtenir les OTUs : filtrage
(RDP, Cole et al., 2008), suivi d‟un tri par échantillon (RDP, Cole et al., 2008),
sélection des séquences communes aux deux réplicats (clusterisation par CD-
Hit, Li et al., 2006) et classement des séquences en OTUs).
par la polymérase, il est incorporé dans le brin néo-formé, déclenchant une réaction chimique
aboutissant à l'émission d'un signal lumineux capté par la caméra CCD du pyroséquenceur.
L‟utilisation de cette technique a plusieurs avantages. Tout d‟abord, elle permet
d‟effectuer un séquençage plus rapide et à moindre coût par rapport à la technique de Sanger
utilisée classiquement. D‟autre part, elle permet d‟obtenir un très grand nombre de séquences
en parallèle (jusqu'à un million de séquences pour un „run‟ dans la version Titanium) avec des
séquences de taille relativement grande, dans le cas de cette étude, 450 bases. Pour toutes ces
raisons, le pyroséquençage est devenue aujourd'hui la technique de séquençage de référence
en écologie.
C‟est donc, ici, le protocole GS FLX Titanium Amplicon Sequencing (Roche, Annexe I)
qui a été adopté. Les amplicons ont été séquencés dans un seul sens à partir d'un primer de
séquençage reconnaissant l'adapteur B du kit Lib-A MV de Roche (Plateforme de Génomique
Environnementale, UMR 6553 EcoBio).
Un quart de plaque de séquençage à été utilisé pour chacune des deux banques réalisées à
partir du mélange d'amplicons. Ainsi, une demi-plaque de séquençage a été utilisée pour le
séquençage des deux réplicats dans le cadre de cette étude.
Traitement et analyse des données
- Traitement des données
Avant d‟être analysées, les
séquences ont été soumises à
quatre étapes de traitement
(Figure 3).
Étape 1 : Les séquences ont été
soumises à trois étapes
successives de filtrage : (i) par
les filtres des logiciels Roche
(filtres lors du traitement du
signal), (ii) par les filtres
développés par la plate-forme de
11
Génomique Environnementale du CAREN (élimination des séquences trop courtes, contenant
des nucléotides indéterminés, ayant une composition en nucléotides anormale) et (iii) par les
filtres implémentés dans les outils de la base RDP (pas de nucléotides qui diffèrent dans les
amorces, pas de nucléotides indéterminés dans les séquences, taille minimale de la séquence
de 150 nucléotides, score Q de qualité supérieur ou égal à 20 (Cole et al., 2008).
Étape 2 : Les séquences ont été triées en fonction des échantillons grâce à la reconnaissance
des marqueurs de multiplexage (Outils de RDP, Cole et al., 2008).
Étape 3 : Les séquences, classées par échantillons, ont été clusterisées (100% de
ressemblance, CD-Hit, Li et al., 2006) et les séquences appartenant à des clusters présents
dans les deux réplicats ont été sélectionnées..
Étape 4 : Les séquences retenues ont été classées en unités taxonomiques opérationnelles (ou
OTUs), par clusterisation à 98% de ressemblance et élimination de certaines séquences trop
courtes (programme Mothur (Schloss et al., 2009)).
- Analyse des OTUs
Les données ont été analysées sur deux axes distincts.
Tout d‟abord, pour étudier la diversité et de la structure des communautés
microbiennes, les indices de diversité de Shannon et de similarité de Sorensen (prenant en
compte la redondance d‟organismes entre les échantillons ; diversité β) et ont été calculés
(Mothur, Schloss et al., 2009). De même, des courbes de raréfaction ont pu être tracées grâce
aux nombres d‟OTUs obtenus en fonction du nombre de séquences obtenues (Mothur, Schloss
et al, 2009). Enfin, une Analyse en Composante Principale sur la répartition des OTUs en
fonction des échantillons a permis d‟étudier la structure des communautés microbiennes
échantillonnées (R, Thioulouse et Dray, 2007).
D‟autre part, la composition taxonomique des communautés microbiennes a été
étudiée grâce à l‟assignation taxonomique des séquences représentatives des OTUs dans la
classification taxonomique de la base de séquences d'ARNr 16S RDP (Cole et al., 2008).
Enfin, un arbre phylogénétique (méthode du Neighbor Joining, programme MEGA4 (Tamura
et al., 2007)) a été reconstruit à partir de ces séquences pour faire le lien entre la diversité des
OTUs et la composition taxonomique observée.
12
Tableau 3 : Répartition du nombre de séquences avant et après filtrage et tri par échantillon en fonction du MID. . Les
séquences classées en « No Tag » sont celles qui n‟ont pas pu être attribuées à un échantillon en raison d‟un MID non
reconnaissable.
RÉSULTATS
Analyses préliminaires et filtrage des résultats
235 818 séquences ont été récupérées au total et avant filtrage (135 079 pour le
réplicat 1 et 100 739 pour le réplicat 2). Après les trois étapes de filtrage, 127 431 séquences
ont été récupérées (78 488 pour le réplicat 1 et 48 943 pour le réplicat 2).
- Assignation des séquences par échantillon
L‟utilisation d‟identifiants de multiplexage permet d‟attribuer chacune des séquences
obtenues à l‟échantillon auquel elle appartient. Le nombre de séquences obtenues par
échantillons pour chacun des réplicats est donné dans le Tableau 3. Les séquences ont été
filtrées selon quatre critères (pas de nucléotides qui diffèrent dans les amorces, pas de
nucléotides indéterminés dans les séquences, taille minimale de la séquence de 150
nucléotides, score Q de qualité supérieur ou égal à 20, Outils de Ribosomal Database Project
(Cole et al., 2008)).
Le nombre de séquences varie entre les échantillons et donc en fonction du marqueur
utilisé pour le multiplexage (MID) Certains MIDs n'ont pas permis pour permettre aux
séquences d‟être de récupérer des séquences d'ARNr 16S. C‟est le cas des MIDs utilisés pour
les échantillons Pz32 et Pz43. Cependant, les répartitions du nombre de séquences en fonction
des échantillons présentent des tendances similaires entre les deux réplicats, sauf pour Pz41,
13
Figure 4 : Nombre de singletons (séquences spécifiques d'un
réplicat, présentes en copie unique) de clusters et séquences
spécifiques de chaque réplicat (un cluster spécifique contient au
moins deux séquences) et de clusters et de séquences communes aux
deux réplicats (un cluster commun au moins deux séquences). Seuls
les séquences regroupées dans des clusters communs aux deux
réplicats ont été retenus pour la suite des analyses.
dont le nombre de séquences obtenues pour le réplicat 2 est beaucoup plus faible que pour le
réplicat 1 (1 432 contre 9 632 séquences).
- Sélection des séquences par clusterisation.
La comparaison des séquences des deux réplicats permet d'éliminer les erreurs potentielles
dues aux étapes de PCR, de PCR en émulsion et de séquençage (substitutions, insertions ou
délétions de nucléotides, formation de chimères). L‟analyse des articles publiés à ce jour
utilisant le séquençage de masse d'amplicons indique que la stratégie choisie ici est novatrice.
Quand une séquence donnée est retrouvée dans les deux réplicats, il peut en être déduit que
cette séquence existe vraiment, la
probabilité que deux erreurs produites
aléatoirement dans les deux réplicats
soient identiques étant très faible
(P=0,00000567). Pour identifier les
séquences retrouvées dans les deux
réplicats, une stratégie automatisée a été
mise en place consistant à comparer
l'ensemble des séquences obtenues
contre elles-même pour identifier les
groupes de séquences identiques. 29104
séquences appartenant à 3252 groupes
communs aux deux réplicats (Figure 4)
ont été retenues pour la suite de
l‟analyse (Scripts développés par
A.Dufresne). Ainsi, 35 % (17119,
réplicat 2) à 70 % (55227, réplicat 1)
des séquences produites sont en copie
unique dans les deux réplicats et ne
peuvent être utilisées pour la suite de
l'analyse. Le nombre de séquences par
groupe varie de 1152 à 2. La majorité
des groupes ne contiennent que deux
séquences (une séquence de chaque réplicat) (Figure 5). Sans cette stratégie innovante, ces
Figure 5 : Distribution du nombre de séquences par cluster.
Quelques clusters regroupent un grand nombre de séquences mais
la majorité n‟en contient que 2, une de chaque réplicat.
14
séquences présentes en copie unique dans chacun des réplicats n‟auraient pas été prises en
compte dans la suite de l‟analyse des communautés microbiennes.
- Classement des séquences en Unités Taxonomiques Opérationnelles (OTU).
A partir des séquences sélectionnées par l‟étape précédente, une deuxième clusterisation a été
réalisée en utilisant un seuil d‟identité moins strict. Les séquences ayant au minimum un seuil
d‟identité de 98% (Shabarova et Pernthaler, 2010), ont été regroupées en 706 Unités
Taxonomiques Opérationnelles (ou OTU). Le seuil de 98% est celui classiquement utilisé
pour définir, sur le plan moléculaire, les espèces en microbiologie ; on ne parle ici, toutefois,
pas d‟espèces, ce seuil étant relativement laxe.
- Qualité d’échantillonnage de la diversité
Les courbes de raréfaction (Figure 6) montrent une saturation forte de la diversité en termes
d‟OTU (le nombre d'OTU augmente de 100 unités quand le nombre de séquences passent de
15000 à environ 30000), ce qui signifie que l‟effort de séquençage appliqué est suffisant pour
envisager la diversité des communautés microbiennes globale présente dans les différents
échantillons analysés.
Figure 6 : Courbe de raréfaction montrant le nombre total d‟OTUs en fonction du
nombre de séquences obtenues à partir de l'ensemble des échantillons. Les OTUs
sont définis avec un seuil de 98% d'identité entre les séquences.
15
Structure des communautés microbiennes
- Diversité des communautés :
Les diversités observées pour chacun des piézomètres (échantillon par échantillon) sont
faiblement mais significativement différentes les unes des autres (Kruskal-Wallis chi-squared
= 7.2, df = 2, p=0,02732). La diversité
observée sur la totalité des séquences
(Figure 7) est plus importante que les
diversités de chacun des échantillons (H‟
Tot : 4,59 ; Diversité α selon Shannon :
3,80) et la communauté microbienne du
piézomètre 3 présente une plus forte
diversité que les deux autres piézomètres
(H‟ Pz3 : 3,97 ; H‟ Pz2 : 3,80 ; H‟ Pz4 :
3,65). La proportion de diversité des
séquences au sein des piézomètres par
rapport à la diversité totale des séquences
du site varie faiblement (de 79 à 86%).
Cependant, c'est le piézomètre 3 qui présent
la plus forte diversité par rapport à la
diversité totale des séquences (H‟ PzX/H‟ Tot : Pour Pz3 : 0,86 contre Pz2 : 0,83 et Pz4 :
0,79 ; calculs selon Johnson et al., 2004b). Enfin, la proportion de diversité entre les
piézomètres est relativement faible ((H‟Tot-Diversité α)/H‟Tot : 0,17 ; Calculs selon Johnson
et al., 2004b).
- Similarité des communautés
microbiennes :
Les indices de similarité (Tableau 4)
montrent un regroupement des
échantillons issus du même piézomètre
(indice de similarité au sein du
piézomètre : supérieur à 0,5 pour les trois)
malgré un nombre de séquences par
Figure 7 : Indices de diversité de Shannon. La diversité α
représente la diversité moyenne des séquences des
piézomètres. Grâce à ces indices de diversité, il est possible
de calculer la proportion de diversité de chacune des
communautés (Diversité des séquences du
piézomètre/Diversité totale), de même que la proportion de
diversité entre les communautés ((Diversité totale-Diversité
α)/diversité totale) par rapport à la diversité totale des
séquences.
Tableau 4 : Similarité entre les échantillons séquencés
(indice de Sorensen). Le code couleur correspond à la
similarité globale (vert : similarité globale supérieure à 0,5 ;
saumon : similarité globale comprise entre 0,38 et 0,5 ;
jaune : similarité globale inférieure à 0,38.).
16
piézomètre pouvant être assez différent. Néanmoins, comme le nombre de séquences
produites est suffisant pour décrire la diversité dans tous les échantillons (courbes de
raréfaction) la différence du nombre de séquences par échantillon a un effet limité. D‟autre
part, la communauté microbienne du piézomètre 3 se différencie des deux autres (indice de
similarité globale : entre 0,25 et 0,35 alors que compris entre 0,35 et 0,5 pour l‟indice de
similarité global entre les deux autres types de communautés).
Composition des communautés microbiennes
Les séquences représentatives des OTU ont été assignées aux taxons définis dans la
taxonomie RDP à l‟échelle du phylum, afin, dans un premier temps, d‟analyser la
composition des communautés microbiennes. Les différences structurelles des communautés
sont également présentes sur le plan de la composition entre les échantillons. En effet, deux
ACP successives montrent des résultats venant confirmer l‟existence de différences profondes
entre les communautés microbiennes des trois piézomètres.
Tout d‟abord, les résultats de l‟ACP effectuée sur les échantillons en fonction des
phyla montrent une différenciation importante entre les piézomètres en termes de composition
(Figure 8).
Figure 8 : Résultats principaux de l‟ACP : projection des OTU en fonctions des échantillons. Les axes du cercle de corrélation (a)
sont déterminés par les échantillons contribuant au moins à 50% (Axe 1 : Beta-Proteobacteries, Bactéries non classées, Chloroflexi,
Actinobacteria, Verrucommicrobia, Acidobacteria, Nitrospira ; Axe 2 : Firmicutes, Bacteroidetes, Lentisphaerae, Gamma-
Proteobacteria, Alpha-Proteobacteries, Proteobacteria non classées, Planctomyces). Les échantillons forment 3 groupes distincts
lorsqu‟ils sont projetés dans ce plan calculé (b).
1
2
3
a b
17
Les piézomètres se différencient fortement sur le plan de la composition en phyla. Les
échantillons sont, en effet, répartis selon trois groupes :
- Groupe 1 : Les ß-Proteobacteria dominent largement (contribution de 97% à l‟axe),
avec une composition de communauté microbienne associée aux échantillons du
piézomètre 2 et à un des échantillons du piézomètre 4.
- Groupe 2 : La présence de Firmicutes et de Bacteroidetes est déterminante dans les
communautés microbiennes des échantillons du piézomètre 3
- Groupe 3 : La communauté microbienne de l‟échantillon Pz41 présente une
composition taxonomique particulière et se détache nettement des autres échantillons.
D‟autre part, l‟étude de la composition des communautés en termes d‟OTU montre des
résultats intéressants. En effet, l‟ACP effectuée fait émerger une différenciation des OTU en
quatre groupes distincts, dépendants des piézomètres (Figure 9).
Figure 9 : Résultats principaux de l‟ACP : projection des OTU en fonctions des échantillons. Les axes du cercle de corrélation (a)
sont déterminés par les échantillons contribuant au moins à 55% (Axe 1 : Pz21, Pz22, Pz23, Pz42 ; Axe2 : Pz31, Pz33). Les OTU
forment 4 groupes distincts lorsqu‟ils sont projetés dans ce plan calculé (b).
a b
1
2
3
4
18
D‟autre part, les OTU forment quatre groupes distincts en fonction des échantillons :
- Groupe 1 : OTU présents dans les échantillons des piézomètres 2 et 4, très peu
présentes dans les échantillons du piézomètre 3.
- Groupe 2 : OTU présents dans les échantillons du piézomètre 3, très peu présentes
dans les échantillons des piézomètres 2 et 4.
- Groupe 3 : OTU rares mais présentes dans les échantillons des piézomètres 2 et 4 et
quasiment absents des échantillons du piézomètre 3.
- Groupe 4 : OTU très peu présents dans tous les échantillons.
Analyse de la composition taxonomique
Les séquences représentatives des OTU ont été assignées aux taxons définis dans la
taxonomie RDP afin d‟étudier la composition taxonomique des échantillons prélevés (Figure
10). Le domaine des Archaea est
complètement absent des échantillons, alors
même que les amorces couvraient
théoriquement une partie de la diversité de ce
domaine. Sur un total de 20 phyla, un phylum
ressort nettement et domine les échantillons,
celui des β-Proteobacteria (qui représente
quasiment 70% de la totalité des séquences.).
D‟autres phyla sont également retrouvés, dans
d‟importantes proportions : Bacteroidetes
(11% des séquences), Firmicutes (5,5% des
séquences) et Acidobactéries (2,7% des
séquences). Enfin, 5,5% des séquences
obtenues ne peuvent être assignée à aucun des
phyla connus aujourd'hui.
Acidobacteria
Actinobacteria
Bacteroidetes
Chloroflexi
Cyanobacteria
Firmicutes
Gemmatimonadetes
Lentisphaerae
Nitrospira
OP10
OP11
Planctomycetes
Proteobacteria Unclassified
Proteobacteria-alpha
Proteobacteria-beta
Proteobacteria-delta
Proteobacteria-gamma
Unclassified Bacteria
Verrucomicrobia
WS3
0 5 1015202530354045
pz21 (rep1+2)
pz22 (rep1+2)
pz23 (rep1+2)
pz31 (rep1+2)
pz33 (rep1+2)
pz41 (rep1+2)
pz42 (rep1+2)
Figure 10 : Distribution taxonomique des OTUs. Les phyla sont
représentés en pourcentage par échantillon. Le signal taxonomique
semble bien conservé au sein des piézomètres.
19
L‟arbre phylogénétique (Figure 12) construit à partir des séquences représentatives des
OTU montre l'existence d'une très grande diversité entre les OTU. Les séquences assignées à
un même phylum bactérie se regroupent ensemble dans l'arbre et la majorité des phyla de
bactéries détectés dans ces séquences semblent monophylétique, à l‟exception des Firmicutes,
des Bacteroidetes, et des α- et δ-Proteobacteria.
Les séquences non assignées apparaissent fortement distantes de celles assignées à des phyla
connus. D‟autre part, et de manière intéressante, une partie de ces séquences forment
également des groupes monophylétiques au sein de l‟arbre phylogénétique.
Figure 11 : Arbre phylogénétique (méthode : Neighbor Joining) représentant la diversité des OTUs de l‟ensemble des
échantillons. Chaque couleur représente un phylum. La couleur grise représente les OTUs non assignées.
20
DISCUSSION
Les connaissances liées à la composition des communautés microbiennes prennent de
plus en plus d‟importance en s‟intégrant aux problématiques liées au contexte de changement
global. De plus, les nappes phréatiques représentent 97% du potentiel d‟eau potable sur Terre
et abriteraient 40% de la biomasse procaryotique (Griebler & Lueders, 2009). Par ailleurs,
l‟implication des communautés microbiennes dans tous les processus biogéochimiques rend
leur connaissance nécessaire à la compréhension du fonctionnement des écosystèmes
(Fuhrman, 2009) et, notamment, des écosystèmes aquatiques souterrains (Porter, 2009). C‟est
dans ce cadre que s‟inscrit cette étude, dont le but était de décrire le mieux possible la
diversité des communautés microbiennes d'un aquifère modèle (Betton, France). Plusieurs
innovations importantes sont associées aux résultats présentés ici. En effet, il s‟agit de :
(i) La première analyse exhaustive de la diversité microbienne d’un aquifère, par une
approche de séquençage massif d’amplicons
(ii) La première analyse d'amplicons de longue taille des fragments (450 nucléotides)
par séquençage de masse (GS FLX 454)
(iii) La première étude ayant choisi comme stratégie l'usage de réplicats vrais de
séquençage.
Conformément aux hypothèses de travail, il existe une structuration spatiale des
communautés microbiennes, bien que les puits d'où aient été prélevés les échantillons d'eau ne
soient distants que de quelques dizaines de mètres les uns des autres. En effet, les indices de
similarité de Sorensen montrent une différenciation forte des communautés microbiennes
d‟un des puits (le piézomètre 3, situé au sud du site). Les résultats de l‟ACP concernant la
répartition des OTU dans les piézomètres sont en accord avec ces observations. Ainsi, les
OTU forment quatre groupes distincts, dont deux sont fortement affiliés au piézomètre
d‟origine de la communauté ainsi qu'un groupe d'OTU spécifique au piézomètre 3. La
distribution taxonomique montre également une forte variabilité au niveau du site. En effet,
les résultats de l‟ACP effectuée sur les échantillons en fonctions des phyla indiquent un
détachement des communautés microbiennes du piézomètre 3. Cette structuration correspond
aux observations déjà faites sur les indices de similarité de Sorensen et de diversité. Ainsi, les
21
échantillons du piézomètre 3 se singularisent d‟un point de vue structurel et taxonomique.
Parallèlement à cette différenciation des communautés, des différences de composition
chimique des eaux sont mises en évidence. En effet, le piézomètre 3 présente la particularité
d‟être situé à proximité d‟un pôle d‟activités anthropiques agricoles et domestiques et l'eau
échantillonnée dans ce puits contient de fortes teneurs en nitrates (suivi effectué par l‟équipe
de Luc Aquilina, données en cours d‟acquisition). Néanmoins, les travaux réalisés ne
permettent pas de définir si ces différences dans la chimie de l'eau sont la résultante de la
composition microbienne de la communauté ou inversement. Ces changements de diversité
des communautés microbiennes peuvent être également la conséquence de changements de
fonctionnement global de l‟environnement incluant plantes et sols (Griebler & Lueder, 2009)
puisque l'eau des aquifères résulte de la percolation.
La composition taxonomique trouvée dans les échantillons analysés est partiellement
en accord avec la littérature existante (Shabarova, 2010, Griebler et Lueders, 2009,
Goldscheider, 2006) avec notamment la dominance de séquences du phylum β-Proteobacteria
(environ 70% des séquences) et la présence de phyla caractéristiques des milieux aquatiques
souterrains tels que des Bactéroidetes (11% des séquences), Firmicutes (5,5% des séquences)
ou encore des Acidobactéries (2,7% des séquences). Compte tenu de la profondeur de
séquençage et de la stratégie d'usage de réplicats vrais nous mettons en évidence la présence
de micro-organismes associés à 'la biosphère rare'. Ainsi, environ 0,5% des OTU
appartiennent à des phyla tels que OP10, OP11, WS3 ou encore Gemmatimonadetes. L'un des
résultats les plus originaux du travail présenté ici est la mise en évidence
d‟approximativement 5,5% de séquences n‟ayant d'affinités phylogénétiques avec aucun des
phyla de bactéries connus à ce jour. Ces séquences non-assignées représentent 27% des OTU
et contribuent donc fortement à la diversité des communautés échantillonnées. Elles forment
des groupes inconnus dans les arbres phylogénétiques. Certain de ces groupes présentent des
distances phylogénétiques très élevées par rapport aux séquences présentes dans les bases de
données et forment des branches très profondes (anciennes d'un point de vue évolutif). Cette
présence d‟organismes formant des phyla nouveaux démontre la nécessité d‟étudier en
profondeur la diversité des communautés microbiennes selon des stratégies rigoureuses telles
qu'appliquées ici. Dans toutes les études d‟amplicons par séquençage de masse publiées
jusqu‟à présent, la saturation du nombre d‟OTU n‟est jamais observée. La diversité des micro-
22
organismes semble donc gigantesque (par exemple : Sogin et al., 2006). Les courbes de
raréfaction construites ici indiquent une forte saturation du nombre d‟OTU trouvés, ce qui est
en désaccord avec les travaux publiés jusqu'à présent. Une différence essentielle, qui doit être
soulignée entre ces travaux et l'étude conduite ici, est l'exclusion fiable des séquences
artificielles qui a été opérée ici au moyen de l'usage de réplicats vrais de séquençage de
masse. Il est vraisemblable que les études comme celle de Sogin et al. (2006) ont une diversité
apparente bien plus élevée que la diversité réelle contenue dans les échantillons. Ceci est
d'autant plus vrai que les algorithmes de clusterisation utilisent souvent la composition en
nucléotides pour produire les clusters. De fait, une erreur de séquençage dans un
homopolymère, une erreur d'incorporation de nucléotide dans la PCR, ou autre, implique une
inflation artificielle du nombre d'OTU (Kunin et al., 2010). Cette étude montre que
l'utilisation de réplicats d'analyse (amplification PCR et séquençage indépendants) permet
d'obtenir de manière simple des résultats de qualité supérieure. Il faut noter également que
l'utilisation de réplicats permet également de retenir dans le jeu de données des séquences
présentes en copies uniques dans chaque réplicat et ainsi d'augmenter la couverture de la
diversité. Un bémol peut toutefois être formulé, quand de grandes variations du nombre de
séquences produites dans les deux réplicats existent. Dans cette étude, il est probable que des
séquences uniquement présentes dans le réplicat 1 (70% des séquences) aient été éliminées à
tort de l'analyse à cause du plus petit nombre de séquences dans le réplicat 2. La variabilité du
nombre de séquences pourrait être liée à une différence d‟efficacité des amorces de fusion
utilisées lors de l‟amplification.
Cette étude amène de nombreuses perspectives de travail. Tout d‟abord, pour connaître
et comprendre le fonctionnement fin des aquifères, il serait pertinent d‟explorer en détails la
diversité sous plusieurs aspects. Dans un premier temps, il est nécessaire d‟étudier le lien
entre diversité et temps de renouvellement de l‟eau en échantillonnant des eaux d‟âges
différents et notamment plus anciennes. Ce type d‟étude peut apporter des informations sur le
fonctionnement et la dynamique des populations microbiennes des eaux souterraines et
d‟ouvrir de nouvelles perspectives sur le fonctionnement de ces écosystèmes aquatiques
souterrains. En effet, la circulation d‟eau, dans les écosystèmes aquatiques souterrains, se fait
en espace réduit, ce qui entraîne une variabilité importante des temps de résidence et des
apports de matière (Bougon et al., 2009). Dans le cas des puits étudiés dans cette étude, les
23
temps de résidence de l‟eau sont courts et similaires (inférieurs à 10 ans). Un autre
piézomètre, plus profond, présentant des temps de résidence beaucoup plus longs (eaux
fossiles de datation estimé à 10000 ans) a été échantillonné au cours de ce stage. Ces
échantillons permettront de tester l'hypothèse d'un effet 'Arche de Noé‟. En effet, l'isolement
dû à la circulation très lente des eaux pourrait impliquer des processus évolutifs originaux et
une conservation de la biodiversité microbienne dans le temps. Cette analyse sera également
appliquée à l‟étude d'autres types d‟hydrosystèmes, tels que les systèmes karstiques,
fonctionnant différemment sur le plan hydrobiogéochimique (percolation et infiltration
différentes, avec de nombreux échanges d‟ions et de matière avec la roche mère) et ne
possédant pas le même type de roche matrice (calcaire pour les hydrosystèmes karstiques
contre granit pour les hydrosystèmes fissurés) (Aquilina et al., 2003, Aquilina et al., 2006). Ce
type d‟étude permettra de tester l‟hypothèse de l‟existence d‟un lien entre le fonctionnement
hydrobiogéochimique d‟un système et le peuplement de ce dernier. De même, il sera possible
de déterminer si la diversité observée pour l‟hydrosystème fissuré modèle de Betton est une
caractéristique locale ou si le patron de diversité peut être élargi et prédit en relation avec la
chimie et le temps de renouvellement des eaux souterraines dans tous les aquifères.
Par ailleurs, la diversité mise en évidence dans cette étude ouvre bien sur des questions
sur le plan fonctionnel. En effet, si l‟approche de séquençage d‟amplicons appliquée dans
cette étude permet d‟étudier la diversité dans son ensemble, elle ne permet pas d‟accéder aux
fonctions réalisées par les individus. Les approches de métagénomique (séquençage d'un
mélange de génomes) et de métatranscriptomique (séquençage des transcrits d'une
communauté microbienne) permettrait de faire le lien entre diversité et fonctions En effet,
une analyse métagénomique permet de prédire les fonctions potentiellement exercées par les
individus tandis que l'analyse de métatranscriptomique permet d‟accéder aux fonctions
exprimées à un moment donné. Cependant, la très grande majorité des OTU (~97%)
contiennent moins de 1% du nombre total de séquences (moins de 290 séquences) (Figure 6)
Ceci indique l'existence d'un très grand nombre d'organismes rares contribuant très peu à
l'ensemble des séquences obtenues. L‟origine et le rôle de cette diversité rare reste à définir.
C‟est d‟autant plus intéressant que de nombreux OTU rares contiennent des séquences non
assignées à des phyla bactériens. Étant donné la faible profondeur de prélèvement, il est
possible qu‟une partie de cette diversité rare provienne du sol. Néanmoins, la présence de
24
cette diversité rare pourrait poser problème pour des études de métagénomique. En effet, la
faible représentation de ces micro-organismes dans les communautés pourrait les rendre
difficilement détectables sur le plan fonctionnel par les approches de génomique
environnementale.
De notre capacité à établir le lien entre diversité et fonction dépend notre capacité à
prédire les réactions des patrons de diversité et des communautés microbiennes face aux
perturbations liées à l‟activité humaine. De plus, ce type de travail pourrait, à terme, permettre
d‟émettre des diagnostiques concernant l‟état des écosystèmes aquatiques souterrains et sur
leur fonctionnement biogéochimique. Enfin, ce type de travail pourrait ouvrir la voie à une
meilleure compréhension de l‟évolution des organismes, par la mise en évidence branches
profondes, notamment chez les bactéries (Theobald, 2010).
25
ANNEXE I : Référence des protocoles
Extraction de l’ADN :
PowerSoil®-DNA Isolation Kit, Mobio Laboratories Inc.,
http://www.mobio.com/images/custom/file/protocol/12888.pdf (dernière mise à jour: 2009)
Protocole de Roche Applied Science-454 Systems :
Design des amorces de fusion
Technical Bulletin-Amplicon Fusion Primer Design Guidelines GS FLX Titanium Series Lib-
A Chemistry (Août 2009).
Préparation des librairies d’amplicons
GS FLX Titanium Series, Amplicon Library Preparation Method Manual, Roche Applied
Science (Octobre 2009).
Amplification par PCR en emulsion
GS FLX Titanium Series- emPCR Method Manual Lib-A, MV, Roche Applied Science
(Octobre 2009, revu en Janvier 2010).
Pyroséquençage :
GS FLX Titanium Series Amplicon Sequencing, Roche Applied Science (Octobre 2009).
(Protocoles disponibles sur le site de 454-Roche Applied Science, diffusion restreinte :
http://454.com/my454/)
26
ANNEXE II : Correspondance entre amorces fusionnées et échantillons
Tableau 4 : Amorces fusionnées complètes, comportant Adaptateur, Clé, MID et amorce spécifique de la zone
amplifiée.
Tableau 5 : Correspondance entre la couple
d‟amorces utilisé et l‟échantillon amplifié
27
BIBLIOGRAPHIE
Aquilina L., Ladouche B., Dörfliger N., Bakalowicz M. (2003), Deep Water Circulation,
Residence Time and Chemistry in a karst complex, Groundwater, 41: 790-805.
Aquilina L., Ladouche B., Dörfliger N. (2006), Water storage and transfer in the epikarst of
karstic systems during high flow periods, Journal of Hydrology, 327: 472-485.
Balkwill D.L., Reeves R.H., Drake G.R., Reeves J.Y., Crocker F.H., Baldwin King M., Boone
D.R. (1997), Phylogenetic characterization of bacteria in the subsurface microbial culture
collection, Federation of European Microbiological Societies Microbiology Reviews, 20:
201-216.
Bougon N., Aquilina L., Briand M.P., Coedel S., Vandenkoornhuyse P. (2009), Influence of
hyological fluxes on the structure of nitrate reducing bacteria communities in a peatland,
Soil Biology and Biochemistry, 41: 1289-1300.
Cole J.R., Wang Q., Cardenas E., Fish J., Chai B., Farris R.J., Kulam Syed Mohideen A.S.,
McGarrell D.M., Marsh T., Garrity G.M., Tiedje J.M. (2008), The Ribosomal Database
Project: improved alignments and new tools for rRNA analysis, Nucleic Acid Research, 37:
141-145.
Fuhrman J.A., (2009), Microbial community structure and its functional implications, Nature,
459: 193-199.
Goldscheider N., Hunkeler D., Rossi P. (2006), Review: Microbial biocenoses in pristine
aquifers and an assessment of investigative methods, Hydrogeology Journal, 14: 926-941.
Griebler C., Lueders T. (2009), Microbial biodiversity in groundwater ecosystems,
Freshwater Biology, 54: 649-677.
Huson D.H., Richter D.C., Rausch C., Dezulian T., Franz M., Rupp R. (2007), Dendroscope:
An interactive viewer for large phylogenetic trees, Biomed Central Bioinformatics, 8:460.
28
Johnson A., Llewellyn N., Smith J., van der Gast C., Lilley A., Singer A., Thompson I.
(2004a), The role of microbial community composition and groundwater chemistry in
determining isoproturon degradation potential in UK aquifers, Federation of European
Microbial Societies Microbiology Ecology, 49: 71-82.
Johnson D., Vandenkoornhuyse P.J., Leake J.R., Gilbert L., Booth R.E., Grime J.P., Young
J.P.W, Read D.J. (2004b), Plant communities affect arbuscular mycorrhizal fungal
diversity and community composition in grassland microcosms, New Phytologist, 161:
503-515.
Kunin V., Engelbrekston A., Ochman H., Hugenholtz P. (2010), Wrinkles in the rare
biosphere: Pyrosequencing errors can lead to artificial inflation of diversity estimates,
Environmental Microbiology, 12: 118-123.
Li W., Godzik A. (2006), CD-Hit: A fast program for clustering and comparing large sets of
protein or nucleotide sequences, Bioinformatics-Application Notes, 22: 1658-1659.
Schloss P.D, Westcott S.L., Tyabin T., Hall J.R., Hartmann M., Hollister E.B., Lesniewski
R.A., Oakley B.B., Parks D.H., Robinson C.J., Sahl J.W., Stres B., Dhallinger G.G., Van
Horn D.J. Weber C.F., 2009, Introducing Mothur: open-source, platform-independent,
community-supported software for describing and comparing microbial communities,
Applied and Environmental Microbiology, 75: 7537-7541.
Sogin M.L., Morrison H.G., Huber J.A., Welch D.M., Huse S.M., Neal P.R., Arrieta J.S.,
Herndl G.J. (2006), Microbial diversity in the deep sea and the underexplored “rare
biosphere”, Proceedings of the National Academy of Science of the United States, 103:
12115-12120.
Tamura K., Dudley J., Nei M., Kumar S. (2007), MEGA4: Molecular Evolutionary Genetics
Analysis (MEGA) software version 4.0. Molecular Biology and Evolution 24:1596-1599
29
Theobald D.L. (2010), A formal test of the theory of universal common ancestry, Nature, 465:
219-222.
Thioulouse J., Dray S. (2007), Interactive Multivariate Data Analysis in R with the ade4 and
ade4TkGUI packages, Journal of Statistical Software, 22: 1-14.
Ward B.B., (2002), How many prokaryotic species are there?, Proceedings of the National
Academy of Science of the United States, 99(16): 10234-10236.
Ward D.M. (2006), Microbial diversity in natural environments: focusing on fundamental
questions, Antonie van Leeuwenhoek, 90: 309-324.
Yu Z., Morrison M. (2004), Comparison of different hypervariable regions of rrs genes for
use in fingerprinting of microbial communities by PCR-Denaturing Gradient Gel
Electrophoresis, Applied and Environmental Microbiology, 70: 4800-4806.
Zuker M., Mathews D.H., Turner D.H. (1999), Algorithms and Thermodynamics for RNA
Secondary Structure Prediction: A Practical Guide in RNA Biochemistry and
Biotechnology, Barciszewski J., B.F.C. Clark, eds., NATO ASI Series, Kluwer Academic
Publishers, 370 p.
30
Résumé :
Les écosystèmes aquatiques souterrains représentent 97% des ressources d‟eau douces sur
Terre. Cependant, leur fonctionnement reste très mal connu, notamment concernant les
organismes les peuplant et l‟impact que peut avoir le régime hydrologique sur les communautés
microbiennes. D‟autre part, le potentiel physiologique et l‟important panel d‟activités que
représente la biomasse procaryotique place les microorganismes au cœur de tous les processus
biogéochimiques. Il semble donc nécessaire d‟explorer la diversité et la structure des
communautés microbiennes de ces écosystèmes particuliers afin de mieux envisager leur
fonctionnement global. Grâce aux nouvelles approches de biologie moléculaire (pyroséquençage
d‟amplicons de grande taille) et à un traitement original des données (approche par réplicat de
séquençage), il a été possible d‟aborder de manière rigoureuses les hypothèses selon lesquelles (i)
il y aurait une structuration spatiale des communautés à l‟échelle du site, (ii) il y aurait une
homogénéité des communautés au sein d‟un point d‟échantillonnage. L‟étude a montré qu‟il
existait une variabilité spatiale des communautés microbiennes, pouvant être due à une variabilité
des régimes hydrauliques. De plus, les résultats de l‟étude montrent l‟existence d‟une incroyable
diversité. Une partie de la diversité reste non assignée et a le potentiel pour former de nouveaux
phylums. Cette étude amène des perspectives importantes de travail telles que l‟élargissement à
d‟autres types de systèmes aquatiques souterrains, à d‟autres temps de résidences ainsi que
l‟exploration fonctionnelle des communautés microbiennes en présence.
Mots Clés : Hydrosystème fissuré ; pyroséquençage d‟amplicons ; communauté microbienne ;
diversité ; structure.
Abstract :
Underground aquatic ecosystems are the second most important fresh water source in the
world. However, there are true holes in understanding their functioning, especially when it comes
to replacing the inhabiting communities in it and characterizing the link between
hydrobiogeochemical conditions and microbial communities. Furthermore, the physiological
potential and the large range of activities of the prokaryotic biomass places it in the core of all
biogeochemical processes. Therefore, it seems necessary to explore the diversity and the structure
of the fractured underground water system microbial communities, in order to enable a better
comprehension of their global functioning. With new molecular approaches (great size amplicons
pyrosequencing) and an innovative and original treatment of the data (replicate approach), it has
been possible to test hypothesis such as (i)communities are spatially structured within the aquifer,
(ii)microbial communities are homogenous within a sample point. On the one hand, study has
shown spatial variability of the microbial communities, possibly linked to hydrological variation
of the water circulation. On the other hand, results have shown the existence of an amazing
diversity within the aquifer. A part of this diversity remains unassigned and has the potential to
make new phyla emerge. However, this study points out major work perspectives, such as a
possible enlargement of the results into other types of underground water systems and into a large
scale of water residence time. Moreover, it seems necessary to functionally investigate these
microbial communities.
Key-words: fractured hydrosystem; amplicon pyrosequencing; microbial communities; diversity;
structure