RFLP
Définition
L'ensemble du génome
humain est commun à tous aux mutations près. Ces mutations
se produisent au hasard. Elles sont rencontrées dans les
gènes codant des protéines (4% du génome complet) en modifiant
ou pas le phénotype. Lorsqu'elles sont en dehors des phases
codantes elles peuvent être dans des régions régulatrices
(modifiant ou non le phénotype) ou dans des régions qui
ne " servent pas "(ce qui signifie que l'on ne
connaît pas le rôle de ces zones et qu'on n'a pas repéré
de maladies dues à des mutations dans ces régions). Elles
peuvent néanmoins modifier certaines propriétés de l'ADN.
Nous avons vu (CH2 qu'il existe des endonucléases de restriction
capables de couper l'ADN en des sites précis. Une mutation
dans un de ces sites peut modifier localement la séquence
qui ne sera plus reconnue par cette ER. Dans cette région
, l'ER au lieu de couper l'ADN en 2 morceaux de taille 2
et 5kbp ne générera plus qu'un seul morceau de 7kbp.
Lorsque l'on digère le
génome humain (3,5x109bp pour un génome haploïde)
par une enzyme de restriction dont le site est à 6bp (probabilité
moyenne de coupure (1/4)6=1/4096 soit 1 site tous les 4kbp),
on obtient de l'ordre de 106 fragments qu'on
ne peut examiner un à un pour déterminer la taille d'un
fragment particulier. Il faut un moyen de repérer la région
où la mutation est susceptible de s'être produite. Une caractéristique
unique d'une région particulière d'ADN est sa séquence (à
condition de n'être pas de l'ADN répété). On peut mettre
en évidence un fragment de séquence donnée par sa capacité
à hybrider avec un fragment de séquence complémentaire.
Figure 6- 32. Un
RFLP présente deux formes alléliques.
Un site FFLP est caractérisé
par
- l'enzyme de restriction qui présente
le site polymorphe
- un fragment d'ADN unique qui hybride
avec l'ADN de la région voisine du site polymorphe.
Découverte d'un
site RFLP
Pour mettre en évidence
un RFLP on procède en deux étapes:
1 recherche dans une
banque génomique de clones qui ne contiennent que de l'ADN
unique (exclusion de tous ceux qui portent de l'ADN répété).
2 recherche d'une endonucléase
de restriction qui sur la région contenant l'ADN unique
précédemment isolé produit un polymorphisme de la taille
des fragments générés. Ce polymorphisme doit être suffisamment
fréquent dans la population pour présenter de l'intérêt.
On commence donc par constituer
une banque d'ADN génomique dans un vecteur classique (ici
les vecteurs qui ont une très grande capacité ne sont d'aucune
utilité car leur probabilité de n'avoir que de l'ADN non
répétitif est en raison inverse de leur capacité). On transfère
les clones de cette banque sur une membrane de nylon afin
de pouvoir les hybrider. Puisque l'on veut exclure les clones
qui contiennent de l'ADN répété, on va les repérer par leur
capacité à hybrider avec l'ADN génomique total, qui lui
aussi est riche en ADN répété. On marque par le 32P
(par nick-translation) de l'ADN génomique fragmenté. Cet
ADN sert à hybrider l'ADN des clones, fixé à la membrane
de nylon. Après lavage on fait une autoradiographie. Les
clones marqués sont ceux à exclure. On dispose alors d'une
collection d'ADN qui vont à leur tour servir de sonde pour
la seconde étape.
Il faut maintenant reconnaître
si une endonucléase génère des fragments de taille différentes
sur différents exemplaires d'un chromosome (donc des individus
différents non apparentés de préférence). On prélève des
leucocytes sur une vingtaine d'individus sans liens de parenté.
Pour chaque échantillon on extrait l'ADN génomique. Chacun
des vingt ADN va être soumis a diverses digestions par une
seule endonucléase à chaque fois (de l'ordre de 30 enzymes
sont essayées en moyenne). Le résultat de ces digestions
complètes est la fragmentation en un grand nombre de morceaux
de tailles variées puisque tout le génome est représenté.
Le produit de chaque digestion est déposé sur un gel d'agarose
et subit une électrophorèse qui a pour effet de trier les
fragments par ordre décroissant de taille. Un ADN marqueur
constitué du mélange de bouts d'ADN de taille connue permettra
par la suite d'estimer la taille des fragments intéressants
s'ils existent. On transfère l'ADN du gel d'agarose sur
membrane de nylon (technique du Southern blot). La sonde
d'ADN unique marquée (radioactivement ou par un fluorochrome)
mise en évidence à l'étape précédente va servir à repérer
dans tout le génome le ou les morceaux qui contiennent cette
séquence. On hybride la membrane et l'ADN qu'elle porte
avec la sonde marquée et on en fait une autoradiographie.
Les résultats observés
peuvent être de deux types.
Soit, pour une enzyme
donnée les 20 échantillons donnent la ou les mêmes bandes,
ce qui signifie que, au voisinage de la sonde les 20 génomes
sont découpés par l'endonucléase de la même façon: absence
de polymorphisme.
Soit pour une autre enzyme
parmi les 20 échantillons certains présentent des bandes
qui n'apparaissent pas ou sont déplacées (donc de taille
différente) dans d'autres. Dans ce dernier cas, il y a bien
un polymorphisme de la longueur des fragments de restriction
qui permet de distinguer deux chromosomes homologues si
l'un porte un site de coupure là ou l'autre n'en a pas.

Figure 6- 33. Découverte
d'un polymorphisme de restriction.
Mise en évidence
d'un marqueur RFLP
Voir le chapitre 3
Microsatellite
Ce sont des séquences
d'ADN répétées en tandem d'un motif de 2 à 10 pb, par exemple
(CA)n(TG)n (CA sur un brin, TG sur l'autre) dans une région
génomique, et dont la taille totale est inférieure à 100
pb . Chaque microsatellite correspond à un locus unique
dans le génome, parfaitement défini par les séquences uniques
qui encadrent la répétition. Le polymorphisme très élevé
(nombreux allèles) de ces loci est dû à des variations dans
la longueur de la répétition : cette longueur identifie
les allèles de chacun de ces loci. Les microsatellites sont
répartis uniformément sur l'ensemble du génome et constituent
d'excellents marqueurs génétiques (les allèles sont facilement
identifiables par PCR). Les microsatellites sont issus d'un
dérapage au moment de la réplication.
Voir le CH3
Minisatellite
Ce sont des séquences
d'ADN s répétées en tandem d'un motif consensus (de 10 à
100 pb) dont la taille totale peut varier de 100 à 2000
pb. Ils sont préférentiellement localisés dans les régions
télomériques. De par leur inégale répartition dans le génome
ce sont des marqueurs moins utiles en cartographie.
Carte physique
De la même façon que l'on
réalise une carte de restriction d'un plasmide avec différentes
combinaisons d'enzymes de restriction et de sondes, il est
possible d'établir une carte physique d'un génome complexe.
La distance entre deux locus peut être déterminée directement
par analyse de fragments de restriction : la taille du plus
petit fragment contenant les deux locus permet d'estimer
la distance qui les sépare. En règle générale, les locus
utilisés correspondent à des marqueurs génétiques espacés
de plusieurs cM, soit plusieurs mégabases. Il est donc nécessaire
de réaliser des digestions partielles et/ou d'utiliser des
enzymes de restriction à sites rares (NotI, MluI) afin de
libérer des fragments d'ADN suffisamment grands. Compte
tenu de leur taille importante, les fragments générés peuvent
être séparés par électrophorèse en champ pulsé.
L'alignement de clones
chevauchants couvrant
l'ensemble du génome correspond à la première étape de la
cartographie physique. Ce travail d'alignement a été réalisé
très tôt pour des organismes ayant un génome de taille modeste.
Une carte physique d'E. Coli, par exemple, a été
construite dès 1987 par alignement de phages sur 4,7 Mb.
Mais il est évident que ces alignements ne sont pas envisageables
dans le cas des mammifères dont la taille du génome est
estimée à 3000 Mb. L'effort de construction des contigs
étant inversement proportionnel à la taille des fragments
étudiés, plusieurs types de vecteurs ont été développés
afin de permettre le clonage de grands fragments, certains
pouvant dépasser la mégabase XE "mégabase" : (
cosmides, pYAC, PAC et BAC, voir CH2). La mise au point
de ces nouveaux vecteurs a révolutionné le domaine de la
cartographie physique. En effet, il devenait envisageable
de constituer des banques ordonnées de clones individualisés
et, en utilisant ces nouveaux outils, d'ordonner ces clones
en contigs couvrant tout ou partie du génome. Pour ce faire,
plusieurs techniques ont été développées : l'analyse de
fragments de restriction (fingerprint), l'analyse du contenu
en STS et l'hybridation croisée.
L'approche de fingerprinting,
a été appliquée pour l'établissement de la carte physique
humaine. Le principe de cette technique est basé sur l'analyse
comparée des fragments de restriction entre clones, afin
de déterminer des fragments communs et donc le chevauchement.
Le développement de la
cartographie génétique à l'aide de microsatellites a fourni
un nombre important de marqueurs STS (Sequence-Tagged Site),
faciles à utiliser par PCR. Le criblage des banques avec
ces marqueurs permet d'isoler des clones chevauchants et
l'analyse du contenu en STS de l'ensemble des clones permet
la reconstitution de l'ordre chromosomique.
Figure 6- 35. Mise
en ordre de 4 clones chevauchants à l'aire de sites de restriction.
Les différentes stratégies
exposées précédemment possèdent toutes de sérieuses limitations.
C'est pourquoi, lors de la réalisation de la première carte
physique complète du génome humain, l'équipe du Généthon
(Cohen et al 1993) a cherché à tirer profit de toutes
les techniques pour en combiner les avantages tout en minimisant
les inconvénients. En effet, une partie des 98208 clones
de la banque, soit 33000 YAC de 900 kb de moyenne, ont été
analysés à la fois par fingerprinting (trois enzymes de
restriction et deux sondes répétées), par leur contenu en
STS (2100 marqueurs microsatellites incorporés dans la carte
génétique) et par hybridation avec des sondes de PCR inter-Alu
provenant de 25000 YAC. De plus, 500 YAC positifs pour des
marqueurs génétiques ont été localisés cytogénétiquement
. La poursuite de ce travail a conduit deux ans plus tard
à la publication d'une carte de seconde génération (Chumakov
et al 1995), couvrant près de 75 % du génome en 225
contigs de 10 Mb de moyenne et comportant près de 4500 STS.
Figure 6- 36. Principe
de la création de contigs.