Université Pierre et Marie Curie

Génétique

Introduction
Génes et génomes
Polymorphisme
Mutagenèse
Analyse fonctionnelle
Cartographie
Cartographie génétique des eucaryotes
Cartographie physique
Balisage du génome
Comparaison entre cartes physique et génétique
Applications
Biodiversite, évolution
Applications
Glossaire
Page d'accueilTable des matièresNiveau supérieurPage précédenteBas de la pagePage suivante

Balisage du génome

 

 

RFLP

Définition

L'ensemble du génome humain est commun à tous aux mutations près. Ces mutations se produisent au hasard. Elles sont rencontrées dans les gènes codant des protéines (4% du génome complet) en modifiant ou pas le phénotype. Lorsqu'elles sont en dehors des phases codantes elles peuvent être dans des régions régulatrices (modifiant ou non le phénotype) ou dans des régions qui ne " servent pas "(ce qui signifie que l'on ne connaît pas le rôle de ces zones et qu'on n'a pas repéré de maladies dues à des mutations dans ces régions). Elles peuvent néanmoins modifier certaines propriétés de l'ADN. Nous avons vu (CH2 qu'il existe des endonucléases de restriction capables de couper l'ADN en des sites précis. Une mutation dans un de ces sites peut modifier localement la séquence qui ne sera plus reconnue par cette ER. Dans cette région , l'ER au lieu de couper l'ADN en 2 morceaux de taille 2 et 5kbp ne générera plus qu'un seul morceau de 7kbp.

Lorsque l'on digère le génome humain (3,5x109bp pour un génome haploïde) par une enzyme de restriction dont le site est à 6bp (probabilité moyenne de coupure (1/4)6=1/4096 soit 1 site tous les 4kbp), on obtient de l'ordre de 106 fragments qu'on ne peut examiner un à un pour déterminer la taille d'un fragment particulier. Il faut un moyen de repérer la région où la mutation est susceptible de s'être produite. Une caractéristique unique d'une région particulière d'ADN est sa séquence (à condition de n'être pas de l'ADN répété). On peut mettre en évidence un fragment de séquence donnée par sa capacité à hybrider avec un fragment de séquence complémentaire.

pic097.jpg

Figure 6- 32. Un RFLP présente deux formes alléliques.

Un site FFLP est caractérisé par

  • l'enzyme de restriction qui présente le site polymorphe
  • un fragment d'ADN unique qui hybride avec l'ADN de la région voisine du site polymorphe.

Découverte d'un site RFLP

Pour mettre en évidence un RFLP on procède en deux étapes:

1 recherche dans une banque génomique de clones qui ne contiennent que de l'ADN unique (exclusion de tous ceux qui portent de l'ADN répété).

2 recherche d'une endonucléase de restriction qui sur la région contenant l'ADN unique précédemment isolé produit un polymorphisme de la taille des fragments générés. Ce polymorphisme doit être suffisamment fréquent dans la population pour présenter de l'intérêt.

On commence donc par constituer une banque d'ADN génomique dans un vecteur classique (ici les vecteurs qui ont une très grande capacité ne sont d'aucune utilité car leur probabilité de n'avoir que de l'ADN non répétitif est en raison inverse de leur capacité). On transfère les clones de cette banque sur une membrane de nylon afin de pouvoir les hybrider. Puisque l'on veut exclure les clones qui contiennent de l'ADN répété, on va les repérer par leur capacité à hybrider avec l'ADN génomique total, qui lui aussi est riche en ADN répété. On marque par le 32P (par nick-translation) de l'ADN génomique fragmenté. Cet ADN sert à hybrider l'ADN des clones, fixé à la membrane de nylon. Après lavage on fait une autoradiographie. Les clones marqués sont ceux à exclure. On dispose alors d'une collection d'ADN qui vont à leur tour servir de sonde pour la seconde étape.

Il faut maintenant reconnaître si une endonucléase génère des fragments de taille différentes sur différents exemplaires d'un chromosome (donc des individus différents non apparentés de préférence). On prélève des leucocytes sur une vingtaine d'individus sans liens de parenté. Pour chaque échantillon on extrait l'ADN génomique. Chacun des vingt ADN va être soumis a diverses digestions par une seule endonucléase à chaque fois (de l'ordre de 30 enzymes sont essayées en moyenne). Le résultat de ces digestions complètes est la fragmentation en un grand nombre de morceaux de tailles variées puisque tout le génome est représenté. Le produit de chaque digestion est déposé sur un gel d'agarose et subit une électrophorèse qui a pour effet de trier les fragments par ordre décroissant de taille. Un ADN marqueur constitué du mélange de bouts d'ADN de taille connue permettra par la suite d'estimer la taille des fragments intéressants s'ils existent. On transfère l'ADN du gel d'agarose sur membrane de nylon (technique du Southern blot). La sonde d'ADN unique marquée (radioactivement ou par un fluorochrome) mise en évidence à l'étape précédente va servir à repérer dans tout le génome le ou les morceaux qui contiennent cette séquence. On hybride la membrane et l'ADN qu'elle porte avec la sonde marquée et on en fait une autoradiographie.

Les résultats observés peuvent être de deux types.

Soit, pour une enzyme donnée les 20 échantillons donnent la ou les mêmes bandes, ce qui signifie que, au voisinage de la sonde les 20 génomes sont découpés par l'endonucléase de la même façon: absence de polymorphisme.

Soit pour une autre enzyme parmi les 20 échantillons certains présentent des bandes qui n'apparaissent pas ou sont déplacées (donc de taille différente) dans d'autres. Dans ce dernier cas, il y a bien un polymorphisme de la longueur des fragments de restriction qui permet de distinguer deux chromosomes homologues si l'un porte un site de coupure là ou l'autre n'en a pas.

Figure 6- 33. Découverte d'un polymorphisme de restriction.

 

Mise en évidence d'un marqueur RFLP

Voir le chapitre 3

Microsatellite

Ce sont des séquences d'ADN répétées en tandem d'un motif de 2 à 10 pb, par exemple (CA)n(TG)n (CA sur un brin, TG sur l'autre) dans une région génomique, et dont la taille totale est inférieure à 100 pb . Chaque microsatellite correspond à un locus unique dans le génome, parfaitement défini par les séquences uniques qui encadrent la répétition. Le polymorphisme très élevé (nombreux allèles) de ces loci est dû à des variations dans la longueur de la répétition : cette longueur identifie les allèles de chacun de ces loci. Les microsatellites sont répartis uniformément sur l'ensemble du génome et constituent d'excellents marqueurs génétiques (les allèles sont facilement identifiables par PCR). Les microsatellites sont issus d'un dérapage au moment de la réplication.

Voir le CH3

Minisatellite

Ce sont des séquences d'ADN s répétées en tandem d'un motif consensus (de 10 à 100 pb) dont la taille totale peut varier de 100 à 2000 pb. Ils sont préférentiellement localisés dans les régions télomériques. De par leur inégale répartition dans le génome ce sont des marqueurs moins utiles en cartographie.

Carte physique

De la même façon que l'on réalise une carte de restriction d'un plasmide avec différentes combinaisons d'enzymes de restriction et de sondes, il est possible d'établir une carte physique d'un génome complexe. La distance entre deux locus peut être déterminée directement par analyse de fragments de restriction : la taille du plus petit fragment contenant les deux locus permet d'estimer la distance qui les sépare. En règle générale, les locus utilisés correspondent à des marqueurs génétiques espacés de plusieurs cM, soit plusieurs mégabases. Il est donc nécessaire de réaliser des digestions partielles et/ou d'utiliser des enzymes de restriction à sites rares (NotI, MluI) afin de libérer des fragments d'ADN suffisamment grands. Compte tenu de leur taille importante, les fragments générés peuvent être séparés par électrophorèse en champ pulsé.

 

L'alignement de clones chevauchants couvrant l'ensemble du génome correspond à la première étape de la cartographie physique. Ce travail d'alignement a été réalisé très tôt pour des organismes ayant un génome de taille modeste. Une carte physique d'E. Coli, par exemple, a été construite dès 1987 par alignement de phages sur 4,7 Mb. Mais il est évident que ces alignements ne sont pas envisageables dans le cas des mammifères dont la taille du génome est estimée à 3000 Mb. L'effort de construction des contigs étant inversement proportionnel à la taille des fragments étudiés, plusieurs types de vecteurs ont été développés afin de permettre le clonage de grands fragments, certains pouvant dépasser la mégabase XE "mégabase" : ( cosmides, pYAC, PAC et BAC, voir CH2). La mise au point de ces nouveaux vecteurs a révolutionné le domaine de la cartographie physique. En effet, il devenait envisageable de constituer des banques ordonnées de clones individualisés et, en utilisant ces nouveaux outils, d'ordonner ces clones en contigs couvrant tout ou partie du génome. Pour ce faire, plusieurs techniques ont été développées : l'analyse de fragments de restriction (fingerprint), l'analyse du contenu en STS et l'hybridation croisée.

L'approche de fingerprinting, a été appliquée pour l'établissement de la carte physique humaine. Le principe de cette technique est basé sur l'analyse comparée des fragments de restriction entre clones, afin de déterminer des fragments communs et donc le chevauchement.

Le développement de la cartographie génétique à l'aide de microsatellites a fourni un nombre important de marqueurs STS (Sequence-Tagged Site), faciles à utiliser par PCR. Le criblage des banques avec ces marqueurs permet d'isoler des clones chevauchants et l'analyse du contenu en STS de l'ensemble des clones permet la reconstitution de l'ordre chromosomique.

pic098.jpg

Figure 6- 35. Mise en ordre de 4 clones chevauchants à l'aire de sites de restriction.

Les différentes stratégies exposées précédemment possèdent toutes de sérieuses limitations. C'est pourquoi, lors de la réalisation de la première carte physique complète du génome humain, l'équipe du Généthon (Cohen et al 1993) a cherché à tirer profit de toutes les techniques pour en combiner les avantages tout en minimisant les inconvénients. En effet, une partie des 98208 clones de la banque, soit 33000 YAC de 900 kb de moyenne, ont été analysés à la fois par fingerprinting (trois enzymes de restriction et deux sondes répétées), par leur contenu en STS (2100 marqueurs microsatellites incorporés dans la carte génétique) et par hybridation avec des sondes de PCR inter-Alu provenant de 25000 YAC. De plus, 500 YAC positifs pour des marqueurs génétiques ont été localisés cytogénétiquement . La poursuite de ce travail a conduit deux ans plus tard à la publication d'une carte de seconde génération (Chumakov et al 1995), couvrant près de 75 % du génome en 225 contigs de 10 Mb de moyenne et comportant près de 4500 STS.

pic099.jpg

Figure 6- 36. Principe de la création de contigs.

 

Page d'accueilTable des matièresNiveau supérieurPage précédenteHaut de la pagePage suivante