Les différentes sortes d'ADN
On a
vu ci-dessus que tout ADN double brin est dénaturable de
façon réversible par la chaleur.
Dans l'expérience suivante,
après avoir dénaturé l'ADN génomique d'un organisme, on
le place dans des conditions ménagées de refroidissement
afin de favoriser la renaturation. On mesure la fraction
d'ADN non encore renaturé en fonction du temps.
Sur l'axe des Y on porte
le pourcentage d'ADN qui reste simple brin par rapport à
la concentration totale d'ADN. L'axe des X porte une échelle
logarithmique du produit de la concentration initiale de
l'ADN (en moles/litre) par le temps écoulé (en secondes).
Ces courbes sont appelées
courbes de Cot. Une courbe lisse est l'indice d'une renaturation
progressive et régulière de l'ADN. C'est ce qui est observé
pour des virus, des bactéries et pour des cellules de levure.
Par contre lorsque l'on prend de l'ADN d'organismes multicellulaires
(Homo sapiens), l'aspect est totalement différent.
La courbe observée semble le résultat de la mise bout à
bout de trois courbes. Ce qui indique que dans le premier
cas il y avait un seul type d'ADN alors que dans le second
trois types d'ADN différents doivent coexister : le premier
type se renature très rapidement, le second se renature
nettement plus lentement, quant au troisième il ne se renature
que très lentement. L'interprétation de cette observation,
est que l'ADN qui se renature rapidement n'a aucun mal à
retrouver un brin qui lui soit complémentaire parce qu'il
contient une (ou des) séquence très fréquente, alors que
le troisième type a beaucoup de mal à retrouver son complément
parce que cette séquence est " unique ".
Figure 1-19. Courbes de
Cot obtenues pour des unicellulaires (A) et des pluricellulaires
(B)
Ces trois types d'ADN ont
été étudiés plus en détail pour définir les éléments constitutifs
de chacun.
ADN hautement répété
L'ADN hautement répété n'est
pas codant. Il représente 10 à 15% du génome. Il est constitué
de séquences hétérochromatiques donc localisées principalement
autour des centromères. Cet ADN hautement répété comprend
:
des répétitions de motifs
courts (5 à 10 bp) disposés en tandem et répétés jusqu'à
plusieurs centaines de milliers de fois ;
des séquences répétées de
motifs toujours disposés en tandem mais plus longues (100
à 200 bp) ;
des séquences hautement répétées
et dispersées dans tout le génome, les micro satellites
;
les centromères dans la région
desquels on reconnaît des séquences CEN qui chez l'homme
sont des motifs de 171 bp répétées en tandem dont la longueur
varie de 300 kpb à 5 000 kbp ; on les rencontre identiques
sur tous les chromosomes
les telomères et séquences
TEL situées à l'extrémité des chromosomes constituées de
motifs répétés riches en C et A. Ces télomères auraient
pour rôle de protéger l'extrémité des chromosomes de l'érosion
au cours des réplications successives et de l'attaque des
nucléases intracellulaires.
ADN moyennement répété
L'ADN moyennement répété
est en grande majorité non codant. Il représente 25 à 40%
du génome humain. A la fois plus hétérogène et constitué
de motifs plus longs (100 à 1 000 bp), il est dispersé dans
le génome et comprend :
les séquences Alu : 130 bp
répétées en 5' et 3' de l'ordre de 900 000 par génome humain
;
les séquences LINE qui semblent
dériver d'un ancien rétrotransposon. Leur longueur varie
de 5 à 7 kbp avec 5 000 copies complètes par génome et jusqu'à
100 000 copies partielles;
on trouve aussi des séquences
codants pour autre chose que des polypeptides
* gènes des ARNr grands et
petits 28S, 18S et 5,8S groupés en unités qui sont disposées
en batteries de plus de 200 copies. Ces groupes se retrouvent
chez l'homme sur les
chromosomes 13, 14, 15, 21
et 22 ;
* gènes des ARNt disposées
en batteries de plus de 200 copies, jusqu'à 20 000 copies
* gènes des ARN 5S disposées
en batteries de plus de 200 copies, jusqu'à 1 200 copies
* gènes des ARN 7SL et autres
petits ARN moins bien connus.
ADN non répété
L'ADN non répété correspond
essentiellement aux gènes qui codent pour des protéines.
Comme ces gènes sont parfois apparentés car provenant d'anciennes
duplications ils forment des familles qui ont des séquences
présentant plus ou moins de ressemblance. L'appellation
ADN non répété ou unique est donc abusive au sens strict
puisqu'il existe plusieurs formes apparentées (voir le chapitre
évolution). Néanmoins au regard du niveau de répétition
des deux types précédents, celui-ci se distingue par la
rareté dans le pool global de ces séquences qui se ressemblent
plus ou moins.
Ces trois types d'ADN ne
se retrouvent pas en parts comparables dans tous les génomes.
Lorsque la complexité de l'organisme augmente et/ou la quantité
d'ADN on constate qu'il y a plus d'ADN répétitif.
Espèce |
Helicobacter
pylori
bactérie |
Saccharomyces
cerevisiae
champignon |
Homo sapiens
mammifère |
| Chromosomes
nombre
Forme
Longueur d'un centromère |
1
circulaire
absent |
2 x 16
linéaire
110bp |
2 x 23
linéaire
>106pb |
| Séquences
codant des protéines
densité en gènes
Longueur moyenne d'un gène
gènes avec introns |
91%
1gène/kb
945bp
0 |
72%
1 gène/2,5kb
1 450bp
environ 4% |
1 à 4%
1 gène/100kb
en moyenne 20kb
seuls quelques gènes n'ont pas d'introns |
| Séquences
codant des ARN
ARN ribosomiques
ARN de transfert |
0,7%
36 espèces(7 groupes, 12 gènes isolés) |
5%
262 copies |
0,4%
1 300 copies |
| Séquences
répétées
hautement
moyennement |
0
17 éléments IS(~<1%) |
0
30 copies de Ty (1,2%) |
50%
Lines 105 copies (7%)
Sines(Alu)106 copies (9%) |
Tableau 1-2. Répartition
des différents types d'ADN en fonction de l'organisme.
Condensation
L'ADN est associé à des protéines
les histones. Chez les eucaryotes il est localisé dans le
noyau de la cellule et replié d'une manière ordonnée qui
assure le stockage d'une grande quantité d'ADN dans le noyau.
A titre d'exemple voici son
état dans le plus petit chromosome humain qui contient de
l'ordre de 10 fois un génome de E. coli soit 4 x 107bp.
S'il était étendu il aurait une longueur de 14 000
m
(14 cm). Dans son état le plus condensé lors de la mitose
il mesure 2
m,
soit une condensation d'un facteur 7 000.
Cette condensation ne se
fait pas en une seule fois, mais par plusieurs niveau hiérarchiques
d'organisation. Le premier niveau est constitué par l'enroulement
de l'ADN autour d'un noyau protéique pour produire une "perle
" appelée le nucléosome , c'est une condensation d'un
facteur 6, qui se retrouve aussi bien dans l'euchromatine
que l'hétérochromatine. Le second niveau est l'enroulement
des perles dans une structure hélicoidale appelée la fibre
30nm que l'on rencontre dans la chromatine interphasique
et les chromosomes mitotiques. Cette structure accroit la
condensation d'un facteur 40. La condensation maximale est
atteinte quand la fibre est organisée en boucles, entrelacs
et domaines qui donne une condensation de 1000 dans les
chromosomes interphasiques et de 10 000 dans les chromosomes
mitotiques.
En général, les chromosomes
eukaryotes sont constitués d'un complexe ADN-protéines organisé
d'une manière compacte. On distingue les éléments suivants.
La chromatine est l'unité
analytique du chromosome.
Le nucléosome est le niveau
le plus simple de condensation de l'ADN. 200bp d'ADN sont
enroulées autour d'un octamère de petites protéines, les
histones (deux molécules de chaque : H2A, H2B, H3 et H4).
146bp font deux tours autour du noyau histone et le reste
des bases relie ce nucléosome au suivant. L'enroulement
est négatif.
Figure 1-20. Premier niveau
de condensation de l'ADN.
La fibre de 30nm est une
structure qui ressemble à un solénoide avec 6 nucléosomes
par tour. La stabilité de cette structure est assurée par
une cinquième histone H1.
Le chromosome
Le chromosome XE "chromosome"
eucaryote comporte des structures essentielles à ses fonctions
et au maintien de son intégrité. Il s'agit du centromère
situé dans le chromosome et des télomères XE "télomères"
situés aux extrémités du chromosome.
Un centromère est un ADN
condensé qui est responsable de la ségrégation précise des
chromosomes fils après la réplication de l'ADN. Pendant
la mitose, le centromère se divise en sorte que les chromatides
XE "chromatide" peuvent migrer aux pôles opposés
de la cellule ;mais dans la première division de méiose
XE "méiose" , le centromère ne se divise pas et
rend solidaire les deux chromatides soeurs. Il ne se divisera
que lors de la seconde division de méiose au moment de la
migration des chromatides soeurs aux pôles opposés. C'est
par un ou plusieurs sites (cinétochore) dans le centromère
que le chromosome est fixé aux fibres du fuseau. Ce site
est composé d'ADN interagissant avec des protéines. La séquence
nucléique de ces régions est appelée CEN. Une unité CEN
a environ 120bp de long et contient plusieurs sous domaines.
Trois protéines interviennent dans le cinétochore (protéines
CfbIII). Une mutation ponctuelle dans un des sous domaines
de l'ADN peut abolir la fonction centromérique.
Les télomères sont indispensables
pour la réplication et la stabilité des chromosomes et sont
situés à leurs extrémités.Ils sont en général hétérochromatiques
et contiennent des séquences répétées en tandem (dans le
même sens) le motif répété est souvent de la forme(T/AxGy)
avec x compris entre 1 et 4 et y supérieur à1.
espèce |
motif télomérique |
Arabidopsis |
TTTAGGG |
Homme |
TTAGGG |
Oxytricha |
TTTTGGGG |
Dyctiostelium |
TAGGG |
Tetrahymena |
TTGGGG |
Trypanosome |
TAGGG |
Levure (variable
suivant les souches) |
(TG)1-3TG2-3
|
Tableau 1-3. Séquence d'un
motif télomérique en fonction de l'organisme.
Ce premier chapitre avait
pour but de vous rappeler les points essentiels que vous
avez déjà rencontrés au cours de vos études précédentes
et qui nous seront utiles pour aller plus loin en génétique
moléculaire et formelle. Les deux ne s'opposant pas mais
se complétant.
Depuis 1866 les travaux
de Mendel avaient proposé des hypothèses rendant compte
des règles suivies lors de la transmission des caractères
de génération en génération.
A partir de 1975, de nouvelles
techniques ont fourni de nouveaux outils pour compléter
les notions déjà acquises, les affiner et aller plus loin
dans la compréhension du génome.