Dans certains cas ce sont
les génomes entiers qui se sont dupliqués.
Gènes Hox
La différenciation des
différentes parties du corps est programmée par un groupe
de gènes que l'on trouve groupés aussi bien chez les vertébrés
que chez les arthropodes. Ces gènes ont un motif extrêmement
conservé d'interaction avec l'ADN : la " boite "
homéotique. Parmi les gènes homéotiques certains qui ont
une parenté plus étroite . Ce qui a permisde distinguer deux sous groupes, les gènes paraHOX et les gènes HOX.
Les gènes HOX sont des
gènes qui codent des facteurs de transcription XE "facteurs
de transcription" jouant un rôle primordial dans le
devenir des différents territoires d'un embryon. On les
trouve chez tous les triploblastiques. Ils présentent dans
leur séquence une boite homéotique XE "homéotique"
, c'est à dire une région à la séquence très conservée de
180 bp( qui code donc 60AA) qui spécifie une région protéique
(l'homéodomaine) qui sert comme élément primordial dans
la régulation des éléments de différenciation des cellules.
Figure 7- 7. Plan
d'un gène homéotique.
Dans l'homéodomaine deux
zones sont particulièrement conservées : acides aminés 15
à 20 et 48 à 53 qui sont inchangés au sein de tous les gènes
Hox de la drosophile ainsi que dans les gènes Hox1 à Hox10
de mammifères.
Une autre particularité
remarquable des gènes Hox est leur regroupement sur une
région chromosomique ainsi que leur ordre dans ce groupe
qui reflète celui dans lequel ils s'expriment le long de
l'axe antéro-postérieur du corps. De la drosophile à l'homme
on retrouve cette colinéarité spatio-temporelle. Les gènes
à l'extrémité 3' du groupe sont les gènes antérieurs qui
définissent la tête (Hox1, Hox2,lab,pb,zen, ...) ;les gènes
du milieu du groupe sont les gènes centraux qui définissent
le tronc (dfd, Hox4-8, Scr, ftz, Ubx, AbdA,...) et les plus
5' sont les gènes postérieurs qui définissent la queue.
Figure 7- 8. Gènes
homéotiques chez divers organismes animaux.
Cette famille de gènes
est déjà représentée par un seul gène chez les éponges (diploblastiques)
puis on les trouve de plus en plus nombreux dans le règne
animal au fur et à mesure que le plan corporel se diversifie.
Depuis une dizaine d'années on en a découvert chez de nombreuses
espèces. En voici quelques exemples
• Chez les diploblastiques
- éponges :
gènes D hox mais pas de VRAI gène HOX
- cnidaires : 4 gènes Hox : parmi les antérieurs
et médians
• Chez les triploblastiques
acœlomates
- plathelminthes (les
plus primitifs) gènes Hox : parmi les antérieurs
et médians (a, une planaire, Dugesia 7
gènes Hox)
- Caenorhabditis 5 gènes HOX en un complexe
(c’est le nombre minimum de gènes pour les
nématodes).
• Chez les cœlomates
protostomiens (arthropodes, annélides et mollusques)
- Drosophile (diptère)
8 gènes HOX
- Tribolium (coléoptère)un groupe
de 7 gènes HOX
- Artemia (arthropode) on a reconnu 5 gènes
HOX ce qui suggère un seul complexe
- Limulus (chélicérate) de nombreux
gènes HOX dont ceux du groupe 3. Il y aurait plusieurs
complexes.
- Hirudo medicinalis (sangsue, annélide)
gènes HOX identifiés.
- Cténodrilus (ver polychète) gènes
HOX antérieurs et médians mais pas de postérieurs
groupe 3 peut être représenté
- mollusques (octopus, aplysia) gènes HOX antérieurs
et médians mais pas de postérieurs groupe
3 représenté
Haliotis
(gastéropode) un paralogue possible du groupe
9
• Chez les cœlomates
deutérostomiens (la phylogénie a été
établie à l’aide de l’ARNr 18S)
- échinodermes
groupe frère de tous les autres, caractérisé
par une symétrie radiale mais il y a déjà
10 gènes HOX en un groupe unique
- hémichordés (pas encore de chorde mais
un système nerveux dorsal et un pharynx perforé,
exemple : les vers priapuliens, Balanoglosse) le sacoglosse
possède un gène HOX représentant
chacun des groupes 1 à 9. Le groupe 10 n’est
pas représenté et ces gènes sont
organisés en un seul complexe.
- urochordés (tuniciers, ascidies) chez Ciona
et Styela on n’a identifié qu’un
gène HOX différent de ceux qui déterminent
la partie médiane du corps. Chez un autre représentant,
Molgula oculata un seul gène HOX également
a été identifié, c’est un paralogue
du groupe 10 ; cette espèce a une larve qui présente
une queue. Par contre chez Molgula occulta aucun
gène HOX n’a été trouvé,
la larve est dépourvue de queue. Ces quelques éléments
semblent montrer que dans ce groupe il y aurait eu évolution
par perte de gènes HOX.
- céphalocordés (Amphioxus) un
complexe a été mis en évidence. Il
comporte 14 gènes (le 13ème est dupliqué)
- vertébrés agnathes (lamproie, Petromyzon
marinus) 3 ou 4 complexes de gènes.
- vertébrés à mâchoire : tous
les organismes de ce groupe étudiés jusqu’ici
possèdent 4 complexes de gènes HOX au moins.
- Certains poissons acanthoptérygiens ont 2 exemplaires
de chacun des 4 complexes généralement retrouvés
chez les vertébrés à mâchoire.
L'origine des gènes Hox
est sans doute due à une série de duplications à partir
d'un unique gène ancestral (cf D hox des éponges). Dans
un premier temps des duplications de ce gène unique ont
modelé un groupe de gènes Hox, ensuite, ce groupe lui-même
s'est dupliqué. On en retrouve la trace à la base des chordés.
Les agnathes (vertébrés sans mâchoires) en possèdent deux
groupes (première duplication) puis chez les Gnathostomes
(vertébrés à mâchoires) on en trouve 4, et l'étude plus
approfondie de quelques poissons a montré que dans ce groupe
il y avait eu une duplication supplémentaire portant le
nombre des groupes à 8 (cas du poisson zèbre)
Figure 7- 9. Phylogénie
animale et complexes homéotiques.

Figure 7- 10. Duplication
des groupes Hox à l'origine des animaux à mâchoires.
Ces complexes homéotiques
provenant d'anciennes duplications, peut-on encore déceler
la trace de ces duplication en dehors des complexes ?
Dans les banques de séquences
on a cherché des gènes répondant aux critères suivants :
- membres d'une famille multigénique
- situés à proximité d'un complexe HOX
Ces critères ont permis
de dégager 4500 gènes. On les a alors examinés du point
de vue de leur séquence en acides aminés. Parmi ces gènes
332 représentant 74 familles présentent des analogies.
La présence de ces gènes
membres de familles multigéniques est-elle significative
ou ne reflète-t-elle que la grande redondance du génome
?
L'étude de la répartition
des gènes appartenant à des familles répétées dans l'ensemble
du génome (qui est fonction de la représentativité de la
famille) montre que la probabilité d'une densité de 332
gènes dans 74 familles près des complexes HOX est de 0,01.
Si l'on se limite à des zones plus proches des complexes
(il y a eu moins de crossing over depuis l'époque des duplications)
cette même probabilité devient 2 x 10-5, ce qui
montre qu'il y a bien eu duplication de portions importantes
du génome dans lesquelles sont inclus les complexes HOX.
Traces de duplications
chez la levure
Le séquençage systématique
du génome de la levure Saccharomyces cerevisiae a
été terminé en 1996. Son annotation a donné des résultats
inattendus. De nombreux gènes qui n'avaient pas été identifiés
par l'existence de mutants, ont été mis en évidence. Ils
existent en plusieurs exemplaires très ressemblants et codent
probablement pour des protéines qui assurent des fonctions
identiques ou au moins apparentées (d'ou l'absence de mutants).
Le génome complet qui comporte 70% de régions codantes comporte
de l'ordre de 6000 gènes (dont 140 pour des ARNr, 40 pour
de petits ARNsn et 275 pour des ARNt). On a recherché systématiquement
des régions qui comportaient des gènes analogues. pour être
identifiées comme des répétitions de telles régions devaient
répondre à plusieurs critères.
- Avoir un score d'identité élevé (recherche
BLAST) dont la probabilité au hasard était de l'ordre
de 10-18 ;
- 3 gènes devaient être retrouvés séparés
par moins de 50kbp ;
- l'ordre et l'orientation de ces gènes
devait être le même.
55 régions ont été trouvées
qui renfermaient 376 paires de gènes homologues (identité
moyenne de 63% en séquence protéique). Elles représentent
50% du génome et contiennent en moyenne 6,9 gènes.
Ces régions si ressemblantes
doivent être la conséquence de duplications qui sont à l'origine
du génome actuel de la levure. Deux hypothèses peuvent rendre
compte de ces régions redondantes.
- Des duplications successives et indépendantes
ont affecté séparément chaque region dupliquée
- Une seule duplication du génome complet
suivie de réarrangements et pertes de gènes ont laissé
ces traces redondantes.
On constate que dans 50
régions sur 55, l'orientation par rapport au centromère
est la même (dans l'hypothèse orientation au hasard on en
attendrait 27,5 soit
2=18,
très significatif). En dehors de ces régions on trouve également
des gènes redondants (172 paires). Parmi ces derniers, 117
paires présentent aussi une orientation conservée par rapport
au centromère. Par contre lorsque l'on considère une paire
constituée par un gène inclus dans un bloc et l'autre hors
d'un bloc (plus probablement issu d'une duplication indépendante),
les orientations par rapport au centromère sont aléatoires.
Ces constatations ont amené à favoriser l'hypothèse d'une
unique duplication du génome à l'origine du génome de levure,
suivie de réarrangements tels que des translocations réciproques.

Figure 7- 11. Une
duplication et des remaniements divers ont produit le génome
actuel de la levure.
Un des champignons les
plus proches de Saccharomyces semble être Kluyveromyces.
Or dans ce genre, on ne trouve qu'un représentant de chacune
des paires de gènes homologues des blocs précédents. Ce
qui confirme que Kluyveromyces s'est différencié
d'un ancêtre commun à ces deux taxa avant l'événement de
duplication. La comparaison des deux génomes met en lumière
certains remaniements postérieurs à la duplication.
Des estimations datent
approximativement la duplication du génome de 100millions
d'années. Ce qui laisse suffisamment de temps pour de nombreux
remaniements qui ont rendu méconnaissable (ou presque) 50%
du génome.

Figure 7- 12. Remaniements
après la duplication unique du génome.
Une différence notable
du métabolisme des deux champignons est l'aptitude qui n'existe
que chez la levure de fermenter activement les sucres en
conditions anaérobies et de produire de l'éthanol. On peut
tenter de rapprocher la date estimée de la duplication de
celle ou les angiospermes (et leurs fruits, riches en sucres)
sont devenus abondants (108 ans). Ce qui peut
suggérer une pression de sélection qui aurait favorisé un
organisme qui ayant dupliqué son génome pouvait alors faire
évoluer une copie de certains gènes vers une nouvelle fonction,
les autres gènes en double exemplaire étant perdus (chez
la levure on estime les gènes perdus après cette duplication
initiale à environ 85%).