Université Pierre et Marie Curie

Génétique

Introduction
Génes et génomes
Polymorphisme
Mutagenèse
Analyse fonctionnelle
Cartographie
Biodiversite, évolution
Unité du monde vivant
Complexification des génomes
Duplication de gènes
Duplication de génome
Transposons
Clonage de gènes par homologie
Phylogénie
Applications
Glossaire
Page d'accueilTable des matièresNiveau supérieurPage précédenteBas de la pagePage suivante

Duplication de génome

 

Dans certains cas ce sont les génomes entiers qui se sont dupliqués.

Gènes Hox

La différenciation des différentes parties du corps est programmée par un groupe de gènes que l'on trouve groupés aussi bien chez les vertébrés que chez les arthropodes. Ces gènes ont un motif extrêmement conservé d'interaction avec l'ADN : la " boite " homéotique. Parmi les gènes homéotiques certains qui ont une parenté plus étroite . Ce qui a permisde distinguer deux sous groupes, les gènes paraHOX et les gènes HOX.

Les gènes HOX sont des gènes qui codent des facteurs de transcription XE "facteurs de transcription" jouant un rôle primordial dans le devenir des différents territoires d'un embryon. On les trouve chez tous les triploblastiques. Ils présentent dans leur séquence une boite homéotique XE "homéotique" , c'est à dire une région à la séquence très conservée de 180 bp( qui code donc 60AA) qui spécifie une région protéique (l'homéodomaine) qui sert comme élément primordial dans la régulation des éléments de différenciation des cellules.

pic006.jpg

Figure 7- 7. Plan d'un gène homéotique.

Dans l'homéodomaine deux zones sont particulièrement conservées : acides aminés 15 à 20 et 48 à 53 qui sont inchangés au sein de tous les gènes Hox de la drosophile ainsi que dans les gènes Hox1 à Hox10 de mammifères.

Une autre particularité remarquable des gènes Hox est leur regroupement sur une région chromosomique ainsi que leur ordre dans ce groupe qui reflète celui dans lequel ils s'expriment le long de l'axe antéro-postérieur du corps. De la drosophile à l'homme on retrouve cette colinéarité spatio-temporelle. Les gènes à l'extrémité 3' du groupe sont les gènes antérieurs qui définissent la tête (Hox1, Hox2,lab,pb,zen, ...) ;les gènes du milieu du groupe sont les gènes centraux qui définissent le tronc (dfd, Hox4-8, Scr, ftz, Ubx, AbdA,...) et les plus 5' sont les gènes postérieurs qui définissent la queue.

pic007.jpg

Figure 7- 8. Gènes homéotiques chez divers organismes animaux.

Cette famille de gènes est déjà représentée par un seul gène chez les éponges (diploblastiques) puis on les trouve de plus en plus nombreux dans le règne animal au fur et à mesure que le plan corporel se diversifie. Depuis une dizaine d'années on en a découvert chez de nombreuses espèces. En voici quelques exemples


• Chez les diploblastiques

- éponges : gènes D hox mais pas de VRAI gène HOX
- cnidaires : 4 gènes Hox : parmi les antérieurs et médians

• Chez les triploblastiques acœlomates

- plathelminthes (les plus primitifs) gènes Hox : parmi les antérieurs et médians (a, une planaire, Dugesia 7 gènes Hox)
- Caenorhabditis 5 gènes HOX en un complexe (c’est le nombre minimum de gènes pour les nématodes).

• Chez les cœlomates protostomiens (arthropodes, annélides et mollusques)

- Drosophile (diptère) 8 gènes HOX
- Tribolium (coléoptère)un groupe de 7 gènes HOX
- Artemia (arthropode) on a reconnu 5 gènes HOX ce qui suggère un seul complexe
- Limulus (chélicérate) de nombreux gènes HOX dont ceux du groupe 3. Il y aurait plusieurs complexes.
- Hirudo medicinalis (sangsue, annélide) gènes HOX identifiés.
- Cténodrilus (ver polychète) gènes HOX antérieurs et médians mais pas de postérieurs groupe 3 peut être représenté
- mollusques (octopus, aplysia) gènes HOX antérieurs et médians mais pas de postérieurs groupe 3 représenté

Haliotis (gastéropode) un paralogue possible du groupe 9

• Chez les cœlomates deutérostomiens (la phylogénie a été établie à l’aide de l’ARNr 18S)

- échinodermes groupe frère de tous les autres, caractérisé par une symétrie radiale mais il y a déjà 10 gènes HOX en un groupe unique
- hémichordés (pas encore de chorde mais un système nerveux dorsal et un pharynx perforé, exemple : les vers priapuliens, Balanoglosse) le sacoglosse possède un gène HOX représentant chacun des groupes 1 à 9. Le groupe 10 n’est pas représenté et ces gènes sont organisés en un seul complexe.
- urochordés (tuniciers, ascidies) chez Ciona et Styela on n’a identifié qu’un gène HOX différent de ceux qui déterminent la partie médiane du corps. Chez un autre représentant, Molgula oculata un seul gène HOX également a été identifié, c’est un paralogue du groupe 10 ; cette espèce a une larve qui présente une queue. Par contre chez Molgula occulta aucun gène HOX n’a été trouvé, la larve est dépourvue de queue. Ces quelques éléments semblent montrer que dans ce groupe il y aurait eu évolution par perte de gènes HOX.
- céphalocordés (Amphioxus) un complexe a été mis en évidence. Il comporte 14 gènes (le 13ème est dupliqué)
- vertébrés agnathes (lamproie, Petromyzon marinus) 3 ou 4 complexes de gènes.
- vertébrés à mâchoire : tous les organismes de ce groupe étudiés jusqu’ici possèdent 4 complexes de gènes HOX au moins.
- Certains poissons acanthoptérygiens ont 2 exemplaires de chacun des 4 complexes généralement retrouvés chez les vertébrés à mâchoire.

 

L'origine des gènes Hox est sans doute due à une série de duplications à partir d'un unique gène ancestral (cf D hox des éponges). Dans un premier temps des duplications de ce gène unique ont modelé un groupe de gènes Hox, ensuite, ce groupe lui-même s'est dupliqué. On en retrouve la trace à la base des chordés. Les agnathes (vertébrés sans mâchoires) en possèdent deux groupes (première duplication) puis chez les Gnathostomes (vertébrés à mâchoires) on en trouve 4, et l'étude plus approfondie de quelques poissons a montré que dans ce groupe il y avait eu une duplication supplémentaire portant le nombre des groupes à 8 (cas du poisson zèbre)

pic008.jpg

Figure 7- 9. Phylogénie animale et complexes homéotiques.

Figure 7- 10. Duplication des groupes Hox à l'origine des animaux à mâchoires.

 

Ces complexes homéotiques provenant d'anciennes duplications, peut-on encore déceler la trace de ces duplication en dehors des complexes ?

Dans les banques de séquences on a cherché des gènes répondant aux critères suivants :

  • membres d'une famille multigénique
  • situés à proximité d'un complexe HOX

Ces critères ont permis de dégager 4500 gènes. On les a alors examinés du point de vue de leur séquence en acides aminés. Parmi ces gènes 332 représentant 74 familles présentent des analogies.

La présence de ces gènes membres de familles multigéniques est-elle significative ou ne reflète-t-elle que la grande redondance du génome ?

L'étude de la répartition des gènes appartenant à des familles répétées dans l'ensemble du génome (qui est fonction de la représentativité de la famille) montre que la probabilité d'une densité de 332 gènes dans 74 familles près des complexes HOX est de 0,01. Si l'on se limite à des zones plus proches des complexes (il y a eu moins de crossing over depuis l'époque des duplications) cette même probabilité devient 2 x 10-5, ce qui montre qu'il y a bien eu duplication de portions importantes du génome dans lesquelles sont inclus les complexes HOX.

Traces de duplications chez la levure

Le séquençage systématique du génome de la levure Saccharomyces cerevisiae a été terminé en 1996. Son annotation a donné des résultats inattendus. De nombreux gènes qui n'avaient pas été identifiés par l'existence de mutants, ont été mis en évidence. Ils existent en plusieurs exemplaires très ressemblants et codent probablement pour des protéines qui assurent des fonctions identiques ou au moins apparentées (d'ou l'absence de mutants). Le génome complet qui comporte 70% de régions codantes comporte de l'ordre de 6000 gènes (dont 140 pour des ARNr, 40 pour de petits ARNsn et 275 pour des ARNt). On a recherché systématiquement des régions qui comportaient des gènes analogues. pour être identifiées comme des répétitions de telles régions devaient répondre à plusieurs critères.

  • Avoir un score d'identité élevé (recherche BLAST) dont la probabilité au hasard était de l'ordre de 10-18 ;
  • 3 gènes devaient être retrouvés séparés par moins de 50kbp ;
  • l'ordre et l'orientation de ces gènes devait être le même.

55 régions ont été trouvées qui renfermaient 376 paires de gènes homologues (identité moyenne de 63% en séquence protéique). Elles représentent 50% du génome et contiennent en moyenne 6,9 gènes.

Ces régions si ressemblantes doivent être la conséquence de duplications qui sont à l'origine du génome actuel de la levure. Deux hypothèses peuvent rendre compte de ces régions redondantes.

  • Des duplications successives et indépendantes ont affecté séparément chaque region dupliquée
  • Une seule duplication du génome complet suivie de réarrangements et pertes de gènes ont laissé ces traces redondantes.

On constate que dans 50 régions sur 55, l'orientation par rapport au centromère est la même (dans l'hypothèse orientation au hasard on en attendrait 27,5 soit 2=18, très significatif). En dehors de ces régions on trouve également des gènes redondants (172 paires). Parmi ces derniers, 117 paires présentent aussi une orientation conservée par rapport au centromère. Par contre lorsque l'on considère une paire constituée par un gène inclus dans un bloc et l'autre hors d'un bloc (plus probablement issu d'une duplication indépendante), les orientations par rapport au centromère sont aléatoires. Ces constatations ont amené à favoriser l'hypothèse d'une unique duplication du génome à l'origine du génome de levure, suivie de réarrangements tels que des translocations réciproques.

Figure 7- 11. Une duplication et des remaniements divers ont produit le génome actuel de la levure.

 

Un des champignons les plus proches de Saccharomyces semble être Kluyveromyces. Or dans ce genre, on ne trouve qu'un représentant de chacune des paires de gènes homologues des blocs précédents. Ce qui confirme que Kluyveromyces s'est différencié d'un ancêtre commun à ces deux taxa avant l'événement de duplication. La comparaison des deux génomes met en lumière certains remaniements postérieurs à la duplication.

Des estimations datent approximativement la duplication du génome de 100millions d'années. Ce qui laisse suffisamment de temps pour de nombreux remaniements qui ont rendu méconnaissable (ou presque) 50% du génome.

Figure 7- 12. Remaniements après la duplication unique du génome.

 

Une différence notable du métabolisme des deux champignons est l'aptitude qui n'existe que chez la levure de fermenter activement les sucres en conditions anaérobies et de produire de l'éthanol. On peut tenter de rapprocher la date estimée de la duplication de celle ou les angiospermes (et leurs fruits, riches en sucres) sont devenus abondants (108 ans). Ce qui peut suggérer une pression de sélection qui aurait favorisé un organisme qui ayant dupliqué son génome pouvait alors faire évoluer une copie de certains gènes vers une nouvelle fonction, les autres gènes en double exemplaire étant perdus (chez la levure on estime les gènes perdus après cette duplication initiale à environ 85%).

 

Page d'accueilTable des matièresNiveau supérieurPage précédenteHaut de la pagePage suivante