Projet du génome humain: Caractéristiques silencieuses et objectifs du projet du génome humain

Lisez cet article pour en savoir plus sur les fonctionnalités silencieuses, les objectifs, les applications et les défis futurs du projet du génome humain!

Chaque individu a une identité qui est due à sa constitution génétique. Deux individus ne sont similaires (à l'exception des jumeaux mono-zygotes) car leur constitution génétique est différente.

Courtoisie d'image: img.mit.edu/newsoffice/images/article_images/original/20130103132743-0.jpg

Les différences dans la constitution génétique sont dues aux différences dans les séquences de nucléotides de leurs ADN. Les scientifiques avaient donc toujours pour ambition de cartographier le génome humain. Les progrès des techniques de génie génétique ont permis d’isoler et de cloner des fragments d’ADN et de déterminer les séquences nucléotidiques de ces fragments.

Par conséquent, en 1990, le US Department of Energy et le National Institute of Health ont lancé et coordonné le projet de séquençage du génome humain appelé HGP ou Human Genome Project. Welcome Trust (UK) a rejoint le projet en tant que partenaire majeur. Plus tard, le Japon, la France, l'Allemagne, la Chine et d'autres pays l'ont également rejoint.

HGP est un méga projet impliquant beaucoup d'argent, des techniques les plus avancées, de nombreux ordinateurs et des scientifiques à l'œuvre. On peut imaginer l’ampleur du projet: si le coût du séquençage d’un pb est de 3 dollars, un séquençage de 10 10 pb coûterait un milliard de dollars. Si les données doivent être stockées dans des livres, chaque livre comptant 1 000 pages et chaque page contenant 1 000 lettres, environ 3 300 livres seront nécessaires. La base de données bioinformatique et d’autres dispositifs informatiques à grande vitesse ont contribué à l’analyse, au stockage et à la récupération d’informations.

Buts:

HGP s'était fixé les objectifs suivants.

1. Déterminez la séquence et le nombre de toutes les paires de bases du génome humain.

2. Identifiez tous les gènes présents dans le génome humain.

3. Déterminez les fonctions de tous les gènes.

4. Identifiez les différents gènes responsables de troubles génétiques.

5. Déterminer la prédisposition génétique et l'immunité à divers troubles.

6. Stockez les informations dans des bases de données.

7. Améliorer les outils d'analyse des données.

8. Découvrez les possibilités de transfert de technologie développée au cours des projets de grande envergure à l'industrie.

9. Le projet peut engendrer de nombreux problèmes éthiques, juridiques et sociaux (ELSI) qui doivent être abordés et résolus.

Le séquençage du projet devait être achevé en 2003. Le 12 février 2001, une annonce officielle concernant l'achèvement du projet a été faite. L'annonce du séquençage de chromosomes individuels a toutefois été annoncée en mai 2006, après l'assignation des séquences de nucléotides aux chromosomes I.

Méthodologie:

Il existe deux types d'approches pour analyser le génome,

(i) Identifier tous les gènes exprimés sous forme de balises de séquence exprimées par l’ARN ou d’EST

(ii) séquençage du génome entier (régions codantes et non codantes) et affectation ultérieure des différentes régions avec des fonctions - annotation de séquence.

HGP a suivi la deuxième méthodologie qui implique les étapes suivantes.

(i) tout l'ADN de la cellule est isolé et fragmenté de manière aléatoire en fragments,

(ii) ils sont insérés dans des vecteurs spécialisés tels que ВАС (chromosomes artificiels bactériens) et YAC (chromosome artificiel de levure),

(iii) Les fragments sont clonés dans des hôtes appropriés tels que des bactéries et des levures. La PCR (réaction en chaîne de la polymérase) peut également être utilisée pour le clonage ou la copie de fragments d’ADN,

(iv) les fragments sont séquencés sous forme de séquences d’ADN annotées (émanation de la méthodologie mise au point par le double lauréat du prix Nobel, Frederick Sanger),

(v) Les séquences ont ensuite été organisées sur la base de certaines régions qui se chevauchent. Il a fallu générer des fragments qui se chevauchent pour le séquençage,

(vi) Des programmes informatiques ont été utilisés pour aligner les séquences.

(vii) Les séquences ont ensuite été annotées et attribuées à différents chromosomes. Tous les chromosomes humains ont été séquencés, 22 autosomes X et Y. Le chromosome I devait être séquencé pour la dernière fois en mai 2006. (viii) Grâce au polymorphisme des microsatellites et aux sites de reconnaissance des endonucléases de restriction, les cartes génétique et physique du génome ont également été préparés.

Principales caractéristiques du génome humain:

1. Le génome humain compte 3, 1647 milliards de paires de bases de nucléotides.

2. La taille moyenne des gènes est de 3000 paires de bases. Le gène le plus important est celui de la dystrophie musculaire de Duchenne sur chromosome X. Il compte 2, 4 millions de paires de bases (2 400 kilos). Les gènes de la B-globine et de l'insuline ont moins de 10 kilobases.

3. Le génome humain comprend environ 30 000 gènes. Auparavant, on estimait qu'il contenait 80 000 à 100 000 gènes. Le nombre de gènes humains est à peu près le même que celui de la souris. Neuf dixièmes de gènes sont identiques à ceux de la souris. Nous avons plus de deux fois plus de gènes que de fruits (Drosophila melanogaster) et six fois plus de gènes que chez la bactérie Escherichia coli.

La taille du génome ou le nombre de gènes ne sont pas liés à la complexité de l'organisation du corps. Par exemple, Lily a 18 fois plus d'ADN que le génome humain, mais produit moins de protéines que nous parce que son ADN contient plus d'introns et moins d'exons.

4. Le chromosome I contient 2968 gènes et le chromosome Y, 231 gènes. Ce sont les gènes maximum et minimum pour les chromosomes humains.

5. La fonction de plus de 50% des gènes découverts est inconnue.

6. Moins de 2% du génome représente des gènes structurels codant pour des protéines.

7. 99, 9% des bases nucléotidiques sont exactement similaires chez tous les êtres humains.

8. Seulement 0, 1% du génome humain contenant environ 3, 2 millions de nucléotides représente la variabilité observée chez l'homme.

9. Environ 1, 4 million d’emplacements présentent des différences mononucléotidiques appelées SNP (Snips) ou polymorphismes mononucléotidiques. Ils ont le potentiel d’aider à trouver des emplacements chromosomiques pour les séquences associées à la maladie et à retracer l’histoire humaine.

10. Les séquences répétées ou répétitives constituent une grande partie du génome humain. Il y a environ 30 000 locus minisatellites, chacun ayant 11 à 60 pb répétés en tandem mille fois. Ce sont environ 2 000 000 microsatellites, chacun avec jusqu'à 10 pb répété 10 à 100 fois.

11. Les séquences répétitives sont des séquences nucléotidiques répétées plusieurs fois, parfois cent à mille fois. Ils n'ont pas de fonction de codage direct mais fournissent des informations sur la structure, la dynamique et l'évolution des chromosomes.

12. Environ 1 million de copies de séquences répétées courtes de 5 à 8 paires de bases sont regroupées autour des centromères et à proximité des extrémités des chromosomes. Ils représentent l'ADN indésirable.

Applications et défis futurs:

1. Troubles:

Plus de 1200 gènes sont responsables de maladies cardiovasculaires humaines courantes, de maladies endocriniennes (comme le diabète), de troubles neurologiques (comme la maladie d'Alzheimer), de cancers et de bien d'autres.

2. Cancers:

Des efforts sont en cours pour déterminer les gènes qui transformeront les cellules cancéreuses en cellules normales.

3. Soins de santé:

Il indiquera les perspectives d’une vie plus saine, de médicaments de synthèse, de régimes génétiquement modifiés et enfin de notre identité génétique.

4. Interactions:

Il sera possible d'étudier comment divers gènes et protéines fonctionnent ensemble dans un réseau interconnecté.

5. Etude des tissus.

Tous les gènes ou transcriptions dans un tissu, un organe ou une tumeur particulier peuvent être analysés pour connaître la cause de l'effet produit.

6. Organismes non humains:

Les informations sur les capacités naturelles des organismes non humains peuvent être utilisées pour relever les défis en matière de soins de santé, d'agriculture, de production d'énergie et de restauration de l'environnement. Pour cela, un certain nombre d'organismes modèles ont été séquencés, par exemple, des bactéries, des levures Coenorhabditis elegans (nématodes non-pathogènes libres), Drosophila (de manière fructueuse), du riz, d'Arabidopsis, etc.