Notes utiles sur le projet du génome humain (expliquées avec le diagramme)

Notes utiles sur le projet du génome humain!

Le projet du génome humain est l’entreprise scientifique la plus ambitieuse et la plus excitante de l’être humain. Le projet sur le génome humain est administré par le National Institute of Health et le Département américain. d'énergie. Aux États-Unis, les travaux sur ce projet ont débuté en 1990 avec la détermination de cartographier et de séquencer l’ensemble complet des chromosomes en 15 ans.

"Acquérir une connaissance complète de l'organisation, de la structure et des fonctions du génome humain - le plan directeur de chacun de nous - constitue l'objectif général du projet du génome humain." L'objectif étant de séquencer trois milliards de bases du génome humain et, en 1990, 100 000 avaient été analysés.

De nombreuses séquences du génome sont hautement répétitives et n’ont pas de fonction évidente. Cela représente environ 50% de l'ADN total. Comme on l’a vu plus haut, ce n’est pas un mince travail et le travail et les coûts sont également frustrants. C'est un projet ambitieux.

Les études de ce projet seront entreprises en trois étapes:

(i) cartographie

(ii) séquençage

(iii) Analyse fonctionnelle

La cartographie de la génétique humaine est difficile pour les raisons suivantes:

i) Raisons éthiques

(ii) La durée du cycle de reproduction est seulement de 15 à 16 ans.

(iii) Impossibilité de mener une reproduction contrôlée.

Une vue régulière des stratégies utilisées pour la cartographie, une automatisation poussée du séquençage et de nouvelles techniques peuvent aider les scientifiques à atteindre cet objectif.

Donnis Keller et al. (1987) ont décrit la première carte RFLP du génome humain. Il a identifié les locus RFLP avec un espacement moyen de 10 centimorgans (cM). G. Craig Venter et al. (1990) au lieu de prendre la stratégie du «Projet du génome humain» consistant à séquencer une base à la fois l'ADN chromosomique, ils ont isolé les molécules d'ARNm, les ont copiées dans des étiquettes de séquence d'ADN ou des EST.

Ils ont identifié plus de 8 000 gènes entre 1990 et 1992. M. Venter et ses 70 scientifiques de l'Institut de recherche en génomique de Gaitherburg, dans le Maryland, espèrent déterminer la séquence de 2 000 à 3 000 gènes humains par semaine.

Les cartes physiques de tous les chromosomes humains étaient terminées en 1994. EST peut être utilisé pour isoler le gène entier. Avec EST, de nombreuses bases de données de séquences de nucléotides ont été mises à disposition. Il a facilité la construction de la carte de transcription préliminaire du génome humain.

Les EST ne représentent que des gènes exprimés. Les EST sont des clones d'ADNc. Utilisation de la banque de données de séquences de nucléotides (banque de gènes) et de la base de données de séquences de protéines (ressources d'informations protéiques) Les EST peuvent être appariés avec des séquences existantes et des gènes attribués à l'aide de programmes informatiques.

Le Dr Venter a ensuite mis au point une «stratégie de tir au génome complet» consistant à fragmenter de manière aléatoire l'ADN en segments et à cloner les fragments en vecteurs. Les structures tridimensionnelles des protéines du plus petit génome, Mycoplasma genitalium et Haemophilus influenzae Rd, aux fonctions totalement inconnues, ont été déterminées dans le cadre d'un projet de génomique structurale.

Cet effort étudie l'utilisation d'informations structurelles pour faciliter l'assignation fonctionnelle des protéines. Craig Venter a formé «l'Institut de recherche en génomique (TIGR)» dans le Maryland (États-Unis). Ici, plusieurs bactéries ont été séquencées.

Les structures des protéines hypothétiques sont utilisées pour guider les études visant à connaître la fonction des protéines. Avec plus de 25 structures déterminées à ce moment-là, les résultats sont très encourageants pour connaître un certain niveau de compréhension fonctionnelle.

L'achèvement de la séquence d'ADN humain en 2003 a coïncidé avec le 50e anniversaire de la description par Watson et Crick de la structure de l'ADN. Le projet du génome humain a été marqué par des progrès accélérés. Le brouillon du génome humain a été achevé en 2000.

En février 2001, «Science and Nature» a publié le projet de séquence de travail et d'analyse du génome humain. Les scientifiques ont d'abord créé une carte physique du génome humain avec des clones de chaque chromosome organisés en séries de cotations longues.

Étant donné que la plupart des clones mesurent plus de 100 000 pb et que les techniques actuelles ne peuvent résoudre que 600 à 750 pb de séquence, chaque séquence doit être séquencée en fragments.

En utilisant une approche à coup de canon suivie par l'assemblage de tout le clone par identification informatisée des chevauchements, l'ADN séquencé a été mis à disposition dans une base de données couvrant le génome entier. J. Craig Venter (1997) de Celera Corporation a eu recours à une stratégie différente, appelée séquençage de pistolet à injection de génome entier, qui a permis d’éliminer l’établissement d’une carte physique du génome.

Les scientifiques ont séquencé des fragments d'ADN dans le génome de manière aléatoire. Des décennies plus anciennes, on estime à environ 100 000 le nombre de gènes humains contenus dans les 3, 2 x 10 9 pb. La séquence du génome a cependant révélé qu'il n'y avait que 20 000 à 25 000 gènes. Bien que les humains aient évolué relativement récemment, le génome humain est très ancien.

Peu de caractéristiques intéressantes du génome humain sont:

(i) Il y a plus de 3, 2 milliards de paires de bases.

(ii) On estime que le génome humain contient 20 000 à 25 000 gènes et détermine les séquences de 3 milliards de paires de bases chimiques constituant l'ADN humain.

(iii) La population humaine comprend des millions de différences de bases uniques appelées polymorphismes mononucléotidiques (SNP). Chaque être humain diffère du suivant d'environ 1 pb sur 1 000 pb.

(iv) Le génome humain comporte des zones riches en gènes séparées par des zones pauvres en gènes appelées déserts de gènes.

(v) Environ 45% de notre génome est constitué de transposons.

(vi) Seulement 2% du génome code les protéines.

(vii) Améliorer les outils d'analyse des données.

(viii) Utilisation de la technologie concernée dans des secteurs tels que les industries.

(ix) Aborder les problèmes éthiques, juridiques et sociaux (ELSI) qui peuvent apparaître en raison de HGP.

(x) Le génome humain contient 3164, 7 millions de bases de nucléotides. Le plus grand gène humain connu est la dystrophine, qui porte 2, 4 millions de bases, le gène moyen comptant environ 3 000 bases. Les fonctions de 50% des gènes découverts restent à découvrir.

(xi) Environ 99, 9% des bases nucléotidiques sont exactement similaires chez tous les êtres humains. Auparavant, le nombre total de gènes était estimé entre 80 000 et 1 40 000, mais on dit maintenant que ce nombre est de 30 000.

(xii) Une grande quantité de génome humain est constituée de séquences répétées.

(xiii) Le chromosome 1 contient le maximum de gènes (2968), le chromosome Y étant le plus faible (231).

Fig. 6.68. Instantané du génome humain

Des laboratoires et des groupes de recherche de nombreux pays participent à la recherche sur le génome humain. Les données recueillies auprès de toutes ces sources doivent être utilisées et intégrées. Les deux contributeurs notables du projet du génome humain sont le Centre d'Etudes Polymorphisme Humaine (CEPH) et Généthon (une usine de génétique humaine) en France.