Processus de prévision et de dénombrement des gènes

Processus de prévision et de comptage des gènes!

L'annonisation est un processus qui identifie les gènes, leurs séquences régulatrices et leurs fonctions possibles. L'annonation indique les gènes codant pour des protéines autres que les protéines, les gènes codant pour l'ARN r, l'ARN t et les ARN nucléaires, des éléments génétiques mobiles et des familles de séquences répétitives présentes dans le génome.

La tâche d'annonce ne commence qu'après l'obtention de la séquence du génome. La prédiction des gènes est un problème important pour la biologie computationnelle et il existe divers logarithmes qui peuvent être utilisés pour la prédiction de gènes en utilisant des gènes identifiés comme un ensemble de données d'apprentissage.

Le comptage des gènes devient difficile malgré la connaissance de la position d'existence des gènes dans un génome. La présence de gènes qui se chevauchent et de variantes d'épissage rend la tâche plus difficile. Il devient difficile de prédire quelles parties de l'ADN doivent être considérées comme identiques ou comme plusieurs gènes différents.

Fig.6.70. Une carte SNP

De nombreux gènes chez les eucaryotes portent un motif d'exons (régions codantes) suivi d'introns (régions non codantes). Pour cette raison, les gènes ne sont pas organisés en ORF (cadres de lecture ouverts) continus. Un ORF a une série de codons qui spécifient une séquence d'acides aminés.

Les seconds gènes des eucaryotes sont généralement très espacés, ce qui leur donne plus de chances de localiser les faux gènes. Mais les nouvelles techniques du logiciel de balayage ORF pour les gènes eucaryotes rendent le balayage plus efficace. Nous pouvons maintenant compter les gènes d'un organisme (avec une erreur expérimentale).

On dit qu'environ 99, 8% des 3, 2 milliards de paires de bases entre deux humains sont identiques et que 0, 2% sont différents. Pour 500 nucléotides, un seul nucléotide diffère entre deux individus. Cela signifie qu'une variation dans quelques endroits de la séquence d'ADN peut entraîner une maladie grave et des caractères différents chez l'homme.

Similarité génomique, SNPs et génomique comparée:

Comme déjà dit, 99, 8% de chaque génome humain est similaire à tout autre génome humain et 0, 2% différent. Cela signifie que deux personnes ne diffèrent que par 6 millions d'emplacements sur 3, 2 milliards.

Si ces emplacements ont peu d'effet, deux êtres humains seront identiques. Les humains ressemblent à plus de 98% aux chimpanzés. Ainsi, la différence dans quelques emplacements dans l'ADN conduit à rendre chaque individu unique. Pour chaque 500-1 000 nucléotides, un nucléotide diffère entre deux individus.

Les variations importantes dans les génomes individuels sont les polymorphismes mononucléotidiques ou SNP, qui ont été observés dans les régions codantes et non codantes du génome. Les SNP sont essentiellement une altération de base unique, c’est-à-dire A, C, G ou T, ce qui entraîne des variations de l’ADN conduisant à l’existence de lettres différentes à de telles positions. Le type de nucléotide ou de base présent à un emplacement donné sur un chromosome peut varier selon les personnes.

On dit que - 90% de la variation de séquence chez l'homme est due à la présence de SNP. Ainsi, les SNP fournissent un marqueur moléculaire présent en haute densité.

Dans les empreintes digitales d'ADN dans des parties du génome particulièrement non codantes, de telles variations génétiques chez différents êtres humains sont exploitées.

De telles variations génétiques sont également responsables de la sévérité de la maladie et de la réponse de l'organisme au traitement. Une différence d'une seule base du gène Apo E conduit à la maladie d'Alzheimer et une délétion au sein du CCRS (gène du récepteur de la chimiokine) est responsable de la résistance des DD et du SIDA.

Les SNP sont utilisés pour cartographier les gènes impliqués dans les maladies humaines. En utilisant les SNP comme marqueurs, chaque gène du génome humain peut être cartographié. Les SNP sont situés dans le gène ou peuvent montrer une liaison étroite.

Les données de séquence sont stockées dans des bases de données et analysées pour connaître les SNP. Des puces à ADN et des microréseaux ont été mis au point pour l'identification des SNP. Les médecins qui utilisent des échantillons d’ADN de patients peuvent identifier le profil du profil génotypique du SNP. Ainsi, ils sont capables de dire la réponse des patients à un type de médicament spécifique.

La pharmacogénomique est la branche de la médecine qui étudie l’effet de la variation génétique sur la susceptibilité à la maladie et la réponse du médicament.

Étant donné que peu de SNP diffèrent en fréquence dans différentes populations, leur analyse peut être utilisée pour étudier la génétique des populations.

Il est intéressant de noter que les génomes de souris et d’homme se ressemblent beaucoup (environ 97, 5%). Le génome humain et le chimpanzé ne diffèrent que par un ratio de 1 à 3%. On peut donc en conclure que cela est dû au partage d'un ancêtre commun il y a 100 millions d'années et que le génome n'a pas beaucoup changé.

De petites différences génétiques découlent la diversité humaine, telles que la vision, la couleur des cheveux, la taille du pied, etc. Certains de ces SNPs sont liés à des populations humaines spécifiques et fournissent des informations sur les migrations humaines qui ont eu lieu il y a plusieurs années et sur un passé évolutif plus lointain. .