Motifs et méthodologies du séquençage du génome

Le séquençage des génomes est sophistiqué, complexe et nécessite une technologie spécialisée. Un segment de 500 à 800 pb peut être séquencé. Cependant, les génomes sont très volumineux, par exemple E. coli avec 4, 2 x 10 6 pb et 3, 2 x 10 9 pb pour l'homme.

Ainsi, pour le séquençage, de petits segments sont nécessaires. Ces segments sont produits en divisant de manière aléatoire l'ADN génomique en petits fragments. De tels fragments chevauchent généralement d'autres fragments à leurs extrémités. Les fragments sont clonés dans un vecteur pour générer une bibliothèque génomique d'organisme.

Raisons pour le séquençage complet d'un génome:

(i) Il fournit des informations de base pour la découverte de gènes et fournit un inventaire des gènes.

(ii) Il représente les relations possibles entre les gènes.

(iii) Le séquençage des génomes fournit un ensemble d'outils pour des expériences ultérieures.

(iv) Les informations génétiques d'un organisme sont disponibles à partir de la séquence du gène.

(v) Le séquençage génétique complet d'un organisme fournit toutes les informations génétiques nécessaires à la formation d'un organisme.

Méthodologies utilisées pour le séquençage du génome:

(i) Séquençage dirigé des contigs du chromosome artificiel bactérien (BAC):

Les chromosomes artificiels bactériens sont simplement des plasmides conçus pour le clonage de très longs segments (c.-à-d. De 100 000 à 300 000 pb) d’ADN. Ces vecteurs sont utilisés pour créer des banques génomiques dans lesquelles la taille de l’insert est comprise entre 80 et 100 kb. Des fragments d'ADN de milliers de paires de bases sont clonés dans le vecteur BAC.

La bibliothèque génomique est criblée en localisant des clones de restriction communs appelés contigs. Les membres de contig contiennent des régions qui se chevauchent pour permettre la détermination précise de leur emplacement dans contig.

Le but ultime des méthodes de cartographie physique est de recevoir un contig complet pour chaque chromosome du génome. Les contigs cartographiés sont séquencés en brisant de grands fragments d’ADN en petits segments. Chaque clone du contig est séquencé. La séquence nucléotidique est identifiée seule par clone jusqu'à la séquence complète du génome.

(ii) Séquençage aléatoire ou approche ascendante:

Il est possible de cloner dans un organisme n'importe quel gène désiré d'un autre organisme par coup de canon. Pour tout ce génome, le premier organisme est digéré avec une endonucléase de restriction pour produire un mélange aléatoire de fragments.

Des banques aléatoires (shotgim) d'ADN génomique sont construites dans de petits vecteurs plasmidiques à insert de 2, 0 kb et moyen, à savoir de 10 kb, avec une banque de banques de BAC génomiques à grand insert (80-100 kb). Des fragments sont insérés dans un vecteur plasmidique et les plasmides recombinants sont transformés dans la cellule hôte souhaitée.

Dans le séquençage par canon à décharge, les clones sélectionnés au hasard sont séquencés jusqu'à ce que les clones de la bibliothèque génomique soient analysés. En d’autres termes, nous pouvons dire que, dans le tir au hasard, les chromosomes sont divisés en sections, puis la section de l’ADN génomique est divisée en millions de petits segments et tous les segments sont séquencés de manière non biaisée.

Les zones de l'ADN qui se chevauchent sont appariées pour former des segments de plus en plus grands d'ADN génomique. Le séquençage de l'ADN est effectué aux deux extrémités des inserts de clones choisis au hasard dans les banques de plasmides d'insertion petites et moyennes afin de fournir une couverture au moins trois fois supérieure du génome.

De petits fragments d'ADN sont insérés au hasard dans différentes molécules de plasmide. En cas de chevauchement d'inserts, ils proviennent tous du même emplacement génomique mais de régions différentes décalées à gauche ou à droite l'une par rapport à l'autre.

Les fragments qui se chevauchent sont alignés dans une séquence ou dans une séquence pour la région concernée (méthode du tir à la mitraillette). Les génomes procaryotes ont peu d'ADN respectif et le séquençage des armes à feu donne de bons résultats. Les eucaryotes portent de nombreuses séquences répétées.

Tout cela mène à la confusion. Toutefois, le chevauchement des fragments est exploité dans la phase d’assemblage par un exercice de calcul. Le programme informatique identifie les séquences qui se chevauchent et les relie en un seul tronçon continu. Ce processus a été appliqué avec succès pour le séquençage de toutes les séquences du génome microbien publiées par Celera Genomics.