Concept de test du chi carré

Dans cet article, nous discuterons du concept de test du Khi-deux.

Le test du chi carré a été utilisé pour vérifier que les allèles se séparent selon les principes mendéliens. Il est nécessaire de comparer les nombres attendus et observés. Il est utilisé dans les statistiques pour juger de l'importance des données d'échantillonnage. Le professeur Fisher a mis au point un test du chi carré. Symboliquement écrit comme X 2 (prononcé comme Ki-carré).

C'est une mesure statistique à l'aide de laquelle il est possible d'évaluer l'importance de la différence entre les nombres génotypiques observés (fréquences) et les nombres attendus (fréquences) obtenus à partir d'un univers hypothétique.

Que le rapport expérimental et prévu concorde ou non. Cela pourrait être testé par le test du chi carré. Ce test détermine qu’au cours de toute procédure expérimentale traitant de données quantitatives, certaines variations, appelées «erreur expérimentale», peuvent être attribuées à la seule erreur du hasard.

Ceci peut être calculé par la formule suivante:

X 2 = ∑ = (valeur observée - valeur attendue) 2 / valeur attendue

Prenons l'exemple du ratio de phénotype et de génotype d'expériences menées par Mendel. En appliquant X 2, les résultats montrent que les fréquences observées sont en accord avec les ratios prédits. Les données des expériences réelles de Mendel sont présentées dans le tableau suivant. Les variations du rapport prévu et prévu sont dues uniquement à l'erreur expérimentale.

Mendel a observé dans son expérience que le rapport était de 9: 3: 3: 1 chez les dihybrides croisés chez la génération F 2, tandis que le rapport chez les croisements monohybrides chez les F 2 était de 1: 2: 1. rondes, graines vertes, 108 rides, graines jaunes et 32 ​​rides, graines vertes.

Les nombres attendus de chaque phénotype sont donc 556 (9/16) = 312, 75 graines rondes et jaunes; 556 (3/16) = 104, 25 round. Graines vertes; 556 (3/16) = 104, 25 rides jaunes et 556 (1/16) = 34, 75 rides vertes. Le khi-deux indiquera si la différence entre le rapport réel et prévu est due à une erreur expérimentale ou non.

La valeur du chi carré calculée est 0, 470, ce qui est obtenu en appliquant la formule suivante:

X 2 = ∑ = (valeur observée - valeur attendue) 2 / valeur attendue

Le degré de liberté est requis pour le calcul de X 2, le nombre de contraintes indépendantes déterminant le nombre de degrés de liberté (ou df). Le degré de liberté est une mesure du nombre de variables indépendantes présentes dans une expérience donnée.

Il est précisé que les risques d'erreur n'affectent qu'une seule variable indépendante. Dans les expériences Mendels indiquées ci-dessus, les variables n'étant que 4, le degré de liberté est de 4 -1 = 3. Le nombre de trois classes phénotypiques quelconques est déterminé, le nombre de la quatrième classe est fixe.

Pour connaître la probabilité, nous devons consulter la table du chi carré.

Le tableau est donné sous:

L'hypothèse n'est jamais d'accord ou en désaccord avec la valeur de P. Les résultats de l'investigateur qui sont acceptables ou inacceptables en ce qui concerne l'hypothèse, évaluent les résultats des observations du Khi-deux. Les 5 points de pourcentage (0-05) sur la table sont généralement choisis comme standard arbitraire pour déterminer la signification ou la qualité de l'ajustement.

La valeur de table de X 2 pour 3 degrés de liberté au niveau de 5% est de 7, 82, la valeur du khi carré de 0, 47 est inférieure à la valeur de la table et est donc correcte. En d'autres termes, on peut dire qu'une probabilité au niveau de signification de 5% est 7, 82, ce qui est plus / plus élevé, donc l'hypothèse est correcte. Si elle est inférieure à 5%, alors rejetée.

Prenons un autre exemple pour comprendre l’application des tests du Khi-deux. La théorie génétique stipule que les enfants ayant l'un des parents de groupe sanguin A et l'autre de groupe sanguin B appartiendront toujours à l'un des trois types A, AB, B et que la proportion des trois types sera en moyenne de 1: 2. :1. Un échantillon de 300 enfants a été recueilli - 30% étaient de type A, 45% de type AB et les autres de type B.

La valeur de la table X 2 pour (3 - 1) 2d.f. à 5% (0, 05) le niveau de signification est 5, 99. La valeur calculée du chi-carré est 4, 5, ce qui est inférieur à la valeur de la table et peut être attribuée au fait que l'erreur a été provoquée par l'expérience. Cela confirme l’hypothèse théorique de la théorie de l’héritage (ségrégation des allèles) selon laquelle A, AB et B se situent dans la proportion 1: 2: 1.

Un autre exemple à cet égard est le suivant:

La proportion de la fève dans quatre groupes, à savoir A, B, C et D, devrait être de 9: 3: 3: 1. Un agriculteur a semé 1600 haricots. Les résultats de son expérience montrent que, dans quatre groupes, les données sont 882 313 287 et 118. Le résultat expérimental confirme-t-il la théorie selon laquelle elles se trouvent dans le rapport 9: 3: 3: 1?

En prenant l'hypothèse nulle que les résultats de l'expérience appuient la théorie, les fréquences attendues sont:

9/10 x 1600, 3/16 x 1600, 3/16 x 1600, 1/16 x 1600 = 900 300 30000 100

Ainsi:

La valeur tabulaire de X 2 pour 3 df à un niveau de signification de 5% = 7, 815.

Puisque la valeur calculée de X 2 est inférieure à la valeur de la table, l'hypothèse peut être acceptée et les résultats sont conformes à la théorie.

Le test du chi carré est également utilisé pour déterminer si la population est en équilibre de Hardy-Weinberg.

Une des utilisations de la méthode de Hardy-Weinberg est de prédire la fréquence des homozygotes individuels pour un allèle récessif délétère. Ces auteurs ont découvert qu’une population d’accouplement aléatoire (panmictique) sans mutations, sans pression de sélection, sans dérive génétique et sans migration, les fréquences relatives de chaque gène (allèle) tendent à rester constantes de génération en génération.

La loi indique les fréquences des génotypes aux fréquences des gènes dans les populations qui s'accouplent de manière aléatoire. Les allèles ségrégeant à un locus donné peuvent facilement calculer les fréquences de génotype attendues dans cette population. Ceci est connu sous le nom de loi de Hardy-Weinberg ou souvent appelé loi d'équilibre de population.

Une fois que nous connaissons les fréquences des allèles dans la population, il est possible de calculer les fréquences avec lesquelles le génotype sera présent dans la progéniture de cette génération. La population d'organismes diploïdes se reproduisant sexuellement dans un locus avec deux allèles aux fréquences p et q, après une génération d'accouplement aléatoire, les fréquences du génotype seraient AA, Aa et aa seront p 2, 2pq, q 2 .

Prenons l'exemple suivant: deux allèles du gène AA sont dominants, alors que les allèles sont des gènes récessifs. Selon les lois de Mendel sur l'héritage, le ratio de génotype serait de 25% AA (homozygote dominant), 50 seraient Aa (hétérozygote) et 25% serait aa (homozygote récessif).

La formule statistique pour cette loi est p 2 + 2pq + q 2 . Selon les lois de Mendel, ce qui suit devrait être une combinaison génétique.

Cela montre que les allèles restent constants de génération en génération.

L'application du test du khi-deux est légèrement différente de celle de la loi de Hardy-Weinberg, car elle traite des fréquences du génotype attendu plutôt que des nombres. Le degré de liberté est pris n-2 au lieu de n-1.