Tests non paramétriques: concepts, précautions et avantages

Après avoir lu cet article, vous apprendrez: - 1. Concepts de tests non paramétriques 2. Hypothèses de tests non paramétriques 3. Précautions 4. Quelques tests non paramétriques 5. Avantages 6. Inconvénients.

Concepts de tests non paramétriques:

Un peu plus récemment, nous avons assisté à la mise au point d'un grand nombre de techniques d'inférence qui ne font pas d'hypothèses nombreuses et rigoureuses sur la population à partir de laquelle nous avons échantillonné les données. Ces techniques de distribution gratuites ou non paramétriques aboutissent à des conclusions nécessitant moins de qualifications.

Après avoir utilisé l’un d’entre eux, nous pourrions peut-être dire que «quelle que soit la forme de la population, nous pouvons en conclure que…».

Les deux noms alternatifs fréquemment donnés à ces tests sont:

Sans distribution:

Les tests non paramétriques sont «sans distribution». Ils ne supposent pas que les scores analysés proviennent d'une population répartie d'une certaine manière, par exemple d'une population normalement répartie.

Lorsque nous testons l’importance de la différence entre deux moyennes (en termes de CR ou de t, par exemple), nous supposons que les scores sur lesquels reposent nos statistiques sont normalement répartis dans la population. En réalité, dans l'hypothèse nulle, nous estimons à partir des statistiques de notre échantillon la probabilité d'une différence réelle entre les deux paramètres.

Lorsque N est assez petit ou que les données sont fortement asymétriques, de sorte que l'hypothèse de normalité est douteuse, les «méthodes paramétriques» ont une valeur douteuse ou ne sont pas du tout applicables. Ce dont nous avons besoin dans de tels cas, ce sont des techniques qui nous permettront de comparer des échantillons et de faire des déductions ou des tests de significativité sans avoir à assumer une normalité dans la population.

De telles méthodes sont appelées non paramétriques ou distribution libre. Le test du chi carré X 2, par exemple, est une technique non paramétrique. La signification de X 2 ne dépend que des degrés de liberté de la table; aucune hypothèse n’est nécessaire quant à la forme de la distribution des variables classées dans les catégories du tableau X 2 .

Le coefficient de corrélation de différence de rang (rho) est également une technique non paramétrique. Lorsque p est calculé à partir de notes classées par ordre de mérite, la distribution à partir de laquelle les notes sont prises est susceptible d'être fortement asymétrique et N est presque toujours petit.

Tests de classement:

Alternativement, beaucoup de ces tests sont identifiés comme des «tests de classement», et ce titre suggère leur autre mérite principal: les techniques non paramétriques peuvent être utilisées avec des scores qui ne sont pas exacts au sens numérique, mais qui ne sont en fait que des classements.

Hypothèses des tests non paramétriques:

Un test statistique non paramétrique est basé sur un modèle qui ne spécifie que des conditions très générales et aucune concernant la forme spécifique de la distribution à partir de laquelle l'échantillon a été tiré.

Certaines hypothèses sont associées à la plupart des tests statistiques non paramétriques, à savoir:

1. que les observations sont indépendantes;

2. La variable à l'étude a une continuité sous-jacente;

3. Procédures non paramétriques Moins d'hypothèses différentes sur la population que les procédures paramétriques.

4. Contrairement aux tests paramétriques, il existe des tests non paramétriques qui peuvent être appliqués de manière appropriée aux données mesurées dans une échelle ordinale et d'autres à des données d'une échelle nominale ou catégorique.

Précautions lors de l'utilisation de tests non paramétriques:

Lors de l'utilisation de tests non paramétriques, l'étudiant est mis en garde contre les défaillances suivantes:

1. Lorsque les mesures sont en termes d'échelles d'intervalle et de rapport, la transformation des mesures en échelles nominales ou ordinales entraînera la perte d'une grande quantité d'informations. Par conséquent, dans la mesure du possible, des tests paramétriques devraient être appliqués dans de telles situations. En utilisant une méthode non paramétrique comme raccourci, nous gaspillons de l'argent pour économiser de l'argent.

2. Lorsque les hypothèses sous-jacentes à un test paramétrique sont satisfaites et que des tests paramétriques et non paramétriques peuvent être appliqués, le choix doit être fait sur le test paramétrique car la plupart des tests paramétriques ont une plus grande puissance dans de telles situations.

3. Les tests non paramétriques fournissent sans aucun doute un moyen d'éviter l'hypothèse d'une normalité de la distribution. Mais ces méthodes ne font rien pour éviter les hypothèses d'indépendance sur l'homoscédasticité, le cas échéant.

4. Le spécialiste du comportement doit spécifier l'hypothèse nulle, l'hypothèse alternative, le test statistique, la distribution d'échantillonnage et le niveau de signification avant la collecte des données. La recherche d’un test statistique après la collecte des données tend à maximiser les effets de toute différence fortuite favorisant un test par rapport à un autre.

En conséquence, la possibilité de rejeter l'hypothèse nulle lorsqu'elle est vraie (erreur de type I) est considérablement accrue. Cependant, cette mise en garde s’applique aussi bien aux tests paramétriques qu’aux tests non paramétriques.

5. Nous n'avons pas le problème de choisir des tests statistiques pour les variables catégorielles. Les tests non paramétriques seuls conviennent aux données énumératives.

6. Les tests F et t sont généralement considérés comme des tests robustes, car la violation des hypothèses sous-jacentes n'invalide pas les inférences.

Il est de coutume de justifier l’utilisation d’un test théorique normal dans une situation où la normalité ne peut être garantie, en affirmant qu’il est robuste en non-normalité.

Quelques tests non paramétriques:

Nous allons discuter de quelques tests non paramétriques courants.

1. Test de signe:

Le test de signe est la plus simple de toutes les statistiques sans distribution et comporte un très haut niveau d'applicabilité générale. Il est applicable dans les situations où le rapport critique t, le test des échantillons corrélés ne peut pas être utilisé car les hypothèses de normalité et d'homoscédasticité ne sont pas remplies.

Les étudiants sont conscients du fait que certaines conditions dans le cadre de l'expérience introduisent l'élément de relation entre les deux ensembles de données.

Ces conditions sont généralement une situation pré-test, post-test; une situation de test et de re-test; test d'un groupe de sujets sur deux tests; formation de «groupes appariés» en appariant certaines variables externes qui ne font pas l'objet d'une enquête, mais qui peuvent affecter les observations.

En test-test, nous testons la signification du signe de différence (en plus ou en moins). Ce test est appliqué lorsque N est inférieur à 25.

L'exemple suivant nous expliquera clairement le test-sign:

Exemple:

Les scores souvent sujets dans deux conditions différentes, A et B sont donnés ci-dessous. Appliquer le test-signe et tester l'hypothèse selon laquelle A est supérieur à B.

En excluant 0 (zéro), nous avons neuf différences, dont sept sont un plus.

Nous devons maintenant développer le binôme, (p + q) 9

(p + q) 9 = p 9 + 9p 8 q + 36p 7 q 2 + 84p 6 q 3 + 126 p 5 q 4 + 126 p 4 q 5 + 84 p 3 q 6 + 36 p 2 q 7 + 9 pq 8 + q 9 .

Le nombre total de combinaisons est 2 9 ou 512. En additionnant les 3 premiers termes (à savoir, p 9 + 9p 8 q + 36 p 7 q 2 ), nous avons un total de 46 combinaisons (soit 1 sur 9, 9 sur 8 et 36 sur 7) qui contiennent 7 ou plus signes plus.

Quelque 46 fois sur 512 essais, 7 signes positifs ou plus sur 9 ou plus surviendront lorsque le nombre moyen de signes + sous l'hypothèse nulle est de 4, 5. La probabilité de 7 ou plus signes + est donc 46/512 ou 0, 09, et est clairement non significative.

C’est un test unilatéral, puisque notre hypothèse est que A est meilleur que B. Si l’hypothèse de départ avait été que A et B diffèrent sans spécifier lequel est supérieur, nous aurions eu un test à 2 queues pour lequel P = .18.

Il existe des tableaux indiquant le nombre de signes nécessaires à la signification à différents niveaux, lorsque la taille de N varie. Lorsque le nombre de paires est aussi élevé que 20, la courbe normale peut être utilisée comme une approximation de l'expansion binomiale ou du test x 2 appliqué.

2. Test médian:

Le test de la médiane est utilisé pour comparer les performances de deux groupes indépendants, comme par exemple un groupe expérimental et un groupe témoin. Premièrement, les deux groupes sont jetés ensemble et une médiane commune est calculée.

Si les deux groupes ont été choisis au hasard dans la même population, la moitié des scores de chaque groupe devrait être au-dessus et la moitié en dessous de la médiane commune. Afin de tester cette hypothèse nulle, il faut dresser un tableau 2 x 2 et calculer x 2 .

La méthode est montrée dans l'exemple suivant:

Exemple:

Un psychologue clinicien veut étudier les effets d’un médicament apaisant sur les tremblements des mains. Le médicament a été administré à 14 patients psychiatriques et à une dose inoffensive à 18 autres patients. Le premier groupe est le groupe expérimental, le second le groupe témoin.

Le médicament augmente-t-il la stabilité, comme le montrent les scores les plus bas dans le groupe expérimental? Comme nous ne sommes concernés que si le médicament réduit les tremblements, il s'agit d'un test unilatéral.

Test médian appliqué aux groupes expérimental et témoin. Les signes plus indiquent des scores supérieurs à la médiane commune, les signes négatifs se situent sous la médiane commune.

N = 14 N = 18

Médiane commune = 49, 5

La médiane commune est 49, 5. Dans le groupe expérimental, 4 scores sont supérieurs et 10 inférieurs à la médiane commune au lieu des 7 ci-dessus et 7 inférieurs par hasard. Dans le groupe témoin, 12 scores sont supérieurs et 6 inférieurs à la médiane commune au lieu des 9 attendus dans chaque catégorie.

Ces fréquences sont entrées dans le tableau suivant et X 2 est calculé à l'aide de la formule (indiquée ci-dessous) avec correction pour continuité:

AX 2 c de 3.17 avec 1 degré de liberté donne un p qui se situe à 0, 08 à peu près à mi-chemin entre 0, 05 et 0, 10. Nous voulions savoir si la médiane du groupe expérimental était significativement inférieure à celle du contrôle (indiquant ainsi plus de stabilité et moins de tremblement).

Pour cette hypothèse, un test unilatéral, p / 2, correspond à environ 0, 04 et X 2 c est significatif au niveau 0, 5. Si notre hypothèse avait été que les deux groupes diffèrent sans préciser la direction, nous aurions eu un test bilatéral et X 2 aurait été marqué comme non significatif.

Notre conclusion, faite à titre provisoire, est que le médicament produit une certaine réduction des tremblements. Mais en raison des petits échantillons et de l'absence d'un résultat très significatif, le psychologue clinicien répéterait presque certainement l'expérience - peut-être plusieurs fois.

X 2 est généralement applicable dans le test médian. Cependant, lorsque N 1 et N 2 sont petits (par exemple, moins de 10 environ) et que le test X 2 n’est pas précis, il convient d’utiliser la méthode exacte de calcul des probabilités.

Avantages des tests non paramétriques:

1. Si la taille de l'échantillon est très petite, il ne peut y avoir aucune alternative à l'utilisation d'un test statistique non paramétrique à moins de connaître exactement la nature de la distribution de la population.

2. Les tests non paramétriques reposent généralement sur moins d'hypothèses sur les données et peuvent être plus pertinents dans une situation donnée. En outre, l'hypothèse testée par le test non paramétrique peut être plus appropriée pour la recherche.

3. Des tests statistiques non paramétriques sont disponibles pour analyser les données qui sont intrinsèquement classées, ainsi que celles dont les scores apparemment numériques ont la force des classements. En d’autres termes, le chercheur ne peut dire que de ses sujets que l’un a plus ou moins le caractère qu’un autre, sans pouvoir dire combien plus ou moins.

Par exemple, en étudiant une variable telle que l’anxiété, nous pourrons peut-être affirmer que le sujet A est plus anxieux que le sujet B sans savoir du tout à quel point il est plus anxieux.

Si les données sont intrinsèquement classées, ou même si elles ne peuvent être classées que dans la catégorie plus ou moins (plus ou moins, meilleure ou pire), elles peuvent être traitées par des méthodes non paramétriques, alors qu'elles ne peuvent pas être traitées par des méthodes paramétriques sauf si elles sont précaires et, peut-être, des hypothèses irréalistes sont faites sur les distributions sous-jacentes.

4. Des méthodes non paramétriques sont disponibles pour traiter des données qui sont simplement classificatoires ou catégoriques, c'est-à-dire mesurées sur une échelle nominale. Aucune technique paramétrique ne s'applique à de telles données.

5. Il existe des tests statistiques non paramétriques appropriés pour traiter les échantillons, constitués d'observations de plusieurs populations différentes. Les tests paramétriques ne peuvent souvent pas traiter de telles données sans nous obliger à formuler des hypothèses apparemment irréalistes ou des calculs fastidieux.

6. Les tests statistiques non paramétriques sont généralement beaucoup plus faciles à apprendre et à appliquer que les tests paramétriques. De plus, leur interprétation est souvent plus directe que celle des tests paramétriques.

Inconvénients des tests non paramétriques:

1. Si toutes les hypothèses d'une méthode statistique paramétrique sont effectivement réunies dans les données et si l'hypothèse de recherche peut être testée à l'aide d'un test paramétrique, les tests statistiques non paramétriques sont une perte de temps.

2. Le degré de gaspillage est exprimé par le rendement énergétique du test non paramétrique.

3. Une autre objection aux tests statistiques non paramétriques est qu’ils ne sont pas systématiques, alors que les tests statistiques paramétriques ont été systématisés et que différents tests ne sont que des variantes d’un thème central.

4. Une autre objection aux tests statistiques non paramétriques a trait à la commodité. Les tableaux nécessaires à la mise en œuvre des tests non paramétriques sont très dispersés et se présentent sous différents formats.