Une approche de la théorie de la décision sur le prédicteur et le critère des industries

Le problème de la sélection peut être envisagé sous un angle quelque peu différent de celui utilisé. Cette deuxième approche s'avère intéressante en ce sens que nous constaterons que la validité des prédicteurs n'est peut-être pas une variable de sélection aussi importante que le montre le point de vue traditionnel. Notre nouvelle perspective est basée sur un modèle de théorie de la décision. Nous devrions commencer par réaffirmer l'objectif dans une situation de sélection typique. Dans de nombreuses situations de sélection, nous souhaitons établir un score de coupe sur notre prédicteur, ce qui réduira au minimum les erreurs de décision.

Dans ce type de situation, il est implicite de supposer que le rapport de sélection peut être manipulé à volonté. c'est-à-dire qu'il n'est pas «fixé» à une certaine valeur. La notion selon laquelle notre variable de critère peut être divisée de manière significative en deux ou plusieurs groupes distincts, tels que «réussi» et «non réussi» est également implicite. Notre objectif est de manipuler le score de coupe (ce qui revient à manipuler le rapport de sélection) afin minimiser le nombre d'erreurs commises dans notre processus de décision concernant le recrutement ou le rejet d'une personne.

Nous avons indiqué précédemment qu'il existait deux types d'erreur de décision dans le paradigme de sélection, les faux positifs et les faux négatifs, comme indiqué ci-dessous:

Notre objectif est alors de trouver le point de coupure qui donnera le moins d'erreurs totales. Par souci de commodité, nous commencerons par supposer que les deux types d’erreur sont considérés comme tout aussi coûteux. Autrement dit, nous n’avons aucune raison de préférer commettre une erreur fausse positive sur une fausse erreur négative, ou inversement. En faisant cette hypothèse, il est possible de formuler le problème directement en termes de minimisation du nombre total d'erreurs des deux types, plutôt que de devoir pondérer les deux types d'erreurs par leur «coût» respectif.

Emplacement du point de coupure:

Pour illustrer la manière dont le problème consistant à trouver un emplacement optimal pour notre score de découpage peut être abordé, considérons le cas où nous avons une validité spécifiée (par exemple environ 0, 70) et un pourcentage spécifié d’employés actuels considérés comme ayant réussi (souvent appelé dans ce contexte le «taux de base»).

Ceci peut être schématisé comme suit:

L'étape suivante consiste à présenter les mêmes données sous une forme légèrement différente. Premièrement, nous savons que notre groupe total d’employés est supposé avoir une distribution normale en termes de scores de prédicteur. Deuxièmement, et tout aussi important, les deux sous-groupes (succès et échec) sont supposés avoir des distributions normales. En regardant l'exemple ci-dessus, il est facile de déduire que le score prédictif moyen du groupe ayant réussi va être supérieur à celui du groupe ayant échoué.

Nous pourrions schématiser ceci comme suit:

Les deux distributions auront la même taille car elles sont basées sur le même nombre de personnes (c.-à-d. 50% dans chaque groupe). Il existe une relation algébrique entre la différence entre les moyennes des deux sous-groupes vus de cette manière et la taille du coefficient de corrélation. Si les moyennes de groupe sont significativement différentes les unes des autres (disons à un niveau de signification de 0, 05), alors le coefficient de corrélation sera également significatif au même niveau.

En poussant notre diagramme un peu plus loin, nous pouvons placer les deux distributions de fréquence des sous-groupes côte à côte sur la même ligne de base, comme indiqué ci-dessous.

Cela fait, nous pouvons maintenant revenir à notre question initiale: où devons-nous situer une limite sur le prédicteur afin de minimiser le nombre total d’erreurs? Il s'avère que la solution mathématique à ce problème donne une réponse très simple: le point de coupure qui minimise l'erreur totale est le point où les deux distributions se coupent.

Cela peut être facilement démontré au niveau conceptuel en regardant les trois cas illustrés ci-dessous. La même différence entre les moyennes (c'est-à-dire la même corrélation) est utilisée dans tous les cas - tout ce qui a été modifié est l'emplacement du point de coupure sur le prédicteur.

Dans l’illustration (a), le nombre de faux positifs (échecs supérieurs au seuil) est donné par la zone B. Le nombre de faux négatifs (succès inférieurs au seuil) est donné par la zone A. Ainsi:,

Erreur totale = A + B

Pour l'illustration (b), le nombre de faux positifs est donné par B et le nombre de faux négatifs est donné par A + C. Ainsi,

Erreur totale = A + B + C

Pour l’illustration (c), le nombre de faux positifs est donné par B + C et le nombre de faux négatifs est donné par A. Ainsi,

Erreur totale = A + B + C

Puisque l'inspection des trois illustrations confirme rapidement que les zones A + B sont identiques dans les trois cas, il est évident que l'erreur est augmentée d'un certain degré C chaque fois que la coupure est éloignée (dans un sens ou dans l'autre) du point où les deux distributions se croisent.

Quelques ramifications inhabituelles:

Nous avons maintenant un principe général pour localiser une note de coupe qui minimisera le nombre total d'erreurs dans une situation de prise de décision de sélection, à savoir au point d'intersection.

Il s'avère que, tant que les deux types d'erreurs sont considérés comme étant également coûteux, il s'agit d'une règle très générale qui n'est pas affectée par:

(1) La taille relative des deux groupes (c’est-à-dire le pourcentage de succès), ou

(2) Les variances ou dispersions respectives des deux distributions.

Cela conduit à des aspects intéressants et très importants du problème général de prédiction concernant la relation entre la validité du test et son utilité. Rorer, Hoffman, LA Forge et Hsieh (1966) ont signalé trois cas intéressants.

Cas 1:

Les moyennes et les variances des deux groupes diffèrent l'une de l'autre. Supposons que notre groupe de succès soit de taille égale à celui de groupe infructueux et présente une moyenne significativement plus élevée sur le prédicteur, mais que sa variance est beaucoup plus petite.

Un diagramme d'une telle situation est comme suit:

Notre principe d’établissement de seuils indique que nous devrions les placer à l’intersection des deux distributions. Notez que cela se produit deux fois dans ce cas particulier. Ainsi, nous avons une coupure supérieure et une coupure inférieure. Nous devrions sélectionner uniquement les personnes qui se situent dans l'intervalle entre les seuils en termes de score au test. Tout autre point de coupure entraînera une erreur totale plus grande que celle qui serait obtenue avec ceux situés aux points d'intersection.

Cas 2:

Les groupes ont des moyennes égales mais des variances différentes. Dans ce cas très intéressant, les deux groupes ne diffèrent pas par leur score prédicteur moyen, c'est-à-dire que les employés non réussis font aussi bien le test que les employés qui réussissent au test. Cela implique que le coefficient de corrélation est nul entre le prédicteur et le critère. Cependant, nous avons également indiqué que les deux groupes différaient par leur variabilité.

Si nous supposons que le groupe ayant réussi est le groupe présentant la variabilité la plus faible aux fins d'exposition, nous pouvons l'exprimer de manière schématique comme suit:

Même si les deux groupes ont le même score de critère moyen, il est possible de définir des seuils qui amélioreront la prédiction par rapport aux méthodes actuelles, étant donné que les deux distributions se croisent en deux points en raison de leur variabilité inégale. Ainsi, nous sommes dans la situation unique où il n’y aurait aucune validité apparente (mesurée par un coefficient de corrélation) mais où la prévision peut être grandement améliorée par l’utilisation de seuils appropriés.

Cas 3:

Les moyennes de groupe sont très différentes mais la taille du groupe est également très différente. Supposons qu'il s'agisse d'une situation dans laquelle le taux de base des employés non retenus est très faible, c'est-à-dire qu'environ 90 pour cent de nos employés actuels sont considérés comme ayant réussi. Une telle situation est illustrée dans le diagramme suivant.

Nous avons ici une autre situation unique. Même si les moyennes de groupe peuvent être substantiellement différentes, donnant ainsi une corrélation substantielle entre critère et prédicteur, il ne sera pas possible d'établir de seuil permettant de réduire les erreurs par rapport à ce qui est actuellement obtenu avec les méthodes actuelles. En raison de la différence marquée de taille entre les deux groupes, nous voyons que les deux distributions ne se croisent en aucun point.

Dans notre système de sélection actuel, nous ne commettons des erreurs que 10% du temps. Si nous déplaçons notre seuil de gauche à droite dans le cas 3 (il est situé dans l'extrême gauche pour commencer, puisque nous sélectionnons actuellement toutes ces personnes), nous commencerons bien sûr à éliminer certaines des personnes non réussies actuellement en poste. employés dans le système actuel.

En même temps, cependant, nous allons commencer à rejeter les employés qui se révéleront être un succès. En regardant rapidement le diagramme, on s'aperçoit que cette augmentation du nombre de faux négatifs serait supérieure à la diminution correspondante du nombre de faux positifs, peu importe où nous mettons notre seuil. Ainsi, toute coupure basée sur un test entraînera plus d'erreurs que nous n'en avons sans le test, même si le test est hautement valide.