Problèmes et procédures impliqués dans la sélection des postes

Avant de procéder à l'examen des modèles de sélection de base disponibles pour le psychologue, il est nécessaire de se pencher sur un bref aperçu du modèle général de prédiction multiple. Ce modèle est généralement appelé modèle de régression multiple. Dans le paradigme de prévision général, nous développons une droite de régression pour ajuster l'ensemble des points de données définis par les scores des personnes sur un prédicteur (axe des abscisses) et sur le critère (les axe des ordonnées ou ordonnée).

La figure 3.1 illustre une telle situation. La ligne de régression de la figure 3.1 est une ligne droite et est située de sorte que la somme des distances quadratiques de chaque point à la ligne (parallèles à l’axe des y) soit aussi petite que possible. Nous utilisons une droite parfaitement ajustée puisque nous avons supposé une relation linéaire entre x et y.

La formule de base pour une ligne droite est

y = a + bx

Où y = score prédit sur critère

a = une constante indiquant le point où la droite de régression croise l'axe des y

b = pente de la ligne, représentée par y / ∆x, ou changement de y observé pour un changement correspondant de x

x = score observé sur le prédicteur

Ainsi, le modèle de ligne de régression de base apparaît comme illustré à la figure 3.2.

Notez que sur la figure 3.2, la droite de régression croise l'axe des y à une valeur de 2. Ainsi a = 2. Notez également que pour chaque augmentation de 2 unités de x, il existe une augmentation correspondante de 1 unité de y. Donc ∆y / x = 1/2 = 0, 5 = b. L'équation de régression devient alors

y = 2 + 0, 5x

Quelle que soit la valeur de x, nous avons une droite de régression qui nous permet de prédire un score y correspondant. Par exemple, si x était 8, alors

y = 2 + 0, 5 (8)

= 2 + 4

= 6

Pour résumer: Dans le cas d'un prédicteur unique, on calcule une droite droite qui convient le mieux aux points observés, où le terme «meilleur ajustement» signifie que la somme des écarts carrés des valeurs observées autour de la ligne sera minimale.

Les formules nécessaires pour calculer les constantes a et b qui définissent cette droite sont appelées «formules des moindres carrés» et sont les suivantes:

La formule pour b est un rapport de la covariance entre le prédicteur et le critère et la variation totale dans le prédicteur. Lorsque la variance du critère et la variance du prédicteur sont égales, b = r ou la pente de la droite de régression est égale au coefficient de corrélation.

Deux prédicteurs:

Il est logique de supposer que si le prédicteur X 1 peut contribuer à la bonne prédiction des scores des critères, et si le prédicteur X 2 peut également contribuer à la bonne prédiction des scores des critères, l’utilisation conjointe des deux prédicteurs devrait permettre une meilleure prédiction globale que l’un ou l’autre prédicteur individuellement. Cependant, la mesure dans laquelle les deux prédicteurs (lorsqu'ils sont combinés) améliorera la prévisibilité dépend de plusieurs facteurs, dont le plus important est la corrélation entre les deux prédicteurs eux-mêmes.

Considérons, par exemple, la situation où deux prédicteurs sont chacun corrélés de manière substantielle avec un critère mais ne sont pas corrélés l'un avec l'autre, comme suit:

Il est clair que beaucoup de variance de critère supplémentaire peut être expliquée à l'aide du prédicteur 2 avec le prédicteur 1. La relation combinée entre deux prédicteurs ou plus et un critère s'appelle une corrélation multiple et porte le symbole R. Comme ce fut le cas avec r 2, la valeur de R ”représente la quantité totale de variance de critère qui peut être expliquée en utilisant plusieurs prédicteurs. Lorsque les prédicteurs 1 et 2 ne sont pas corrélés, le coefficient de corrélation multiple au carré peut être une fonction additive des coefficients de corrélation au carré individuels, ou

R 2 c . 12 = r 2 1c + r 2 2c (3.1)

Ainsi, lorsque (l'inter-corrélation des prédicteurs) est égale à zéro, la validité multiple au carré est la somme des validités individuelles au carré.

Lorsque deux prédicteurs sont corrélés, les choses deviennent un peu plus complexes. Prenons une situation (comme dans le diagramme ci-dessous) où chaque prédicteur a une validité individuelle substantielle mais où r 12 est également assez grand.

En raison de l'inter-corrélation entre ces prédicteurs, le diagramme montre que l'ampleur du chevauchement entre le prédicteur 2 et le critère peut être divisée en deux parties: la zone unique du prédicteur 2 et la zone partagée avec le prédicteur 1. Ainsi, l'utilisation de un second prédicteur dans cette situation nous permet de prendre en compte une variance de critère supérieure à celle qui pourrait être obtenue avec le prédicteur 1 seul, mais toute la variance de critère prédite par 2 n'est pas une variance nouvelle. On peut donc énoncer une règle générale concernant plusieurs prédicteurs.

Toutes choses étant égales par ailleurs, plus la corrélation entre les prédicteurs est élevée, moins la prédiction globale sera améliorée en combinant les deux prédicteurs. Bien entendu, le cas extrême serait la situation dans laquelle les prédicteurs étaient parfaitement corrélés et que nous n'aurions aucune variance de critère supplémentaire expliquée par l'ajout du prédicteur 2 à notre batterie de sélection.

Dans le cas de deux prédicteurs corrélés l'un à l'autre, nous pouvons exprimer R2 en fonction des validités séparées et de la taille de l'inter-corrélation entre les prédicteurs de formule 2

R 2 c . 12 = r 2 1c + r 2 2c - 2r 12 r 1c r 2c / 1 - r 2 12 (3.2)

notez que si r 12 = 0, alors la formule 3.2 se réduit à

R 2 c . 12 = r 2 1c + r 2 2c

qui est la formule 3.1.

Une illustration plus explicite de l’influence de l’intercorrélation des prédicteurs sur la taille des coefficients de corrélation multiples peut être obtenue à partir du tableau 3.1, où des exemples de valeurs R et R 2 sont donnés pour des paires de prédicteurs ayant des validités de 0, 30, 0, 50 et 0, 70. dans des conditions hypothétiques d'inter-corrélation de 0, 00, 0, 30 et 0. 60. La figure 3.3 montre la tendance générale en utilisant les données du tableau 3.1. La morale du psychologue est évidente: évitez d’utiliser des prédicteurs susceptibles d’être très liés les uns aux autres.

Équations de prédiction:

L'équation de prédiction dans une situation à deux prédicteurs est une extension du modèle à un prédicteur. La forme générale de l'équation est

y = a + b 1 x 1 + b 2 x 2 (3.3)

C'est l'équation pour un avion au lieu d'une ligne droite. Pour le lecteur familiarisé avec la géométrie, la figure 3.4 présente un dessin en trois dimensions des relations entre les variables x 1, x 2 et y correspondant à l'équation 3.3. Il existe des formules permettant de calculer les constantes a, b et permettant d'obtenir le meilleur plan de régression. Une fois que ces constantes ont été déterminées, l'équation résultante peut ensuite être utilisée pour établir des prédictions de performance de critère pour les nouveaux candidats à un emploi, en fonction de leurs scores sur les prédicteurs distincts.

À titre d'illustration, supposons que des données soient disponibles sur 100 hommes embauchés pour le travail X au cours d'un mois donné, ce qui inclut les scores à deux tests ainsi que les données de critère après une période de six mois. Ces données peuvent être analysées pour déterminer les valeurs de a, b 1 et bi qui décrivent le mieux les relations entre les variables.

Supposons que l'équation suivante soit le résultat final:

y = 2 + 0, 5x 1 + 0, 9x 2 (3.4)

Cette équation indique que le score de critère le plus probable pour un nouvel employé sera égal à la moitié de son score au test 1 plus neuf dixièmes de son score au test 2 plus deux. Ainsi, si un nouveau candidat obtient 20 points à l’épreuve 1 et 30 à l’épreuve 2, les performances attendues de son critère au bout de six mois à compter de la date d’embauche seront les suivantes:

= 2 + 0, 5 (20) + 0, 9 (30)

= 2-t-10 + 27

= 39

L'extension du modèle à deux prédicteurs à un modèle à k-prédicteurs, où k représente un grand nombre de prédictions potentielles de la réussite au travail, n'est pas trop difficile sur le plan conceptuel. Notre modèle se développe à la forme

y = a + b 1 x 1 + b 2 x 2 + b 3 x 3 +… + b k x k (3.5)

Cependant, les procédures de calcul permettant de résoudre les valeurs des moindres carrés de toutes les constantes d'une telle équation deviennent assez complexes, à moins que des ressources informatiques ne soient disponibles. Le lecteur est également prié de se rappeler que, dans toute la discussion précédente, il y a eu l'hypothèse implicite d'un monde linéaire, c'est-à-dire que toutes les relations entre les paires de variables sont linéaires. Il est possible de modifier le modèle de régression multiple pour éviter cette hypothèse, mais cela sort du cadre de ce livre.

Modérateurs:

L'un des concepts les plus importants de la théorie de la sélection et du placement est le concept de variable modérateur. Parfois appelée variable de contrôle de la population, une variable modératrice peut être considérée comme toute variable qui, lorsqu'elle est variée systématiquement, a un effet sur l'ampleur de la relation entre deux ou plusieurs autres variables.

Peut-être qu'un exemple hypothétique (Figure 3.15) du fonctionnement d'un modérateur servira à illustrer son influence sur le processus de sélection. Le diagramme de dispersion supérieur illustre une validité générale de 0, 50 entre le prédicteur et un critère. Cependant, la «population» représentée dans le diagramme de dispersion est celle qui comprend les deux sexes, à savoir. Les hommes et les femmes sont regroupés pour déterminer la validité. Même une inspection occasionnelle du diagramme de dispersion en haut indique (si les hommes et les femmes sont codés différemment comme cela a été fait ici) que la tendance des scores observés pour les hommes diffère de celle observée pour les femmes.

Pour avoir une idée plus précise de leurs différences, les deux diagrammes de dispersion inférieurs de la figure 3.15 montrent les relations prédicteur-critère séparément pour les hommes et pour les femmes. Maintenant, la différence est frappante. Pour les hommes, nous observons une relation hautement positive, qui produit une validité de 0, 80. Pour les femmes, en revanche, on constate qu’il n’ya pratiquement pas de relation entre le prédicteur et le critère. La validité pour les femmes est de 0, 05.

La variable modérateur dans l'exemple ci-dessus est, bien sûr, la variable de sexe. La relation entre le prédicteur et le critère est considérablement affectée par la variation du modérateur. La question «quelle est la validité de mon prédicteur» devient clairement plus complexe. Ce qui semblait initialement une validité modérément respectable s'est maintenant transformé en deux validités bien distinctes et distinctes: une très élevée et une très faible.

Un nom pour ces dernières validités pourrait être des validités conditionnelles, c'est-à-dire la validité du prédicteur étant donné que la population est composée de femmes ou que la population est composée d'hommes. Une caractéristique intéressante des variables de modérateur est qu'un modérateur n'a pas besoin d'avoir de relation directe avec le prédicteur ni avec la variable de critère (c'est-à-dire, r ym et r im = 0).

Exemples de modérateurs:

Des exemples réels de modérateurs ont été trouvés dans un certain nombre d'enquêtes de recherche. Vroom (1960), par exemple, a trouvé des effets de modérateur assez marqués utilisant le degré de motivation des gestionnaires et des superviseurs de première ligne comme variable modératrice. Tous les hommes étudiés étaient employés dans l’usine de Chicago ou de New York d’une société de distribution nationale spécialisée dans la livraison de petits colis et colis de grands magasins et d’autres magasins de détail à des résidences privées. Les données de l'étude qui illustrent le mieux le concept de modérateur sont présentées dans le tableau 3.4.

Tous les superviseurs ont été divisés en trois groupes en fonction de leur degré de motivation évalué en utilisant un composite de plusieurs indices de motivation obtenus dans la recherche. Des validations pour un test de capacité de raisonnement non verbal ont ensuite été obtenues pour chacun des quatre types différents d’évaluations de supervision de ces hommes.

Cela a été fait séparément à chaque niveau de motivation. Comme le montre le tableau 3.4, le test était apparemment un prédicteur tout à fait valable du niveau de notation d'un homme par son superviseur si seuls les hommes très motivés étaient pris en compte. Si nous varions systématiquement la motivation en descendant vers les groupes n'ayant que des niveaux de motivation modérés ou faibles, nous constatons un changement systématique correspondant dans la relation entre le test et le critère. Plus la motivation de l'employé est faible, moins la validité du prédicteur est bonne, en fait, les validités deviennent même négatives pour les groupes à faible motivation.

On peut trouver d’autres exemples de modérateurs dans les études de Dunnette et Kirchner (1960) et de Ghiselli et ses collaborateurs (1956, 1960). Les travaux de Dunnette et Kirchner ont principalement consisté à identifier des modérateurs liés à l’emploi qui regroupent des personnes dans des emplois similaires en termes de responsabilités pour obtenir une prédiction maximale dans chaque groupe d’emplois.

La méthode de Ghiselli pourrait être qualifiée de système de modérateur «sans variable». Les personnes sont regroupées simplement en fonction de la qualité avec laquelle leur succès peut être prédit sans référence directe à une variable externe. Fredericksen et Gilbert (I960) ont également effectué des recherches sur les modérateurs afin de déterminer le degré de cohérence de l'effet d'un modérateur au fil du temps. Ils ont découvert qu'un modérateur identifié dans une étude de 1954 (Fredericksen et Melville, 1954) fonctionnait toujours dans le cadre du suivi de I960.

Théorie de la sélection moderne versus traditionnelle:

Le concept de variable de modérateur illustre peut-être le mieux la tendance actuelle en matière de sélection et de placement. Traditionnellement, la sélection et la validation étaient des problèmes qui semblaient être mieux résolus en établissant simplement un critère qui semblait fiable et un prédicteur permettant de prédire au mieux ce critère.

L’accent a été presque entièrement mis sur l’établissement d’une validité élevée, sans que l’on s’intéresse de manière approfondie à l’exploration des nombreuses variables supplémentaires qui, si elles sont variées, peuvent s’ajouter à la corrélation obtenue ou s’en soustraire. La devise générale qui semblait trop souvent caractériser la méthodologie de sélection était le slogan "Si cela fonctionne, utilisez-le!"

Sans aucun doute, cette politique a été à l'origine de développements très différents en psychologie industrielle. Premièrement, cela a probablement contribué au degré d'acceptation des psychologues dans l'industrie. La direction est généralement orientée vers des résultats positifs, tels que représentés par une sélection améliorée, et ne se préoccupe pas excessivement de la manière dont elle est réalisée.

Malheureusement, cependant, cette orientation est probablement également responsable du fait que les validités en matière de prédiction n’ont pas sensiblement augmenté (voire pas du tout) au cours des 50 dernières années - un commentaire assez troublant sur les efforts des psychologues engagés dans ce type de travail.

Ghiselli (1955) a examiné dans un grand nombre d'études de validité, en 1955, qu'il était effectivement inhabituel d'obtenir un coefficient de validité de 0, 50 ou plus. La figure 3.16 présente les distributions de fréquence présentées par Ghiselli de coefficients de validité d'amplitudes variables pour différents types d'emplois. Notez que seul un grand nombre de validations supérieures à 0, 50 est utilisé dans la distribution des validités pour les employés de bureau utilisant des tests d’intelligence comme prédicteurs et les mesures de compétence comme critères.

L’intérêt actuel pour les modérateurs est représentatif d’une approche plus large et un peu plus sophistiquée de la sélection. On peut faire remonter cela au moment où Toops (1948) a lancé un appel aux psychologues pour qu’ils envisagent la possibilité qu’en stratifiant les personnes (par exemple, les travailleurs) systématiquement en fonction de variables personnelles, on puisse améliorer les prédictions. Sa méthode de classification, qu'il a appelée procédure addend, est le précurseur des modérateurs.

Le modèle de sélection de Dunnette:

Peut-être que la vision actuelle de la méthodologie de sélection peut être mieux représentée par le modèle de sélection proposé par Dunnette (1963). Ce modèle est présenté dans le diagramme présenté à la figure 3.17 et est conçu pour mettre en évidence le labyrinthe de complexités et d’interrelations existant dans la situation de sélection. Le modèle peut être considéré comme plus qu'une tentative de simplement souligner la nature dynamique de la sélection - il représente également un plaidoyer pour que les psychologues exploitent ces dynamiques et les exploitent au mieux afin d'améliorer la prévisibilité.

On peut probablement comprendre le point de vue représenté par le modèle en termes de description exacte utilisée par Dunnette (1963, p. 318):

Notez que le modèle de prévision modifié tient compte des interactions complexes qui peuvent survenir entre les prédicteurs et diverses combinaisons de prédicteurs, différents groupes (ou types) d'individus, différents comportements au travail et les conséquences de ces comportements par rapport aux objectifs de l'organisation. . Le modèle permet aux prédicteurs d'être utiles de manière différenciée pour prédire les comportements de différents sous-ensembles d'individus.

De plus, il montre que des comportements similaires peuvent être prévisibles en raison de modèles d'interaction très différents entre des groupes de prédicteurs et d'individus, ou même que le même niveau de performance des prédicteurs peut conduire à des modèles de comportement au travail très différents pour des individus différents. Enfin, le modèle reconnaît la fâcheuse réalité selon laquelle des comportements identiques ou similaires au travail peuvent, après être passés par le filtre de la situation, avoir des conséquences organisationnelles très différentes.

La tendance actuelle en matière de sélection représentée par la notoriété des modérateurs et par le modèle de sélection de Dunnette devrait se traduire par une amélioration de l'efficacité de la sélection et du degré de compréhension de la dynamique de la prédiction précise.

Variables de suppression:

Aucune discussion sur la sélection ne serait complète sans une mention des variables de suppression. Dans un sens, une variable de suppression est similaire à une variable de modérateur en ce sens qu'elle est définie comme «une variable qui peut avoir un effet sur l'ampleur d'une relation prédicteur-critère donnée, même si elle n'a que peu ou pas de relation avec la variable de critère elle-même. ”

La dynamique de prédiction d’une variable suppressive peut être mieux comprise en réexaminant le concept de corrélation partielle et sa mesure associée, la corrélation semi-partielle.Si l’un avait deux prédicteurs et un critère qui étaient corrélés entre eux, comme le montre corrélation partielle entre le critère et le prédicteur x, qui est r 1c. 2, a été définie comme étant la corrélation entre x 1 et C après que les effets de x 2 ont été partiellement éliminés des deux, de sorte que

Supposons que nous voulions seulement supprimer les effets de X2 du critère avant de calculer la corrélation. Une telle corrélation est appelée corrélation semi-partielle ou partielle. Par exemple, nous pourrions être intéressés par la corrélation entre les résultats des tests d’intelligence (notre facteur prédictif x 1 ) et le niveau de compétence final à la fin d’un programme de formation en dactylographie (le critère) x 2 pourrait représenter le niveau de compétence initial de tous les employés en termes de leur vitesse de frappe avant de suivre le cours de formation. Nous voulons donc supprimer les effets du niveau de compétence initial sur les performances finales avant de calculer la validité de notre test d’intelligence.

Notre corrélation semi-partielle devient maintenant:

Le mécanisme d'une variable de suppression est identique à celui présenté ci-dessus, sauf que (1) en général, la variable x 2 n'a qu'une faible relation (le cas échéant) avec le critère et (2) on cherche à supprimer ses effets du prédicteur x 1 .

La situation générale peut donc être schématisée comme suit:

On ne peut pas prédire avec certitude si les corrélations partielles ou semi-partielles seront plus grandes ou plus petites que la simple corrélation existante entre les variables, car la taille du numérateur et du dénominateur est affectée par le processus de fragmentation. La seule fois où ce n'est pas le cas, c'est lorsque la variable en cours de définition est uniquement liée à l'une des deux autres variables, comme dans le cas du suppresseur. Dans une telle situation, seul le dénominateur est affecté ultérieurement (la variance est supprimée) et la corrélation semi-partielle qui en résulte est plus grande que la simple corrélation non partielle entre variables.

Validation croisée:

Une caractéristique de la plupart des systèmes de sélection à prédiction multiple est que, dans leur développement, on a généralement tendance à capitaliser sur la variation fortuite existant dans l’échantillon d’employés utilisé aux fins de validation. Cela est particulièrement vrai avec le modèle de régression multiple, mais s'applique également à la procédure de coupure multiple. Parce que le modèle de régression multiple a des propriétés de moindres carrés, c'est-à-dire que nous minimisons délibérément les erreurs de prédiction de notre échantillon particulier, il est probable que si nous appliquons maintenant notre équation à un nouvel échantillon (de la même population), nous ne retrouverons pas notre prédiction. aussi efficace qu'avant.

Ainsi, notre R 2 calculé est une surestimation de ce que la future validité de notre système de prédiction est susceptible d’être, car l’utilisation de notre équation à des fins de prédiction implique automatiquement son application à de nouveaux échantillons de travailleurs. Cette baisse attendue de R2 est connue dans les statistiques comme étant le problème du rétrécissement et peut être illustrée au mieux en examinant la figure 3.18.

La figure 3.18 présente deux échantillons d'individus. Chacun représente un échantillon aléatoire tiré de ou appartenant à la même population. Par exemple, l'échantillon A peut représenter tous les candidats à un emploi X pendant les mois impairs, et l'échantillon B peut représenter tous les demandeurs d'emploi au cours des mois pairs d'une année donnée.

Il serait très inhabituel, même avec un très grand nombre de demandeurs dans chaque échantillon, que les deux échantillons soient identiques en termes de diagrammes de dispersion. Comme on peut s'attendre à ce que leurs diagrammes de dispersion varient en raison d'une erreur d'échantillonnage, on peut également s'attendre à ce que la corrélation entre le prédicteur et le critère (validité) varie légèrement, de même que l'équation de régression calculée sur chaque échantillon.

Supposons que nous prenions l'équation de régression calculée sur l'échantillon A et l'utilisions pour prédire les scores de l'échantillon B. Nous ne pouvions évidemment pas faire un aussi bon travail en minimisant l'utilisation de la ligne A avec l'échantillon B comme nous pouvions utiliser la ligne de régression B - après tout, la ligne B par définition minimise Σd 2 pour cet échantillon. Toute autre ligne sera donc associée à une erreur plus importante. Ainsi, R2 doit être réduit en conséquence.

Il existe des formules pour estimer l'ampleur du retrait que l'on peut attendre lorsqu'on utilise cette équation sur un nouvel échantillon. Une telle formule est

R 2 8 = 1 - [(1 - R2) n-1 / n - k - 1]

R 2 = corrélation multiple réduite au carré

R 2 = corrélation multiple au carré obtenue à partir de l'échantillon de validation

n = nombre de personnes dans l'échantillon de validation

k = nombre de prédicteurs dans l'équation de régression

Cependant, il est préférable de valider cette équation par recoupement en obtenant un deuxième échantillon et en l’essayant pour voir dans quelle mesure elle le prédisait. S'il semble y avoir une très grande chute, on peut vouloir réviser l'équation (peut-être en combinant les deux échantillons dans un groupe). Un rétrécissement important se produit le plus souvent lorsque la taille de l'échantillon est petite et / ou que le nombre de prédicteurs est grand par rapport à la taille de l'échantillon.

Mosier (1951) a examiné un certain nombre de types de validation croisée qui peuvent être effectués en fonction de la conception de l’étude et de l’opportunité de généraliser uniquement à un nouvel échantillon ou de rechercher des généralisations plus larges permettant l’équation de prédiction (par exemple)., à différents sexes, critères différents, etc.). Le premier est appelé un cas de généralisation de la validité; ce dernier est un cas d'extension de validité. Bien entendu, une réduction plus importante serait attendue dans ce dernier cas, et la formule 3.9 sur% s'applique aux cas de généralisation de la validité.