Méthodes utilisées pour évaluer le rendement au travail

Le psychologue industriel a le choix des méthodes pour établir une procédure d'évaluation du rendement au travail qui implique des jugements de la part d'individus. Ces méthodes peuvent être regroupées en classes en fonction du type de comparaison requis de la part de la personne effectuant l'évaluation. Les trois systèmes les plus couramment utilisés sont les systèmes de notation, les systèmes de classement et les comparaisons par paires.

1. Systèmes de notation:

La mécanique de tout système d’échelle d’évaluation est assez simple. La tâche du juge est de juger de la mesure dans laquelle l'individu possède ou est décrit par une caractéristique particulière. Bien qu’elle puisse revêtir de nombreuses formes différentes, sa principale caractéristique est que le juge peut attribuer le même résultat à deux personnes, caractéristique que l’on ne retrouve pas dans les deux autres méthodes.

Échelles d'évaluation numérique:

Cette forme est probablement le type d’échelle d’évaluation le plus répandu et le plus répandu. Ces échelles sont souvent appelées «échelles graphiques».

Un exemple est donné ci-dessous:

La tâche du juge est de donner à chaque travailleur un score de 1 à 9 qui décrit le mieux son «degré de fiabilité». Le score critère pour un travailleur est généralement le score moyen de tous les juges. Dans la situation où plusieurs critères différents constituent le critère (par exemple, degré de fiabilité, niveau général de connaissance du travail, relations avec les autres travailleurs, etc.), le problème devient plus complexe. Souvent, le critère total utilisé est simplement le score total de toutes les questions.

Cependant, lorsque plusieurs questions sont utilisées pour évaluer les travailleurs, il faut immédiatement faire face au problème du critère composite par rapport au critère multiple. Une approche de plus en plus populaire dans de telles situations consiste à analyser par facteur les questions afin de déterminer les dimensions de critère indépendantes sous-jacentes, puis d'attribuer des «scores de facteur» à chacune de ces dimensions, qui sont ensuite utilisés comme critères.

Balances standard:

Un autre type d’échelle d’évaluation implique l’utilisation d’un ensemble de normes ou d’exemples à des fins de comparaison. Ceux-ci sont utilisés à la place des points d'ancrage verbaux trouvés avec l'échelle graphique ou avec ceux-ci.

Une échelle standard conçue pour évaluer la fiabilité peut ressembler à ceci:

L'évaluateur peut ensuite comparer l'homme qu'il évalue avec les hommes au travail désignés comme points de référence sur l'échelle. Cette méthode est aussi parfois appelée une échelle de comparaison d'homme à homme. La principale difficulté des balances standard consiste à trouver des normes appropriées. Cela nécessite généralement une mise à l'échelle minutieuse d'un groupe d'employés actuels. Il y a aussi le problème très délicat d'utiliser les noms de ces hommes sans aucune gêne. Il faut donc faire très attention à ce que la balance standard ne soit pas rendue publique. Une autre difficulté tient au fait que les intervalles entre les hommes sur l’échelle n’ont souvent pas la même ampleur.

L'avantage de la méthode est assez clair. Tant qu'un groupe de juges peut s'accorder sur les qualifications d'un petit groupe de travailleurs bien connus de tous les juges, une échelle de comparaison prête à l'emploi est fournie, garantissant que tous les juges auront un référent commun pour évaluer le reste du personnel. les hommes.

Échelle des points cumulés (liste de contrôle):

De nombreuses échelles d'évaluation exigent du juge qu'il vérifie ou indique lesquels des énoncés, des adjectifs ou des attributs décrivent la personne évaluée. Par exemple, le formulaire d'évaluation illustré à la figure 7.3 est représentatif d'une liste de contrôle adjective.

Chaque personne se voit attribuer un score total basé sur les éléments vérifiés. Dans l'exemple présenté, une personne peut recevoir un + 1 pour chaque adjectif favorable et un - 1 pour chaque adjectif défavorable. Dans les listes de contrôle plus élaborées, des poids différentiels peuvent être attribués aux différents éléments. Par exemple, Uhrbrock (1961) a mis à l'échelle 2000 déclarations concernant le comportement des travailleurs.

Chaque déclaration a reçu une valeur moyenne sur l’échelle de sa perception du caractère favorable dans la description d’un travailleur. Les déclarations peuvent ensuite être sélectionnées pour être utilisées dans une liste de contrôle qui est utilisée par les superviseurs pour évaluer leurs employés. La méthode de notation pourrait être basée sur le score total (somme algébrique) des éléments cochés ou éventuellement sur la valeur médiane (moyenne) de tous les éléments cochés. Quelques exemples d'énoncés d'Uhrbrock, ainsi que leurs valeurs d'échelle, sont présentés dans le tableau 7.3.

Liste de vérification des incidents critiques:

La technique de l'incident critique est une procédure développée par Flanagan (1954). En règle générale, cette procédure peut être décrite comme une procédure d’évaluation par liste de contrôle. Cependant, il est également suffisamment différent dans son développement pour mériter une mention séparée.

La méthode comporte trois étapes distinctes:

1. Collecte des incidents critiques

2. Mise à l'échelle des incidents

3. Construire l'échelle de la liste de contrôle

La première étape est ce qui rend cette méthode unique. L'expression «incident critique» désigne tous les comportements sur le lieu de travail que le superviseur considère comme «remarquables». À noter, à son tour, peut faire référence à des exemples de «remarquables» ou de «mauvais» sur le lieu de travail. comportement au travail. En d’autres termes, il est demandé à chaque superviseur de fournir autant de cas de comportement au travail exceptionnel qu’il peut se rappeler. Ces incidents sont ensuite présentés (étape 2) à un groupe d'experts qui attribuent des valeurs d'échelle quant au degré de désirabilité de cet incident.

Dans la troisième étape, une liste de contrôle est construite, qui ne comprend que les déclarations ou les incidents jugés pertinents pour définir les travailleurs «bons» et «pauvres». Ces listes de contrôle peuvent ensuite être utilisées par un superviseur pour évaluer ses travailleurs. Lors de l’évaluation d’un travailleur, il coche simplement à côté de chaque incident qu’il a constaté qu’il «commettait» ou exposait. Le score d'un travailleur est généralement considéré comme la valeur moyenne ou médiane de tous les incidents contrôlés pour lui (le score total peut également être utilisé).

La liste de contrôle des incidents critiques a le grand avantage de se baser sur les comportements ou les incidents sur le lieu de travail. Un superviseur n'est pas obligé de juger des traits de caractère ou de classer ses ouvriers, etc. Il doit seulement indiquer s'il a ou non observé un incident particulier de la part de chaque ouvrier. Kirchner et Dunnette (1957) ont rapporté des résultats favorables dans une étude suivant quelque peu la procédure décrite ci-dessus.

Avant de quitter la méthode de l'incident critique, il convient de souligner qu'elle a plus de généralité et d'application que le simple fait d'être une source d'éléments de la liste de contrôle d'évaluation des performances. Les incidents de comportement liés au travail ont été utilisés avec beaucoup de succès dans la recherche sur les domaines du leadership (Fleishman, 1955), des valeurs organisationnelles (Shartle, Brumback et Rizzo, 1964) et de la créativité (Buel, 1960).

2. Systèmes de classement:

Une caractéristique d'un système d'évaluation est qu'il permet à deux personnes ou plus d'avoir la même évaluation ou la même valeur d'échelle. Un système de classement par sa nature décourage cela. Le classement simple nécessite que le juge ordonne les individus du plus haut au plus bas.

Ainsi, un groupe particulier de superviseurs peut classer dix employés comme indiqué ci-dessous:

Les systèmes de classement ont l’avantage inhérent d’être extrêmement simples à expliquer et d’être facilement acceptés par les personnes désignées comme juges. La procédure leur est «logique». Cela présente également l'avantage de permettre à un évaluateur de classer un nombre assez élevé d'individus sans grande difficulté. Une règle empirique reconnaît que des résultats satisfaisants et fiables avec un système de classement peuvent être obtenus avec des N allant de 50 à 60.

Guilford (1954) a signalé un autre avantage du classement. Comme le juge est obligé de faire des comparaisons entre hommes plutôt que des comparaisons absolues, il doit comparer les individus lorsqu'il décide de placer l'un au-dessus de l'autre.

La méthode oblige le juge à faire la distinction entre les personnes classées, qu’il se sente réellement différent! Supposons que les dix hommes donnés dans notre exemple précédent étaient plutôt égaux en capacités. Les juges auraient alors probablement beaucoup de difficulté à essayer de classer les hommes, et le classement d’un juge serait extrêmement trompeur quant au mérite relatif des dix hommes en question.

Une façon de vérifier cette possibilité consiste bien entendu à faire appel à plusieurs juges. Si les juges sont d’accord sur les classements, il est possible d’écarter la possibilité qu’il n’y ait aucune différence «réelle» ou réelle entre les hommes. Dans l'exemple précédent, les juges semblent raisonnablement cohérents pour déterminer qui est un travailleur bon et un travailleur pauvre. Ainsi, leurs choix doivent être fondés sur des raisons réelles plutôt que aléatoires pour ordonner les hommes en question. C'est une excellente raison d'utiliser plusieurs juges chaque fois que possible et de calculer l'accord entre les juges avec un indice tel qu'un coefficient de corrélation.

3. Comparaisons appariées:

Bien que les systèmes d’ordre de classement exigent implicitement qu’un homme soit comparé aux autres de la liste au cours du processus de classement, cela n’est pas systématiquement intégré à la méthode. Une procédure qui oblige systématiquement l'évaluateur à comparer chaque homme avec un autre est connue sous le nom de méthode de comparaison par paires. Par exemple, considérons la situation où quatre employés sont évalués par un superviseur. Si nous formons toutes les paires d'hommes possibles, nous aurons N (N-l) / 2 paires formées; dans notre cas, 4 (3/2) = 6 paires.

La procédure habituelle consiste donc à présenter chacune des paires (une à la fois) au superviseur. Le superviseur indique (généralement avec une coche) lequel des deux hommes il estime être le meilleur. Une matrice de comparaison appariée peut ensuite être construite comme celle illustrée ci-dessous, dans laquelle la règle suivante est utilisée: Chaque fois qu'un superviseur préfère une colonne à une ligne, placez une marque dans cette cellule.

Supposons que le superviseur X porte les jugements suivants sur les six paires de travailleurs:

Si nous plaçons des marques de pointage dans notre matrice en utilisant la règle ci-dessus, nous avons les éléments suivants:

Ainsi, ce superviseur classe B comme le meilleur travailleur, suivi dans l’ordre par C, A et D. Dans la pratique, les jugements de plusieurs juges sont inclus dans la matrice afin de fournir une estimation plus stable de l’ordre de mérite des juges. les hommes en cours d'évaluation. En outre, il est courant de convertir les proportions de chaque cellule en scores standard (scores Z), puis de rechercher un score Z moyen pour chaque colonne.

Ce score Z moyen est alors la valeur d'échelle pour la personne représentée par cette colonne dans la matrice. L’avantage de cette dernière procédure est que ces valeurs d’échelle peuvent être considérées comme représentant non seulement l’ordre de classement des capacités du travailleur, mais également une indication du degré de différenciation des capacités de deux travailleurs.

Une simple illustration basée sur les réponses de dix superviseurs hypothétiques aux quatre hommes susmentionnés peut être utile. Considérons d’abord la matrice de décompte suivante

Convertissons maintenant la matrice de comptage en une matrice de proportions, où nous définissons une proportion comme ⁿ / _N, où n est égal au nombre de marques de pointage dans une cellule et N est égal au nombre de juges ou au nombre de marques de pointage possibles. Il est de coutume de saisir des proportions de 0, 50 dans toutes les cellules de la diagonale, même si nous ne présentons jamais réellement une personne jumelée avec elle-même aux juges.

La prochaine étape consiste à convertir les proportions en scores Z. (Vous trouverez un tableau à cet effet dans n'importe quel ouvrage élémentaire de statistiques.)

Si nous ajoutons une constante de 0, 78 à toutes les valeurs d'échelle pour éliminer les signes négatifs, les individus peuvent alors être représentés selon un continuum de mérite.

Notez que la distance entre C et A est considérablement plus grande que la distance entre D et A ou B et C. Si les hypothèses de cette méthode sont remplies, ces distances relatives peuvent être considérées comme indiquant les différences de mérite relatives entre les les individus évalués - une caractéristique attrayante de cette méthode d’évaluation des performances. Pour une couverture plus détaillée de la comparaison par paires, voir Edwards (1957) ou Guilford (1954).

Un des inconvénients de la méthode de comparaison par paires est qu’elle n’est pas particulièrement utile lorsque le nombre d’individus à évaluer devient important. Un peu plus tôt, il avait été signalé qu'un superviseur pouvait probablement classer avec succès les 50 ou 60 employés. Si nous essayions d’utiliser la procédure de comparaison par paires, nous aurions

50 (49) 72 = 1225 paires

Même si un superviseur pouvait travailler à raison de six paires par minute, il lui faudrait plus de trois heures pour obtenir la note. Plus le nombre de personnes à évaluer est grand, plus l'exigence de temps est astronomique.