5 méthodes pour décrire la distribution de fréquence

Les méthodes suivantes sont couramment utilisées pour décrire les distributions de fréquence sous forme graphique: 1. Histogramme ou diagramme de colonnes 2. Diagramme à barres ou diagramme à barres 3. Polygone de fréquence 4. Polygone de fréquence lissé 5. Diagramme à secteurs.

Méthode n ° 1. Histogramme ou diagramme en colonnes:

C'est l'un des plus populaires et des plus largement utilisés pour présenter une distribution de fréquence. Un histogramme est un ensemble de rectangles dont les aires sont proportionnelles aux fréquences de classe. C'est un graphique dans lequel les fréquences sont représentées par des barres. L'histogramme se présente sous la forme d'une série de graphiques à barres placées les unes à côté des autres de manière verticale.

Notez les propriétés suivantes de l'histogramme:

(i) Les fréquences sont le long de l’axe vertical et les scores (CI) le long de l’axe horizontal.

(ii) On suppose que les scores sont répartis uniformément dans l'intervalle de classe, nous donnant ainsi des barres rectangulaires.

(iii) Les fréquences dans chaque intervalle d'un histogramme sont représentées par un rectangle, la taille de l'intervalle étant la base et la fréquence de cet intervalle la hauteur.

(iv) La surface de chaque rectangle dans un histogramme correspond à la fréquence dans un intervalle donné, tandis que la surface totale d'un histogramme correspond à la fréquence totale (N) de la distribution.

(v) Il est préférable de construire un histogramme sur un papier quadrillé, régi par des lignes horizontales et verticales équidistantes.

Voyons comment l'histogramme de la distribution de fréquence peut être construit dans deux situations: lorsque les intervalles de classe sont égaux et lorsque les intervalles de classe sont inégaux.

Histogramme (intervalle de classe égal):

Étape 1:

Dans le tableau 2.12, les classes incluses sont indiquées et, dans un premier temps, elles doivent être converties en classes avec des limites de classe réelles ou réelles, comme indiqué dans la deuxième colonne du même tableau.

Étape 2:

En règle générale, une classe vacante est également autorisée à l'une des extrémités de la classe et doit être répercutée à deux extrémités extrêmes de l'échelle horizontale, à savoir 9.5 et 99.5 (voir Fig. 2.1). Cela améliore la lisibilité du graphe et est également utile dans la construction d'un polygone de fréquence.

Étape 3:

Ces vraies limites de classe sont ensuite tracées avec l'axe horizontal (axe des X) à l'aide d'une échelle de mesure appropriée. Afin de donner une symétrie et un équilibre à l'histogramme ou à toute représentation graphique, il faut être prudent dans la sélection des unités de distance afin de représenter la limite de classe sur l'axe X et les fréquences sur l'axe Y.

Pour représenter ces distances, les échelles de mesure sur deux axes sont sélectionnées de manière à ce que la hauteur de l'histogramme ou de toute autre représentation graphique soit d'environ 75% de sa largeur.

Étape 4:

Lorsque la limite inférieure se trouve être un score éloigné de l'origine, indiquez une pause dans l'axe des X () pour indiquer que l'axe vertical a été déplacé pour plus de commodité. Ensuite, démarrez l’axe X avec la limite inférieure de l’intervalle de classe le plus bas.

Un histogramme représentant la distribution de fréquence des scores dans le tableau 2.12 est présenté à la Fig. 2.1. Sur cette figure, le rectangle formé sur la classe 19, 5 - 29, 5 a une hauteur de 4 unités le long de l'échelle verticale et, en tant que tel, sa surface devient 4 x 1 = 4 unités carrées, ce qui correspond à la fréquence de la classe. De même, les hauteurs des autres rectangles formés sur des classes consécutives sont respectivement 6, 8, 12, 9, 7 et 4.

Histogramme (intervalle de classe inégal):

Pour prendre un exemple, regroupons arbitrairement les classes 150 - 154 et 155-159 en une classe égale à 150 - 159 *, et 185 - 189 et 190 - 194 en une classe égale à 185 - 194 ** dans le tableau 2.13.

L'intervalle de classe des quatrième et dixième classes est le double de celui du reste des classes. Ainsi, les fréquences dans ces deux classes ne sont pas comparables aux autres classes. Pour établir cette comparabilité, les fréquences des grandes classes doivent être divisées par deux ou par deux.

Ainsi, avant de former un histogramme pour la distribution de fréquence avec des intervalles de classe inégaux, toutes les classes les plus grandes doivent être exprimées sous forme de multiples de classes plus petites; puis divisé les fréquences de classe correspondantes par ces multiples.

Cette division donne donc la hauteur des rectangles, comme indiqué dans le tableau 2.14. Cependant, les hauteurs des autres rectangles formés sur des classes de longueurs unitaires resteront égales aux fréquences de classe correspondantes. La distribution de fréquence des scores dans le tableau 2.14 est reflétée dans la Fig. 2.3.

Avantages:

1. C'est simple et facile à faire.

2. Tous les avantages de la représentation graphique ci-dessus sont applicables ici.

Limites:

1. Il est difficile de superposer plus d'un histogramme sur le même graphique.

2. Les histogrammes ne permettent pas de comparer facilement plusieurs distributions de fréquence. Les polygones de fréquence conviennent beaucoup mieux à cette fin.

3. L'hypothèse selon laquelle les scores sont répartis de manière égale dans l'IC génère une erreur plus grande lorsque N est petit que lorsque N est grand.

4. Il ne peut pas être lissé.

Méthode n ° 2. Diagramme à barres ou graphique à barres:

Le diagramme à barres est l’un des dispositifs les plus simples et les plus couramment utilisés pour la présentation de données en séries discrètes. Celles-ci sont particulièrement satisfaisantes pour les données catégoriques ou les séries. Ils consistent en un groupe de rectangles équidistants, un pour chaque groupe ou catégorie de données dans lequel les valeurs ou les grandeurs sont représentées par la longueur ou la hauteur des rectangles, la largeur des rectangles étant arbitraire et immatérielle.

Ces diagrammes sont appelés unidimensionnels car, dans ces diagrammes, une seule dimension, à savoir la hauteur (ou la longueur) des rectangles est prise en compte pour présenter les valeurs données.

Les points suivants peuvent être pris en compte pour dessiner des diagrammes à barres:

(i) Toutes les barres dessinées dans une seule étude doivent avoir une largeur uniforme (bien que arbitraire) en fonction du nombre de barres à dessiner et de l'espace disponible.

(ii) Un espacement correct mais uniforme doit être prévu entre les différentes barres pour rendre le diagramme plus attrayant et élégant.

(iii) La hauteur (longueur) des rectangles ou des barres est prise proportionnellement à la magnitude des observations, l’échelle étant choisie tenant compte de la magnitude de la plus grande observation.

(iv) Toutes les barres doivent être construites sur la même ligne de base.

(v) Il est souhaitable d'écrire les valeurs (magnitudes) représentées par les barres en haut des barres pour permettre au lecteur d'avoir une idée précise de la valeur sans regarder l'échelle.

(vi) Les barres peuvent être dessinées verticalement ou horizontalement. Cependant, dans la pratique, les barres verticales sont généralement utilisées car elles donnent un lever attrayant et attrayant.

(vii) Dans la mesure du possible, les barres doivent être disposées de gauche à droite (de haut en bas dans le cas de barres horizontales) par ordre de grandeur pour donner un effet agréable.

Dans une ville donnée, le nombre total d'écoles est de 24 et la répartition des écoles sur le plan de la gestion, comme indiqué dans le tableau 2.15.

Pour une variable discrète, l'unité de mesure sur l'axe horizontal n'a pas d'importance. Les classes ne sont pas non plus liées les unes aux autres. Les barres sont donc équidistantes et de largeur égale sur l’axe horizontal.

Cependant, la hauteur des barres est proportionnelle aux fréquences respectives. Les graphiques à barres sont fréquemment utilisés pour la présentation imagée de données discrètes. Si deux variables sont utilisées simultanément, même alors, les graphiques à barres peuvent être très efficaces.

Par exemple, si, parallèlement au nombre total d'écoles (en termes de gestion), le nombre d'écoles de garçons, d'écoles de filles et d'écoles mixtes doit également être indiqué, vous pouvez le faire sur le même papier quadrillé en utilisant des couleurs différentes., chacun indiquant la catégorie par sexe. Pour chaque gestion, il y aura 4 barres ayant différentes couleurs indiquant différentes catégories.

Méthode n ° 3. Polygone de fréquence:

Un polygone est une figure proche à plusieurs angles. Le polygone de fréquence est une représentation graphique de la distribution de fréquence dans laquelle les points médians du CI sont tracés en fonction des fréquences.

Laissez-nous discuter de la façon de dessiner un polygone de fréquence:

Étape 1:

Tracez deux lignes droites perpendiculaires l’une à l’autre, la ligne verticale près du côté gauche du papier et la ligne horizontale près du bas. Étiquetez la ligne verticale (axe des Y) OY et la ligne horizontale (axe des X) OX. Mettez le O où les deux lignes se croisent. Ce point est l'origine.

Afin de donner une symétrie et un équilibre au polygone, il faut être prudent dans la sélection des distances unitaires sur les deux axes. Une bonne règle générale consiste à sélectionner les unités X et Y qui donneront une hauteur approximative à 75% de la largeur de la figure.

Étape 2:

Ensuite, vous devez indiquer les points médians du CI sur l'axe horizontal, au lieu d'indiquer les limites de l'intégrale. Ici, le point médian des intervalles juste avant l'intervalle le plus bas et juste après l'intervalle le plus haut doit également être indiqué (les points médians 137 et 202 respectivement dans le tableau 2.16). Le long de la ligne verticale, marquez les unités pour représenter les fréquences des intervalles de classe.

Étape 3:

Au milieu de chaque intervalle sur l’axe des X, montez dans le sens Y sur une distance égale au nombre de points de cet intervalle. Placez des points à ces endroits.

Étape 4:

Après avoir tracé tous les points du graphique, reliez ces points par une série de lignes droites courtes pour former le polygone de fréquence.

Méthode n ° 4. Polygone de fréquence lissée:

Un polygone de fréquence doit être lissé:

je. Éliminer les irrégularités fortuites;

ii. Pour avoir une meilleure idée de ce à quoi le chiffre pourrait ressembler si les données étaient plus nombreuses;

iii. Pour savoir à quoi ressemblerait un polygone si les erreurs de regroupement et les erreurs d’échantillonnage en sont supprimées;

iv. Déterminer la forme qu’elle prendrait si elle représentait des conditions libérées de fluctuations accidentelles mineures.

Lors du lissage d'un polygone de fréquence, une série de moyennes mobiles ou continues sont prises, à partir desquelles des fréquences nouvelles ou ajustées sont déterminées. Pour trouver un ' f ajusté ou lissé, ajoutez le f sur l'intervalle donné et le fs sur les deux intervalles adjacents (l'intervalle juste en dessous et l'intervalle juste au-dessus) et divisez-les par 3.

Par exemple, la valeur l lissée pour l'intervalle 170-174 dans le tableau 2.17 est (8 + 10 + 6) / 3 ou 8, 00. Pour trouver les valeurs lissées pour les deux intervalles aux extrêmes de la distribution, à savoir 140-144 et 195-199, une procédure légèrement différente est nécessaire. Premièrement, nous ajoutons 0, le f sur l’intervalle de pas en dessous ou au-dessus, au f sur l’intervalle donné et au f sur l’intervalle adjacent, et divisons par 3. Le f lissé pour 140-144 est (0 + 1 + 3) / 3 est ou 1, 33; et la valeur l lissée pour 195-199 est (2 + 1 + 0) / 3 ou 1, 00.

Nous devons prendre deux autres CI sur 135-139 et les 200-204 autres, pour lesquels le f est pris égal à 0. Leur f lissé dans chaque cas est égal à (0 + 0 + 1) / 3 ou .33 et (0). + 0 + 1) / 3 ou 0, 33. L'inclusion de ces deux derniers intervalles fait N = 50, 00 pour la distribution lissée.

Si N est grand, le lissage ne modifiera peut-être pas beaucoup la forme d'un graphique et est donc souvent inutile.

Avantages:

(i) C'est simple et facile à faire.

(ii) Il est possible de superposer plusieurs polygones de fréquence sur le même graphique en utilisant des lignes colorées, des lignes brisées, des lignes en pointillés, etc.

(iii) Des comparaisons de plusieurs distributions de fréquence peuvent facilement être effectuées via des polygones de fréquence.

(iv) Tous les avantages de la représentation graphique décrits précédemment sont applicables ici.

(v) Il peut être lissé. Limites.

Limitation:

(ii) La partie de la zone située au-dessus d'un intervalle donné ne peut pas être considérée comme proportionnelle à la fréquence de cet IC en raison d'irrégularités dans la surface de fréquence.

(ii) L'hypothèse selon laquelle tous les scores d'un IC se situe au milieu de cet intervalle produit une erreur plus grande lorsque N est plus grand que lorsque N est petit.

(iii) Il est moins précis que l'histogramme dans la mesure où il ne représente pas précisément, c'est-à-dire en termes de surface, la fréquence à chaque intervalle.

Le graphique de fréquence cumulative:

Le graphique de fréquence cumulée est un autre moyen de représenter une distribution de fréquence à l'aide d'un diagramme. Avant de pouvoir tracer un graphique de fréquence cumulée, les scores de la distribution doivent être ajoutés en série ou cumulés, comme indiqué dans le tableau 2.18.

Pour déterminer le Cum.f pour chaque ligne, nous devons ajouter les f progressivement, à partir du bas. Par exemple, dans la distribution des scores, la première fréquence cumulée est 1; 1 + 3, à partir du bas de la distribution, donne 4 comme entrée suivante; 4 + 2 = 6; 6 + 4 = 10, etc. Le dernier cumulatif / est égal, bien sûr, à 50 ou à N, la fréquence totale.

En traçant le polygone de fréquence, la fréquence de chaque intervalle est prise au milieu de l'intervalle de classe. Mais en construisant une courbe de fréquence cumulative, chaque fréquence cumulative est tracée à la limite supérieure exacte de l'intervalle sur lequel elle tombe.

En effet, en ajoutant progressivement de bas en haut chaque porteuse de fréquence cumulée jusqu'à la limite supérieure exacte de l'intervalle de classe. Avec une échelle choisie, si nous prenons les limites supérieures des ci le long de l'axe des abscisses et que nous prenons les valeurs cumulées le long de l'axe des ordonnées, nous pouvons tracer un graphique pour la distribution de fréquence cumulative.

Dans une courbe de fréquence cumulée, chaque fréquence cumulée est tracée à la limite supérieure de l'intervalle. Pour que la courbe commence sur l’axe des X, elle commence à 139, 5 (limite supérieure exacte de 134, 5 à 139, 5), dont la fréquence cumulative est 0.

La courbe de pourcentage cumulatif ou Ogive:

En tirant un «Ogive», nous devons calculer les pourcentages cumulés à la limite supérieure de chaque ci. «Fréquence des pourcentages cumulés» signifie quel pourcentage de N est le Cum- f . La courbe de pourcentage cumulé ou ogive diffère du graphique de fréquence cumulée en ce que les fréquences sont exprimées en tant que pourcentage cumulé de N sur l'axe des Y au lieu de fréquences cumulées. Le tableau 2.19 montre comment les fréquences cumulées peuvent être converties en pourcentage de N.

Dans les colonnes (1), (2) et (3), les intervalles de classe, les limites supérieures de ci et les fréquences sont indiqués; et dans la colonne (4), les f s ont été cumulés à partir du bas de la distribution vers le haut. Ces cumuls sont exprimés en pourcentages de N dans la colonne (5). La conversion des cumuls en pourcentages cumulatifs peut être réalisée en divisant chaque cumulatif / par N; par exemple, 2 + 40 = 0, 05, 6 + 40 = 0, 15, etc.

Une meilleure méthode, en particulier lorsqu'une machine à calculer est disponible, consiste à déterminer d'abord l'inverse. 1 / N, appelé le taux, et multipliez chaque somme f dans l'ordre par cette fraction. Comme le montre le tableau 2.19, le taux est 1/40 ou 0, 025. Par conséquent, en multipliant 2 par 0, 025, nous obtenons 0, 05 ou 5%; 6 X. 025 =. 15 ou 15%, etc.

La courbe de la figure 2.8 représente une ogive tracée à partir des données de la colonne (5), tableau 2.19. Les limites de l'intervalle exact ont été définies sur l'axe des X et une échelle composée de 10 distances égales, représentant chacune 10% de la distribution, a été marquée sur l'axe des Y. Le premier point de l'ogive est placé à 5 unités Y juste au-dessus de 35, 5. Le dernier point est 100 unités Y au-dessus de 56, 5 limite supérieure exacte de l'intervalle de classe le plus élevé.

De l'ogive on peut lire PR. de différents scores et aussi les percentiles:

(a) Lecture des centiles de l'ogive:

Supposons que nous voulions savoir P 2 5- Comme nous le savons, P 25 est un point en dessous duquel se trouvent 25% des cas. Posons 25 sur l’axe des Y et dessinons une ligne horizontale à partir de ce point. Il rencontrera l'ogive à un moment donné.

À partir de ce point, tracez une perpendiculaire sur l’axe des X. À partir de l'axe X, nous pouvons lire le score. De l'ogive on peut lire que P 2 5 = 41, 5. De même, nous pouvons lire que P 50 = 46, 7 et P 75 = 49. Nous pouvons lire les autres centiles de la même manière à partir de l'ogive.

(b) percentile de lecture Classement des scores:

Supposons que nous voulions savoir que PR d'un score de 53, 5. Nous devons localiser ce score sur l'axe des X et tracer une ligne verticale à partir de ce point. La ligne rencontrera l'ogive en un point à partir duquel nous pourrons tracer une ligne horizontale à gauche et cette ligne rejoindrait l'axe des Y en un point. Nous pouvons lire le cum% f à ce stade. Ce cum% / valeur est le PR. de la partition.

Ainsi, nous pouvons lire que:

PR d'un score, 40 = 20

PR d'un score, 53 = 90.

Nous pouvons lire les PR de n'importe quelle autre partition de l'ogive de la même manière.

Méthode n ° 5. Diagramme à secteurs:

Les diagrammes à secteurs sont très couramment utilisés pour désigner la répartition en pourcentage. Il s'appelle ainsi parce que tout le graphique ressemble à un camembert et que les composants du camembert ressemblent à des tranches coupées dans le camembert. Il présente les pourcentages et non les chiffres absolus.

Les diagrammes à secteurs sont très utiles pour montrer les dépenses d’un gouvernement, d’une entreprise, etc. réparties sur différentes têtes. Il est également utilisé dans l'enseignement de la géographie, des sciences, etc.

Les étapes suivantes peuvent être suivies lors de la construction d'un diagramme à secteurs:

1. Tracez un cercle de taille appropriée avec une boussole. La taille du rayon dépend de l'espace disponible et d'autres facteurs.

2. Préparez les données sous forme de% sous différentes têtes. Ces pourcentages pour différents secteurs doivent être transposés en degrés correspondants sur le cercle.

Pour cela, il faut connaître la valeur de l'angle de chaque sous-partie. Nous savons que la valeur de tous les angles d’un point est égale à 360 °, c’est-à-dire que le cercle entier est à 360 °, ce qui représente 100%. Ainsi, 1% signifie 360 ​​° / 100 = 3, 6 °.

La formule suivante s'appliquera donc pour trouver la valeur de l'angle de chaque sous-groupe:

3. Supposons qu'il y ait 3 composants avec la valeur 60% comme performants, 25% comme performants moyens et 15% comme performants faibles. Par conséquent, ils doivent représenter respectivement 216 ° (60 x 3, 6 °), 90 ° (25 x 3, 6 °) et 54 ° (15 x 3, 6 °).

4. Lorsque les valeurs de tous les angles ont été déterminées, leur total peut ne pas correspondre exactement à 360 ° en raison d'une approximation. Si tel est le cas, il peut être nécessaire d'ajuster légèrement certaines valeurs d'angle pour obtenir un total égal à 360 °.

5. Mesurez les points sur le cercle pour représenter la taille de chaque secteur à l'aide d'un rapporteur. Il est courant d’organiser les secteurs en fonction de leur taille, en plaçant le plus grand secteur au sommet et d’autres en

séquence en sens horaire. Les secteurs peuvent être étiquetés. Les étiquettes peuvent être placées à l'intérieur du secteur ou à l'extérieur du cercle.