3 principales formes de données

Pour comprendre la nature des données, il devient nécessaire d’étudier les différentes formes de données, comme indiqué ci-dessous:

1. Qualitatif et quantitatif.

2. Données continues et discrètes.

3. Données primaires et secondaires.

Formulaire 1. Données qualitatives et quantitatives:

Considérons un ensemble de données figurant dans le tableau 2.1:

Dans le tableau 2.1, le nombre d'écoles a été présenté en fonction de la gestion des écoles. Les écoles ont donc été classées en 4 catégories, à savoir les écoles publiques, les écoles locales du corps, les écoles privées subventionnées et les écoles privées non subventionnées. Une école donnée appartient à l'une des quatre catégories. Ces données sont présentées en tant que données qualitatives ou qualitatives.

Ici, la catégorie ou la qualité à laquelle on se réfère est la gestion. Ainsi, les données qualitatives ou qualitatives résultent d'informations classées en catégories. Ces catégories sont énumérées par ordre alphabétique ou par ordre de fréquence décroissante ou par un autre moyen conventionnel. Chaque donnée appartient clairement à une classification ou une catégorie.

Nous rencontrons fréquemment des données catégoriques ou qualitatives qui sont incommensurables avec une échelle et, en tant que telles, d'une ampleur non exprimable. Le sexe, la nationalité, la profession, la religion, le type de crime, l'état matrimonial, l'alphabétisation, etc. sont des exemples de données qualitatives. Les personnes varient selon le sexe en tant qu '«homme» et «femme», en fonction de la nationalité «américaine», «française», italienne »ou« indienne ».

Les étudiants d'un collège peuvent être classés dans la faculté des sciences, des arts ou du commerce. Dans ce système de classification, il n'y a pas d'ordre naturel dans les classes. Il est soit purement arbitraire, soit basé sur la présence ou l’absence d’un attribut particulier dans un individu ou un objet.

Dans le tableau 2.2, le nombre d’élèves a été indiqué en fonction de la hauteur. Les étudiants qui se situent dans une plage de hauteurs spécifiée sont regroupés. Par exemple, 15 élèves se situent dans une plage de hauteurs comprise entre 4, 5 "et 4, 8". Comme le regroupement est basé sur des nombres, ces données sont appelées données numériques ou quantitatives.

Chaque fois que la mesure d'une variable ou de données est possible sur une échelle dans certaines unités appropriées, on parle de données quantitatives. Sur ces données, les objets varient en magnitude et en degré et les mesures indiquent une telle variation. Des exemples de données quantitatives sont: l'âge, la taille, le revenu et la capacité intellectuelle, etc.

Ici, l'âge est mesurable en années ou en mois, la taille en centimètres, le revenu en roupies et la capacité intellectuelle sous la forme de scores à un test. Avec des données quantitatives, les objets peuvent être placés dans des classes ordonnées, autrement dit, on peut dire qu'une classe est plus élevée que l'autre sur un continuum. Les poids observés des personnes et le revenu qu'elles gagnent par mois, les scores de 50 étudiants à un examen, le nombre de chambres dans des maisons, etc., ne sont que quelques exemples de telles mesures.

Ainsi, des données numériques ou quantitatives résultent du comptage ou de la mesure. Nous rencontrons fréquemment des données numériques dans les journaux, des publicités, etc. concernant la température des villes, les moyennes de cricket, les revenus, les dépenses, etc.

Formulaire n ° 2. Données continues et discrètes:

Les données numériques ou quantitatives peuvent être continues ou discrètes selon la nature des éléments ou des objets observés.

Considérons le tableau 2.3 décrivant les hauteurs d’élèves d’une classe:

Le tableau 2.3 présente les données relatives aux hauteurs d'élèves d'une classe. Ici l'élément observé est la taille des étudiants. La hauteur varie de 4'8 "à 5'10". La taille d'un individu peut être n'importe où de 4'8 "à 5'10". Deux étudiants peuvent varier de presque zéro pouce de hauteur. Même si nous prenons deux points adjacents, par exemple 4'8.00 ″ et 4'8.01 ″, il peut y avoir plusieurs valeurs entre les deux points.

Ces données sont appelées données continues, car la hauteur est continue. Continu Les données proviennent de la mesure d'attributs ou de variables continus, dans lesquels les individus peuvent différer d'un montant à l'autre proche de zéro. Poids et tailles des enfants; température d'un corps; l'intelligence et le niveau de réussite des élèves, etc. sont des exemples de données continues.

La hauteur d'un individu ne peut pas être mesurée avec une précision absolue et, en tant que telle, nous ne pouvons pas compter le nombre de personnes dont la hauteur est exactement de 16 cm. La hauteur réelle peut varier d’un centième de centimètre de cette valeur. Dans de tels cas, les données sont donc données par rapport à certains groupes ou intervalles de classe.

En série continue, l'unité statistique est capable de division et peut être mesurée en fractions de toutes tailles, même les plus petites. En termes simples, les variables continues forment des séries continues. Dans ces séries, les éléments passent de valeur en valeur avec des différences fractionnaires.

Les données discrètes sont caractérisées par des lacunes dans l'échelle, pour lesquelles aucune valeur réelle ne peut jamais être trouvée. Ces données sont généralement exprimées en nombres entiers. La taille de la famille, la scolarisation des enfants, le nombre de livres, etc. sont des exemples de données discrètes. Généralement, les données résultant de la mesure sont continues, tandis que celles issues du comptage ou de la classification arbitraire sont discrètes.

Les données discrètes sont capables d'une mesure exacte et entre les valeurs de deux éléments successifs, des ruptures définies sont visibles. Les unités statistiques, dans le cas de données discrètes, ne peuvent pas être divisées et restent complètes et indivisibles. Ils sont formés par des faits distincts, par exemple, le nombre de travailleurs travaillant dans des établissements industriels ou le nombre de maisons ne peuvent pas être subdivisés. De même, fils, épouse, etc. ne peuvent être divisés en fractions.

Les scores des élèves, bien que présentés sous une forme distincte, peuvent être considérés comme des données continues, puisqu'un score de 24 représente un point quelconque compris entre 23, 5 et 24, 5. En réalité, la réalisation est un attribut continu ou une variable.

Toutes les mesures d'attributs continus ont un caractère approximatif et, en tant que telles, ne permettent pas de distinguer les données continues des données discrètes. La distinction est faite sur la base de la variable mesurée. La «taille» est une variable continue, mais le nombre d'enfants donnerait des données discrètes.

Formulaire n ° 3. Données primaires et secondaires:

Les données collectées par ou au nom de la personne ou des personnes qui vont utiliser ces données font référence à des données primaires. Par exemple, la présence d'enfants, le résultat des examens que vous menez sont des données primaires.

Si vous contactez les parents des enfants et leur demandez quelles sont leurs qualifications scolaires pour les mettre en rapport avec la performance des enfants, vous obtenez également des données primaires. En fait, lorsqu'un individu collecte personnellement des données ou des informations relatives à un événement, à un plan ou à une conception définis, cela fait référence à des données primaires.

Parfois, une enquête peut utiliser les données déjà collectées par une autre personne, telles que la fréquentation scolaire des enfants, les performances des élèves dans diverses matières, etc. Pour son étude, les données sont alors des données secondaires.

Les données utilisées par une personne ou des personnes autres que les personnes par qui ou pour qui les données ont été collectées se réfèrent à des données secondaires. Pour de nombreuses raisons, il se peut que nous devions utiliser des données secondaires, qui devraient être utilisées avec précaution, dans la mesure où les données auraient pu être collectées dans un but différent de celui de l'enquêteur et risquent de perdre certains détails ou de ne pas être totalement pertinentes.

Pour utiliser des données secondaires, il est toujours utile de connaître:

je. Comment les données ont été collectées et traitées.

ii. La précision des données.

iii. Dans quelle mesure les données ont été résumées.

iv. Dans quelle mesure les données sont-elles comparables à d’autres tableaux?

v. Et comment interpréter les données, en particulier lorsque les chiffres collectés dans un but sont utilisés dans un autre but.