Groupe représentatif. Représentativité de l'échantillon

Échantillon représentatif

Un échantillon représentatif est un échantillon qui présente la même distribution de caractéristiques relatives que la population.

En anglais:Échantillon représentatif

Voir également:Échantillons de population

Dictionnaire financier Finam.

Voyez ce qu'est « échantillonnage représentatif » dans d'autres dictionnaires :

Échantillon représentatif- Un groupe de participants qui représente plus ou moins fidèlement la composition de la population étudiée. L'échantillon peut refléter la répartition par âge et par sexe, ainsi que toute autre caractéristique qui influence le résultat de l'expérience en termes de... ...

échantillon représentatif- - [Glossaire anglais-russe des termes de base sur la vaccinologie et l'immunisation. Organisation mondiale de la santé, 2009] Thèmes vaccinologie, vaccination FR échantillonnage représentatif ... Guide du traducteur technique

ÉCHANTILLON REPRÉSENTATIF- (échantillon représentatif) un échantillon qui est (ou est considéré comme) un véritable reflet de la population parentale, c'est-à-dire qui présente le même profil de caractéristiques, par exemple la structure par âge, structure de classe, le niveau d'éducation. Représentant... ... Grand dictionnaire sociologique explicatif

ÉCHANTILLON REPRÉSENTATIF- Voir échantillon, représentatif... Dictionnaire en psychologie

ÉCHANTILLON REPRÉSENTATIF- un échantillon dans lequel toutes les fonctionnalités principales population, dont il est extrait cet échantillon, sont présentés à peu près dans la même proportion ou avec la même fréquence que ce signe apparaît dans cette population générale... Dictionnaire encyclopédique en psychologie et pédagogie

Échantillon représentatif- il s'agit d'un échantillon dans lequel toutes les caractéristiques principales de la population générale dont cet échantillon est extrait sont présentées approximativement dans la même proportion ou avec la même fréquence avec laquelle cette caractéristique apparaît dans cette population générale... ... Dictionnaire sociologique Socium

Échantillon représentatif- (échantillon représentatif). Un échantillon qui reflète fidèlement la condition et les propriétés de l’ensemble de la population... La psychologie du développement. Dictionnaire par livre

échantillon représentatif- (échantillon représentatif) un échantillon constitué selon les règles, c'est-à-dire de telle manière qu'il reflète les spécificités de la population générale tant dans la composition que dans les caractéristiques individuelles des sujets inclus. Dictionnaire psychologue pratique. M. : AST,... ... Grande encyclopédie psychologique

Anglais échantillonnage, représentatif; Allemand Stichprobe, représentant. Échantillon qui présente essentiellement la même répartition des caractéristiques relatives que la population. Antinazi. Encyclopédie de sociologie, 2009... Encyclopédie de sociologie

Échantillon représentatif Un échantillon qui présente la même distribution de caractéristiques relatives que la population. Dictionnaire des termes commerciaux. Akademik.ru. 2001... Dictionnaire des termes commerciaux

Cela signifie que si vous interviewiez, disons, 400 personnes ville de district, où la population adulte solvable est de 100 000 personnes, a constaté que 33 % des acheteurs interrogés préfèrent les produits d'une usine de transformation de viande locale, alors avec une probabilité de 95 % on peut dire que 33+5 % sont des acheteurs réguliers de ces produits (c'est-à-dire de 28 à 38%) des habitants de cette ville.

Vous pouvez également utiliser les calculs de Gallup pour estimer la relation entre la taille de l'échantillon et l'erreur d'échantillonnage (voir ci-dessus).

Aujourd’hui, de nombreux calculs difficiles sont effectués grâce à la technologie et des programmes statistiques peuvent être obtenus sur Internet. Ainsi, avec le calcul de l'échantillon, le sociologue paresseux a eu cette opportunité.

informations sur le site Web du Centre d'analyse « Affaires et marketing » (http://www.bma.ru/enter.htm), où l'utilisateur n'a qu'à saisir les données nécessaires puis à cliquer sur le bouton « Calculer ».

Inspection et réparation d'échantillons

La qualité de l'information sociologique peut être réduite par de nombreux facteurs : questions de questionnaire mal formulées, méthode de recherche mal choisie, réponses manquantes dans les questionnaires, échantillonnage mal planifié, etc.

La pratique de la recherche empirique - étrangère et nationale, fondamentale et appliquée - montre que des erreurs, y compris dans l'échantillonnage, se produisent dans presque toutes les études. Une autre question est de savoir si ces changements sont significatifs ou insignifiants. Et comme des erreurs, des chevauchements et des déplacements se produisent toujours, il y aura toujours du travail pour les spécialistes impliqués dans le contrôle et la réparation des échantillons. Et cette zone elle-même science méthodologique une vieillesse prématurée n’attend pas. Non seulement en science, mais aussi dans tout autre domaine, le métier d'inspecteurs et de réparateurs a toujours été lucratif et prestigieux.

Contrôle d'échantillonnage nous appellerons le processus de comparaison scientifique des populations générales et des échantillons, identifiant le degré de leur divergence, identifiant les causes de l'écart et développant moyens possibleséliminer les erreurs. DANS au sens étroit- Ce égalisation de l'échantillon et distributions générales caractéristiques sociodémographiques des répondants.

Sous exemples de réparations vous devez comprendre le processus d'élimination des erreurs lui-même, c'est-à-dire écarts entre deux ensembles, en utilisant les méthodes, méthodes et outils qu'offre la science méthodologique.

Ainsi, la deuxième technique est la mise en œuvre pratique de la première, analytique, et toutes deux constituent deux étapes obligatoires dans la conduite d'une recherche sociologique.

Le contrôle de l'échantillonnage est souvent utilisé dans un sens élargi, y compris la réparation de l'échantillonnage. Dans ce cas, nous parlons de largement compris réparation d'échantillons en tant que traitement primaire des données statistiques, y compris la correction : a) échantillon de population; b) répartitions des caractéristiques sociodémographiques des répondants ; c) les valeurs aberrantes et les réponses manquantes, ainsi que la pondération des données initiales. Espèces spécifiées Les corrections visent à réparer l'élément le plus important, à savoir l'échantillon de recherche, et à accroître son degré de représentativité. Pourquoi est-ce important? Le questionnaire peut être extrêmement intéressant, profond

L'objectif principal de la réparation des échantillons est d'améliorer la qualité des échantillons déjà informations collectées. L'exemple de procédure de réparation comprend plusieurs opérations 40 .

Correction de la population échantillon. Les répondants sélectionnés ne sont pas toujours capables ou désireux, pour diverses raisons, de répondre aux questions. Quelqu'un est tombé malade ou est parti en voyage d'affaires urgent, un autre refuse pour des raisons idéologiques ou est incapable de répondre en raison d'une insuffisance mentale. Il est difficile de trouver quelqu'un à la maison, même si le géomètre est venu le voir plus d'une fois.

Se pose le problème du remplacement des répondants, qui peut être résolu selon plusieurs méthodes : sélectionner le répondant suivant sur la liste (par exemple, le numéro suivant dans annuaire téléphonique), en utilisant l'échantillon initial grandes tailles et former un échantillon répété. Dans ce dernier cas, si le taux de réponse est beaucoup plus faible que prévu, la base de sondage est élargie pour inclure des noms supplémentaires trouvés, par exemple, au hasard. Le plus façon efficace la recherche d'un remplaçant équivalent est envisagée. Si par exemple votre échantillon comprend un retraité actif de telle ou telle nationalité et un veuf, alors il convient de lui trouver en remplacement un autre retraité d'âge, de nationalité similaire, veuf et actif. Souvent, cette méthode se transforme en une entreprise qui demande beaucoup de travail et de temps. Si la liste de population est petite et qu’un remplaçant ne peut être trouvé, vous devez abandonner la méthode équivalente et passer à une autre.

Correction des distributions des caractéristiques démographiques des répondants. Si à la fin de l'étude, il s'avère dans votre passeport recherche que vous avez par exemple trop de femmes, de personnes avec l'enseignement supérieur ou des personnes âgées par rapport à celles parts en pourcentage qu'ils ont dans la population générale, alors trois méthodes peuvent être appliquées : 1) supprimer les groupes de répondants qui étaient surreprésentés ; 2) interroger les groupes qui se sont révélés représentatifs

en quantités insuffisantes ; 3) augmenter mathématiquement la valeur des réponses insuffisamment représentées, ou réduire celles qui sont surreprésentées. Mais il convient d’abord de déterminer si les deux influencent le contenu des réponses. Peut-être que tout peut rester tel quel.

Pondération des données d'entrée- méthode mathématique augmenter ou diminuer la valeur des réponses groupe spécifique répondants (par exemple, des femmes rurales célibataires âgées de 30 à 45 ans). La pondération consiste à attribuer un certain poids à chaque répondant (un coefficient par lequel toutes les opinions et réponses d'un ou d'un groupe de répondants doivent être multipliées afin de rétablir la représentativité). Selon A. Balabanov 41, la pesée est Le seul moyen restaurer la représentativité des études par panel sans perte de précision. Comme il existe de nombreuses méthodes de pondération, le sociologue est confronté à des difficultés considérables. problèmes méthodologiques problèmes qui ne peuvent être résolus sans une formation et des connaissances appropriées. Les coefficients de pondération peuvent être déterminés de différentes manières, et le processus d’attribution des coefficients est presque impossible à contrôler de l’extérieur, par d’autres chercheurs. Le moyen le plus simple est le numéro d'un groupe sociodémographique spécifique, par exemple les adolescents de 13 à 17 ans, de la population générale. (N) divisé par le nombre de répondants représentant un groupe donné tranche d'âge (P), estimant qu'un répondant représente l'opinion des personnes jV de la population générale.

Employés de l'Institut de sociologie de l'Académie des sciences de l'URSS A.A. Davydov et A. O. Kryshtanovsky ont établi à un moment donné des faits intéressants 42. Il s'avère que les caractéristiques démographiques des personnes interrogées n'ont pratiquement aucun lien avec les réponses sur la satisfaction au travail et dans la vie, l'évaluation du rythme de la perestroïka, l'approbation des activités des dirigeants politiques, l'évaluation événements de politique étrangère etc. En d’autres termes, les hommes et les femmes répondent de la même manière aux questions sur la satisfaction de vivre ou sur les événements politiques. Pour ces indicateurs, une repondération n’est pas nécessaire. Si une caractéristique, par exemple le sexe, est étroitement liée à toutes les questions de fond ou diverses questions connecté avec différentes caractéristiques, alors la correction devra être effectuée selon le schéma décrit dans le manuel.

Les spécialistes du VTsIOM assurent une réparation minutieuse de l'échantillon lors de l'analyse des données afin de minimiser les écarts survenus pendant la phase de travail sur le terrain. Des biais particulièrement forts sont observés en termes de sexe et d’âge.

Correctionréponses nettement différenciées des répondants. Au cours d'une enquête, vous tombez parfois sur des réponses de répondants qui se démarquent nettement du contexte général. Les raisons peuvent être très différentes : le répondant a mal compris la question de l'enquête, il a une vision originale du monde ou il a simplement décidé de se moquer des scientifiques. Il peut y avoir d'autres raisons. Mais vous ne pouvez pas revenir vers lui et lui demander à nouveau. Dans ce cas, surtout s'il y a beaucoup de questionnaires, il vaut mieux supprimer la copie défectueuse du tableau général.

Correction des réponses manquantes. Les lacunes surviennent le plus souvent dans les questions ouvertes et tabulaires. Le moyen le plus simple de corriger cela est de les exclure, ou l’ensemble du questionnaire, de l’analyse scientifique. Quand on manque non pas la question du contenu, mais celle du quoi. est dans le passeport, faites ceci. Si les caractéristiques sociodémographiques ne sont pas associées à des réponses significatives, alors le questionnaire avec des valeurs manquantes doit se voir attribuer les caractéristiques sociodémographiques les plus fréquentes dans l'échantillon ou être déterminées de manière aléatoire ou proportionnelle (s'il existe de nombreux questionnaires de ce type). S'il existe un lien, vous devez alors déterminer quel groupe (par exemple, hommes ou femmes) est le plus proche des réponses du questionnaire, où la colonne « sexe » n'est pas indiquée, et ajouter cet attribut 44.

Si beaucoup de données sont reçues, l'échantillon peut être réparé par réduction de la population échantillonnée. Ceci, selon A.A. Davydov et A.O. Kryshtanovsky, l'approche la plus rationnelle de la réparation des échantillons, puisque cette stratégie ne repose sur aucune hypothèse supplémentaire. Si la taille de l'échantillon est petite, pour le réparer, il est nécessaire de faire un certain nombre d'hypothèses supplémentaires qui ne découlent pas du matériel collecté et dont la véracité est difficile à vérifier.

Un rééchantillonnage est effectué lorsque la vérification a montré que l'échantillon ne représente pas la population dans son ensemble. Dans ce cas, de nouveaux répondants sont sélectionnés et ajoutés à l'échantillon précédemment utilisé jusqu'à ce qu'un niveau de représentativité satisfaisant soit atteint.

Tous les sociologues organisant des recherches empiriques n’incluent pas dans leur « passeport » des données sur le contrôle et la réparation des échantillons. Ainsi, parmi les 300 études contenues dans la banque de données de l'Académie des sciences de l'IS URSS pour 1988, l'échantillon seulement de dix avait été réparé 45 . A titre de comparaison, notons : à l'étranger, la réparation d'échantillons est depuis longtemps une méthode courante pour améliorer la qualité de l'information sociologique.

Raisons antérieures les lacunes étaient masquées par le manque de matériel informatique, de logiciels spécialisés, manuels méthodologiques, qualification insuffisante des chercheurs. Aujourd'hui, il existe à la fois la technologie et programmes nécessaires, mais le problème n'est pas résolu. Apparemment, cela ne peut pas être réduit aux seuls aspects techniques.

En pratique, l’erreur d’échantillonnage est déterminée en comparant les caractéristiques connues de la population avec les moyennes de l’échantillon. En sociologie, lors des enquêtes auprès de la population adulte, les données des recensements de population, les registres statistiques actuels et les enquêtes antérieures sur le même site sont le plus souvent utilisées. Caractéristiques sociodémographiques (sexe, âge, nationalité, Situation familiale). Puisqu’une comparaison de ses propres données avec celles d’autres personnes peut être effectuée après avoir terminé l’étude, cette méthode de contrôle est appelée a postériori, ceux. réalisé après l'expérience.

Par exemple, l'Institut J. Gallup, à partir d'échantillons de 1 500 personnes, contrôle la représentativité à l'aide des données disponibles dans les recensements nationaux sur la répartition de la population par sexe, âge, éducation, revenu, profession, race (blanche - couleur), lieu de résidence. , taille du règlement 46. Dans les études menées par VTsIOM, la fiabilité des données d'échantillonnage est déterminée par la méthode de contrôle a posteriori. Le questionnaire de suivi doit comprendre plusieurs questions sur lesquelles des informations fiables sont disponibles auprès du Comité national des statistiques de la Fédération de Russie. Ceux-ci incluent généralement le sexe, l’âge, l’éducation, le type d’établissement, l’état civil, le secteur d’emploi et la situation professionnelle du répondant. Quatre indicateurs - le sexe, l'âge, l'éducation et le lieu de résidence du répondant sont utilisés pour identifier les groupes témoins lors de la détermination des poids.

répondants - ils doivent correspondre à des groupes similaires dans la population générale 47. Depuis statistiques officielles Si nous savons combien d’hommes et de femmes il y a en Russie, il est facile de comparer les données de surveillance à l’aide de ces chiffres et de déterminer l’erreur.

Dans les enquêtes du Centre socio-express de l'Institut de sociologie de l'Académie des sciences de Russie, la représentativité de l'échantillon panrusse (volume de conception de 2 000 personnes) est contrôlée par les proportions régionales de la population, les proportions entre les zones urbaines et urbaines. population rurale, proportions entre la population des types d'établissements spécifiés. L'enquête est réalisée au moyen d'un entretien formalisé au lieu de résidence. L'échantillonnage est basé sur dix zones économiques et géographiques, dont chacune a grandes villes(plus de 500 000 habitants), des villes de taille moyenne (50 à 500 000), des petites villes (jusqu'à 50 000) ou des agglomérations de type urbain, ainsi que des agglomérations rurales. Les auteurs estiment que l'erreur marginale de leur échantillon ne dépasse pas 3% 48 .

Le contrôle efficace de l'échantillon et, en général, de la qualité des données d'une étude est la publication des caractéristiques clés de l'étude, principalement des outils méthodologiques. Si l'auteur d'une étude cache des informations en invoquant un secret commercial, alors des soupçons de malhonnêteté doivent nécessairement surgir. Comme le note à juste titre A. Balabanov, toutes les méthodes de mesure, même dans le domaine des études marketing et des médias, sont connues depuis longtemps, elles sont absolument ouvertes et ne peuvent faire l'objet d'un secret commercial. De plus, le manque de données sur la méthodologie de mesure constitue une violation de tous les accords existants dans le monde, notamment sur les mesures médiatiques 49 .

Exemple de passeport

En écrivant rapport scientifique et publication d'un article dans une revue académique, les auteurs de l'étude exigent toujours des explications claires concernant l'étude elle-même et l'échantillonnage

population : qui et quand a mené l'étude, quelles méthodes de recherche ont été utilisées, quel est le type, la taille et la nature de l'échantillon, l'erreur de représentativité, la composition de la population de l'échantillon selon les principaux paramètres (par exemple, le sexe, l'âge, la nationalité, l'éducation). ), contrôle des données, etc. Si ces informations sont manquantes, alors l'article n'est généralement pas accepté dans la revue, et s'il n'est que partiellement présent, alors les chercheurs sérieux ne lui font pas confiance. Ainsi, le passeport de recherche et le passeport échantillon ne sont pas moins nécessaires aux auteurs qu'aux éditeurs et aux lecteurs.

Le modèle de passeport du sociologue apparaît deux fois. Pour la première fois, un sociologue doit donner une description du type d'échantillon avec une brève justification de l'opportunité de son utilisation conformément aux objectifs de l'étude, aux exigences de représentativité et aux capacités organisationnelles de l'étude. Section méthodique votre programme de recherche. La section sur l'échantillonnage contient des réponses à prochaines questions:

♦ Quel est l'objet empirique de l'étude ?

♦ L'étude est-elle continue ou sélective ?

♦ S'il est échantillonné, prétend-il être représentatif ?

♦ S'il prétend être représentatif, quelle est sa population ?

♦ Combien d'étapes de sélection sont utilisées dans l'échantillon ?

♦ Quelle est l'unité de sélection à chaque étape ?

♦ Quelle stratégie de sélection est utilisée à chaque étape (aléatoire, quota) ?

♦ Quel type spécifique d'échantillonnage aléatoire est utilisé ?

♦ Quels paramètres sont utilisés dans l'échantillonnage par quotas ?

♦ Quelle est la base de sondage (liste, fiche, carte) ?

♦ Quelle est l'unité d'observation à la dernière étape de sélection ?

Les principes d'échantillonnage sont décrits non seulement pour la méthode d'enquête, mais également pour chaque méthode utilisée dans l'étude : analyse documentaire, observation, etc.

Exemple conditionnel exemples de descriptions. En étudiant l’efficacité des formes d’organisation du travail en équipe, une telle stratégie est possible. 1. Les travailleurs réunis dans une forme d'organisation du travail en brigade sont considérés comme un objet empirique. 2. L'étude est sélective. 3. La population générale est constituée de tous les travailleurs réunis sous forme de brigade. 4. Trois étapes de sélection sont appliquées. 5. Au premier stade, il existe des brigades engagées dans des activités arbitraires principales et auxiliaires.

qualité Pour ces dernières, une enquête continue est utilisée (en raison de leur petit nombre), et pour les premières, une enquête par sondage est utilisée. 6. La deuxième étape est la sélection des équipes impliquées dans la production principale. Selon les indicateurs caractérisant résultats finaux, les brigades sont divisées en trois groupes : a) avancés ; b) moyenne ; c) en retard. En fonction du nombre d'équipes pour chaque groupe, une liste est établie et une sélection aléatoire disproportionnée en est effectuée (par exemple, trois équipes dans chacune) en utilisant une certaine « étape d'échantillonnage ». 7. Troisième étape - une enquête complète est réalisée auprès d'équipes sélectionnées. L'unité d'observation est l'individu salarié 50.

La deuxième fois que le sociologue rencontre une description de l'échantillon, c'est après la réalisation de la recherche - lorsqu'il rédige un rapport scientifique ou article scientifique au magazine.

La description incomplète des données du passeport de l'étude est malheureusement la maladie la plus courante chez les scientifiques russes. Certains ne savent pas exactement comment les compiler, d'autres considèrent que ces informations sont inutiles ou sans importance. Et il existe aussi une catégorie de chercheurs qui n'ont tout simplement rien à signaler, car en décrivant toutes les informations sur l'échantillon, ils exposeront leur analphabétisme. Un cas courant est celui où un sociologue a mené une étude, a constitué un échantillon et en a tiré quelque chose. Mais il ne peut pas formuler de passeport ni exprimer ses actions dans un langage scientifique.

Une maladie chronique des sociologues nationaux est l'absence ou une culture méthodologique insuffisamment élevée. Cela concerne non seulement l'organisation et la conduite des recherches sur le terrain, mais aussi la publication de leurs résultats dans la presse ouverte. Ce fait est connu de tous et est périodiquement discuté des années 1960 aux années 2000. Parfois, nos sociologues et nos psychologues parviennent à se faire prendre sur le fait, comme on dit.

Selon les recherches de V.V. Solodnikov, qui a mené une analyse secondaire des publications dans trois revues académiques : « Recherche sociologique", "Problèmes psychologiques"

et « Psychological Journal » pour 1986-1992, ni les sociologues ni les psychologues ne se lassent d'avancer, de justifier et de tester des hypothèses. La plupart des scientifiques (de 61 % parmi les psychologues à 92 % parmi les sociologues) se passent d'un tel outil cognitif, violant ainsi tous les canons. méthode scientifique. Seules 8 % des publications sociologiques formulent explicitement des hypothèses. Les sociologues et les psychologues décrivent mal l'objet de la recherche : peu indiquent le nombre de répondants, le sexe et l'âge des répondants, le niveau d'éducation des répondants, le lieu de résidence, la durée ; la vie de famille(pour les personnes mariées), revenus et statut professionnel. Le problème de la représentativité, c'est-à-dire la comparaison de l’échantillon et de la population générale en fonction de ces caractéristiques n’est presque pas discutée du tout. Par ailleurs, les sociologues évoquent rarement le pilotage d’outils et l’utilisation de techniques préalablement testées. Bien que la méthode la plus courante de collecte d'informations empiriques soit une enquête, il est rare de décrire quel type d'enquête a été utilisé en fonction du lieu, de l'heure ou de la méthode de remplissage du questionnaire.

2.12. Représentativité

Représentativité (français) représentant- indicatif) - la propriété d'un échantillon de population de représenter les caractéristiques de la population générale. La représentativité de l'échantillon signifie que, avec une erreur prédéterminée ou calculée sur l'échantillon réel, ce qui est établi dans la population échantillon peut être identifié avec la population générale ou, si nous utilisons le langage des statistiques, nous pouvons trouver des estimations des paramètres. de la population générale. Premièrement, chaque unité de la population doit avoir probabilité égale entrer dans l’échantillon. Deuxièmement, afin d'éviter une sélection directionnelle, la sélection des unités dans la population générale doit être effectuée quelle que soit la caractéristique étudiée. Troisièmement, la sélection doit être effectuée autant que possible à partir de populations homogènes. Quatrièmement, le nombre d'unités de population sélectionnées pour l'enquête doit être suffisamment grand.

Processus détermination directe La représentativité de l'échantillon comprend les étapes suivantes : comparaison des indicateurs moyens des répartitions de l'échantillon et de la population générale ; comparaison des formes de distribution de ces indicateurs. La moyenne de la distribution est généralement considérée comme la moyenne 144

arithmétique ou moyenne arithmétique pondérée de cette distribution.

Dans le cas de l'étude de populations présentant des caractéristiques alternatives, au lieu de la moyenne arithmétique, la proportion d'unités possédant la caractéristique considérée est calculée par rapport à l'ensemble de la population. Si l'on note le volume de la population par le symbole N, et un phénomène avec ce signe - M, Que R- la proportion de phénomènes présentant cette caractéristique est déterminée :

Où Q- la proportion de phénomènes de signe alternatif.

Il est possible d'utiliser les conclusions obtenues sur la base d'une étude d'un échantillon de population si la différence entre les moyennes arithmétiques (ou parts moyennes) des caractéristiques de l'échantillon et de la population générale tend vers zéro. On suppose que cette exigence est satisfaite. lorsque quatre conditions mentionnées ci-dessus sont remplies, cependant, connaissant uniquement les moyennes de l'échantillon, il est impossible de donner des estimations précises de leur différence, car les indicateurs moyens de la population générale sont inconnus. eux-mêmes peuvent fluctuer en fonction des unités de la population générale auxquelles appartiennent les unités. Par conséquent, évaluer la représentativité d'un échantillon de population sur la base des indicateurs moyens de sa répartition revient à rechercher l'erreur de représentativité.

La comparaison de l’échantillon et de la population générale ne donne pas une image complète de la population générale. Ainsi, dans deux populations ayant les mêmes indicateurs moyens, les écarts entre les valeurs maximales et minimales d'une caractéristique, qui déterminent la forme de sa distribution, peuvent être différents. Si une telle distribution est représentée graphiquement, elle forme une courbe symétrique en forme de cloche (normale), reflétant le fait que la somme de nombreuses variables aléatoires indépendantes distribuées de manière aléatoire est approximativement répartie sur loi normale. Ordonnée oui, qui détermine la hauteur de la courbe pour chaque point X, représente la densité de probabilité pour la valeur x g

La densité de probabilité maximale se produit à la valeur moyenne de la variable et égal à un. Cela signifie que moins

valeur aléatoire variable diffère de sa valeur moyenne, plus plus probable ses manifestations. Et vice versa, plus l'écart des valeurs d'une variable par rapport à sa valeur moyenne est grand, moins il est probable qu'elles apparaissent. Ainsi, les valeurs des écarts par rapport aux valeurs moyennes, c'est-à-dire valeurs de la forme x (- X, contiennent des informations sur la variation des variables étudiées. Si toutes les valeurs d'une caractéristique étaient les mêmes et coïncidaient avec sa taille moyenne, alors la totalité de la valeur de cet attribut serait extrêmement homogène.

Habituellement, le nombre d'écarts positifs par rapport à la moyenne arithmétique de la population est approximativement égal au nombre d'écarts négatifs, c'est-à-dire la somme de tous les écarts tend inévitablement vers zéro. Ainsi, s’il fallait additionner au total tous les écarts d’une caractéristique, cette somme serait toujours égale à zéro :

Pour éviter cela, chaque écart est mis au carré et la somme des carrés est trouvée - la variance.

Distribution normale est entièrement caractérisé par les paramètres suivants : jc - la valeur moyenne de la caractéristique et a - l'écart carré moyen (type). Moyenne X détermine la position de la distribution par rapport à l'axe des x ; l'écart type montre la forme de la courbe ; comment plus de valeur et plus la courbe est large et plus son maximum est bas.

L'aire sous la courbe normale est située de telle manière qu'à l'intérieur des limites x ± o 68 % de la répartition totale de la caractéristique est située à l'intérieur des limites x ± 2<т - 95,5, в пределах x ± Zet - 99,7%. La probabilité que la différence entre une variable aléatoire distribuée approximativement selon une loi normale et sa valeur moyenne dépasse Z en valeur absolue est inférieure à 0,3 %. Il s’ensuit qu’avec une précision de près de cent pour cent, nous pouvons dire :

Une évaluation d'un échantillon représentatif de population basée sur la forme de distribution des indicateurs est une comparaison des mesures de variation de ces indicateurs dans l'échantillon et dans la population générale. La dispersion de la population générale n'est pas toujours connue, mais en statistiques mathématiques, il a été prouvé que l'inter-

Entre les variances générales et les variances d'échantillon, il existe une relation de la forme :

Où P- taille de l'échantillon.

Le problème de la représentativité de l'échantillon est important en tant que problème de légitimité de l'extrapolation des conclusions obtenues à partir de l'analyse de la population échantillon à l'ensemble de la population 52.

Chapitre 3. PROGRAMME

Informations connexes.

Un échantillon est un ensemble de données prélevées à l’aide de certaines procédures auprès d’une population à des fins d’analyse exploratoire. La représentativité est la propriété de reproduire l'idée du tout par sa partie. Autrement dit, c’est la possibilité d’étendre l’idée de partie au tout, qui inclut cette partie.

La représentativité d'un échantillon est un indicateur selon lequel l'échantillon doit refléter pleinement et de manière fiable les caractéristiques de la population dont il fait partie. Il peut également être défini comme la propriété d'un échantillon à représenter au mieux les caractéristiques de la population qui sont significatives du point de vue de l'objet de l'étude.

Supposons que la population générale soit composée uniquement d'élèves (900 personnes réparties dans 30 classes, 30 personnes dans chaque classe). L'objet de l'étude est l'attitude des écoliers à l'égard du tabac. Un échantillon de population composé de 90 étudiants ne représentera l'ensemble de la population que bien moins bien qu'un échantillon des mêmes 90 étudiants, qui comprendrait 3 étudiants de chaque classe. La principale raison est la répartition inégale des âges. Ainsi, dans le premier cas, la représentativité de l’échantillon sera faible. Dans le deuxième cas, élevé.

En sociologie, on dit qu’il existe la représentativité d’un échantillon et sa non-représentativité.

Un exemple d’échantillon non représentatif est un cas classique survenu en 1936 aux États-Unis lors de l’élection présidentielle.

Literary Digest, qui avait très bien réussi à prédire les résultats des élections précédentes, s'est cette fois trompé dans ses prévisions, bien qu'il ait envoyé plusieurs millions de questions écrites à ses abonnés, ainsi qu'à des personnes interrogées qu'ils avaient sélectionnées dans les annuaires téléphoniques et les listes d'immatriculation des voitures. Sur le quart des bulletins de vote retournés complets, les votes ont été répartis comme suit : 57 % ont donné la préférence au candidat républicain nommé Alf Landon et 41 % ont préféré le président sortant, le démocrate Franklin Roosevelt.

En fait, F. Roosevelt a remporté les élections avec près de 60 % des voix. L’erreur du Literary Digest était la suivante. Ils voulaient augmenter la représentativité de l'échantillon . Et comme ils savaient que la plupart de leurs abonnés s'identifiaient comme républicains, ils ont décidé d'élargir l'échantillon pour inclure les répondants qu'ils avaient sélectionnés dans les annuaires téléphoniques et les listes d'immatriculation des voitures. Mais ils n’ont pas tenu compte des réalités existantes et ont en fait sélectionné encore plus de partisans républicains, car à l’époque les classes moyennes et supérieures pouvaient se permettre d’avoir une voiture et un téléphone. Et il s’agissait pour la plupart de républicains et non de démocrates.

Il existe différents types d'échantillonnage : aléatoire simple, en série, typique, mécanique et combiné.

L'échantillonnage aléatoire simple consiste à sélectionner aléatoirement, sans aucun système, parmi l'ensemble de la population, les unités étudiées.

L'échantillonnage mécanique est utilisé lorsqu'il y a de l'ordre dans la population générale, par exemple, il existe une certaine séquence d'unités de travailleurs, de listes électorales, de numéros de téléphone des répondants, de nombres d'appartements et de maisons, etc.).

La sélection typique est utilisée lorsque la population entière peut être divisée en groupes par type. Lorsque vous travaillez avec la population, il peut s'agir, par exemple, de groupes éducatifs, d'âge, sociaux lors de l'étude d'entreprises - une industrie ou une organisation distincte, etc.

La sélection en série est pratique lorsque les unités sont combinées en petites séries ou groupes. Une telle série peut être constituée de lots de produits finis, de classes scolaires et d'autres groupes.

L'échantillonnage combiné implique l'utilisation de tous les types d'échantillonnage précédents dans l'une ou l'autre combinaison.

L’un des principaux éléments d’une étude bien conçue est l’identification de l’échantillon et de sa nature. échantillon représentatif. C'est comme l'exemple du gâteau. Après tout, il n’est pas nécessaire de manger tout le dessert pour comprendre son goût ? Une petite partie suffit.

Donc le gâteau est population (c'est-à-dire tous les répondants éligibles à l'enquête). Cela peut être exprimé géographiquement, par exemple, uniquement par les résidents de la région de Moscou. Sexe : femmes uniquement. Ou il y a des restrictions d'âge - les Russes de plus de 65 ans.

Le calcul de la population est difficile : il faut disposer des données du recensement de la population ou des enquêtes d'évaluation préliminaire. Par conséquent, la population générale est généralement « estimée » et, à partir du nombre obtenu, on calcule échantillon de population ou échantillon.

Qu’est-ce qu’un échantillon représentatif ?

Échantillon– il s’agit d’un nombre clairement défini de répondants. Sa structure doit coïncider autant que possible avec la structure de la population générale en termes de principales caractéristiques de sélection.

Par exemple, si les répondants potentiels représentent l’ensemble de la population de la Russie, où 54 % sont des femmes et 46 % des hommes, alors l’échantillon doit contenir exactement le même pourcentage. Si les paramètres coïncident, l'échantillon peut alors être qualifié de représentatif. Cela signifie que les inexactitudes et les erreurs dans l'étude sont réduites au minimum.

La taille de l'échantillon est déterminée en tenant compte des exigences de précision et d'économie. Ces exigences sont inversement proportionnelles les unes aux autres : plus la taille de l’échantillon est grande, plus le résultat est précis. De plus, plus la précision est élevée, plus les coûts nécessaires à la réalisation de l’étude sont élevés. Et vice versa, plus l'échantillon est petit, moins il coûte cher et moins les propriétés de la population générale sont reproduites de manière précise et aléatoire.

Ainsi, pour calculer le volume de choix, les sociologues ont inventé une formule et créé calculatrice spéciale:

Probabilité de confiance Et erreur de confiance

Que signifient les termes " probabilité de confiance" Et " erreur de confiance" ? La probabilité de confiance est un indicateur de l’exactitude des mesures. Et l’erreur de confiance est une erreur possible dans les résultats de la recherche. Par exemple, avec une population de plus de 500 000 personnes (disons vivant à Novokuznetsk), l'échantillon sera de 384 personnes avec une probabilité de confiance de 95 % et une erreur de 5 % OR (avec un intervalle de confiance de 95 ± 5). %).

Qu’est-ce qui en découle ? En réalisant 100 études avec un tel échantillon (384 personnes), dans 95 pour cent des cas, les réponses obtenues, selon les lois de la statistique, seront à ± 5 % de la réponse originale. Et nous recevrons un échantillon représentatif avec une probabilité minimale d’erreur statistique.

Une fois la taille de l'échantillon calculée, vous pouvez voir s'il y a un nombre suffisant de répondants dans la version démo du panel de questionnaires. Vous pouvez en savoir plus sur la manière de mener une enquête par panel.