Formulaires d'écran pour l'affichage d'informations statistiques. Cours sur les statistiques

Un graphique statistique est un dessin dans lequel des agrégats statistiques, caractérisés par certains indicateurs, sont décrits à l'aide d'images ou de signes géométriques conventionnels. Dans les graphiques statistiques, le système de coordonnées rectangulaires est le plus souvent utilisé, mais il existe également des graphiques construits selon le principe coordonnées polaires(graphiques circulaires).

Classification des types de graphiques :

a) la méthode de construction d'une image graphique ;

b) des signes géométriques représentant des indicateurs et des relations statistiques ;

c) problèmes résolus à l'aide d'images graphiques.

Graphiques statistiques selon la forme de l'image graphique :

1. Linéaire : courbes statistiques.

2. Planaire : colonne, bande, carré, circulaire, secteur, bouclé, point, fond.

3. Volumétrique : surfaces de distribution.

Graphiques statistiques pour la méthode de construction et les tâches d'image :

1. Diagrammes : diagrammes de comparaison, diagrammes de dynamique, diagrammes structurels (la méthode la plus courante d'images graphiques. Ce sont des graphiques de relations quantitatives).

2. Cartes statistiques : cartogrammes, cartodiagrammes (graphiques de distribution quantitative sur une surface. Dans leur objectif principal, ils sont étroitement liés aux diagrammes et ne sont spécifiques que dans le sens où ils représentent des images conventionnelles de données statistiques sur une carte géographique de contour, c'est-à-dire ils montrent la répartition spatiale ou la répartition spatiale des statistiques)

10/ Indicateurs absolus

Indicateurs absolus reflètent les dimensions physiques des processus et phénomènes étudiés par les statistiques, à savoir leurs caractéristiques de masse, de surface, de volume, d’étendue et de temps. Ce sont toujours des numéros nommés. Exprimé en naturel, coût ou main d'œuvre unités de mesure.

Unités naturelles – tonnes, kilomètres, litres, barils, pièces.

Les unités naturelles conventionnelles sont utilisées lorsqu'un produit comporte plusieurs variétés et que le volume total ne peut être déterminé qu'en fonction de la propriété de consommation commune à toutes les variétés. La conversion en unités conventionnelles est effectuée sur la base de coefficients spéciaux, calculés comme le rapport des propriétés de consommation de variétés de produits individuelles à la valeur de référence.

Les unités de mesure de coût fournissent une évaluation monétaire des phénomènes socio-économiques (valeur du PIB). Les unités de mesure du travail vous permettent de prendre en compte les coûts totaux de main-d'œuvre dans l'entreprise et l'intensité de travail des opérations individuelles du processus technologique (jours-personnes, heures-personnes).

Indicateurs absolus individuels reçu directement dans le processus observation statistique en raison du trait quantitatif d’intérêt.

Indicateurs absolus volumétriques récapitulatifs obtenu en résumant et en regroupant les valeurs individuelles.

11/ Indicateurs relatifs

Un indicateur relatif est le résultat de la division d'un indicateur absolu par un autre et exprime la relation entre les caractéristiques quantitatives des phénomènes socio-économiques.

Sans indicateurs relatifs, il est impossible de mesurer l'intensité de développement du phénomène étudié dans le temps, d'évaluer le niveau de développement d'un phénomène par rapport à d'autres phénomènes qui lui sont interconnectés et de faire des comparaisons spatiales et territoriales.

Lors du calcul d'un indicateur relatif, l'indicateur absolu trouvé au numérateur du rapport obtenu est appelé actuel ou comparé, et l'indicateur au dénominateur s'appelle base de comparaison ou base.

Les indicateurs relatifs peuvent être exprimés en coefficients, pourcentages, ppm, prodécimaux ou peuvent être nommés valeurs. Les pourcentages sont utilisés dans les cas où l'indicateur absolu comparé ne dépasse pas celui de base de 2 à 3 fois. Si la supériorité est supérieure, alors le coefficient est utilisé.

On distingue : types d'indicateurs relatifs.

    L'indicateur de dynamique relative (RDI) est le rapport entre le niveau du processus ou du phénomène étudié pour une période de temps donnée et le niveau du même phénomène dans le passé. L'OPD est mesurée en pourcentage ou exprimée sous forme de coefficient.

    Cette valeur indique combien de fois le niveau actuel est supérieur au niveau de base ou quelle part de la base il s'agit. Si l’OPD est exprimé sous forme de multiple, il représente un facteur de croissance.

    En multipliant ce coefficient par 100, on obtient le taux de croissance.

    L'indicateur de plan relatif (RPI) est le rapport entre le niveau prévu d'un indicateur et l'indicateur déjà atteint dans le passé.

    L'indice de structure relative (RSI) est le rapport des parties structurelles de l'objet étudié et est déterminé rapport de l'indicateur, caractérisant une partie de la population à un indicateur caractérisant l'ensemble de la population. OPS est exprimé en unités ou en pourcentages.

    Indice de coordination relatif (RCI) – rapport différentes parties appartenant au même objet.

    Indicateur de comparaison relative (RCI) – le ratio de produits similaires indicateurs absolus, caractérisant différents objets.

    L'indice d'intensité relative (RII) caractérise le degré de répartition du processus ou du phénomène étudié dans son environnement inhérent et est déterminé par le rapport de l'indicateur caractérisant le phénomène à l'indicateur caractérisant l'environnement de répartition de ce phénomène. L'OPI se mesure en pourcentage, ppm, prodécimille. Cet indicateur calculé quand valeur absolue s’avère insuffisant pour formuler des conclusions étayées sur l’ampleur du phénomène. Un type d'OPII sont des indicateurs niveau développement économique

, caractérisant la production du PIB par habitant, le chiffre d'affaires commercial par habitant, etc. Les indicateurs du niveau de développement économique sont nommés valeurs et sont mesurés en roubles par habitant, etc.

Pour une présentation visuelle et compacte des informations statistiques, des tableaux et graphiques statistiques (y compris des graphiques, des cartogrammes et des diagrammes cartographiques) sont utilisés.

Les résultats de la synthèse et du regroupement des matériels d'observation statistique sont généralement présentés sous forme de tableaux.

Un tableau est la forme la plus rationnelle, visuelle et compacte de présentation de matériel statistique. Un tableau statistique est un tableau qui contient un résumé caractéristique numérique

la population étudiée selon une ou plusieurs caractéristiques essentielles, interconnectées par la logique de l’analyse économique.

Les principaux éléments du tableau statistique présenté à la Fig. 5.1, composez son tracé :

Riz. 5.1. Tableau statistique

Lors de la construction d'un tableau, les informations numériques sont situées à l'intersection des lignes et des graphiques. Ainsi, extérieurement, le tableau est un ensemble de colonnes et de lignes qui le composent

Le tableau statistique contient trois types de rubriques : générale, supérieure et latérale. L'en-tête général reflète le contenu de l'ensemble du tableau, est situé au-dessus de sa disposition au centre et constitue l'en-tête externe. Les titres supérieurs (titres de prédicat) caractérisent le contenu des colonnes et les titres latéraux (titres de sujet) caractérisent le contenu des lignes. Ce sont des en-têtes internes.

Le squelette du tableau, rempli de titres, forme sa disposition. Si vous écrivez des nombres à l'intersection de graphiques et de lignes, vous obtenez un tableau statistique complet. Le matériel numérique peut être présenté en valeurs absolues, relatives (indices de prix des produits alimentaires) et moyennes. Le cas échéant, les tableaux peuvent être accompagnés d'une note permettant d'expliquer les rubriques, la méthodologie de calcul de certains indicateurs, les sources d'information, etc.

En termes de contenu logique, le tableau est une « phrase statistique », dont les principaux éléments sont le sujet et le prédicat.

Le sujet du tableau statistique contient une liste d'indicateurs, caractérisés par des chiffres. Il peut s'agir d'un ou plusieurs agrégats, d'unités individuelles d'agrégats (entreprises, associations) dans l'ordre de leur liste ou regroupés selon certaines caractéristiques (unités territoriales individuelles, périodes de temps dans tableaux chronologiques etc.). Habituellement, le sujet du tableau est indiqué sur le côté gauche, dans les noms des lignes.

Le prédicat d'un tableau statistique est formé par un système d'indicateurs qui caractérisent l'objet d'étude, c'est-à-dire le sujet du tableau. Le prédicat forme les titres supérieurs et constitue le contenu du graphique avec logique disposition séquentielle indicateurs de gauche à droite.

Le placement du sujet et du prédicat peut être inversé, selon le choix du chercheur. En fonction de la structure du sujet et du regroupement d'unités, on distingue des tableaux statistiques simples et complexes, et ces derniers, à leur tour, sont divisés en groupes et combinatoires.

Dans un tableau simple, le sujet donne une liste simple de tous objets ou unités territoriales de la population. Les tableaux simples peuvent être monographiques et de liste. Les monographies ne caractérisent pas l'ensemble des unités du volume étudié, mais un seul groupe de celui-ci, identifié selon un certain critère préformulé. Ainsi, les tableaux de listes simples sont des tableaux dont le sujet contient une liste d'unités de la population étudiée.

Le sujet d'un tableau simple peut être constitué selon les principes suivants : spécifique, territorial (population des pays de la CEI) ; temporaire, etc. Des tableaux simples ne permettent pas d'identifier les types socio-économiques des phénomènes étudiés, leur structure, ainsi que les relations et interdépendances entre les traits qui les caractérisent. Ces problèmes sont plus complètement résolus en utilisant tableaux complexes: groupe et surtout combinatoire.

Les tableaux de groupe sont des tableaux statistiques dont le sujet contient un regroupement d'unités de population selon une caractéristique quantitative ou attributaire. Le prédicat dans les tableaux de groupe est constitué d'indicateurs nécessaires pour caractériser le sujet.

Le type le plus simple de tableaux de groupes sont les séries de distribution d'attributs et de variations. Un tableau de groupe peut être plus complexe si le prédicat contient non seulement le nombre d'unités dans chaque groupe, mais également un certain nombre d'autres indicateurs importants qui caractérisent quantitativement et qualitativement les groupes du sujet. De tels tableaux sont souvent utilisés pour comparer des indicateurs généraux par groupe, ce qui permet de tirer certaines conclusions pratiques. Les tableaux de groupe permettent d'identifier et de caractériser les types de phénomènes socio-économiques et leur structure en fonction d'une seule caractéristique.

Les tableaux de combinaison sont des tableaux statistiques dont l'objet contient un regroupement d'unités de population simultanément selon deux ou plusieurs caractéristiques : chaque groupe, construit selon une caractéristique, est divisé en sous-groupes selon une autre caractéristique, etc.

Des tableaux de combinaison permettent de caractériser des groupes types identifiés par plusieurs caractéristiques et les relations entre ces dernières. L'ordre de division des unités de population en groupes homogènes selon leurs caractéristiques est déterminé soit par l'importance de l'une d'entre elles dans leur combinaison, soit par l'ordre dans lequel elles sont étudiées.

Le développement complexe d'un prédicat implique de diviser le trait qui le forme en sous-groupes. Il en résulte une approche plus complète et caractéristiques détaillées objet. Dans ce cas, chaque groupe d'entreprises ou chacune d'entre elles séparément peut être caractérisée par une combinaison différente de caractéristiques qui forment le prédicat.

Sergueï Molchanov

Les statistiques savent tout », affirmaient Ilf et Petrov dans leur célèbre roman « Les Douze Chaises » et continuaient : « On sait combien de nourriture le citoyen moyen de la république mange par an... On sait combien de chasseurs, de ballerines... .. les machines, les vélos qu'il y a dans le pays, les monuments, les phares et les machines à coudre... Combien de vie, pleine d'ardeur, de passions et de pensées, nous regarde à partir des tableaux statistiques !..” Pourquoi ces tableaux sont-ils nécessaires, comment les compiler ? et les traiter, quelles conclusions peut-on en tirer - Les statistiques répondent à ces questions (du latin stato - état, latin status - état). La statistique est une science qui étudie, traite et analyse des données quantitatives sur une grande variété de domaines. phénomènes de masse dans la vie.

Objectifs du travail : Comprendre la recherche statistique, le traitement des données et l'interprétation des résultats.

Télécharger:

Aperçu :

« Les statistiques savent tout », affirment Ilf et Petrov dans leur célèbre roman « Les Douze Chaises » et poursuivent : « On sait combien de nourriture le citoyen moyen de la république mange par an... On sait combien de chasseurs, de ballerines. .. machines, vélos, monuments, phares et machines à coudre... Combien de vie, pleine d'ardeur, de passions et de pensées, nous regarde à partir de tableaux statistiques !.." Pourquoi ces tableaux sont-ils nécessaires, comment les compiler et les traiter, quelles conclusions peut-on en tirer - les statistiques répondent à ces questions (du statut italien - état, du latin statut - état).

La statistique est une science qui étudie, traite et analyse des données quantitatives sur une grande variété de phénomènes de masse de la vie.

Objectifs :

Comprendre la recherche statistique, le traitement des données et l'interprétation des résultats.

Collecte d'informations statistiques, traitement et analyse des résultats du point de vue que l'enseignement mathématique est un élément nécessaire au développement.

Objectifs du poste :

Créer une image visuelle enseignement des mathématiques en classe.

Se faire une idée de la possibilité de décrire et de traiter des données à l'aide de diverses caractéristiques statistiques.

Gestion et prévision développement ultérieur enseignement des mathématiques..

Hypothèse. Les statistiques nous permettent d’identifier les problèmes liés à l’enseignement des mathématiques dans notre classe.

Pertinence : Augmenter la motivation dans l’apprentissage sciences mathématiques, lien avec des situations de vie spécifiques. Capacité à collecter, traiter et analyser des données statistiques lors de l'apport travaux de recherche.

Plan:

I.Introduction :

Histoire du développement des statistiques.

Caractéristiques statistiques.

II. Travaux de recherche :

Questionnaire.

Tableau de toutes les données.

Diagrammes et conclusions (gammes, modes, fréquences, polygones de fréquence, moyenne arithmétique).

Conclusion générale :

Histoire des statistiques.

Les statistiques ont une longue histoire. Déjà dans période ancienne Dans l’histoire de l’humanité, les besoins économiques et militaires exigeaient la disponibilité de données sur la population, sa composition et son statut de propriété. Aux fins de la fiscalité, des recensements de population ont été organisés et des registres fonciers ont été effectués.

La première publication sur les statistiques est le « Livre des Nombres » dans la Bible, dans l'Ancien Testament, qui raconte le recensement du personnel militaire effectué sous la direction de Moïse et d'Aaron.

Pour la première fois, nous trouvons le terme « statistiques » dans la fiction – dans « Hamlet » de Shakespeare (1602, acte 5, scène 2). Le sens de ce mot chez Shakespeare est de savoir, courtisans.

Au début, les statistiques signifiaient des descriptions de la situation économique et état politiqueÉtat ou partie de celui-ci. Par exemple, la définition remonte à 1792 : « statistiques décrivant l’état d’un État à l’heure actuelle ou à un moment connu dans le passé ». Actuellement, les activités des services statistiques de l’État répondent bien à cette définition.

Cependant, progressivement, le terme « statistiques » a commencé à être utilisé plus largement. Selon Napoléon Bonaparte, « la statistique est le budget des choses ». Selon la formulation de 1833, « Le but des statistiques est de présenter les faits sous la forme la plus concise ».

Donnons encore deux affirmations.

La statistique consiste en l'observation de phénomènes qui peuvent être subordonnés ou exprimés par des nombres (1895).

Les statistiques sont la présentation numérique de faits provenant de n'importe quel domaine d'étude dans leurs interrelations.

Au fil du temps, la collecte de données sur les phénomènes sociaux de masse est devenue régulière.

AVEC milieu du 19ème V. Grâce aux efforts du grand mathématicien, astronome et statisticien belge Adolphe Quetelet (1796-1874), les règles des recensements de population furent élaborées et la régularité de leur déroulement dans les pays développés fut établie. Pour coordonner le développement des statistiques, à l'initiative d'A. Quetelet, des congrès internationaux de statistique furent organisés et en 1885 fut fondé l'Institut international de statistique, qui existe encore aujourd'hui.

Devenir statistiques de l'État en Russie peut être daté de la fin du XIIe - début du XIIIe siècle, bien que les premiers recensements des terres et de la population avec un programme de plus en plus complexe aient été effectués dès Russie kiévienne(IX - XII siècles). Les réformes de Pierre Ier (1672-1725), qui couvraient tous les domaines principaux vie publique: l'économie du pays, administration, l'armée, la culture et la vie de la population, ainsi que les guerres ont nécessité une comptabilité complète et précise des ressources matérielles et de la population. Au cours de cette période, l'organe gouvernemental suprême - le Sénat - à travers un système de collèges, gérait non seulement l'économie du pays, mais servait également de centre pour effectuer les travaux statistiques les plus importants, collectant des documents d'enquête, des rapports d'industries et d'institutions subordonnées. aux collèges, ainsi qu'à l'administration locale.

La réforme pétrinienne de la fiscalité est associée à l'émergence d'une nouvelle unité, elle est devenue « l'âme » masculine, ce qui a nécessité recensement par habitant population - audits. Le premier audit fut annoncé le 26 novembre 1718, l'audit fut réalisé par l'armée.

Au début du XIIIe siècle. En Russie, l'enregistrement actuel de la population est également né. Ainsi, en 1702, un décret fut publié sur la soumission des relevés hebdomadaires des naissances et des décès par les curés à l'Ordre spirituel patriarcal. Dans la première moitié du XIIIe siècle. Des recensements des ouvriers des usines et des usines ont déjà été effectués.

Première moitié du 19ème siècle est associée à une nouvelle étape dans le développement des statistiques nationales. En septembre 1802, conformément au plus haut Manifeste de l'empereur Alexandre Ier, des rapports écrits par les ministères furent introduits. C’est ainsi qu’a commencé la conception opérationnelle et structurelle des statistiques d’État en Russie. Cette année est considérée comme l’année de naissance des statistiques de l’État russe.

En 1811, un centre officiel de statistiques gouvernementales fut créé pour la première fois : la Direction statistique du ministère de l'Intérieur ; des rapports provinciaux ont été reçus ici. Le premier chef du Département des statistiques fut K.F. Hermann.

Les scientifiques russes ont apporté une grande contribution au développement de la science statistique. Le travail de D.P. Zhuravsky « Sur les sources et l'utilisation des informations statistiques », publié en 1846. Définissant les statistiques comme « un comptage par catégories », Zhuravsky a noté que les statistiques sont nécessaires pour « l'étude de tout ce qui concerne l'homme ». Zhuravsky a identifié les sections les plus importantes des statistiques sociales :

statistiques démographiques - la nécessité de les calculer par classe et par profession ;

étude de la vie populaire, du logement, de la nutrition ;

statistiques des théâtres, des clubs, des réunions nobles, des divertissements publics ;

statistiques des institutions protégeant les droits de propriété ;

statistiques sur la pauvreté, la pauvreté, l'orphelinat ;

statistiques sur le suicide indiquant les moyens, les raisons, le grade, l'âge et d'autres caractéristiques des personnes qui se sont suicidées.

Dans toutes les phrases de D.P. Zhuravsky a poursuivi l'idée d'identifier aussi précisément et complètement que possible la différenciation des personnes en fonction de leurs conditions de vie et de leur richesse.

Une place particulière dans l'histoire Statistiques russes appartient aux statistiques du zemstvo. Aux zemstvos, les corps gouvernement local, à partir du milieu des années 70 du XIXe siècle, des bureaux statistiques spéciaux ont été créés. Les statisticiens de Zemstvo ont collecté et développé un énorme matériel statistique, qui a été utilisé à des fins économiques et économiques approfondies. recherche sociale La Russie post-réforme. Le travail des statistiques du zemstvo se caractérise non seulement par la collecte et le développement de données statistiques, mais également par le développement de méthodologies statistiques.

Les statisticiens éminents du Zemstvo étaient V.I. Orlov, P.P. Chervinsky, F.A. Shcherbina, A.P. Chlikevitch.

Dans les années 90, des inspections d'usine ont été créées, qui tenaient des statistiques à jour, développaient des données sur les statistiques du travail, notamment la composition de la main-d'œuvre, les accidents, les grèves, etc.

Les statistiques industrielles commencent à se développer. Sous la direction de V.E. Varzara en 1900, 1908 et 1912. Les premiers recensements industriels ont été réalisés.

La phase initiale de la statistique soviétique (1917-1930) se caractérise par une intensité exceptionnelle : elle est réalisée grand nombre statistiques spécialement organisées

recensements et enquêtes, les différentes équipes de recherche travaillent avec succès, le premier bilan se construit économie nationale.

Le développement ultérieur des statistiques soviétiques a été entravé par la création dans les années 30 du système administratif-bureaucratique, répressions de masse, dont les meilleurs économistes et statisticiens (N.D. Kondratiev, A.V. Chayanov, V.G. Groman, O.A. Kvitnin et bien d'autres).

À l'heure actuelle, des statistiques industrielles sont en cours de formation et un système d'indicateurs volumétriques est en cours d'élaboration, cachant les tendances négatives du développement de l'économie nationale. Des indicateurs statistiques qualitatifs (indices de productivité du travail, de coût, etc.) sont également activement développés. Les statistiques sont subordonnées à la résolution de problèmes opérationnels et à l'évaluation de la mise en œuvre du plan au détriment de ses fonctions analytiques.

Pendant le Grand Guerre patriotique Les statistiques soviétiques étaient confrontées aux tâches de comptabilité opérationnelle du travail, des ressources matérielles, des mouvements forces de production pays vers les régions orientales.

Après la guerre, le rôle et l'importance des statistiques ont augmenté : les travaux de bilan se sont développés, la théorie de la méthode des indices s'est approfondie et la pratique de son application s'est développée, les modèles et méthodes économiques et mathématiques se sont répandus, le développement statistiques appliquées.
Le mot « statistiques » est souvent associé au mot « mathématiques », ce qui effraie les étudiants qui associent ce concept à formules complexes, exigeant haut niveau abstraction.

Cependant, comme le dit McConnell, les statistiques sont avant tout une façon de penser, et pour les appliquer, il suffit d'avoir un peu d'expérience. bon sens et connaître les bases des mathématiques. Dans notre la vie quotidienne Sans même nous en rendre compte, nous étudions constamment les statistiques. Voulons-nous planifier un budget, calculer la consommation d'essence d'une voiture, estimer l'effort qui sera nécessaire pour maîtriser un certain cours, en tenant compte des notes reçues jusqu'à présent, prévoir la probabilité d'un bon et intempéries selon un rapport météorologique ou généralement évaluer comment tel ou tel événement affectera notre avenir personnel ou commun - nous devons constamment sélectionner, classer et organiser les informations, les relier à d'autres données afin de pouvoir tirer des conclusions qui nous permettent de faire le bon choix décision.

Tous ces types d'activités diffèrent peu des opérations qui sous-tendent recherche scientifique et consistent à synthétiser les données obtenues sur différents groupes d'objets dans une expérience particulière, à les comparer afin de connaître les différences entre eux, à les comparer afin d'identifier des indicateurs évoluant dans le même sens et, enfin, à prédire certains faits sur la base des conclusions auxquelles les résultats conduisent. C’est précisément le but des statistiques dans les sciences en général, notamment dans les sciences humaines. Il n’y a rien d’absolument sûr à ce sujet et, sans statistiques, les conclusions seraient dans la plupart des cas purement intuitives et ne constitueraient pas une base solide pour interpréter les données obtenues dans d’autres études.

Afin d'apprécier les énormes avantages que les statistiques peuvent apporter, nous essaierons de suivre les progrès du déchiffrement et du traitement des données obtenues dans l'expérience. Ainsi, à partir des résultats précis et des questions qu’ils posent au chercheur, nous pourrons comprendre diverses techniques et façons simples de les appliquer. Cependant, avant de commencer ce travail, il nous sera utile de considérer les aspects les plus importants. aperçu général trois sections principales de statistiques.

1. Statistiques descriptives, comme son nom l'indique, permet de décrire, résumer et reproduire sous forme de tableaux ou de graphiques

2. Le but des statistiques inductives est de vérifier si les résultats obtenus à partir d'un échantillon donné peuvent être étendus à l'ensemble de la population sur laquelle l'échantillon a été prélevé. Autrement dit, les règles de cette section de statistiques permettent de savoir dans quelle mesure il est possible de généraliser à plus grand nombre objets, l'un ou l'autre modèle découvert lors de l'étude d'un groupe limité d'entre eux au cours d'une observation ou d'une expérience. Ainsi, à l'aide de statistiques inductives, certaines conclusions et généralisations sont tirées sur la base des données obtenues lors de l'étude de l'échantillon.

3. Enfin, mesurer la corrélation vous permet de connaître le degré de relation entre deux variables afin que vous puissiez faire des prédictions. valeurs possibles l'un d'eux si nous connaissons l'autre.

Il existe deux types de méthodes ou de tests statistiques qui permettent de faire des généralisations ou de calculer le degré de corrélation. Le premier type est le plus largement utilisé méthodes paramétriques, qui utilisent des paramètres tels que la moyenne ou la variance des données. Le deuxième type concerne les méthodes non paramétriques, qui fournissent un service inestimable lorsque le chercheur traite de très petits échantillons ou de données qualitatives ; ces méthodes sont très simples tant en termes de calculs que d'application. Au fur et à mesure que nous nous familiariserons avec les différentes manières de décrire les données et que nous passerons à l’analyse statistique, nous examinerons les deux.

  1. Le mode est le nombre d'une série qui apparaît le plus fréquemment dans cette série. On peut dire que numéro donné le plus « mode » de cette série.
  2. Moyenne série arithmétique les nombres sont le quotient de la somme de ces nombres divisés par leur nombre. La moyenne arithmétique est une caractéristique importante d'un certain nombre de nombres, mais il est parfois utile de considérer d'autres moyennes.
  3. Une mesure statistique de la différence ou de la dispersion des données est la plage.

La plage est la différence entre les valeurs les plus grandes et les plus petites d'une série de données.

La médiane d'une série composée d'un nombre impair de nombres est le nombre de cette série qui sera au milieu si cette série est ordonnée. La médiane d'une série composée d'un nombre pair de nombres est la moyenne arithmétique des deux nombres du milieu de cette série.

Il y a plus moyen pratique trouver la moyenne arithmétique, ainsi que d'autres caractéristiques statistiques - établir un tableau de fréquences.

Types et méthodes d'observation statistique.

L'observation statistique varie selon le type et selon les sources d'information.

Types d'observation statistique.

Observation systématique - actuelle : l'observation est réalisée sur la base de documents primaires contenant les informations nécessaires à une caractéristiques complètes le phénomène étudié.

Observation statistique - périodique. Un exemple est le recensement de la population.

Observation effectuée de temps en temps - ponctuelle.

Les types d'observation statistique peuvent être continus ou non continus.

Une observation continue est celle qui prend en compte tout sans qu’une unité de la population étudiée soit prise en compte.

L'observation discontinue s'oriente vers la prise en compte d'une certaine portion assez massive d'unités d'observation.

Dans la pratique statistique, différents types d'observations non continues sont utilisés :

sélectif;

méthode du tableau principal ;

questionnaire;

monographique.

La qualité de l'observation non continue est inférieure aux résultats de l'observation continue.

Pour obtenir une caractéristique représentative de l'ensemble de la population statistique pour une partie de ses unités, une observation par échantillon basée sur principes scientifiques formation de la population échantillon. Le caractère aléatoire de la sélection des unités de population garantit l'impartialité des résultats de l'échantillonnage.

Méthodes d'observation statistique.

Selon les sources d'informations collectées, on distingue :

direct,

documentaire

enquête.

L'observation directe s'effectue par comptage, mesure des valeurs de signes, relevés d'instruments par des personnes spéciales effectuant des observations, c'est-à-dire par des enregistreurs.

L'observation documentaire est une observation où la réponse aux questions de la fiche d'observation est enregistrée sur la base de documents pertinents.

Une enquête est une observation dans laquelle les réponses aux questions d'un formulaire d'observation sont enregistrées à partir des paroles de la personne interrogée.

Collecte et regroupement de données statistiques.

Pour étudier divers phénomènes sociaux et socio-économiques, ainsi que certains processus se produisant dans la nature, des études statistiques spéciales sont réalisées. Toutes sortes de choses recherche statistique commence par la collecte ciblée d'informations sur le phénomène ou le processus étudié. Cette étape est appelée étape d’observation statistique.

Pour généraliser la systématisation des données obtenues lors de l'observation statistique, elles sont divisées en groupes selon certaines caractéristiques, et les résultats du regroupement sont résumés dans des tableaux.

Présentation visuelle des informations statistiques.

Pour présenter visuellement les données obtenues à la suite de recherches statistiques, elles sont largement utilisées. diverses manières leurs images.

L'un des moyens les plus connus de représenter visuellement une série de données consiste à créer un graphique à barres.

Les diagrammes à colonnes sont utilisés lorsqu'ils souhaitent illustrer la dynamique des changements de données au fil du temps ou la distribution des données obtenues en conséquence.

Pour représenter visuellement la relation entre les parties de la population étudiée, il est pratique d'utiliser des diagrammes circulaires.

Pour construire un camembert, le cercle est divisé en secteurs, angles centraux qui sont proportionnelles aux fréquences relatives déterminées pour chaque groupe de données.

La dynamique des changements dans les données statistiques au fil du temps est souvent illustrée à l'aide d'un polygone. Pour construire un polygone, marquez plan de coordonnées des points dont les abscisses sont des moments dans le temps et les ordonnées sont les données statistiques correspondantes. En reliant ces points successivement par des segments, on obtient une ligne brisée, appelée polygone.

L’une des tâches principales des statistiques est précisément le traitement approprié de l’information. Bien entendu, les statistiques ont bien d'autres tâches : obtenir et stocker des informations, élaborer diverses prévisions, évaluer leur fiabilité, etc. Aucun de ces objectifs n'est réalisable sans traitement des données. Par conséquent, la première chose à faire est de recourir aux méthodes statistiques de traitement de l’information.

Dans notre classe, nous avons décidé de découvrir quel est le niveau de connaissances sur le thème « Résolution de systèmes d'équations linéaires à deux variables », pour lequel nous avons compilé un test spécial de six tâches

Dans la liste alphabétique des élèves, le nombre de problèmes correctement résolus était inscrit à côté de chaque nom. Le résultat est la série de nombres suivante :

F.I.

Nombre de tâches

Agafonova L.

Basharov un

Guseletov D.

Darmaeva K.

Konévin V

Korotkov V.

Krivolapova M.

Misyurkeev A

Misyurkeev V

Mineeva D

Mikhaïlov A.

Molchanova O.

Molchanov S

Naumov S

Popov avec

Postnikova M.

Rekhovskaya Yu

Sataeva N.

Terentyeva T

Ouchakova L.

Chagdurova N.

TOLSTIKHIN patrick

Razuvaev A.

Angélique m

Sur la base de cette série, il est difficile de tirer des conclusions définitives sur la manière dont le travail a été effectué. Pour faciliter l'analyse des informations, cas similaires les données numériques sont classées par ordre croissant. Suite au classement, les séries prendront la forme suivante :

2; 2;

3; 3; 3; 3;

4; 4; 4; 4; 4; 4

5; 5; 5;5;5;5

6; 6; 6; 6;

On voit que la série est divisée en 6 groupes. Chaque groupe représente un certain résultat de l'expérience : un problème a été résolu, deux problèmes ont été résolus, etc.

Dans notre échantillon, la fréquence d'apparition de l'événement « un élève de septième a résolu un problème » est de 1. La fréquence relative de cet événement est égale au rapport de sa fréquence à la taille de l'échantillon, soit 1:23, soit 4,3 % . Pour l'événement « un élève de neuvième année a résolu tous les problèmes », la fréquence est de 4 et la fréquence relative est de 4 : 23 -, soit 17,4 %, etc.

Pour faciliter la perception des résultats, ils sont présentés sous forme de tableaux et de graphiques.

………

Après avoir dressé un tableau, il est utile de vérifier par vous-même : en additionnant toutes les fréquences, nous devrions obtenir la taille de l'échantillon, c'est-à-dire le nombre 50, et en additionnant toutes les fréquences relatives, nous devrions obtenir 100 %.

Pour représentation graphique Sur la base de ce tableau, nous allons construire un diagramme de fréquence.

À l'aide de séries de classement, de tableaux et d'illustrations graphiques, nous avons déjà obtenu des premières informations sur les modèles des séries de données qui nous intéressent. Mais vous connaissez les caractéristiques statistiques d’une série de données qui vous permettent de faire une meilleure analyse statistique.

Par exemple, il est intéressant de connaître le résultat le plus typique des travaux proposés. En utilisant les données présentées dans le tableau, il est facile de voir que le résultat le plus courant est « trois problèmes résolus ». Comme vous le savez, dans le langage des statistiques, cela signifie que le chiffre 4 est le mode de cette série de nombres.

Il est également utile de trouver la moyenne arithmétique de cette série :

(1+2*2+3*4+4*6+5*6+6*4+:23=4.2 Ainsi, on peut dire qu'en moyenne un élève de neuvième résout quatre problèmes. (B dans ce cas la moyenne arithmétique de la série de données coïncidait avec son mode, mais, bien sûr, cela n'arrive pas toujours.)

Étapes de la recherche statistique

Les étapes de la recherche statistique comprennent :

L'observation statistique est une collection massive d'informations primaires organisées scientifiquement sur des unités individuelles du phénomène étudié.

Regroupement et synthèse du matériel - généralisation des données d'observation pour obtenir des valeurs absolues (indicateurs comptables et d'évaluation) du phénomène.

Traitement des données statistiques et analyse des résultats pour obtenir des conclusions étayées sur l'état du phénomène étudié et les schémas de son développement.

Toutes les étapes de la recherche statistique sont étroitement liées les unes aux autres et sont d’égale importance. Les lacunes et les erreurs qui surviennent à chaque étape affectent l'ensemble de l'étude dans son ensemble. C'est pourquoi utilisation correcte des méthodes spéciales de science statistique à chaque étape vous permettent d'obtenir des informations fiables à la suite d'une recherche statistique Méthodes de recherche statistique :

Observation statistique ;

Synthèse et regroupement des données ;

Calcul d'indicateurs généraux (valeurs absolues, relatives et moyennes) ;

Distributions statistiques (séries de variations);

Méthode d'échantillonnage ;

Analyse de corrélation et de régression ;

Série Dynamique ;

Index.

Les statistiques mathématiques modernes sont définies comme la science de la prise de décision dans des conditions d'incertitude. Deux tâches principales peuvent être distinguées statistiques mathématiques:

Indiquer les méthodes de collecte et de regroupement des informations statistiques obtenues à la suite d'observations ou d'expériences.

Ainsi, la tâche des statistiques mathématiques est de créer des méthodes de collecte et de traitement des données statistiques afin d'obtenir des conclusions scientifiques et pratiques.

M Étapes des travaux de recherche :

I. Collecte de données.

Comprend :

Étudier la tâche à accomplir.

Définition concepts significatifs.

Sélection de sources d'informations.

Collecte d'informations.

II. Regroupement des données.

Comprend :

Diviser les données en groupes en fonction des caractéristiques.

Construire une table de données.

III. Analyse des données.

Comprend :

Trouver des caractéristiques statistiques.

Généralisation des résultats obtenus.

IV. Rapport.

Nous avons mené une étude en 7e année « a » et « b » sur la nécessité d'étudier les mathématiques.

Collecte de données : Les élèves des écoles ont été invités à remplir un questionnaire. /Annexe 1/

Regroupement des données : un tableau a été établi à partir des données de l'enquête. /Annexe 2/

Analyse des données : les résultats donnés dans le tableau ont été présentés sous forme de diagrammes. /Annexe 3/

……

Les données traitées peuvent être utilisées :

Pour le travail professeurs de classe en famille.

Pour application pratique dans les cours de mathématiques...

Pour les chefs d'établissement.

Littérature:

Statistiques économiques. "Textbook", 2e édition augmentée. Recommandé par le Ministère des Affaires Générales et enseignement professionnel RF. Moscou. INFRA-M. 2006 Auteurs : Yu. N. Ivanov ; S. E. Kazarinova et autres. Edité par Yu. N. Ivanov, docteur en sciences économiques.

ESB Édition informatique 2006

République de Komi en Russie. Goskomstat de Russie. Goskomstat R.K. 2007

Syktyvkar en chiffres. Goskomstat R.K. 2007

Note typique (mode): 4Position 2. Temps libre pour les étudiants

(Que font les enfants le plus souvent pendant leur temps libre après les cours)

Tableau d'enquête sociologique

Cours

Anglais

Jeux informatiques

Lire des livres

Regarder la télévision

Judo (section)

Volley-ball (section)

marcher dans la rue

Nombre d'étudiants

https://accounts.google.com


Légendes des diapositives :

réalisé par : Molchanov Sergey 7"B" Superviseur : Telesheva L.A. - professeur de mathématiques, établissement d'enseignement municipal "École secondaire Barguzinskaya" Caractéristiques statistiques et recherche

Les statistiques savent tout « Stato » - état « Statut » - état Les statistiques sont une science qui étudie, traite et analyse des données quantitatives sur une grande variété de phénomènes de masse dans la vie.

Comprendre la recherche statistique, le traitement des données et l'interprétation des résultats. Collecte d'informations statistiques, traitement et analyse des résultats d'un point de vue mathématique l'éducation est nécessaireélément de développement. but de l'étude :

Créez une image visuelle de l’enseignement des mathématiques en classe. Se faire une idée de la possibilité de décrire et de traiter des données à l'aide de diverses caractéristiques statistiques. Gestion et prévision du développement futur de l'enseignement mathématique Objectifs :

Les statistiques nous permettent d’identifier les problèmes liés à l’enseignement des mathématiques dans notre classe. Hypothèse

: Augmenter la motivation dans l'enseignement des mathématiques ; lien avec des situations de vie spécifiques : la capacité de collecter, traiter et analyser des données statistiques lors de la conduite de travaux de recherche. Pertinence

Plan : Histoire des statistiques. Caractéristiques statistiques. Recherche sur le thème : « Le besoin de matières mathématiques ». Recherche sur le thème : « Activité de loisir préférée ».

La première publication sur les statistiques est le « Livre des Nombres » dans la Bible, dans l'Ancien Testament, qui raconte le recensement du personnel militaire effectué sous la direction de Moïse et d'Aaron.

Pour la première fois, nous trouvons le terme « statistiques » dans la fiction – dans « Hamlet » de Shakespeare (1602, acte 5, scène 2). Le sens de ce mot chez Shakespeare est de savoir, courtisans.

Les statistiques sont avant tout une façon de penser, et pour les appliquer, il suffit d’avoir un peu de bon sens et des connaissances en mathématiques de base. McConnell

Sections de statistiques de corrélation inductive descriptive

Caractéristiques statistiques de base Moyenne Mode Arithmétique Médiane de plage

La moyenne arithmétique d'une série de nombres est le quotient de la somme de ces nombres divisé par leur nombre. Le mode est généralement le nombre d'une série qui apparaît le plus fréquemment dans cette série.

La plage est la différence entre les valeurs les plus grandes et les plus petites d'une série de données. La médiane d'une série constituée d'un nombre impair de nombres est le numéro de cette série qui sera au milieu si cette série est ordonnée.

Types d'observation statistique Systématique Statistique (périodique) Unique Continue Continue

N° F.I. Nombre de tâches correctement accomplies 1 Agafonova Lyuda 3 2 Basharov Anlrey 6 3 Guseletov Dima 4 4 Darmaeva Ksenia 4 5 Konevin Vitaly 6 6 Korotkov Volodia 2 7 Krivolapova Masha 5 8 Misyurkeev Aliocha 3 9 Misyurkeev Volodia 3 10 Mineeva Dasha 5 11 Mikhailov A 5 12 Molchan ova Olya 5 13 Molchanov S 6 14 Naumov P 6 15 Popov S 4 16 Postnikova M 4 17 Rekhovskaya Yulia 3 18 Sataeva Nastya 5 19 Terentyeva Tanya 5 20 Ushakova Lena 5 21 Chagdurova Natasha 4 22 Tolstikhin Andrey 1 23 Razuvaev Aliosha 2 Un Gelsky Misha 4 Le résultat du test sur le thème "Résolution de systèmes d'équations linéaires à deux variables"

Considérons la série de nombres 3 6 4 4 6 2 5 3 3 5 5 5 6 6 4 4 3 5 5 5 4 1 2 4

Suite au classement, les séries prendront la forme : 1 ; 2 ; 2 ; 3 ; 3 ; 3 ; 3 ; 4 ; 4 ; 4 ; 4 ; 4 ; 4 5 ; 5 ; 5;5;5;5 6; 6 ; 6 ; 6 ;

Fréquence relative de l'événement Mode 4 Médiane 4 Plage de 1 à 6 Moyenne arithmétique (1+2*2+3*4+4*6+5*4+6*4) :23=4,3

I. Collecte de données : étude de la tâche à accomplir. Définition de concepts significatifs. Sélection de sources d'informations. Collecte d'informations. Analyse des données : les résultats donnés dans le tableau ont été présentés sous forme de diagrammes. II. Regroupement des données. Diviser les données en groupes en fonction des caractéristiques. Construire une table de données. III. Analyse des données. Trouver des caractéristiques statistiques. Généralisation des résultats obtenus. IV. Rapport.

La nécessité d'étudier les mathématiques étude n°1

Quelle matière scolaire préférez-vous ? _________________- Quelle matière scolaire est facile à étudier ? ______________________ Quelle matière est la plus difficile à étudier ? __________________ Combien d'heures par jour passez-vous à cuisiner ? devoirs?_________________________________________________________ Aimez-vous les mathématiques ?___________________________ Avez-vous besoin de mathématiques à l'avenir ? ____________________________ Avez-vous besoin d'aide pour faire vos devoirs dans les matières mathématiques ?__________________________________________________ Comment évaluez-vous vos connaissances en mathématiques ? J'ai la marque ___________________... Je sais sur _______________________..... Je peux sur...________________________ Quelle est, à votre avis, la raison des échecs ou des échecs, s'ils surviennent ________________________________________ __________________________________________________________ Voulez-vous améliorer votre résultats dans les matières du cycle mathématique ?__________________________________________________ _________________________________________________________

Question 1 Quelle matière scolaire aimez-vous le plus ?

Question 2 Quelle matière scolaire est la plus difficile à étudier ?

Question 3 Combien de temps consacrez-vous à faire vos devoirs de mathématiques ?

Question 4 Aimez-vous étudier les mathématiques ?

Avez-vous besoin de mathématiques dans votre futur métier ? Oui -100%

Avez-vous besoin d'aide pour vos devoirs de mathématiques ?

Qui vous aide à le comprendre ? sujet difficile en mathématiques ? Maman -45% Enseignant-35% Manuel -20% Papa-15% Grand-mère10% Sœur-10% Amis-5% Personne-5%

Comment évaluez-vous vos connaissances en mathématiques ?

Voulez-vous faire encore mieux en mathématiques ?

Étude de motivation aux activités éducatives n°3

Type d'activité Quotidienne Plusieurs fois par semaine Le dimanche 1 Je lis des journaux et des magazines 2 Je lis de la fiction 5 Je vais à des soirées de loisirs 6 Je regarde des films 7 Je joue à des jeux jeux de sport 8 S'entraîner travail social 9 Je vais à la chasse et à la pêche

11 Je pratique des activités artistiques amateurs 12 Je fais de la randonnée 13 Je travaille dans le secteur de la radio 14 Je fais de la couture et de l'artisanat 15 J'apprends à jouer du instrument de musique 16 J'écoute de la musique, je prends des notes 17 Je m'intéresse à collectionner 18 Je m'intéresse à la danse, je vais en discothèque 19 J'aime fabriquer quelque chose de mes propres mains 20 Je joue avec des animaux

21 Pendant mon temps libre, j'aide mes parents 22 Je passe mon temps sans but 23 Pendant mon temps libre, je travaille 24 (Si vous êtes occupé avec autre chose pendant votre temps libre, ajoutez-le ici !)

Tous les jours

Plusieurs fois par semaine

Le dimanche

Conclusion : Ainsi, les élèves de notre classe écoutent le plus souvent de la musique tous les jours, aident leurs parents, regardent la télévision ; plusieurs fois par semaine - ils font du sport et font quelque chose avec leurs mains ; le dimanche – lire et jouer sur l'ordinateur, regarder la télévision

Conclusion : Ainsi, en utilisant l'exemple de mes travaux de recherche, vous êtes convaincu que les caractéristiques statistiques et la recherche jouent un rôle important dans nos vies et sont utilisées non seulement en mathématiques, mais aussi dans d'autres branches de la science.

Merci de votre attention

Les statistiques doivent être présentées de manière à pouvoir être utilisées. Il existe 3 formes principales de présentation des données statistiques :

    texte – inclusion de données dans le texte ;

    tabulaire – présentation des données dans des tableaux ;

    graphique – expression des données sous forme de graphiques.

La forme texte est utilisée lorsqu'il existe une petite quantité de données numériques.

La forme tabulaire est la plus souvent utilisée, car elle est plus forme efficace présentation de données statistiques. Contrairement aux tableaux mathématiques, qui conditions initiales permettent d'obtenir l'un ou l'autre résultat, les tableaux statistiques renseignent le langage des nombres sur les objets étudiés.

Tableau statistique est un système de lignes et de colonnes dans lesquelles des informations statistiques sur les phénomènes socio-économiques sont présentées dans un certain ordre et connexion.

Tableau 2. Commerce extérieur de la Fédération de Russie pour 2000 – 2006, en milliards de dollars.

Indicateur

Chiffre d'affaires du commerce extérieur

Balance commerciale

y compris:

avec les pays étrangers

balance commerciale

Par exemple, dans le tableau. 2 présente des informations sur le commerce extérieur de la Russie, qu'il serait inutile d'exprimer sous forme de texte.

Distinguer sujet Et prédicat tableau statistique. Le sujet indique l'objet caractérisé - soit des unités de la population, soit des groupes d'unités, soit la population dans son ensemble. Le prédicat donne les caractéristiques du sujet, généralement sous forme numérique. Requis titre tableau, qui indique à quelle catégorie et à quelle heure appartiennent les données du tableau.

Selon la nature du sujet, les tableaux statistiques sont divisés en simple,groupe Et combinatoire. Au sujet d'un tableau simple, l'objet d'étude n'est pas divisé en groupes, mais soit une liste de toutes les unités de la population est donnée, soit la population dans son ensemble est indiquée (par exemple, tableau 11). Dans le sujet du tableau de groupe, l'objet d'étude est divisé en groupes selon une caractéristique, et le prédicat indique le nombre d'unités dans les groupes (absolu ou pourcentage) et des indicateurs récapitulatifs pour les groupes (par exemple, tableau 4) . Au sujet du tableau combiné, la population est divisée en groupes non pas selon une, mais selon plusieurs caractéristiques (par exemple, tableau 2).

Lors de la construction de tableaux, vous devez être guidé par ce qui suit règles générales.

    Le sujet du tableau est situé dans la partie gauche (moins souvent - supérieure) et le prédicat - dans la partie droite (moins souvent - inférieure).

    Les en-têtes de colonnes contiennent les noms des indicateurs et leurs unités de mesure.

    La ligne récapitulative complète le tableau et se situe à la fin, mais parfois elle est la première : dans ce cas, la mention « y compris » est faite dans la deuxième ligne, et les lignes suivantes contiennent les composantes de la ligne récapitulative.

    Les données numériques sont enregistrées avec le même degré de précision dans chaque colonne, les chiffres des nombres étant placés sous les chiffres et la partie entière séparées par un point décimal.

    Il ne doit pas y avoir de cellules vides dans le tableau : si la donnée est nulle, alors un signe « – » (tiret) est placé ; si les données ne sont pas connues, alors l'entrée « aucune information » est faite ou le signe « … » (points de suspension) est placé. Si la valeur de l'indicateur n'est pas nulle, mais la première chiffre significatif apparaît après le degré de précision accepté, alors un enregistrement de 0,0 est effectué (si, par exemple, un degré de précision de 0,1 a été adopté).

Parfois, les tableaux statistiques sont complétés par des graphiques lorsque le but est de mettre en évidence certaines caractéristiques des données et de les comparer. La forme graphique est la forme la plus efficace de présentation des données du point de vue de leur perception. À l'aide de graphiques, on réalise la visualisation des caractéristiques de la structure, de la dynamique, des interrelations des phénomènes et leur comparaison.

Graphiques statistiques- ce sont des images conventionnelles quantités numériques et leurs relations à travers des lignes, des formes géométriques, des dessins ou des cartes géographiques. La forme graphique facilite la prise en compte des données statistiques, les rend visuelles, expressives et visibles. Cependant, les graphiques ont certaines limites : tout d’abord, un graphique ne peut pas inclure autant de données qu’un tableau ; De plus, le graphique montre toujours des données arrondies - pas exactes, mais approximatives. Ainsi, le graphique sert uniquement à décrire la situation globale et non les détails. Le dernier inconvénient est la complexité du tracé. Il peut être surmonté à l'aide d'un ordinateur personnel (par exemple, le « Diagram Wizard » du package Microsoft Bureau Exceller).

Selon la méthode de construction des graphiques, ils sont divisés en diagrammes,cartogrammes Et diagrammes cartographiques.

La manière la plus courante de représenter graphiquement des données sont les diagrammes, qui sont des types suivants : linéaire, radial, par points, planaire, volumétrique et figuré. Le type de diagrammes dépend du type de données présentées et de la tâche de construction. Dans tous les cas, le graphique doit être accompagné d'un titre - au-dessus ou en dessous du champ du graphique. Le titre indique quel indicateur est affiché, pour quel territoire et pour quelle heure.

Les graphiques linéaires sont utilisés pour représenter des variables quantitatives : caractéristiques des variations de leurs valeurs, dynamique, relations entre variables. La variation des données est analysée à l'aide polygone de distribution,cumule(la courbe « inférieur à ») et ogives(la courbe « plus que »). Le polygone de distribution est abordé dans le sujet 4 (par exemple, Fig. 5.). Pour construire des cumulats, les valeurs de la caractéristique variable sont tracées le long de l'axe des abscisses, et les totaux accumulés de fréquences ou de fréquences (de f 1 jusqu'à ∑ f). Pour construire une ogive, les totaux cumulés des fréquences sont placés sur l'axe des ordonnées dans l'ordre inverse (de ∑ fà f 1 ). Cumuler et ogive selon le tableau. 4. représenté sur la Fig. 1.

Riz. 1. Cumules et ogiva de répartition des marchandises par valeur en douane

L'utilisation de graphiques linéaires dans l'analyse de la dynamique est abordée dans le sujet 5 (par exemple, Fig. 13), et leur utilisation pour analyser les relations est abordée dans le sujet 6 (par exemple, Fig. 21). Le sujet 6 couvre également l'utilisation de nuages ​​de points (par exemple, figure 20).

Les graphiques linéaires sont divisés en unidimensionnel, utilisé pour représenter des données sur une seule variable, et bidimensionnel– sur deux variables. Un exemple de graphique linéaire unidimensionnel est un polygone de distribution, et un graphique bidimensionnel est une ligne de régression (par exemple, Fig. 21).

Parfois, en cas de changements importants dans l'indicateur, ils ont recours à une échelle logarithmique. Par exemple, si les valeurs des indicateurs varient de 1 à 1000, cela peut entraîner des difficultés lors de la construction d'un graphique. Dans de tels cas, on passe aux logarithmes des valeurs de l'indicateur, qui ne différeront pas tellement : LG 1 = 0,LG 1000 = 3.

Parmi planaire Selon la fréquence d'utilisation, on distingue des graphiques à barres (histogrammes), dans lesquels l'indicateur est présenté sous la forme d'une colonne dont la hauteur correspond à la valeur de l'indicateur (par exemple, Fig. 4).

La proportionnalité de l'aire d'une figure géométrique particulière à la valeur de l'indicateur sous-tend d'autres types de diagrammes planaires : triangulaire,carré,rectangulaire. Vous pouvez également utiliser une comparaison des aires d'un cercle - dans ce cas, le rayon du cercle est spécifié.

Graphique en bandes présente des indicateurs sous la forme de rectangles allongés horizontalement, mais ne diffère pas par ailleurs d'un graphique à barres.

Parmi les diagrammes plans, on utilise souvent diagramme circulaire, qui sert à illustrer la structure de la population étudiée. L'ensemble entier est pris à 100%, l'aire totale du cercle lui correspond, les aires des secteurs correspondent à des parties de l'ensemble. Construisons un diagramme sectoriel de la structure du commerce extérieur de la Fédération de Russie en 2006 selon les données du tableau. 2 (voir Fig. 2). Lors de l'utilisation de programmes informatiques, les diagrammes circulaires sont construits sous forme tridimensionnelle, c'est-à-dire non pas sur deux, mais sur trois plans (voir Fig. 3).

Riz. 2. Diagramme circulaire simple Fig. 3. Diagramme circulaire 3D

Les diagrammes figurés (images) améliorent la clarté de l'image, car ils incluent une image de l'indicateur représenté, dont la taille correspond à la taille de l'indicateur.

Lors de la construction d'un graphique, tout est tout aussi important : le choix correct de l'image graphique, des proportions et le respect des règles de conception des graphiques. Ces questions sont traitées plus en détail dans et.

Des cartogrammes et des diagrammes cartographiques sont utilisés pour représenter les caractéristiques géographiques des phénomènes étudiés. Ils montrent la localisation du phénomène étudié, son intensité sur un certain territoire - dans la république, la région, l'économie ou circonscription administrative etc. La construction de cartogrammes et de diagrammes cartographiques est par exemple abordée dans la littérature spécialisée.

§1. Notions de statistique, de régularité statistique et de totalité..... 2

§2. Signes des unités d'une population statistique, leur classification...... 2

§1. Le concept d'observation statistique, sa préparation.................................. 4

§2. Types d'observations statistiques................................................... ...................... ..5

§3. Erreurs d'observation................................................. ........ ...................... 6

§4. Résumé et regroupement................................................................ ......... ................. 6

§5. Espèces regroupements statistiques............................................... 6

§6. Tableaux statistiques................................................................ ..................... 7

§7. Graphiques statistiques................................................................ ............... 8

§1. Réel et distribution théorique............................ 21

§2. Courbe de distribution normale.................................................. .... 21

§3. Test de l'hypothèse de distribution normale.................................. 21

§4. Critères d'accord : Pearson, Romanovsky, Kolmogorov........... 21

§5. Importance pratique série de distribution de modélisation..... 22

§1. Concept observation d'un échantillon. Raisons de son utilisation...... 23

§3. Erreurs d'échantillonnage................................................. ...................... 24

§4. Tâches d'observation sélective................................................................ ...... 25

§5. Extension des données d’observation d’échantillons à population générale... 26

§6. Petit échantillon............................................................ ................... 26

§1. Le concept de corrélation et KRA.................................................. 27

§2. Conditions d’application et restrictions du KRA.................................................. 27

§3. Régression des moindres carrés par paire... 28

§4. Application de l'équation de régression linéaire appariée.......... 29

§6. Corrélation multiple........................................... 32


Thème 1. : Introduction aux statistiques.

  1. notions de statistique, de régularité statistique et de totalité.
  2. caractéristiques des unités d'une population statistique, leur classification.
  3. sujet et méthode des statistiques.

§1. Notions de statistique, de régularité statistique et de totalité.

Le mot statistique vient du latin « statut" en traduction - état, état des lieux.

Le terme statistique est né dans la seconde moitié du XVIIIe siècle. En lien avec la connaissance des États, l'étude de leurs caractéristiques. C'est à cette époque que remonte le début de l'enseignement des statistiques à l'université. Selon la branche de la recherche statistique, on distingue : les statistiques de la population, de l'industrie, de l'agriculture, etc. - statistiques appliquées.

La théorie générale des statistiques est un ensemble de méthodes et de techniques permettant de collecter, traiter, présenter et analyser des données numériques. Le terme statistique est utilisé aujourd’hui dans 3 sens :

  1. comme synonyme du mot « données »
  2. branche de valeurs qui combine les principes et méthodes de travail avec des données numériques caractérisant les phénomènes de masse (l'espérance de vie des hommes est inférieure à celle des femmes)
  3. industrie activités pratiques visant à traiter et analyser des données numériques.

Les statistiques nous permettent d'identifier et de mesurer le modèle de développement des processus et phénomènes socio-économiques, ainsi que les relations entre eux dans des conditions de lieu et de temps spécifiques.

La régularité fait référence à la répétabilité, à la séquence et à l'ordre des changements dans les phénomènes.

La régularité statistique est un modèle dans lequel la nécessité est inextricablement liée au hasard dans chaque phénomène individuel et ne se manifeste comme une loi que dans une multitude de phénomènes. Le concept de régularité statistique s'oppose au concept de régularité dynamique manifesté dans tout phénomène. (exemple : S cercle =pr 2 que > r le > S cercle). L'objet de la recherche statistique est un agrégat statistique - un ensemble d'unités possédant une masse, une homogénéité, déterminées par l'intégrité et la présence de variation. Chaque élément individuel est appelé unité statistique de population (ESS)

§2. Signes des unités d'une population statistique, leur classification.

Les CEC ont certaines propriétés appelées traits. La statistique étudie les phénomènes à travers leurs caractéristiques ; plus la population est homogène, plus caractéristiques communes ont ses unités et moins les valeurs de ces caractéristiques varient.

Un attribut descriptif est un attribut qui ne peut être exprimé que verbalement.

  1. Une caractéristique quantitative est une caractéristique qui peut être exprimée numériquement.
  2. Un attribut direct est une propriété directement inhérente à un objet caractéristique.
  3. Une caractéristique indirecte concerne les propriétés non pas de l'objet caractérisé lui-même, mais de l'objet qui lui est associé ou inclus.
  4. La caractéristique principale est une valeur absolue mesurable.
  5. une caractéristique secondaire est le résultat d’une comparaison de caractéristiques primaires ; elle est mesurée directement.
  6. signe naturel - mesuré en morceaux, kg, tonnes, litres, etc.
  7. attribut de travail - mesuré en jours-homme, heures-homme.
  8. indicateur de coût - mesuré en roubles, $, €, ₤.
  9. caractéristique sans dimension – mesure en fractions, %
  10. L'attribut alternatif est un attribut qui ne prend qu'une seule valeur parmi plusieurs valeurs possibles.
  11. attribut discret – accepte uniquement une valeur entière, sans valeur intermédiaire.
  12. attribut continu – un attribut qui prend toutes les valeurs dans une certaine plage.
  13. la caractéristique factorielle est une caractéristique sous l'influence de laquelle une autre caractéristique change.
  14. signe effectif - un signe qui change sous le signe d'un autre
  15. caractéristique momentanée – une caractéristique mesurée à un moment donné.
  16. signe d'intervalle – un signe pour un certain intervalle de temps.

Une même caractéristique peut être classée simultanément dans différentes classifications.

§3. Objet et méthode des statistiques.

Le sujet de la recherche statistique concerne les agrégats statistiques - un ensemble d'objets variables de qualité unique.

Les spécificités du sujet des statistiques déterminent les spécificités de la méthode, elles comprennent :

  1. collecte de données (observation statistique, publication)
  2. généralisation des données (résumé, regroupement)
  3. présentation des données (tableaux et graphiques)
  4. analyse et interprétation de données numériques (calcul de moyennes, analyse de variation, KRA, séries temporelles, indices)

thème 2 : Organisation de l'observation statistique.

Synthèse et regroupement des données.

§1. Le concept d'observation statistique, sa préparation.

§2. Types d'observation statistique.

§3 Erreurs d'observation.

§4 Résumé et regroupement

§5 Types de regroupements statistiques.

§6 Tableaux statistiques.

§7 Graphiques statistiques.

§1. Le concept d'observation statistique, sa préparation.

Toute étude statistique commence par la collecte de données.

Sources d'informations :

  1. diverses publications (journaux, magazines, etc.)
  2. la principale source d'informations statistiques publiées sont les publications des organismes statistiques de l'État (maison d'édition « RF en 2001 » GOSKOMSTAT).
  3. effectuer une observation statistique, c'est-à-dire collecte de données scientifiquement organisée.

L'observation statistique est une observation massive, planifiée et scientifiquement organisée du phénomène de la société et vie économique, qui consiste à enregistrer les caractéristiques de chaque unité de la population étudiée.

Processus d'observation :

  1. Préparation à l'observation
  2. Réaliser une collecte de données de masse
  3. Préparation des données pour le traitement
  4. Élaboration de propositions pour améliorer l'observation statistique.

Préparation des observations :

  1. Déterminer le but et l'objet de l'observation
  2. Détermination de la composition des caractéristiques à enregistrer
  3. Élaboration de documents pour la collecte de données
  4. Sélection de l'unité déclarante et de l'unité par rapport à laquelle l'observation sera effectuée.
  5. Il est nécessaire de déterminer les méthodes et moyens d’obtention des données.

Les problèmes d'organisation doivent être résolus :

  1. il est nécessaire de déterminer la composition des services menant la recherche
  2. instruire le personnel
  3. dresser plan de calendrier travail
  4. répliquer des documents pour collecter des données

L'objet d'observation sont les phénomènes et processus socio-économiques.

Il est nécessaire d’identifier clairement les caractéristiques pour l’enregistrement.

Programme d'observation – une liste de signes à enregistrer pendant le processus d'observation.

Exigences du programme d'observation :

  1. Le programme doit contenir des caractéristiques essentielles qui caractérisent directement le phénomène étudié ; le programme ne doit pas inclure de caractéristiques présentant des phénomènes secondaires ou des caractéristiques dont les valeurs seront manifestement peu fiables ou seront complètement absentes.
  2. Les questions du programme d’observation doivent être précises, sans ambiguïté et faciles à comprendre pour éviter les difficultés à obtenir des réponses.
  3. L'ordre des questions doit être déterminé.
  4. Le programme d'observation doit inclure des questions de nature directe pour conduire et clarifier les données collectées.
  5. Pour assurer l'homogénéité des informations reçues, le programme est établi sous la forme d'un document appelé fiche statistique.

Un formulaire statistique est un document d'un échantillon unique contenant le programme et les résultats d'observation.

Il existe des formulaires individuels (réponses aux questions pour une unité d'observation) et des formulaires radiés (informations pour plusieurs unités de la population statistique).

Le formulaire et les instructions pour le remplir sont des outils d'observation statistique.

Le choix de l'heure d'observation implique de résoudre deux problèmes : établir une date ou un intervalle critique et déterminer la période d'observation.

La date critique est un jour précis de l'année, heure de la journée à partir de laquelle les signes doivent être enregistrés pour chaque unité de la population étudiée.

Période d'observation – la période pendant laquelle les formulaires statistiques sont remplis, c'est-à-dire temps nécessaire à la collecte des données.

Il convient de garder à l'esprit que l'éloignement de la période d'observation de la date ou de l'intervalle critique peut entraîner une diminution de la fiabilité des informations obtenues.

§2. Types d'observation statistique.

DANS statistiques nationales Trois formes d'observations statistiques sont utilisées.

  1. rapports statistiques des entreprises, organisations, institutions.
  2. observation statistique spécialement organisée (recensement, etc.)
  3. registre – une forme de surveillance statistique continue des processus à long terme

L'observation statistique est classée :

Par heure d’observation :

  • surveillance actuelle – un enregistrement continu des signes (bureau d'état civil, délinquance, etc.) est effectué.
  • observation périodique - réalisée à certains intervalles (niveau de vie dans la ville de Tcheliabinsk, coût du panier de consommation, recensement de la population).
  • Unique – observation effectuée une fois dans un but précis.

Par couverture des unités de population :

  • Surveillance continue - des informations doivent être obtenues sur tous les ESN
  • Pas une observation complète :
    • La méthode du tableau principal - les unités les plus importantes de la population étudiée sont examinées (étude d'une entreprise de construction mécanique dans la région de Tcheliabinsk).
    • Observation d'un échantillon – sélection aléatoire des ESN à observer.
    • Surveillance monographique - où une ASE est observée, souvent utilisée pour concevoir un programme de surveillance de masse.

Par méthode de collecte de données :

  • Observation directe - les greffiers eux-mêmes, par mesure et pesée directes, établissent le fait du sujet à enregistrer (un enfant de moins de 1 an à la clinique).
  • Observation documentaire – divers documents sont utilisés (établissement d'une déclaration)

Enquête - informations nécessaires obtenu à partir des propos de l’intimé.

  • Enquête d'expédition - réalisée par des travailleurs spécialement formés qui obtiennent les informations nécessaires sur la base d'une enquête auprès des personnes concernées et enregistrent eux-mêmes les réponses dans un formulaire. Une enquête d'expédition peut être directe (face à face) ou indirecte (enquête téléphonique)
  • Enquête auprès des correspondants - les informations sont fournies par une équipe de correspondants bénévoles, cette méthode nécessite de petits coûts financiers, mais ne fournit pas valeur exacte observation permanente.
  • Auto-inscription - les formulaires sont remplis par les répondants eux-mêmes, et les bureaux d'enregistrement leur distribuent uniquement des formulaires de questionnaire et expliquent comment les remplir.

§3. Erreurs d'observation

La principale exigence appliquée à l’observation statistique est l’exactitude.

L'exactitude est le degré auquel tout indicateur d'une caractéristique correspond à la valeur réelle déterminée à partir de matériaux d'observation statistique.

L'écart entre les valeurs calculées et valeur réelle appelées erreurs d'observation, selon les causes d'apparition, on les distingue : les erreurs d'enregistrement et les erreurs de représentativité. Les erreurs d'enregistrement sont divisées en aléatoires et systématiques.

Erreurs aléatoires - le résultat des actions de facteurs aléatoires (les lignes et les colonnes sont mélangées)

Les erreurs systématiques ont toujours tendance à surestimer ou à sous-estimer l’indicateur. (âge)

Les erreurs de représentativité sont caractéristiques d'une observation incomplète et résultent d'une reproduction inexacte de l'échantillon de l'ensemble de la population d'origine.

Après avoir reçu les formulaires statistiques vous devez :

  1. vérifier l'exhaustivité des données collectées.
  2. effectuer un contrôle arithmétique basé sur la communication divers signes entre eux.
  3. effectuer un contrôle logique basé sur la connaissance des connexions logiques entre les fonctionnalités.

§4. Résumé et regroupement

Sur la base des données collectées, il est impossible de faire des calculs et de tirer des conclusions ; il faut d'abord les résumer et les regrouper dans un seul tableau. Le résumé et le regroupement répondent à ces objectifs.

Le résumé est un complexe d'opérations séquentielles visant à résumer des faits individuels spécifiques qui forment un ensemble et à identifier les caractéristiques et les modèles typiques inhérents au phénomène étudié dans son ensemble.

Vodka simple - calcul des totaux totaux pour la totalité.

Un résumé complexe est un ensemble d'opérations permettant de regrouper des observations individuelles, de calculer les résultats pour chaque groupe et pour l'ensemble de l'objet dans son ensemble, et de présenter les résultats sous forme de tableaux statistiques.

Selon la forme de traitement matériel, la synthèse peut être décentralisée, centralisée - une telle synthèse est réalisée lors d'une observation statistique ponctuelle.

Le regroupement est la division de nombreuses unités de la population étudiée en groupes selon certaines caractéristiques.

§5. Types de regroupements statistiques

Les regroupements peuvent être classés par structure et contenu.

Le regroupement analytique caractérise la relation entre des caractéristiques dont l'une est factorielle et l'autre efficace.

éducation

Un enseignement supérieur inachevé

§6. Tableaux statistiques

Les résultats de la synthèse et du regroupement doivent être présentés de manière à pouvoir être exploités.

Il existe 3 façons de présenter les données :

  1. des données peuvent être incluses dans le texte.
  2. présentation en tableaux.
  3. méthode graphique

Un tableau statistique est un système de lignes et de colonnes dans lequel des informations statistiques sur les phénomènes socio-économiques sont présentées dans un certain ordre.

Une distinction est faite entre le sujet et le prédicat du tableau.

Le sujet est un objet caractérisé par des nombres, généralement le sujet est indiqué sur le côté gauche du tableau.

Un prédicat est un système d'indicateurs par lequel un objet est caractérisé.

Le tableau statistique contient 3 types de rubriques : générale, latérale

Le titre général doit refléter le contenu de l’ensemble du tableau et doit être situé au-dessus du tableau, au centre.

Règle de compilation des tableaux.

  1. Les trois types de titres sont requis sans abréviations de mots ; des unités de mesure générales peuvent être incluses dans le titre.
  2. le tableau ne doit pas contenir de lignes supplémentaires ; il ne doit y avoir aucune marque verticale.
  3. La ligne totale est obligatoire. Cela peut être au début ou à la fin du document. Si au début du document alors si à la fin alors TOTAL :
  1. les données numériques dans une colonne sont enregistrées avec le même degré de précision. Les catégories sont écrites strictement sous les catégories, partie entière séparés par une virgule.
  2. il ne doit pas y avoir de cellules vides dans le tableau ; s'il n'y a pas de données, écrivez « Aucune information » ou « … », si les données sont nulles, alors « - ». Si la valeur n'est pas nulle mais que le premier chiffre significatif apparaît après la précision spécifiée 0,01®0,0 – si la précision acceptée va jusqu'au dixième.
  3. s'il y a plusieurs colonnes dans le tableau, alors les colonnes sujet sont indiquées en majuscules, et les graphiques du prédicat sont des nombres.
  4. si le tableau est basé sur des données empruntées, alors la source des données est indiquée sous le tableau si nécessaire, le tableau peut être accompagné de notes ;

§7. Graphiques statistiques

Les tableaux statistiques peuvent être complétés par des graphiques.

Les graphiques statistiques sont des images conventionnelles de valeurs numériques et de leurs relations à l'aide de lignes, formes géométriques, dessins.

Avantages de l'image graphique

  1. clairement, observablement, expressivement.
  2. les limites de changement de l'indicateur, le taux comparatif de changement et de variabilité sont immédiatement visibles

Inconvénients des images graphiques

  1. Comprend moins de données que dans le tableau.
  2. le graphique montre des données arrondies, situation générale, mais pas les détails.

Graphiques statistiques

Diagrammes

Bouclé

Thème 3 : Indicateurs statistiques.

§1. L'essence et la signification d'un indicateur statistique, ses attributs.

§2. Classification des indicateurs statistiques.

§3. Types d'indicateurs relatifs. Principes de construction.

§4. Systèmes d'indicateurs statistiques.

Un signe statistique est une propriété inhérente à l'ESS ; il existe objectivement selon qu'il est étudié comme science ou non.

Un indicateur statistique est une caractéristique généralisatrice de toute propriété d'une population.

La structure de l'indicateur statistique (ses attributs) :

  • Valeurs moyennes
  • Indicateurs de variations
  • Indicateurs de connexion des panneaux
  • Indicateurs de la structure et de la nature de la distribution
  • Indicateurs de dynamique
  • Indicateurs de fluctuation
  • Indicateurs d'exactitude et de fiabilité des estimations par échantillon
  • Indicateurs d'exactitude et de fiabilité des prévisions

Par apparence: le nombre total d'unités ou la propriété totale d'un objet. Il s'agit de la somme des caractéristiques primaires, mesurées en pcs., kg, m, $, etc.

Indicateur relatif– obtenu en comparant des indicateurs absolus ou relatifs dans l’espace, le temps ou en comparant des indicateurs différentes propriétés l'objet étudié.

Un indicateur relatif du 1er ordre est obtenu en comparant 2 indicateurs absolus. L'indicateur relatif du 2ème ordre est obtenu en comparant les indicateurs relatifs du 1er ordre, etc.

Les indicateurs relatifs du 3ème ordre et plus sont très rares.

Les indicateurs directs sont des indicateurs dont la valeur augmente avec l'augmentation du phénomène étudié.

Les indicateurs inverses sont des indicateurs dont la valeur diminue avec l'augmentation du phénomène étudié.

...structures

...haut-parleurs

…relations

...intensité

...attitude envers la norme

...comparaisons

Indicateurs de structure s’obtiennent en reliant la partie au tout.

Indicateurs de dynamique relative

ü Indicateurs de dynamique (taux de croissance, incréments)

ü Indices

Indicateurs relationnels caractériser les relations entre les caractéristiques :

ü Coefficient de corrélation

ü Indices analytiques

Indicateurs d'intensité caractériser la relation entre deux objets selon des caractéristiques différentes.

ü Intensité du travail - le temps nécessaire pour produire une unité de produit

ü Production – la quantité de produits fabriqués par unité de temps

SORTIE = 1/intensité de travail

Indicateurs d'attitude envers la norme– le rapport entre les valeurs réelles de l'attribut indicateur et celles normatives, planifiées et optimales.

Indicateurs de comparaison – comparaison différents objets selon un signe.

Principes généraux de construction d'indicateurs statistiques :

  1. les indicateurs statistiques sont objectivement liés.
  2. Les indicateurs comparés ne peuvent différer que par un seul attribut ; un indicateur ne peut pas être comparé par deux ou plusieurs attributs.
  3. il faut connaître et prendre en compte les limites de l'indicateur.

Pour chaque caractéristique d'un objet, un système d'indicateurs statistiques est requis.

  1. fonction cognitive – basée sur l’analyse des données
  2. propagande
  3. fonction stimulante

Thème 4 : Moyennes

§1. notion de valeur moyenne

§2. types de moyennes

§3. moyenne arithmétique et ses propriétés

§4. moyenne harmonique, moyenne géométrique, moyenne quadratique.

§5. moyenne multivariée

La forme de statistique la plus courante est la moyenne.

La propriété la plus importante de la moyenne est qu'elle reflète ce qui est commun à chaque unité de la population étudiée, bien que la valeur des caractéristiques des unités individuelles de la population puisse fluctuer dans un sens ou dans l'autre.

La typicité de la moyenne est directement liée à l'homogénéité de la population étudiée. Dans le cas d'une population non homogène, il faut la diviser en groupes qualitativement homogènes et calculer la moyenne pour chacun des groupes homogènes.

La moyenne peut être déterminée grâce au rapport moyen initial (ARR) et à sa formule logique.

Moyennes structurelles

Mode – Mo

Médiane – Moi

Dans la série dynamique, la moyenne arithmétique et la moyenne chronologique sont calculées.

Moyenne arithmétique La valeur moyenne d'une caractéristique est appelée lorsque le calcul du volume total de la caractéristique ne change pas.

Exemple : le poids.

Épouser. nombre premier arithmétique

x je– valeur individuelle de l'attribut

n – nombre total population étudiée

Épouser arithmétique pondéré

Propriétés cf. arithmétique.

La somme des écarts des valeurs individuelles d'une caractéristique par rapport à sa valeur moyenne est nulle

Si chaque valeur individuelle d'une caractéristique est multipliée ou divisée par le même nombre constant, alors la moyenne augmentera ou diminuera du même montant.

si le même nombre constant est ajouté à chaque valeur individuelle de l'attribut, alors la valeur moyenne changera en conséquence pour le même nombre.

Preuve

si les poids f de la moyenne pondérée sont multipliés ou divisés par le même nombre, alors la moyenne ne changera pas.

la somme des carrés des écarts d'une caractéristique est inférieure à celle de tout autre nombre.

Autres types de supports

Vue du milieu

Moyenne simple

Moyenne pondérée

harmonique

géométrique

Quadratique

Il est très difficile de caractériser un groupe par une seule caractéristique et peu d’informations restent en mémoire.

Moyenne multivariée – la valeur moyenne de plusieurs caractéristiques de l'E.S.S.

À partir des relations de valeurs d'attribut pour E.S. aux valeurs moyennes de ces caractéristiques.

Moyenne multivariée pour je unités

x je– valeur de l'attribut j pour i unité

Valeur moyenne de la caractéristique j

k – nombre de fonctionnalités

j – le numéro de l’entité et le nombre de sa population

Sujet 5 : Analyse des variations

§1. Variation des signes et ses causes

§2. Série de distribution

§3. Caractéristiques structurelles série de variations.

§4. Indicateurs de la force de la variation.

§5. Indicateurs d'intensité de variation

§6. types de dispersion. Règle d'addition des écarts.

Une variation de la valeur d'une caractéristique dans un agrégat est la différence de ses valeurs entre différentes unités d'un agrégat donné à la même période ou au même moment.

Raison de la variation : conditions différentes En l’existence du SSE, c’est la variation qui crée le besoin d’une science telle que la statistique.

Réalisation analyse des variations commence par la construction d'une série de variations - une répartition ordonnée des unités de population selon des caractéristiques croissantes ou décroissantes et en comptant les fréquences correspondantes.

Série de distribution

ü classé

ü discret

ü intervalle

Série de variations classées– liste des unités individuelles. agrégats par ordre croissant et décroissant de la caractéristique classée

Séries à variations discrètes – un tableau composé de 2 lignes – valeurs de polymère d'une caractéristique variable et le nombre d'unités avec une valeur caractéristique donnée.

Une série de variations d'intervalles est construite dans les cas suivants :

  1. signe accepte valeurs discrètes, mais leur nombre est trop grand
  2. l'attribut accepte toutes les valeurs dans une certaine plage

Lors de la construction d'une série de variations d'intervalles, il est nécessaire de sélectionner le nombre optimal de groupes, la méthode la plus courante utilisant la formule de Sturgess

k – nombre d'intervalles

n – volume de population

Lors du calcul, vous obtenez presque toujours valeurs fractionnaires, en arrondissant au nombre entier le plus proche.

Durée de l'intervalle – je

Types d'intervalles

la limite inférieure de l'intervalle suivant répète la limite supérieure de l'intervalle suivant

intervalle ouvert, intervalle avec une bordure

Lors du calcul à l’aide d’une série de variations d’intervalle, le milieu de l’intervalle est pris comme xi.

N ME =60 médiane = 1

Cumule – distribution inférieure à

Ogiva – distribution de plus de

La médiane est la valeur d'une caractéristique divisant l'ensemble de la population en deux parties égales.

Pour une série à variation discrète, calcul de la médiane : si n pair, alors No. Me est la médiane de l'unité

Série de variations d'intervalle :

k – nombre d'intervalles

x 0 – limite inférieure de l'intervalle médian

je– longueur de l’intervalle médian

Somme des fréquences

La fréquence cumulée de l'intervalle précédant la médiane.

Fréquence médiane de l'intervalle

Intervalle médian– le premier intervalle dont la fréquence cumulée dépasse la moitié de la somme totale des fréquences.

Graphiquement, la médiane se trouve par cumul.

  1. Les quartiles sont la valeur d'une caractéristique qui divise la population en 4 parties égales.

1er quartile

3ème quartile

2e quartile – médiane.

xQ 1 x Q 3 – limite inférieure de l'intervalle contenant les 1er et 3e quartiles.

l – longueur de l'intervalle

et - les fréquences cumulées des intervalles des intervalles précédents contenant les 1er et 3ème quartiles.

Fréquences des intervalles quartiles.

Pour caractériser la série de variations, les éléments suivants sont utilisés :

Déciles - divisent la population en 10 parties égales, Percytiles - divisent la population en 100 parties égales.

  1. La mode est une caractéristique fréquente d’un trait. Pour une série à variations discrètes – fréquence la plus élevée. Pour une série de variations d'intervalles, le mode est calculé à l'aide de la formule suivante :

Limite inférieure de l'intervalle modal

je– longueur de l’intervalle modal

fMo – fréquence de l'intervalle modal

f Mo +1 – fréquence de l'intervalle suivant le modal

L'intervalle modal est l'intervalle avec la fréquence la plus élevée. Graphiquement, le mode se retrouve dans l'histogramme.

  1. Plage de variation
  2. Déviation linéaire moyenne

Pondéré

  1. Dispersion:

Pondéré

  1. Écart type

Propriété de dispersion.

  1. diminuer toutes les valeurs d'une caractéristique du même montant ne modifie pas le degré de dispersion.
  2. Réduire toutes les valeurs de caractéristiques d'un facteur k réduit la quantité de variance dans à 2 temps et écart type en À une fois
  3. si vous calculez le carré moyen des écarts à partir de toute valeur A qui diffère de la moyenne arithmétique, alors il sera toujours supérieur au carré moyen des écarts calculé à partir de la moyenne arithmétique. Ainsi, la moyenne est toujours inférieure à celle calculée à partir de toute autre valeur, c'est-à-dire il a la propriété de minimalité. Écart type = 1,25 - avec des distributions proches de la normale.

Dans des conditions de distribution normales, il existe la relation suivante entre et le nombre d'observations, 68,3 % des observations sont dans les limites.

95,4% des observations sont dans les limites

99,7% des observations sont dans les limites

Pour comparer la variation des traits dans différentes populations ou pour comparer la variation différents signes utilisé dans un ensemble indicateurs relatifs, la moyenne arithmétique sert de base.

  1. Plage de variation relative.
  2. Déviation linéaire relative
  3. Coefficient de variation

Ces indicateurs fournissent non seulement une évaluation comparative mais constituent également l'homogénéité de la population. La population est considérée comme homogène si le coefficient de variation ne dépasse pas 33 %.

En plus d'étudier la variation d'une caractéristique au sein de la population dans son ensemble, il est souvent nécessaire de retracer les changements quantitatifs de la caractéristique, mais plutôt jusqu'aux groupes dans lesquels la population est divisée et entre eux. Ceci est réalisé en calculant différents types.

Types de dispersion :

  1. Écart total
  2. Variance intergroupe
  3. Variance intra-groupe (résiduelle)

1. mesure la variation d'un trait dans sa totalité sous l'influence de tous les facteurs qui déterminent cette variation

Exemple: consommation de yaourt : échantillon de 100 personnes

Statut social

x i – valeur individuelle de l'attribut

Valeur moyenne de la caractéristique pour l'ensemble de la population

Fréquence de ce signe.

  1. 2. caractérise la variation d'un trait sous l'influence du trait du facteur sous-jacent au regroupement.

Moyenne du groupe

Moyenne globale du groupe

Fréquence par groupe

  1. 3. caractérise la variation d'un trait sous l'influence de facteurs non inclus dans le groupe

x jei valeur de la caractéristique dans le groupe j

Valeur moyenne de la caractéristique en j groupe

f ij – fréquencei-ème fonctionnalité dansgroupe j

Il existe une règle qui relie 3 types de variance, on l'appelle la règle d'ajout de variance.

Écart résiduel par j groupe

Somme des fréquences par j groupe

n– somme totale des fréquences

La tâche principale de l'analyse des séries de variations est d'identifier les modèles de distribution de fréquence.

La courbe de distribution est une représentation graphique sous la forme d'une ligne continue de changements de fréquences dans une série de variations dans un changement fonctionnellement lié de la valeur d'une caractéristique.

Une courbe de distribution peut être construite à l'aide d'un polygone et d'un histogramme. Il est conseillé de réduire la distribution empirique à une distribution théorique, à l'un des types bien étudiés.

Courbe de distribution normale.

Il existe les types de courbes de distribution suivants :

  1. sommet unique
  2. de nombreux sommets

Les populations homogènes sont caractérisées par des courbes à un seul sommet ; une courbe à plusieurs sommets indique l'hétérogénéité de la population et la nécessité de se regrouper.

Découvrir général La distribution consiste à évaluer son homogénéité et à calculer l'asymétrie et l'aplatissement. Pour les distributions symétriques

Pour une étude comparative de l'asymétrie de différentes distributions, le coefficient d'asymétrie As est calculé.

Moment central de troisième ordre ; - RMS au cube ;

Si, alors l'asymétrie est significative

Si comme<0, то As – левосторонняя, если As>0, alors As est droitier.

Si, alors As est insignifiant. Pour les symétriques et modérément asymétriques, l'indicateur d'aplatissement est calculé : si E k >0, alors la distribution atteint un sommet, si E k<0, то распределение плосковершинное.

La variation d'un trait alternatif se manifeste quantitativement comme suit.

0 – unités qui n'ont pas cette caractéristique ;

1 – unités présentant cette caractéristique ;

r– la proportion d'unités possédant cette caractéristique ;

q– la proportion d'unités ne présentant pas cette caractéristique ;

Alors p+q=1.

Un signe alternatif prend 2 valeurs 0 et 1 avec des poids p Et q.

Signes directs– ce sont des signes dont l’ampleur augmente avec l’augmentation du phénomène étudié.

Signes inversés - des signes dont l'ampleur diminue avec l'augmentation du phénomène étudié.

Sortie (directe)

Intensité du travail (inverse)

L'écart de partage maximum est de 0,25.

Thème 6 : Modélisation des séries de distribution.

§1. Distribution réelle et théorique

§2. Courbe de distribution normale.

§3. Tester l'hypothèse de distribution normale.

§4. Critères d’adéquation : Pearson, Romanovsky, Kolmogorov.

§5. Importance pratique de la modélisation des séries de distribution.

§1. Distribution réelle et théorique

L'un des objectifs les plus importants de l'étude des séries de distribution est d'identifier le modèle de distribution et de déterminer sa nature. Les schémas de répartition ne se manifestent le plus clairement qu'avec un grand nombre d'observations.

La distribution réelle peut être représentée graphiquement à l'aide d'une courbe de distribution - représentée graphiquement comme une ligne continue de changements de fréquences dans la série de variations d'une variante fonctionnellement associée au changement.

Une courbe de distribution théorique s'entend comme une courbe d'un type de distribution donné sous une forme générale qui exclut l'influence de facteurs aléatoires par rapport au modèle.

La distribution théorique peut être exprimée par une formule analytique appelée formule analytique. La plus courante est la distribution normale.

§2. Courbe de distribution normale.

Loi de distribution normale :

y – ordonnée de la distribution normale

t – écart normalisé.

; e = 2,7218 ; x je – options de plage de variation ; - moyenne;

Propriétés:

La fonction de distribution normale est paire, c'est-à-dire f(t)=f(-t), . La fonction de distribution normale est entièrement déterminée par l’écart type.

§3. Tester l'hypothèse de distribution normale.

La raison pour laquelle on fait fréquemment référence à la loi de distribution est que la dépendance résulte de l’action de nombreuses causes aléatoires, dont aucune n’est prédominante. Si Mo=Me a été calculé dans une série de variations, cela peut indiquer une proximité avec une distribution normale. La vérification la plus précise du respect du droit commun s'effectue à l'aide de critères particuliers.

§4. Critères d’adéquation : Pearson, Romanovsky, Kolmogorov.

Critère de Pearson.

Fréquence théorique

Fréquence empirique

Méthodologie de calcul des fréquences théoriques.

  1. La moyenne arithmétique est déterminée par la série de variations d'intervalle et t est calculé pour chaque intervalle.
  2. On retrouve la valeur de la densité de probabilité pour la loi de distribution normalisée. PAGE 49
  3. Trouver la fréquence théorique.

l – longueur de l'intervalle

- somme des fréquences empiriques

- densité de probabilité

arrondir la valeur à des nombres entiers

  1. Calcul du coefficient de Pearson
  2. valeur du tableau

d.f. – nombre d'intervalles – 3

d.f. – nombre de degrés de liberté.

  1. si > , alors la distribution n'est pas normale, c'est-à-dire l'hypothèse de distribution normale est annulée. Si< , то распределение является нормальным.

Critère Romanovsky.

Le test de Pearson est calculé ;

Nombre de diplômes.

Si C<3, то распределение близко к нормальному.

Critère de Kolmogorov

, D - la valeur maximale entre les fréquences empiriques et théoriques accumulées. Une condition nécessaire pour utiliser Kolmogorov : Le nombre d'observations est supérieur à 100. Utiliser un tableau de probabilité spécial avec lequel on peut affirmer que cette distribution est normale.

§5. Importance pratique de la modélisation des séries de distribution.

  1. la capacité d'appliquer les lois de la distribution normale à la distribution empirique.
  2. possibilité d'utiliser la règle des 3 sigma.
  3. La possibilité d'éviter des calculs supplémentaires, longs et coûteux, sachant grâce à l'étude de la population que la distribution est normale.

Thème 7 : Observation sélective.

§1. Le concept d'observation sélective. Raisons de son utilisation.

§2. Types d'observation sélective.

§3. Erreurs d'observation sélective.

§4. Tâches d'observation d'échantillons

§5. Extension des données d'observation d'échantillons à la population générale.

§6. Petit échantillon.

§1. Le concept d'observation sélective. Raisons de son utilisation.

Observation sélective - une observation discontinue dans laquelle des unités de la population étudiée, sélectionnées d'une certaine manière, sont soumises à un examen statistique.

Le but (tâche) de l'observation par sondage : caractériser l'ensemble de la population d'unités pour la partie enquêtée, sous réserve de toutes les règles et principes de l'observation statistique.

Raisons d’utiliser l’observation d’échantillons :

  1. économiser du matériel, des coûts de main-d'œuvre et du temps ;
  2. la possibilité d'étudier les unités individuelles de la population statistique et leurs groupes de manière plus détaillée et plus détaillée.
  3. Certains problèmes spécifiques ne peuvent être résolus que par une observation sélective.
  4. une observation sélective compétente et bien organisée donne des résultats très précis.

La population générale est un ensemble d'unités à partir desquelles une sélection est effectuée.

Population échantillon – un ensemble d’unités sélectionnées pour l’enquête. En statistique, il est d'usage de faire la distinction entre les paramètres de la population générale et de la population échantillon.

Types d'observation d'échantillons

Par méthode de sélection :

Répété

L'unité incluse dans l'échantillon, après avoir enregistré les caractéristiques observées, est renvoyée dans la population générale pour participer à la procédure de sélection ultérieure.

La taille de la population générale reste inchangée, ce qui détermine l'inclusion constante de toute unité dans l'échantillon.

Sans répétition

Une unité incluse dans l'échantillon n'est pas restituée à la population à partir de laquelle la sélection a lieu.

Par méthode de sélection :

Correctement aléatoire consiste par rapport à des unités de la population générale au hasard ou au hasard sans aucun élément de cohérence. Cependant, avant de réaliser un tel échantillon, vous devez vous assurer que toutes les unités de la population ont des chances égales d'être incluses dans l'échantillon, c'est-à-dire dans la liste complète des unités de la population statistique, il n'y a aucune omission ou négligence d'unités individuelles. Il est également nécessaire d’établir clairement les limites de la population. Techniquement, la sélection s'effectue par tirage au sort ou à l'aide d'une table de nombres aléatoires.

Échantillonnage mécanique (tous les 5 sur la liste) est utilisé dans les cas où la population est ordonnée d'une manière ou d'une autre, c'est-à-dire il existe une certaine séquence dans la répartition des parts. Lors de l'échantillonnage mécanique, la proportion de sélection est établie, qui est établie par le rapport entre la population générale et la population échantillonnée.

Le risque d'erreur lors de l'échantillonnage mécanique peut survenir en raison : d'une coïncidence aléatoire de l'intervalle sélectionné et de modèles cycliques dans la disposition des unités dans la population générale.

Échantillon zoné est utilisé lorsque toutes les unités de la population générale peuvent être divisées en groupes (régions, pays) selon certains critères.

Échantillonnage combiné.

La sélection des unités peut se faire :

  1. ou proportionnellement à la taille du groupe
  2. ou proportionnellement à la différenciation intragroupe du trait
  3. , où n est le volume de la population échantillon, N est le volume de la population générale, n je taille de l'échantillon je-groupes, N je volume je des échantillons.
  4. - cette méthode est plus précise, mais lors de l'échantillonnage il est très difficile de déterminer à l'avance la variation. (avant la manifestation de l'observation).

Sélection en série.

Il est utilisé lorsque les ECC sont regroupés en petits groupes (séries), par exemple des emballages de produits finis, des groupes d'étudiants. L'essence de l'échantillonnage en série est que les séries sont sélectionnées de manière purement aléatoire ou mécanique, puis qu'une enquête continue est réalisée au sein de la série sélectionnée.

Sélection combinée.

Il s'agit d'une combinaison des méthodes de sélection décrites ci-dessus, le plus souvent une combinaison de séries typiques et en série est utilisée, c'est-à-dire sélection de séries parmi plusieurs groupes typiques.

La sélection peut également être en plusieurs étapes et en une seule étape, en plusieurs phrases et en une seule phrase.

Sélection en plusieurs étapes : De la population générale, les groupes les plus grands sont d'abord extraits, puis les plus petits, et ainsi de suite jusqu'à ce que les unités soumises à l'enquête soient sélectionnées.

Sélection multi-phrases : implique de maintenir la même cellule de sélection à toutes les étapes de sa mise en œuvre. Parallèlement, les unités de sélection retenues à chaque étape ultérieure sont soumises à un examen dont le programme est élargi (Exemple : étudiants de l'ensemble de l'institut, puis étudiants de certaines facultés).

§3. Erreurs d'observation sélective.

Systématique

Les erreurs de représentativité ne surviennent qu'avec une observation sélective. Ils surviennent du fait que la population échantillonnée ne peut pas reproduire exactement la population générale. Ils ne peuvent être évités, mais ils sont facilement prévisibles et, si nécessaire, peuvent être minimisés.

L'erreur d'échantillonnage est la différence entre la valeur d'un paramètre dans la population et sa valeur calculée à partir des résultats d'une observation d'échantillon. Dх=-m+, Dх – erreur maximale dans l'échantillon, m – moyenne générale; - moyenne de l'échantillon.

L'erreur d'échantillonnage maximale est une valeur aléatoire. Les travaux de Chebyshev sont consacrés à l'étude des modèles d'erreurs d'échantillonnage aléatoires. Le théorème de Chebyshev prouve que Dx ne dépasse pas : - l'erreur d'échantillonnage moyenne. Le coefficient de confiance t indique la probabilité d'une erreur donnée. Pages 42-43.

Dans le cas où il est nécessaire de déterminer t à partir d’un F(t) connu, nous prenons le plus grand F(t) le plus proche et déterminons t à partir de celui-ci.

Erreur marginale

P – partager.

Si la sélection a été effectuée de manière non répétitive, alors les formules d'erreur maximale sont ajoutées

Correction pour non-répétition.

Pour chaque type d'observation d'échantillon, l'erreur présentée est calculée différemment :

  1. observation en fait aléatoire et mécanique ;
  2. Surveillance de zone
  3. Échantillonnage en série

r – nombre de séries dans l'échantillon ;

R – nombre de séries dans la population ;

Dispersion de proportion entre les groupes.

§4. Tâches d'observation d'échantillons

Utilisé pour les tâches suivantes :

  1. n - ? pour déterminer la taille de l'échantillon en fonction de F(t), Dx connu.
  2. détermination de l'échantillon Dx à partir de F(t), n connu
  3. détermination de F(t) à partir de Dx et n connus

1 tâche n - ? Premièrement, n est déterminé par la formule de sélection répétée pour la sélection non répétitive :

Méthodes de détermination de l'écart :

  1. il est tiré d’études similaires antérieures.
  2. L'écart type pour une distribution normale est de » 1/6 de la plage de variation.
  3. si la distribution est manifestement asymétrique, alors l'écart type est » 1/5 de la plage de variation
  4. Pour le partage, la dispersion maximale possible p(1-p)=0,25 est appliquée
  5. à n³100, alors s 2 =S 2 – variance de l'échantillon

30 £ n 100 £, alors s 2 =S 2 (n/n-1), s 2 – variance générale

n<30, то S 2 (малая, т.к. дисперсия выборочная) и все расчеты ведутся по S 2

Lors du calcul de n, vous ne devez pas rechercher une grande valeur de t et de petites erreurs marginales, car cela entraîne une augmentation de n et donc une augmentation des coûts. La loi suivante est similaire.

§5. Extension des données d'observation d'échantillons à la population générale.

Le but ultime de tout VN est de caractériser la population générale.

Les valeurs calculées à partir des résultats VN s'appliquent à la population générale en tenant compte de leur limite d'erreur maximale.

Supposons que la consommation mensuelle de yaourt soit d'une personne.

250-20 millions de livres sterling 250+20 ; 230 M£270 £

Et seulement 1000 personnes

230 000 M£270 000 £

48%-5%£p£48%+5%

§6. Petit échantillon.

Dans la pratique de la recherche statistique dans les conditions modernes, nous sommes de plus en plus confrontés à de petits échantillons.

Petit échantillon – échantillon d'observation dont le nombre d'unités n'excède pas 30, n 30 £/

Le développement de la théorie des petits échantillons a été réalisé par le statisticien anglais Gosset, écrivant sous le pseudonyme d'étudiant en 1908.

Il a prouvé que l'estimation de l'écart entre les moyennes d'un petit échantillon et l'échantillon général a une loi de distribution particulière. Lors du calcul sur un petit échantillon, la valeur de s 2 n'est pas calculée. t st pour les limites d'erreur possibles, utilisez le critère d'étudiant. Pages 44-45. - la probabilité d'un événement inverse.

Nombre de degrés de liberté

petite erreur de limite d'échantillon

erreur de fraction marginale

Thème 8 : Analyse et modélisation de corrélation et de régression.

§1. Le concept de corrélation et KRA.

§2. Conditions d’application et restrictions du KRA.

§3. Régression des moindres carrés par paires.

§4. Application de l'équation de régression linéaire appariée.

§5. Indicateurs de proximité et de force de connexion.

§6. Corrélation multiple.

§1. Le concept de corrélation et KRA.

Connexion fonctionnelle y=5x

Corrélation

Il existe 2 types de liens entre les différents phénomènes et leurs caractéristiques : fonctionnels et statistiques.

Une connexion est dite fonctionnelle lorsque, avec un changement de la valeur de l'une des variables, la seconde change d'une manière strictement définie, c'est-à-dire que la valeur d'une variable correspond à une ou des valeurs plus précisément spécifiées d'une autre variable. Une connexion fonctionnelle n'est possible que dans le cas où la variable y dépend de la variable x et ne dépend d'aucun autre facteur, mais dans la vie réelle, cela est impossible.

Une relation statistique existe dans le cas où, avec un changement de la valeur de l'une des variables, la seconde peut, dans certaines limites, prendre n'importe quelle valeur, mais ses caractéristiques statistiques changent selon une certaine loi.

Le cas particulier le plus important de la communication statistique est la corrélation. Dans une relation de corrélation, différentes valeurs d'une variable correspondent à différentes valeurs moyennes d'une autre variable, c'est-à-dire avec un changement de la valeur de la caractéristique x, la valeur moyenne de la caractéristique y change naturellement.

Le mot corrélation a été introduit par le biologiste et statisticien anglais Francis Gal (corrélation)

La corrélation peut se produire de différentes manières :

  • dépendance causale de la variation de la caractéristique résultante sur la variation de la caractéristique factorielle.
  • Une corrélation peut apparaître entre 2 conséquences d'une même cause (incendies, nombre de pompiers, ampleur de l'incendie)
  • La relation des signes dont chacun est à la fois cause et effet (productivité du travail et salaires)

En statistique, il est d'usage de distinguer les types de dépendance suivants :

  1. la corrélation appariée est un lien entre deux caractéristiques, un résultat et un facteur, ou entre deux facteurs.
  2. la corrélation partielle est la dépendance entre la résultante et une caractéristique factorielle avec une valeur fixe d'une autre caractéristique factorielle.
  3. corrélation multiple – dépendance d'une caractéristique efficace à l'égard de deux ou plusieurs caractéristiques factorielles incluses dans l'étude.

Le but de l’analyse de corrélation est de quantifier l’étroitesse de la relation entre les caractéristiques. À la fin du XIXe siècle, Galton et Pearson ont étudié la relation entre la taille des pères et celle des enfants.

La régression examine la forme de la relation. La tâche de l'analyse de régression est de déterminer l'expression analytique de la relation.

L'analyse de corrélation-régression en tant que concept général comprend une modification de l'étroitesse de la connexion et l'établissement d'une expression analytique de la connexion.

§2. Conditions d’application et restrictions du KRA.

  1. disponibilité de données de masse, car la corrélation est statistique
  2. une homogénéité qualitative de la population est nécessaire.
  3. subordination de la répartition de la population selon les caractéristiques résultantes et factorielles, la loi de répartition normale, qui est associée à l'utilisation de la méthode des moindres carrés.

§3. Régression par paires basée sur la méthode des moindres carrés.

L'analyse de régression consiste à déterminer l'expression analytique de la relation. En fonction de leur forme, ils distinguent la régression linéaire, qui s'exprime par l'équation d'une ligne droite, et la régression non linéaire ou.

Selon le sens de la communication, ils se distinguent en directs, c'est-à-dire À mesure que la caractéristique x augmente, la caractéristique y augmente.

inverse

L'inverse, c'est-à-dire À mesure que x augmente, y diminue.

  1. la méthode graphique consiste à tracer des données empiriques sur le champ de corrélation, mais une évaluation plus précise est effectuée à l'aide de la méthode des moindres carrés.

X – signe réel

U - signe efficace

La différence entre la valeur réelle et la valeur au carré calculée à partir de l'équation de couplage doit tendre vers un minimum.

Avec les moindres carrés, min est la somme des écarts carrés des valeurs empiriques de y par rapport aux valeurs théoriques obtenues à l'aide de l'équation de régression sélectionnée.

Pour une dépendance linéaire

Þ un,b

pour une parabole

Pour l'hyperbole

les paramètres a,b,c sont écrits dans l'équation, puis nous remplaçons l'équation résultante par la valeur empirique x je et trouver la valeur théorique ouais, je. Ensuite, nous comparons et je théorique et et je empirique. La somme des carrés de la différence entre eux doit être minime. Nous sélectionnons le type de dépendance dans lequel cette dépendance est remplie.

Dans l'équation de régression linéaire par paires :

b – coefficient de régression linéaire apparié, il mesure la force de la connexion, c'est-à-dire caractérise l'écart moyen de y par rapport à sa valeur moyenne par unité de mesure acceptée.

b=20 lorsque x change de 1, y s'écarte de sa valeur moyenne de 20 en moyenne pour la population.

Un signe positif pour le coefficient de régression indique une relation directe entre les caractéristiques, un signe « - » indique une relation inverse entre les caractéristiques.

§4. Application de l'équation de régression linéaire appariée.

La principale application est la prévision à l’aide d’une équation de régression. La limite de la prévision réside dans les conditions de stabilité d’autres facteurs et conditions de processus. Si l'environnement du processus en cours y change fortement, cette équation de régression n'aura pas lieu.

Une prévision ponctuelle est obtenue en substituant la valeur attendue du facteur dans l'équation de régression. La probabilité qu’une telle prévision se réalise avec précision est extrêmement faible.

Si une prévision ponctuelle est accompagnée de la valeur de l'erreur de prévision moyenne, alors une telle prévision est appelée intervalle.

L'erreur moyenne de prévision est constituée de deux types d'erreurs :

  1. Erreurs de type 1 – erreur de ligne de régression
  2. Erreur de type 2 – erreur associée à une erreur de variation.

Erreur de prévision moyenne.

Erreur dans la position de la droite de régression dans la population

n - taille de l'échantillon

x k – valeur de facteur erronée

Écart RMS de la caractéristique résultante par rapport à la droite de régression dans la population

L'analyse de corrélation consiste à évaluer la force de la connexion. Indicateurs :

  1. coefficient de corrélation linéaire - caractérise l'étroitesse et la direction de la relation entre deux caractéristiques dans le cas d'une relation linéaire entre elles

à =-1 la connexion est un retour fonctionnel, à =1 la connexion est fonctionnelle directe, à =0 il n'y a pas de connexion.

S'applique uniquement aux relations linéaires ; il est utilisé pour évaluer les relations entre des caractéristiques quantitatives. Calculé uniquement sur la base de valeurs individuelles.

Rapport de corrélation :

Empirique : les deux types de variance sont calculés en fonction de l'attribut de performance.

Théorique:

Dispersion des valeurs de la caractéristique résultante calculée à l'aide de l'équation de régression

Dispersion de la valeur empirique de l'attribut résultant

  • haut degré de précision
  • convient pour évaluer l'étroitesse de la relation entre une caractéristique descriptive et quantitative, mais la caractéristique quantitative doit être efficace
  • adapté à tous types de connexions

Coefficient de corrélation de Spearman

Rangs – les numéros d'ordre des unités de la population dans la série classée. Les deux caractéristiques doivent être classées dans le même ordre, de la plus petite à la plus grande, ou vice versa. Si les rangs des unités de population sont notés p x et p y, alors le coefficient de corrélation des rangs prendra la forme suivante :

Avantages du coefficient de série de corrélation :

  1. Il est également possible de classer selon des caractéristiques descriptives qui ne peuvent être exprimées numériquement, donc le calcul du coefficient de Spearman est possible pour les couples de caractéristiques suivants : quantité - quantité ; descriptif – quantitatif ; Descriptif – Descriptif. (l'éducation est une caractéristique descriptive)
  2. montre la direction de la connexion

Inconvénients du coefficient de Spearman.

  1. des différences de rang identiques peuvent correspondre à des différences complètement différentes dans la valeur d'une caractéristique (dans le cas de caractéristiques quantitatives). Exemple : production d'électricité du pays par an

États-Unis 2400 kW/h 1

RF 800 kW/h 2

Canada 600 kW/h 3

Si parmi les valeurs de Spearman, il y en a plusieurs identiques, alors des rangs connexes sont formés, c'est-à-dire mêmes chiffres moyens

Dans ce cas, le coefficient de Spearman est calculé comme suit :

j- nombre de connecteurs pour la caractéristique x

Un j – nombre de rangs identiques dans j connexions dans x

k- nombres de connecteurs par ordre de signe

Bk – nombre de rangs identiques dans oh regrouper par

  1. 4. Coefficient de corrélation de rang de Kendall

Montant maximum du classement

S – somme réelle des rangs

Donne une estimation plus rigoureuse que le coefficient de Spearman.

Pour le calcul, toutes les unités sont classées par attribut x par attribut à Pour chaque rang, le nombre de rangs suivants dépassant leur somme donnée est calculé, noté P, et le nombre de rangs suivants en dessous de cette notation par Q.

P+Q= 1/2 n(n-1)

  1. Coefficient de corrélation de rang de Fechner.

Rapport de Fechner – une mesure de l'étroitesse de la connexion sous la forme du rapport de la différence du nombre de paires de signes correspondants et non correspondants à la somme de ces nombres.

  1. calcul des moyennes en x et y
  2. les valeurs individuelles x i y i sont comparées à des valeurs moyennes avec l'indication obligatoire du signe « + » ou « - ». Si les signes coïncident en x et y, alors on les attribue au nombre « C », sinon, alors à « H ».
  3. Nous comptons le nombre de paires correspondantes et incompatibles.

La tâche de mesurer le lien est confrontée aux statistiques par rapport aux caractéristiques descriptives, un cas particulier important d'une telle tâche, mesurant le lien entre 2 caractéristiques alternatives, dont l'une est une cause et l'autre est une conséquence.

L'étroitesse du lien entre 2 caractéristiques alternatives peut être mesurée à l'aide de 2 coefficients :

  1. coefficient d'association
  2. facteur contingent

Le coefficient contingent présente un inconvénient : lorsqu'une des deux combinaisons hétérogènes A ou Ba est égale à zéro, le coefficient devient un. Il évalue l'étroitesse de la connexion de manière très libérale et la surestime.

Coefficient de Pearson

S'il n'y a pas deux, mais plus de valeurs possibles pour chacune des caractéristiques interdépendantes, les coefficients suivants sont calculés :

  1. Coefficient de Pearson
  2. Coefficient Chuprov pour une caractéristique descriptive

Le coefficient de Pearson est calculé à l'aide de matrices carrées

En dessous de la normale

à 1 et à 2 – le numéro du groupe selon les caractéristiques 1 et 2, respectivement. L'inconvénient du coefficient de Pearson est qu'il n'atteint pas 1 même avec une augmentation du nombre de groupes.

Coefficient de Chuprov (1874 –1926)

Le coefficient Chuprov évalue plus strictement l'étroitesse de la connexion.

§6. Corrélation multiple.

L'étude de la relation entre la résultante et deux ou plusieurs caractéristiques factorielles est appelée régression multiple. Lors de l'étude des dépendances à l'aide de méthodes de régression multiples, deux tâches sont définies.

  1. détermination de l'expression analytique du lien entre la caractéristique effective y et les caractéristiques réelles x 1, x 2, x 3, ... x k, c'est-à-dire trouver la fonction y=f(x 1, x 2, ...x k)
  2. Évaluer l'étroitesse de la relation entre le résultat et chacune des caractéristiques factorielles.

Un modèle de corrélation-régression (CRM) est une équation de régression qui inclut les principaux facteurs influençant la variation de la caractéristique résultante.

La création d'un modèle de régression multiple comprend les étapes suivantes :

  1. choisir une forme de communication
  2. sélection des caractéristiques des facteurs
  3. Veiller à ce que la population soit suffisamment grande pour produire des estimations valides.

I. l'ensemble des connexions entre variables rencontrées dans la pratique est assez complètement décrit par des fonctions de 5 types :

  1. linéaire:
  2. pouvoir:
  3. démonstratif:
  4. parabole:
  5. hyperbole:

bien que les 5 fonctions soient présentes dans la pratique de l'ARC, la dépendance linéaire est le plus souvent utilisée comme l'équation de dépendance linéaire la plus simple et la plus facile à interpréter : , k - de nombreux facteurs inclus dans l'équation, bj

0 – parce que >0,7 donc nous y prêtons une attention particulière

ÉCO. Échelle de densité de connexion :

Si la connexion est 0 – 0,3 – connexion faible

0,3 – 0,5 – perceptible

0,3 – 0,5 – serré

0,7 – 0,9 – élevé

plus de 0,9 – très élevé

puis on compare deux caractéristiques (revenu et sexe)<0,7, то включаем в уравнение множественной регрессии.

Sélection des facteurs à inclure dans l'équation de régression multiple :

  1. Il doit y avoir une relation de cause à effet entre les signes effectifs et réels.
  2. les signes effectifs et réels doivent être étroitement liés les uns aux autres, sinon le phénomène se produit multicolinéarité (>06) , c'est-à-dire Les caractéristiques factorielles incluses dans l'équation influencent non seulement la résultante, mais également les unes les autres, ce qui conduit à une interprétation incorrecte des données numériques.

Méthodes de sélection des facteurs à inclure dans une équation de régression multiple :

1. méthode experte – basé sur une analyse logique intuitive réalisée par des experts hautement qualifiés.

2. l'utilisation de matrices de coefficients de corrélation appariés s'effectue en parallèle de la première méthode, la matrice est symétrique par rapport à la diagonale unité.

3. analyse de régression étape par étape - l'inclusion séquentielle des caractéristiques factorielles dans l'équation de régression et des tests de signification sont effectués sur la base des valeurs de deux indicateurs à chaque étape. Indicateur de corrélation et de régression.

Score de corrélation : calcule la variation de la corrélation théorique d'un ratio ou la variation de la variance résiduelle moyenne. Indicateur de régression – modification du coefficient de régression conditionnellement pure.

Total

31

32

22

85



Avez-vous aimé l'article? Partagez avec vos amis !