Galerie de cartes mentales Super focus sur les statistiques (1)
Il s'agit d'une carte mentale sur les points clés des statistiques (1), y compris les méthodes de collecte de données statistiques, La forme organisationnelle des enquêtes statistiques, Objets de recherche statistique et autres contenus.
Modifié à 2023-12-03 01:20:47Super focus sur les statistiques (1)
Le plus important:
Comment collecter des données statistiques :
1. Méthode d'observation directe, les enquêteurs se rendent sur place pour enquêter en personne
2. Méthode d'entretien, les enquêteurs interrogent les répondants élément par élément selon le plan d'enquête.
3. Méthode de reporting, fournissant des données statistiques selon certaines procédures de reporting
4. Méthode du questionnaire, posant des questions sous forme de feuille de réponses
5. Méthode expérimentale, conduite d'expériences sur des objets d'investigation dans des lieux expérimentaux spéciaux et dans des conditions spéciales.
Forme organisationnelle de l'enquête statistique :
1. Enquête approfondie ; enquêter sur toutes les unités soumises à l'enquête une par une.
Caractéristiques : large gamme, consommation élevée
2. Recensement ; une enquête globale unique spécialement organisée
L'objet de recherche des statistiques : L'objet de recherche des statistiques socio-économiques est l'aspect quantitatif d'un grand nombre de phénomènes socio-économiques dans leur ensemble (c'est-à-dire l'étude des caractéristiques quantitatives et des relations quantitatives du phénomène socio-économique dans son ensemble)
(Réponse courte) Caractéristiques des objets de recherche statistique :
(1) Quantitatif : Comprendre quantitativement la nature et les lois des choses est la caractéristique fondamentale de la recherche statistique. La recherche statistique ne porte pas sur des quantités abstraites, mais sur des quantités concrètes avec un contenu spécifique. Les statistiques sont l'étude de quantités spécifiques étroitement liées au contenu et à la nature du phénomène étudié selon des stipulations qualitatives.
(2) Totalité : La statistique prend comme objet de recherche les caractéristiques quantitatives du phénomène global. Les statistiques nécessitent un grand nombre d'observations et une analyse complète des faits prévalant dans chaque unité de la population pour obtenir des caractéristiques quantitatives qui reflètent le phénomène global.
(3) Variabilité : Les caractéristiques caractéristiques de chaque unité de la population ont des performances différentes en raison de facteurs aléatoires complexes, ce qui est la prémisse de la recherche statistique.
Principaux contenus du plan d'enquête
1. Déterminer le but de l’enquête (pourquoi)
2. Déterminer l'objet de l'enquête (population) et l'unité d'enquête (individu) Qui)
3. Élaborer un plan d'enquête (Quoi)
Contenu nécessaire de l’enquête déterminé en fonction de l’objectif de l’enquête
Déterminer l’heure (Quand) et le lieu (Où) de l’enquête
Statistiques descriptives et statistiques inférentielles :
1. Statistiques descriptives : collecte, organisation, présentation et analyse de données statistiques (données qui reflètent des phénomènes objectifs)
2. Statistiques inférentielles : utiliser des informations sur les échantillons et la théorie des probabilités pour estimer et tester les caractéristiques quantitatives de la population, etc.
Le sens des statistiques et les deux relations
Trois significations : (1) travail statistique, (2) données statistiques (3) statistiques (science)
La statistique est une science méthodologique portant sur la collecte, le traitement, l'identification, l'analyse et l'inférence de diverses informations.
1) Travaux statistiques : investigations et recherches
2) Statistiques : résultats des travaux
3) Statistiques : science méthodologique qui étudie comment collecter, organiser et analyser des données.
Le travail statistique et les données statistiques sont la relation entre le travail et les résultats du travail, et le travail statistique et les statistiques sont la relation entre la pratique et la théorie.
1. Le résultat du travail statistique est des données statistiques
2. La base des données statistiques et de la science statistique est le travail statistique
3. La science statistique n'est pas seulement un résumé théorique de l'expérience du travail statistique, mais également les principes, principes et méthodes qui guident le travail statistique.
Statistiques théoriques et statistiques appliquées (selon le degré de recherche et d'application des méthodes statistiques)
La statistique théorique est un système de méthodes statistiques centré sur la méthodologie.
Les statistiques appliquées sont l'application de méthodes statistiques centrée sur un problème pour résoudre des problèmes pratiques.
Calcul de la médiane du groupe
Médiane du groupe : valeur médiane entre les limites supérieure et inférieure pour représenter le niveau général de chaque groupe de valeurs de marqueur.
Valeur médiane du groupe fermé = (limite supérieure limite inférieure) ÷ 2
La valeur médiane de la limite inférieure manquante du groupe ouvert = la limite supérieure - 1/2 de la distance entre les groupes adjacents,
La valeur médiane du groupe d'ouverture de limite supérieure manquante = la limite inférieure 1/2 de la distance entre les groupes adjacents.
La relation entre l'espacement des groupes et le nombre de groupes dans une séquence équidistante
Lors de la compilation d'une séquence équidistante, la formule pour calculer la distance de groupe est la suivante : distance de groupe = distance totale/nombre de groupes, donc la taille de la distance de groupe est liée au nombre de groupes.
Fréquence ou fréquence - le nombre d'unités distribuées dans chaque groupe
Fréquence ou rapport - le nombre relatif formé par le rapport de chaque série de répétitions au nombre total de répétitions
distribution ascendante des fréquences (ou taux) cumulés
Il s'agit d'abord de répertorier la limite supérieure de chaque groupe, puis d'accumuler la fréquence (ou la fréquence) du groupe avec la valeur d'indicateur faible au groupe avec la valeur d'indicateur élevée.
La fréquence cumulée ascendante d'un certain groupe indique la somme du nombre d'unités dans chaque groupe en dessous de la limite supérieure du groupe. La fréquence cumulée ascendante d'un certain groupe indique la proportion de la somme du nombre d'unités dans chaque groupe en dessous. la limite supérieure du groupe au nombre total d'unités.
Accumuler la distribution des fréquences (ou fréquences) vers le bas : indiquez d'abord la limite inférieure de chaque groupe, puis accumulez les fréquences (ou fréquences) séquentiellement du groupe avec une valeur d'indicateur élevée au groupe avec une valeur d'indicateur faible.
Indicateur total : un indicateur utilisé pour indiquer l'ampleur totale, le niveau total ou la charge de travail des phénomènes sociaux et économiques à un moment, un lieu et une condition donnés.
Classification et signification des indicateurs relatifs
Les indicateurs relatifs, également appelés nombres relatifs statistiques, sont le rapport de deux indicateurs statistiques liés, reflétant la relation quantitative entre les choses.
Les indicateurs relatifs sont divisés en : indicateurs relatifs structurels, indicateurs relatifs proportionnels, indicateurs relatifs d'intensité, indicateurs relatifs dynamiques, indicateurs relatifs comparatifs et indicateurs relatifs de plan.
Détermination du mode d'une séquence de plage
La méthode consiste à observer le nombre de fois et à procéder en deux étapes :
1 Déterminez d’abord le groupe où se trouvent le plus de données
2 Utilisez la méthode d'interpolation proportionnelle pour calculer l'approximation du mode
Chapitre un
Concepts d’indicateurs (Re)Statistiques : signes et indicateurs
Une marque statistique, appelée marque, fait référence au nom d'un attribut ou d'une caractéristique possédée par une unité globale.
Indicateurs statistiques : Concepts et valeurs qui reflètent globalement les caractéristiques quantitatives globales.
La relation entre les signes, les indicateurs et les variables :
(Re)La différence entre signes et indicateurs :
(1) Le panneau explique l'indicateur caractéristique unique global et explique les caractéristiques globales ;
(2) Les marques comprennent les marques de qualité qui ne peuvent être exprimées par des valeurs numériques et les marques de quantité qui peuvent être exprimées par des valeurs numériques.
Le lien entre les signes et les indicateurs :
(1) Les valeurs de certains indicateurs statistiques sont résumées à partir des valeurs des indicateurs quantitatifs des unités globales. Par exemple, la production céréalière totale du comté est résumée à partir de la production céréalière de chaque commune à laquelle il appartient.
(2) Il existe une relation de transformation entre les deux. Si l'objectif de la recherche change, par exemple si l'ensemble d'origine devient l'unité globale, l'indice statistique correspondant deviendra un indicateur quantitatif, et vice versa. (Les variables sont des signes de quantité variable et tous les indicateurs statistiques, et toutes les valeurs de drapeau et valeurs d'indicateur sont des valeurs variables. Certains signes de quantité variable ne sont pas des indicateurs statistiques, mais ils appartiennent à des variables. Dans les signes de quantité, ils sont les indicateurs de quantité inchangés sont appelés constantes ou paramètres, les indicateurs de quantité variable sont appelés variables)
(Lourd) Concepts généraux et compréhension des statistiques
La population statistique, appelée population, fait référence à un tout organique composé de nombreux éléments individuels (unités) qui existent objectivement et possèdent une certaine propriété commune.
fonctionnalité:
Homogénéité : Toutes les unités de la population ont des propriétés communes.
Massivité : La population contient toujours la totalité ou un nombre suffisant d'unités.
Variabilité : Il existe des différences entre les unités de la population.
Concepts et compréhension des indicateurs de qualité
Y compris les indicateurs relatifs et les indicateurs moyens, les indicateurs statistiques qui reflètent le niveau relatif global du phénomène ou la qualité du travail, comme la densité de population, le salaire moyen, etc.
variable de séquence
Une variable ordinale est un type de variable qui distingue les variables par ordre hiérarchique parmi les cas de la même catégorie.
(1) Classer les choses et donner l'ordre de chaque catégorie
(2) Plus précis que l'échelle de classification
(3) Les différences précises entre les catégories ne sont pas mesurées
(4) Les données sont présentées sous forme de « catégorie » mais dans l'ordre
(5) a > ou
Chapitre deux
Concepts tels que objets d'enquête, unités d'enquête, éléments d'enquête, unités déclarantes, etc.
Objet de l'enquête : désigne le phénomène global à étudier, c'est-à-dire la population statistique.
Unité d'enquête : l'unité globale (individuelle) de l'enquête et la personne responsable du contenu de l'enquête.
Unité déclarante : l'unité chargée de fournir des données statistiques selon la date et le format spécifiés, c'est-à-dire l'unité qui remplit et rapporte les données statistiques.
Éléments d'enquête : Contenu d'enquête nécessaire déterminé en fonction de l'objectif de l'enquête
Temps d'enquête
Heure d'enquête : précisez l'heure à laquelle appartiennent les données d'enquête.
troisième chapitre
Regroupement statistique
Le regroupement statistique est basé sur la finalité de la recherche statistique et les caractéristiques de l'objet de recherche, divisant chaque unité de la population statistique en plusieurs parties ou groupes ayant des propriétés différentes selon un certain signe.
Fonction de regroupement statistique
(1) Classification des types de phénomènes
(2) Structure globale de l’étude
(3) Étudier la dépendance entre les phénomènes
La relation entre la moyenne arithmétique, la médiane et le mode dans la distribution de fréquence (caractéristiques de relation sous chaque distribution)
Moyenne arithmétique : la valeur médiane de chaque groupe de valeurs dans l'histogramme de distribution de fréquence est multipliée par la fréquence puis ajoutée.
Médiane : la valeur correspondant à la moitié de l'aire de l'histogramme de distribution de fréquence
Mode : Le mode est la médiane du groupe avec la fréquence d'observations d'échantillons la plus élevée dans le tableau de distribution des fréquences.
Moyenne générale
Définition de la moyenne de la population : La moyenne de tous les individus de la population est appelée moyenne de la population.
Chapitre quatre
La nature de chaque indicateur dans l’indicateur de variation de signature
(1) Le concept de plage complète : La plage complète est également appelée plage, qui est la différence entre la valeur maximale et la valeur minimale d'un ensemble de données.
(2) La notion de différence moyenne : la moyenne arithmétique de la valeur absolue de l'écart de chaque valeur variable par rapport à sa valeur moyenne.
(3) Notions de variance et d'écart type : La variance est la somme moyenne des carrés des différences entre chaque donnée et la moyenne.
L'écart type est la racine carrée arithmétique de la racine carrée moyenne de la somme des écarts de la valeur de signe de chaque unité dans la population et de sa moyenne arithmétique.
(4) Coefficient de variation : L'indicateur de coefficient de variation couramment utilisé est le coefficient d'écart type, c'est-à-dire que plus l'indice de coefficient de variation est élevé, plus le degré relatif de dispersion de chaque unité de la population est élevé et moins il est représentatif. la moyenne globale est ; à l’inverse, la moyenne globale est. Plus le nombre est représentatif, mieux c’est.
Comprendre les indicateurs d’achèvement du plan
L'indice relatif du degré d'achèvement du plan est appelé « indicateur du degré d'achèvement du plan » ou « pourcentage d'achèvement du plan ». Il est le résultat de la comparaison de la valeur d'achèvement réelle des phénomènes sociaux et économiques au cours d'une certaine période avec la valeur de la tâche prévue, et est généralement exprimé en pourcentage. ·
chapitre cinq
Concepts et caractéristiques des enquêtes de (ré)échantillonnage
Une enquête par sondage est une enquête non exhaustive. Il s'agit de sélectionner certaines unités de tous les objets de recherche selon le principe aléatoire en tant que représentatives de l'ensemble à enquêter.
Caractéristiques
(1) Il s’agit d’une enquête non approfondie ;
(2) Sélectionner les unités d'enquête pour l'enquête sur la base du principe aléatoire ;
(3) L’objectif est de comprendre la situation globale globale.
Le principe aléatoire de l’enquête par sondage
Le principe aléatoire signifie que lors de la sélection des unités d'enquête, l'échantillonnage des unités d'échantillonnage n'est pas affecté par les facteurs subjectifs des enquêteurs et d'autres facteurs systématiques, et élimine complètement l'influence de la conscience subjective des gens, de sorte que chaque unité de la population ait une valeur égale. chance d'être échantillonné. La chance de gagner est purement une question de hasard. Le principe aléatoire est le principe de base que doit suivre l’échantillonnage aléatoire.
Comprendre l'erreur d'échantillonnage
Le concept d'erreur d'échantillonnage : sous réserve du respect du principe du caractère aléatoire, les erreurs inévitables découlant des indicateurs d'échantillonnage représentant les indicateurs globaux, à l'exclusion des erreurs d'enregistrement et des erreurs systématiques (générées par la violation du principe du caractère aléatoire, comme la sélection consciente de plus de bonnes unités ) .
La relation entre la limite d'erreur et le nombre d'unités d'échantillonnage (principalement dans des conditions d'échantillonnage répétées simples)
Plus le nombre d’unités d’échantillonnage est grand, plus l’erreur d’échantillonnage moyenne est faible ; à l’inverse, plus l’erreur d’échantillonnage moyenne est grande ;
Erreur moyenne d'échantillonnage, concept d'erreur limite d'échantillonnage, concept de probabilité
Erreur moyenne d'échantillonnage : l'écart type de la moyenne d'échantillonnage (ou numéro d'échantillonnage). Il reflète la dispersion moyenne entre la moyenne de l'échantillon (ou pourcentage d'échantillonnage) et la moyenne de la population (ou pourcentage de la population).
Erreur limite d'échantillonnage : également appelée erreur admissible, il s'agit de l'erreur maximale admissible entre l'indice de l'échantillon et l'indice global déterminée par l'enquêteur en fonction des exigences de fiabilité des résultats d'inférence d'échantillonnage. Généralement exprimé par Δ.
Le degré de probabilité t reflète le degré relatif de l'erreur limite, qui est numériquement égal au multiple de l'erreur limite comme erreur d'échantillonnage moyenne.
Chapitre VII
Correlation positive
Corrélation positive : signifie que deux variables changent dans la même direction. Lorsqu'une variable passe de grande à petite ou de petite à grande, l'autre variable passe également de grande à petite ou de petite à grande.
Déterminer le degré de corrélation en fonction du coefficient de corrélation
r>0 est une corrélation positive, r
|r|=1 signifie une corrélation complètement linéaire 0 ;
|r|≤ 0,3 indique une faible corrélation ; 0,3< |r|≤ 0,5 indique une faible corrélation ;
0,5<|r|≤0,8 est une corrélation significative ; 0,8<|r|<1 est une corrélation élevée.
(Re)relation entre coefficient de régression et coefficient de corrélation
Si le coefficient de régression est supérieur à zéro, le coefficient de corrélation est supérieur à zéro ; si le coefficient de régression est inférieur à zéro, le coefficient de corrélation est inférieur à zéro. (Leurs signes de valeur sont les mêmes)
1. La différence entre le coefficient de corrélation et le coefficient de régression
1. Différentes significations : Coefficient de corrélation : C'est une quantité qui étudie le degré de corrélation linéaire entre les variables.
Coefficient de régression : paramètre qui représente l'influence de la variable indépendante x sur la variable dépendante y dans l'équation de régression.
2. Différentes applications : Coefficient de corrélation : illustre la corrélation entre deux variables.
Coefficient de régression : illustre la relation quantitative entre les changements dépendants entre deux variables.
3. Différentes unités : Coefficient de corrélation : généralement représenté par la lettre r, r n'a pas d'unité
Coefficient de régression : Généralement exprimé par la pente b, b a des unités.
2. La relation entre le coefficient de régression et le coefficient de corrélation :
1. Si le coefficient de régression est supérieur à zéro, le coefficient de corrélation est supérieur à zéro.
2. Si le coefficient de régression est inférieur à zéro, le coefficient de corrélation est inférieur à zéro.
Les liens et les différences entre l'analyse de corrélation et l'analyse de régression
connecter :
1. La théorie et les méthodes sont cohérentes ;
2. S’il n’y a pas de corrélation, il n’y aura pas de régression. Plus le degré de corrélation est élevé, meilleure est la régression ;
3. Le coefficient de corrélation et le coefficient de régression ont la même direction et peuvent être calculés l'un par rapport à l'autre.
la différence :
1. Dans l'analyse de corrélation, x et y sont équivalents ; dans l'analyse de régression, x et y doivent déterminer la variable indépendante et la variable dépendante ;
2. Dans l'analyse de corrélation, x et y sont tous deux des variables aléatoires. Dans l'analyse de régression, seul y est une variable aléatoire.
3. L'analyse de corrélation mesure le degré et la direction de la corrélation. L'analyse de régression peut non seulement révéler l'impact de la variable x sur la variable y, mais peut également utiliser des modèles de régression pour la prédiction et le contrôle.
Une équation de régression linéaire variable peut être écrite et utilisée
La régression linéaire univariée peut être utilisée pour l'analyse prédictive.
chapitre huit
concept de taux de croissance moyen
Taux de croissance moyen : décrit le taux de croissance moyen d'un phénomène sur une période donnée. Elle est égale à la vitesse moyenne de développement moins 1.
Analyse de niveau et analyse de vitesse dans des séries chronologiques
L'analyse des niveaux comprend le niveau de développement, le niveau de développement moyen, le niveau de croissance et le niveau de croissance moyen.
L'analyse de la vitesse comprend la vitesse de développement et la vitesse de croissance, la vitesse de développement moyenne et la vitesse de croissance moyenne.
Facteurs affectant les séries chronologiques : changements irréguliers
changements de cycle
tendance à long terme
changements saisonniers
Chapitre neuf
Quelles formes d’index l’index global des indicateurs de qualité et l’index global des indicateurs de quantité adoptent-ils ?
(1) Indice d'indicateur quantitatif : lors de l'élaboration de l'indice d'indicateur quantitatif, l'indicateur de qualité de la période de base doit être utilisé comme même facteur de mesure.
(2) Indice d'indicateur de qualité : lors de l'élaboration de l'indice d'indicateur de qualité, les indicateurs quantitatifs au cours de la période de référence doivent être utilisés comme le même facteur de mesure.
Distinguer l'indicateur moyen, l'indice indicateur moyen et l'indice moyen
1 : L'indice moyen est un indice global qui reflète le niveau général de chaque unité d'une population homogène dans certaines conditions à un moment et un lieu donnés. Il s'agit d'une valeur représentative des valeurs de signe inégales de chaque unité de la population, et constitue également une mesure de la tendance centrale de la distribution variable.
2 : L'indice indicateur moyen est un nombre relatif calculé en comparant les valeurs indicatrices moyennes des quantités dans les conditions de deux périodes différentes d'un même phénomène économique. Il illustre la direction et le degré des changements du niveau moyen global sur deux périodes.
3 : L'indice moyen est un indice calculé en utilisant la moyenne pondérée des indices individuels.
La relation calculée entre chaque index dans le système d'index
Dans le système d'indices, la relation quantitative entre l'indice total et chaque indice factoriel est exprimée comme l'indice total est égal au produit de chaque indice factoriel, et la différence de variation de l'indice total est égale à la somme des différences de variation de chaque indice factoriel.
Classement de l'indice
Classification par périmètre d'objet : index global et index individuel
Selon la nature de l'indice : indice quantitatif et indice de qualité
Réparti selon différentes périodes de base : indice chaîne et indice à base fixe
Le concept de regroupement statistique est une méthode d'organisation statistique qui divise le phénomène socio-économique global en plusieurs parties ou groupes selon une certaine note basée sur l'objectif et les exigences de la recherche statistique et les différences inhérentes à la population.
(Lourd) La signification et les types d'indicateurs relatifs : La signification des indicateurs relatifs : Il explique la relation quantitative formée par la comparaison relative entre une valeur et une autre valeur.
Il existe quatre types couramment utilisés : les indicateurs relatifs structurels, les indicateurs relatifs comparatifs, les indicateurs relatifs d'intensité et les indicateurs relatifs dynamiques.
Signale la nature de chaque indicateur dans les indicateurs de compilation : temps de compilation, utilisation mémoire, utilisation CPU, nombre d'erreurs de compilation, etc. Ces indicateurs peuvent aider les développeurs à comprendre les performances et l'efficacité du processus de compilation et à optimiser le code et le processus de compilation.
(Lourd) Point temporel et période :
1. La valeur de l'indicateur de période est enregistrée en continu, tandis que la valeur de l'indicateur de point temporel est obtenue par comptage discontinu à un certain moment ;
2. La valeur de l'indicateur de période est cumulative, mais la valeur de l'indicateur de point temporel n'est pas cumulative ;
3. La valeur de l'indicateur de période est directement liée à la durée de la période enregistrée, tandis que la valeur de l'indicateur de point temporel n'a aucune relation avec la durée de la période enregistrée.