Galerie de cartes mentales Chapitre 23 - Statistiques et science des données
Il s'agit d'une carte mentale sur les statistiques et la science des données. Les statistiques sont une discipline relative aux données. De manière générale, les statistiques consistent à collecter, organiser, analyser des données et à en tirer des conclusions.
Modifié à 2023-11-01 18:48:52Cent ans de solitude est le chef-d'œuvre de Gabriel Garcia Marquez. La lecture de ce livre commence par l'analyse des relations entre les personnages, qui se concentre sur la famille Buendía et raconte l'histoire de la prospérité et du déclin de la famille, de ses relations internes et de ses luttes politiques, de son métissage et de sa renaissance au cours d'une centaine d'années.
Cent ans de solitude est le chef-d'œuvre de Gabriel Garcia Marquez. La lecture de ce livre commence par l'analyse des relations entre les personnages, qui se concentre sur la famille Buendía et raconte l'histoire de la prospérité et du déclin de la famille, de ses relations internes et de ses luttes politiques, de son métissage et de sa renaissance au cours d'une centaine d'années.
La gestion de projet est le processus qui consiste à appliquer des connaissances, des compétences, des outils et des méthodologies spécialisés aux activités du projet afin que celui-ci puisse atteindre ou dépasser les exigences et les attentes fixées dans le cadre de ressources limitées. Ce diagramme fournit une vue d'ensemble des 8 composantes du processus de gestion de projet et peut être utilisé comme modèle générique.
Cent ans de solitude est le chef-d'œuvre de Gabriel Garcia Marquez. La lecture de ce livre commence par l'analyse des relations entre les personnages, qui se concentre sur la famille Buendía et raconte l'histoire de la prospérité et du déclin de la famille, de ses relations internes et de ses luttes politiques, de son métissage et de sa renaissance au cours d'une centaine d'années.
Cent ans de solitude est le chef-d'œuvre de Gabriel Garcia Marquez. La lecture de ce livre commence par l'analyse des relations entre les personnages, qui se concentre sur la famille Buendía et raconte l'histoire de la prospérité et du déclin de la famille, de ses relations internes et de ses luttes politiques, de son métissage et de sa renaissance au cours d'une centaine d'années.
La gestion de projet est le processus qui consiste à appliquer des connaissances, des compétences, des outils et des méthodologies spécialisés aux activités du projet afin que celui-ci puisse atteindre ou dépasser les exigences et les attentes fixées dans le cadre de ressources limitées. Ce diagramme fournit une vue d'ensemble des 8 composantes du processus de gestion de projet et peut être utilisé comme modèle générique.
Statistiques et science des données
statistiques
définition
Les statistiques sont une discipline relative aux données. En résumé, les statistiques consistent à collecter, organiser, analyser des données et à en tirer des conclusions.
deux branches
Statistiques descriptives
Définition : Méthodes statistiques pour collecter, organiser et décrire les données de recherche.
(1) Comment obtenir les données requises (collecte) (2) Comment organiser et afficher des données à l'aide de graphiques ou de méthodes mathématiques (organisation) (3) Comment décrire les caractéristiques générales des données (description)
statistiques déductives
Signification : Une méthode statistique qui étudie comment utiliser des échantillons de données pour déduire les caractéristiques de la population.
1. Estimation des paramètres
Utiliser des exemples d'informations pour déduire les caractéristiques globales
2. Test d'hypothèse
Utiliser des exemples d'informations pour déterminer si l'hypothèse globale est vraie
Variables et données
variable
Définition : Une variable est un attribut ou une caractéristique de l'objet de recherche, qui peut avoir deux ou plusieurs valeurs possibles.
Variables quantitatives
Aussi appelée « variable de quantité », la valeur de la variable est la quantité. Tels que les ventes de l'entreprise, le nombre d'employés enregistrés
Variables qualitatives
Variables catégorielles
La valeur de la variable est la catégorie. Tels que le secteur d’activité auquel appartient l’entreprise et le sexe des employés
variable ordinale
Les valeurs des variables sont catégorielles et séquentielles. Tels que le niveau d'éducation des employés, la satisfaction
données
Définition : Les données sont le résultat de la mesure et de l’observation de variables. Les données peuvent être sous forme de valeurs numériques, de texte ou d'images, etc.
Des données quantitatives
C'est le résultat de l'observation d'une variable quantitative et sa valeur est exprimée sous la forme d'une valeur numérique spécifique. Par exemple, les ventes de l'entreprise s'élèvent à 10 millions de yuans
Données classifiées
C'est le résultat de l'observation d'une variable catégorielle, exprimée sous forme de catégorie, généralement exprimée en mots, mais peut également être décrite numériquement. Par exemple, utilisez 1 pour représenter « homme » et 2 pour représenter « femme ».
données séquentielles
C'est le résultat de l'observation d'une variable ordinale, exprimée sous forme de catégorie, généralement décrite par des mots, mais peut également être décrite par des nombres. Par exemple, 1 représente « maîtrise et supérieur », 2 représente « baccalauréat » et 3 représente « diplôme universitaire et inférieur ».
Source de données
Par mode de collecte
observation des données
Données collectées par enquête ou mesure directe. Presque toutes les données statistiques liées aux phénomènes socio-économiques sont des données d'observation, comme le PIB, l'IPC, les prix de l'immobilier, etc.
Données expérimentales
Données collectées en contrôlant les sujets expérimentaux et l'environnement expérimental dans lequel ils sont exposés lors des expériences. Par exemple, des données sur la durée de vie d'un nouveau produit, des données sur l'efficacité d'un nouveau médicament. La plupart des données dans le domaine des sciences naturelles sont des données expérimentales
Selon le point de vue de l'utilisateur
donnée primaire
Les données dérivées d’enquêtes directes et d’expériences scientifiques constituent la source directe de données pour les utilisateurs. Ses principales sources comprennent : l'enquête ou l'observation, l'expérimentation [Astuce] Dans le domaine socio-économique, la principale méthode d'obtention de données lors d'enquêtes statistiques est C’est également un moyen important d’obtenir des données de première main.
Données secondaires
Données dérivées de l’enquête ou de l’expérience de quelqu’un d’autre. Il s'agit d'une source indirecte de données pour les utilisateurs.
enquête statistique
caractéristiques importantes
Premièrement, l’enquête est une activité comportant des plans, des méthodes et des procédures ; Deuxièmement, les résultats de l’enquête se reflètent dans les données collectées.
Classification
Selon l'objet de l'enquête Portée différente
enquête complète
1. Rapports statistiques complets
2. Recensement
(1) Recensement : une enquête d'enregistrement de l'ensemble de la population du pays sans exception
(2) Recensement économique : l'objet se trouve sur le territoire de la République populaire de Chine. Ceux qui exercent des activités industrielles secondaires et tertiaires Toutes personnes morales, unités d’activité industrielle et ménages indépendants.
enquête non approfondie
Mener une enquête sur certaines des unités faisant l'objet d'une enquête. Y compris : rapports statistiques non complets, enquêtes par sondage, enquêtes clés et enquêtes types
Selon le moment de l'inscription à l'enquête Est-ce continu ?
enquête continue
Observer les changements quantitatifs du phénomène global au cours d'une certaine période de temps et expliquer le processus de développement du phénomène, L’objectif est de comprendre l’ensemble des phénomènes sociaux sur une période donnée. Tels que la production de produits en usine, l'apport de matières premières, la consommation d'énergie, la naissance et la mort de la population, etc.
Le résultat est le « nombre de périodes ». Le calcul cumulé est significatif et peut être visualisé sous forme de vidéo.
enquête discontinue
enquêtes menées sur une période de temps considérable (généralement plus d'un an), Généralement, il s’agit d’étudier l’état du phénomène global à un moment donné. Tels que la propriété des équipements de production, la superficie des terres cultivées, etc.
Le résultat est "nombre de points dans le temps". Le calcul cumulé n'a aucun sens et peut être considéré comme une photo.
Chemin
Rapports statistiques
Signification : Une méthode d'enquête qui s'organise uniformément de haut en bas et fournit des données statistiques de base étape par étape de bas en haut. Les rapports statistiques doivent être basés sur certaines données originales et remplis conformément à des formats de tableaux unifiés, des indicateurs unifiés, un délai de soumission et des procédures de soumission unifiés.
Types de rapports statistiques : 1. Selon la portée différente des objets de l'enquête : rapports statistiques complets et rapports statistiques non complets. La plupart des rapports statistiques actuels sont des rapports complets. 2. Selon la durée de la période de référence, elle peut être divisée en : rapport quotidien, rapport mensuel, rapport trimestriel, rapport annuel, etc. 3. Selon le contenu du rapport et la portée de sa mise en œuvre, il peut être divisé en : rapports statistiques nationaux, départementaux et locaux.
recensement
Signification : Une enquête approfondie ponctuelle spécialement organisée dans un but précis, Tels que le recensement, le recensement économique, le recensement agricole, etc. Il est principalement utilisé pour comprendre l’image globale de base des phénomènes sociaux et économiques à un moment donné. Fournir une base permettant au pays de formuler des politiques pertinentes.
4 fonctionnalités
(1) Les recensements sont généralement ponctuels ou périodiques ①Le recensement économique est effectué deux fois tous les 10 ans et est mis en œuvre les années dont le dernier chiffre est 3 ou 8 ; ②Le recensement est effectué tous les 10 ans et est mis en œuvre l'année « 0 » ; ③Le recensement agricole est effectué tous les 10 ans et est mis en œuvre tous les « 6 » ans
(2) Le recensement nécessite généralement une durée d'enquête standard unifiée (c'est-à-dire une date limite), Pour éviter la duplication ou l’omission des données d’enquête et garantir l’exactitude des résultats du recensement [Conseils] L'heure standard pour les cinquième, sixième et septième recensements est minuit le 1er novembre de l'année du recensement. L'heure standard pour le recensement agricole et le recensement économique est minuit le 1er janvier de l'année du recensement. L'heure standard est généralement définie comme l'heure à laquelle les objets étudiés sont relativement concentrés et les changements relatifs sont faibles.
(3) Les données du recensement sont généralement plus précises et présentent un degré plus élevé de standardisation.
(4) Le champ d'utilisation est relativement étroit et ne peut étudier que des phénomènes fondamentaux et spécifiques.
enquête par sondage
Signification : Une enquête non exhaustive qui sélectionne certaines unités de la population d'objets d'enquête comme échantillons à étudier et déduit les caractéristiques quantitatives de la population sur la base des résultats de l'enquête par sondage.
Caractéristiques: (1) Économie : L'avantage le plus important est que, puisque l'unité d'échantillonnage de l'enquête représente généralement une petite partie de l'unité globale, la charge de travail de l'enquête est faible, ce qui implique beaucoup de main d'œuvre, de ressources matérielles, de ressources financières et de temps. être sauvé. (2) Grande actualité : les informations requises peuvent être obtenues rapidement et en temps opportun (3) Large adaptabilité : un plus large éventail d’informations peut être obtenu et convient à l’étude de divers domaines et de diverses questions. (4) Haute précision : la qualité des données des enquêtes par sondage est parfois supérieure à celle des enquêtes globales. La charge de travail étant faible, chaque lien peut être effectué avec plus de soin et les erreurs sont souvent moindres.
Focus sur l'enquête
Signification : Sélectionnez quelques unités clés de la population d'objets d'enquête à étudier. Les unités clés sélectionnées représentent la grande majorité du total en termes de valeur indicielle de l'enquête.
Caractéristiques: Les enquêtes clés ont un large champ d’application et peuvent être réalisées plus rapidement avec moins d’investissement. Obtenir la situation de base ou l'évolution des principaux signes de certains phénomènes. L’objectif nécessite uniquement de comprendre la situation fondamentale et les tendances de développement, et ne nécessite pas la maîtrise de données complètes.
Exemples de matériel pédagogique : (1) Afin de comprendre en temps opportun l'évolution des prix de détail dans les villes urbaines du pays, nous pouvons étudier l'évolution des prix de détail dans 35 grandes et moyennes villes du pays. Il s'agit de l'enquête clé. (2) Pour comprendre en temps opportun la valeur ajoutée et l'actif total des entreprises industrielles du pays, il suffit de mener une enquête ciblée auprès des grandes et moyennes entreprises industrielles du pays. (3) Par exemple, le système de déclaration directe en ligne du Bureau national des statistiques pour 5 000 entreprises industrielles à travers le pays constitue une enquête clé.
enquête typique
Signification : Selon le but et les exigences de l'enquête, sur la base d'une analyse complète des objets étudiés, un certain nombre d'unités typiques ou représentatives sont consciemment sélectionnées pour l'enquête.
effet
(1) Combler les lacunes d’une enquête approfondie (2) L'authenticité des données d'enquête complètes peut être vérifiée sous certaines conditions Par exemple, après un recensement majeur, vous pouvez sélectionner plusieurs unités types pour vérifier l'exactitude des données statistiques.
avantage
Les enquêtes typiques ont l'avantage d'être flexibles et peuvent obtenir des données statistiques approfondies et détaillées grâce à quelques unités typiques. L'enquête typique n'est pas une méthode propre aux activités statistiques, mais c'est une méthode indispensable en termes de processus statistiques. L'utilisation d'enquêtes typiques n'a pas pour but de refléter les caractéristiques quantitatives globales des phénomènes, mais principalement de comprendre les situations spécifiques vives liées aux statistiques, c'est-à-dire les conditions sociales liées à la quantité de phénomènes et à leurs interconnexions, afin de mener des enquêtes approfondies. analyse statistique approfondie
défaut
Limité à la « sélection consciente d'un certain nombre d'unités représentatives », il est largement affecté par la compréhension subjective des gens. Elle doit être utilisée conjointement avec d’autres enquêtes pour éviter toute partialité.
Critères d'évaluation de la qualité statistique
authenticité, exactitude, exhaustivité, Actualité, applicabilité, économie Comparabilité, coordination, disponibilité