Galerie de cartes mentales Carte mentale des statistiques
Il s'agit d'un article sur la cartographie mentale statistique, y compris les bases de la conception de la recherche en médecine traditionnelle chinoise, la distribution de probabilité des variables, l'estimation des paramètres, la description des données statistiques, etc.
Modifié à 2023-12-02 19:35:04statistiques
introduction
Statistiques et médecine traditionnelle chinoise
Pourquoi étudier les statistiques de la médecine chinoise
Plusieurs notions de base
dans l'ensemble
Définition : Une collection contenant tous les individus (données) étudiés
S'il est dénombrable selon le nombre d'unités qu'il contient
population finie
population infinie
échantillon
Définition : C'est un ensemble d'éléments extraits de l'ensemble
Taille de l'échantillon : le nombre d'éléments qui composent l'échantillon
paramètre
Définition : Il s'agit d'une mesure numérique générale utilisée pour décrire les caractéristiques d'un échantillon.
Statistiques
Définition : Il s'agit d'une mesure numérique générale utilisée pour décrire les caractéristiques d'un échantillon.
variable
Définition : Un concept qui décrit certaines caractéristiques d'un phénomène
Diviser les variables par type de données
Variables catégorielles
Définition : Un nom qui décrit une catégorie de choses
variable ordinale
Définition : Un nom décrivant une catégorie ordonnée de choses
Variable numérique
Définition : Un nom qui décrit les caractéristiques numériques de quelque chose
Application des statistiques à la médecine traditionnelle chinoise
Comment apprendre les statistiques de la médecine chinoise
Bases de la conception de la recherche en médecine traditionnelle chinoise
Aperçu de la conception de la recherche
Caractéristiques de la recherche expérimentale
Éléments de base de la conception expérimentale
facteurs de traitement
sujet
effet expérimental
objectivité
précision
sensibilité
Principes de base de la conception expérimentale
Principe de contraste
contrôle placebo
Contrôle vide
Contrôle expérimental
Contrôle standard
maîtrise de soi
Comparaison historique
principe aléatoire
Principe de répétition
Type de conception expérimentale
Conception complètement aléatoire
Conception jumelée
conception en blocs aléatoires
Conception factorielle
Méthodes d'échantillonnage couramment utilisées
échantillonnage aléatoire simple
échantillonnage stratifié
Échantillonnage systématique (échantillonnage égal, échantillonnage mécanique)
échantillonnage en grappes
Description des statistiques
variation individuelle
répartition des fréquences
tableau de distribution de fréquence
1. Trouvez la différence extrême 2. Déterminez la distance du groupe et la section du groupe 3. Préparer le tableau de distribution des fréquences 4. Calculer la fréquence et la fréquence cumulée
Diagramme de distribution de fréquence
utiliser
1. Révéler le type de distribution et les caractéristiques des données 2. Faciliter la découverte de valeurs suspectes individuelles extrêmement grandes ou extrêmement petites 3. Jugement de normalité 4. Faciliter le calcul ultérieur des indicateurs et le traitement statistique
Description statistique des données quantitatives
Indicateur statistique qui décrit la tendance centrale
moyenne arithmétique
moyenne de l'échantillon
Moyenne de la population μ
Conditions : données de distribution symétrique unimodale, en particulier les données de distribution normale
Moyenne géométrique (G)
Conditions : données géométriques, en particulier données lognormales
Avis
Les valeurs observées/mesurées ne peuvent pas avoir 0
Les valeurs observées/mesurées doivent avoir le même signe, soit toutes positives, soit toutes négatives
Médiane (M)
Triez un ensemble d'observations de petite à grande, et l'observation centrale est la médiane
La médiane convient pour décrire l'asymétrie ou les distributions de fréquences sans valeurs définies aux deux extrémités et a une forte applicabilité.
centile
Triez un ensemble d’observations de petit à grand. La x%ième observation est le xième percentile.
Conditions applicables
Données de distribution asymétriques
Données distribuées irrégulièrement ou données distribuées de manière peu claire
données ouvertes
mode
La plupart des occurrences
Cela n’a de sens que lorsque la quantité de données est importante
Indicateurs statistiques qui décrivent le degré de variation
Très pauvre
Également appelée plage complète, représentée par R, c'est la différence entre la valeur maximale et la valeur minimale dans un ensemble de valeurs observées/mesurées.
Plage de différences individuelles dans la réponse : grande plage, grand degré de variation, petite plage, faible degré de variation ;
avantage
Calcul simple et signification claire
défaut
Il ne reflète que la différence entre deux valeurs extrêmes et est instable.
Écart interquartileQ
Reflète la plage de la moitié médiane des observations/mesures
Avantages : calcul simple, stable par rapport à la plage
Inconvénients : Ne prend toujours pas en compte la variation de toutes les valeurs observées/mesurées, et n'est toujours pas assez stable
Il est principalement utilisé pour décrire les caractéristiques de variation de données de distribution manifestement asymétriques et est souvent utilisé en combinaison avec des graphiques statistiques.
variance
Plus la variance est grande, plus la variation est grande
Avantages : Prend en compte toutes les variations des valeurs observées/mesurées, relativement stable
Inconvénients : les dimensions (c'est-à-dire les unités) sont modifiées et ne peuvent parfois pas être expliquées
écart-type
Lorsque l'unité de la moyenne est la même et que les valeurs sont similaires, l'écart type ↑ degré de variation ↑, moins la moyenne est représentative.
Avantages : Compte tenu de la variation de toutes les valeurs observées/mesurées, l'unité est la même que l'indicateur d'origine, relativement stable
coefficient de variation
Aussi appelé coefficient de dispersion, représenté par CV
Des avantages exceptionnels
Aucune unité pour une comparaison facile
Conditions applicables
Comparez le degré de variation de plusieurs ensembles de données avec différentes unités
Comparez le degré de variation de plusieurs ensembles de données avec des moyens très différents
Description statistique des données qualitatives et des données hiérarchiques
nombre absolu
nombre relatif
Nombres relatifs couramment utilisés
taux (indicateur de fréquence)
Taux
Indique le rapport entre le nombre d'occurrences d'un phénomène et le nombre total d'occurrences possibles dans une certaine plage spatiale ou temporelle.
Les ratios et les taux de composition sont différents. Nous ne devrions pas examiner combien de personnes qui développent un cancer du poumon fument, mais plutôt combien de personnes qui fument développent un cancer du poumon.
Remarque : signification du numérateur et du dénominateur ; unité d'observation ; base de proportion (100)
Indicateurs relatifs couramment utilisés en médecine
cas
Indique la fréquence d'une certaine maladie parmi un certain groupe de personnes à un moment donné. Il est généralement utilisé pour indiquer l'apparition ou la prévalence de maladies chroniques à longue évolution.
Formule : Prévalence d'une certaine maladie = (nombre de cas d'une certaine maladie dans un certain endroit pendant une certaine période/population moyenne au même endroit pendant la même période) * proportion de base
taux de létalité
Indique la fréquence des décès dus à une certaine maladie chez les patients pendant une certaine période de temps
Formule : Taux de létalité d'une certaine maladie = (nombre de décès dus à une certaine maladie pendant une certaine période/nombre de patients atteints de la maladie au cours de la même période) * 100 %
Incidence
Indique la fréquence des nouveaux cas d'une certaine maladie parmi une certaine population au cours d'une certaine période de temps.
Formule : Taux d'incidence d'une certaine maladie = (nombre de nouveaux cas d'une certaine maladie au cours d'une certaine période/population moyenne au cours de la même période) * proportion de base
taux de mortalité
Reflète le nombre de décès pour 1 000 personnes dans un endroit donné au cours d'une année donnée.
Formule : Taux de mortalité = (nombre de décès dans un certain endroit au cours d'une certaine année/population moyenne du même endroit la même année) * 1 000
Comparer
comparer aux
Utilisé pour décrire le niveau de comparaison entre les deux
Risque relatif (RR)
Indique combien de fois le risque de maladie ou de décès dans le groupe exposé est celui du groupe non exposé, indiquant la force de l'association entre la maladie et l'exposition.
Rapport de cotes (OR)
Exprime le rapport de cotes de la proportion exposée par rapport à la proportion non exposée dans le groupe de cas et le groupe témoin.
Rapport de composition (indice de composition)
Indique la proportion ou la répartition des composants internes d'un objet ou d'un phénomène
Caractéristiques
La somme est égale à 100% ou 1
Ne peut pas augmenter ou diminuer en même temps
Généralement, le résultat est limité à deux décimales.
Notes d'application
Le dénominateur ne peut pas être trop petit
Le ratio et le taux ne peuvent pas être mélangés
Calcul du taux de consolidation (taux global)
Comparabilité
Erreur d'échantillonnage – Test d'hypothèse
Taux normalisé
Lors de la comparaison de la prévalence, de l'incidence, de la mortalité et d'autres données de deux groupes différents, afin d'éliminer l'impact de leur composition interne sur les taux, des taux standardisés peuvent être utilisés.
Tableaux et graphiques statistiques
Tableau des statistiques
structure
Numéro de tableau
titre
La position médiane supérieure de la table
doubler
Compteur généralement à trois fils
nombre
Remarque
Lorsqu'une explication est nécessaire, veuillez l'indiquer avec * dans le tableau et écrire l'explication sous le tableau.
graphique récapitulatif
structure
titre
Numéroté sous l'image
domaine graphique
titre
titre
Titre horizontal
titre vertical
légende
échelle
unité
Couramment utilisé
Histogramme
Nuage de points
graphique linéaire
diagramme circulaire
graphique centile
test hypothétique
test hypothétique
importance
Déduire si la population est la même en fonction de la différence entre les deux échantillons
Idée basique
Pensée de preuve par contradiction
Les étapes de base
1. Établir des hypothèses et déterminer les niveaux de test 2. Sélectionnez les méthodes de test et calculez les statistiques de test 3. Faire des inférences statistiques basées sur les valeurs P
test t
Test t sur un échantillon
Son objectif est de comparer et de tester si la moyenne de la population μ représentée par la moyenne de l'échantillon X est différente de la moyenne de la population connue.
Test t moyen pour échantillons appariés
Classification 1. Appariement homologue : Deux parties du même sujet ou du même spécimen sont assignées au hasard pour recevoir deux traitements différents. 2. Appariement hétérogène : Afin d'éliminer l'influence des facteurs de confusion, deux sujets homogènes sont appariés pour recevoir deux traitements.
deux types d'erreurs
le premier tri
Catégorie 2
Précautions
Estimation de la moyenne de la population et test d’hypothèses
Erreur d'échantillonnage et erreur type
Méthodes et méthodes couramment utilisées
méthode
Test paramétrique
Test non paramétrique
Chemin
méthode de la valeur critique
méthode de la valeur p
Intervalle de confiance
Test de normalité et transformation de variables
Test de normalité
méthode de jugement simple
Représentation graphique
Diagramme P-P
Diagramme Q-Q
Méthode de test d'hypothèse : valeur P
Test d'homogénéité des variances
Essai F
Le test de Levene
Estimation des paramètres
Erreur d'échantillonnage et distribution d'échantillonnage
concept
La différence entre une statistique d'échantillon et un paramètre de population causée par l'échantillonnage
Distribution d'échantillonnage et erreur type de la moyenne de l'échantillon
Distribution d'échantillonnage de la moyenne de l'échantillon standard
La moyenne de l'échantillon est distribuée autour de la moyenne de la population
À mesure que n augmente, le degré de variation diminue
Petite plage de variation
Pas nécessairement égal à la moyenne globale
Erreur standard:
Indique la taille de l’erreur moyenne de l’échantillon et décrit la fiabilité de la moyenne de l’échantillon.
Erreur type = écart type / taille de l'échantillon de racine carrée
distribution
est une courbe de distribution unimodale
Le degré de liberté v est le seul paramètre
Distribution d'échantillonnage et erreur type de la fréquence d'échantillonnage
Estimation de la moyenne de la population
estimation ponctuelle
Utiliser des exemples de statistiques pour estimer directement les paramètres de la population
estimation de l'intervalle
Intervalle de confiance
Un intervalle est utilisé pour estimer la plage du paramètre global en fonction d'une certaine probabilité ou crédibilité (1-α). Cette plage est généralement appelée intervalle de crédibilité ou intervalle de confiance du paramètre. est appelé crédibilité ou confiance est souvent considérée comme 95 % ou 99 %.
Précision
Plus la crédibilité est proche de 1, plus la précision est élevée
Précision
Plus la longueur CL est petite, plus la précision est élevée.
Estimation du tarif global
Utilisation du taux d'échantillonnage comme estimation ponctuelle du taux de population
Distribution de probabilité des variables
Caractéristiques globales de la variable
distribution normale
concept
fonctionnalité
Distribution unimodale, la position du pic est à la moyenne
Concentration, symétrie, variabilité uniforme
Dépend de μ et σ
Loi sur la répartition des zones
L'aire totale entre la courbe normale et l'axe horizontal est toujours égale à 1
Distribution binomiale et distribution de poisson
Détermination des plages de valeurs médicales de référence
Définition : la plupart des gens normaux
en principe
La taille de l'échantillon est suffisamment grande pour les personnes normales
Déterminer les côtés simples et doubles en fonction des caractéristiques de l'indicateur
Valeur centile appropriée