Galerie de cartes mentales statistiques médicales
Il s'agit d'une carte mentale sur les statistiques médicales. Dans le domaine médical, il s'agit d'un ensemble de concepts, de principes et de méthodes permettant de collecter des données, d'analyser des données et d'en tirer des conclusions.
Modifié à 2023-12-23 18:28:41Cent ans de solitude est le chef-d'œuvre de Gabriel Garcia Marquez. La lecture de ce livre commence par l'analyse des relations entre les personnages, qui se concentre sur la famille Buendía et raconte l'histoire de la prospérité et du déclin de la famille, de ses relations internes et de ses luttes politiques, de son métissage et de sa renaissance au cours d'une centaine d'années.
Cent ans de solitude est le chef-d'œuvre de Gabriel Garcia Marquez. La lecture de ce livre commence par l'analyse des relations entre les personnages, qui se concentre sur la famille Buendía et raconte l'histoire de la prospérité et du déclin de la famille, de ses relations internes et de ses luttes politiques, de son métissage et de sa renaissance au cours d'une centaine d'années.
La gestion de projet est le processus qui consiste à appliquer des connaissances, des compétences, des outils et des méthodologies spécialisés aux activités du projet afin que celui-ci puisse atteindre ou dépasser les exigences et les attentes fixées dans le cadre de ressources limitées. Ce diagramme fournit une vue d'ensemble des 8 composantes du processus de gestion de projet et peut être utilisé comme modèle générique.
Cent ans de solitude est le chef-d'œuvre de Gabriel Garcia Marquez. La lecture de ce livre commence par l'analyse des relations entre les personnages, qui se concentre sur la famille Buendía et raconte l'histoire de la prospérité et du déclin de la famille, de ses relations internes et de ses luttes politiques, de son métissage et de sa renaissance au cours d'une centaine d'années.
Cent ans de solitude est le chef-d'œuvre de Gabriel Garcia Marquez. La lecture de ce livre commence par l'analyse des relations entre les personnages, qui se concentre sur la famille Buendía et raconte l'histoire de la prospérité et du déclin de la famille, de ses relations internes et de ses luttes politiques, de son métissage et de sa renaissance au cours d'une centaine d'années.
La gestion de projet est le processus qui consiste à appliquer des connaissances, des compétences, des outils et des méthodologies spécialisés aux activités du projet afin que celui-ci puisse atteindre ou dépasser les exigences et les attentes fixées dans le cadre de ressources limitées. Ce diagramme fournit une vue d'ensemble des 8 composantes du processus de gestion de projet et peut être utilisé comme modèle générique.
statistiques médicales
introduction
Qu'est-ce que les statistiques médicales
En médecine, ensemble de concepts, de principes et de méthodes permettant de collecter des données, de les analyser et d'en tirer des conclusions.
Contenu de base des statistiques médicales
Étapes de base du travail statistique
1.Conception
2. Recueillir des informations
3. Organisez les informations
4. Analyser les données
Concepts de base en statistiques médicales
Homogénéité et variation
homogène
Il fait référence à la nature identique ou similaire entre les unités d'observation ou les études, et nécessite généralement que les facteurs d'influence des principaux indicateurs de recherche soient identiques ou fondamentalement identiques.
Mutations
Fait référence à la différence entre différentes unités d'observation ou individus de la population pour la même mesure.
Variables et types de données
variable
C'est l'abréviation de variable aléatoire, qui représente les caractéristiques, la quantité et le degré de l'objet observé. Les valeurs observées d'une variable sont appelées données, également appelées valeurs de variables.
type de données
Données quantitatives (données métriques)
Données qualitatives (données de comptage)
Données ordinales (données semi-quantitatives ou données hiérarchiques)
Faites attention à l'analyse
Type numérique
Il existe une unité de mesure
Par exemple : taille, poids, tension artérielle, température, etc. ; nombre de membres de la famille, pouls, nombre de globules blancs, etc.
Qualitatif
Aucune unité de mesure
Par exemple : sexe (homme/femme), groupe sanguin (A/B/AB/O), etc.
Qualitatif
Chaque catégorie diffère par degré ou par ordre
Par exemple : résultats de laboratoire (-/ / /), degré de traitement (significatif/efficace/amélioré/inefficace), etc.
population et échantillon
dans l'ensemble
Désigne l'ensemble de l'objet de recherche, qui comprend généralement toutes les unités ou individus d'observation homogènes.
échantillon
Désigne une partie représentative des unités d'observation ou des individus sélectionnés dans la population, généralement obtenus par sélection aléatoire.
paramètre
Indicateurs statistiques qui décrivent les caractéristiques globales.
Statistiques
Indicateurs caractéristiques calculés à partir d'échantillons.
Probabilité et distribution de probabilité
Probabilité
Une mesure quantitative qui décrit la probabilité qu'un événement aléatoire se produise.
Événements aléatoires
Aussi appelés « événements incertains » : événements qui peuvent ou non se produire. Comparez avec « événement inévitable ».
Événement à faible probabilité
Il est habituel d’appeler un événement avec P ≤ 0,05 un événement à faible probabilité, ce qui signifie qu’il est très peu probable qu’il se produise dans un échantillonnage aléatoire.
Nous pensons que cela n'arrivera probablement pas
Description statistique
Des données quantitatives
tableau de fréquence
Étapes de création du tableau de fréquence
1. Déterminez le nombre de groupes
2. Déterminez la distance du groupe
3. Déterminez les limites du groupe
4. Déterminez la fréquence du groupe
Utilisations des tableaux de distribution de fréquence et des histogrammes
1. En tant que forme de relevé de données, il peut remplacer les données originales pour faciliter une analyse plus approfondie.
2. Il est pratique d’observer le type de distribution des données.
3. Il est facile de trouver des valeurs extrêmement grandes ou extrêmement petites dans les données éloignées du groupe.
4. Lorsque la taille de l'échantillon est relativement grande, la fréquence de chaque segment de groupe peut être utilisée comme estimation de la probabilité.
Version PPT pour l'enseignant
①Révéler le type de distribution de fréquence (s'il s'agit d'une distribution normale)
Distributions symétriques et asymétriques
② Révéler les caractéristiques de distribution de fréquence (niveau moyen, degré de variation)
Indicateur statistique qui décrit la tendance centrale
moyenne
Il s'agit d'un indicateur statistique qui décrit la tendance centrale ou le niveau moyen d'un ensemble d'observations. Y compris la moyenne arithmétique, la moyenne géométrique et la médiane, etc.
Classification
Moyenne arithmétique (X)
Convient aux valeurs de variables quantitatives qui sont normalement distribuées ou approximativement normalement distribuées
Moyenne de la population μ, moyenne de l’échantillon x–
Moyenne géométrique (G)
Convient aux données proportionnelles avec une relation multiple
Formule de calcul G=lg⁻¹(∑lgX/n)
Tels que le titre d'anticorps, le titre d'agglutination sérique, le nombre de bactéries, la concentration de certaines substances, etc.
Médiane et centile
Médiane (M)
centile
Quartiles (Q)
P₂₅, P₇₅
centile
Pₓ
Lorsque les données sont normalement distribuées, μ≈M, P₅₀=M
Applicable à 1. Il y a des valeurs très grandes et très petites aux deux extrémités 2. Pas de données exactes à la fin de la distribution 3. Le type de distribution global est inconnu
Indicateurs statistiques qui décrivent le degré de variation
degré de variation
Le degré de différence ou de changement (ou de variation) entre un ensemble de valeurs observées
Classification
Extrêmement médiocre (R)
Convient aux distributions asymétriques, le type de distribution est inconnu
Écart interquartile (QR)
Écart (Var)
Convient pour une distribution normale
Variance de la population σ², variance de l'échantillon s²
Somme des carrés (SS) à partir de la moyenne
Décrit le degré de dispersion de chaque observation par rapport au niveau moyen X–
∑(X-X–)²
degrés de liberté
ν=n-1
Cela signifie que parmi les n carrés d’écarts par rapport à la moyenne, en raison de la limitation de la moyenne de l’échantillon X–, seules n-1 sommes des carrés d’écarts par rapport à la moyenne sont indépendantes.
écart-type
Écart type de la population σ, écart type de l'échantillon s
Coefficient de variation (CV)
Utilisé pour comparer directement le degré de variation de deux échantillons sans être affecté par le niveau moyen (ou la moyenne des données de référence)
Il s'agit d'un indicateur statistique qui décrit le degré relatif de dispersion.
CV=S/X–×100 %
Données qualitatives
nombre relatif
Taux
Il représente le rapport entre le nombre d'occurrences d'un certain phénomène et le nombre total d'occurrences possibles dans une certaine plage spatiale ou temporelle, indiquant l'intensité ou la fréquence d'un certain phénomène.
Indique l'intensité ou la fréquence d'un certain phénomène sur une certaine période de temps. C'est un indicateur d'intensité.
rapport de composition
Indique la proportion de chaque composant de quelque chose dans l'ensemble, souvent exprimée en pourcentage.
Décrire les composants constitutifs et servir d'indicateurs constitutifs.
comparaison relative (rapport)
Il s'agit du rapport de deux valeurs d'indicateurs liées A et B, utilisé pour décrire le niveau de comparaison entre les deux.
Les deux peuvent être des nombres absolus, des nombres relatifs ou des nombres moyens, et peuvent avoir des propriétés identiques ou différentes.
Indicateurs relatifs couramment utilisés
taux de mortalité
Le nombre total de décès dans un certain endroit au cours d'une certaine année / la population annuelle moyenne du même endroit la même année × 1 000 %
taux de létalité
Le nombre de décès dus à une certaine maladie pendant une certaine période / le nombre de patients atteints de la même maladie pendant la même période × 100 %
Incidence
Nombre de nouveaux cas d'une certaine maladie au cours d'une certaine période/population moyenne au cours de la même période×proportion de base
Prévalence
Le nombre de cas d'une certaine maladie dans un certain endroit pendant une certaine période/la population moyenne de l'endroit au cours de la même période×proportion de base
Points à noter lors de l'utilisation d'indicateurs relatifs
1. Ne confondez pas ratio de composition et taux
2. Lorsque vous utilisez des nombres relatifs, le dénominateur ne doit pas être trop petit.
3. Calculez correctement le tarif total
Additionnez respectivement les numérateurs et les dénominateurs (si les dénominateurs sont similaires, vous pouvez diviser directement)
4. Faites attention à la comparabilité des données
Utilisez la méthode de standardisation pour convertir différentes compositions en compositions standards, puis comparez-les.
5. Une erreur d'échantillonnage existe dans la fréquence d'échantillonnage ou le rapport de composition
Effectuer des tests d’hypothèses et des inférences statistiques
Méthode de test d'hypothèse
test t
Test t sur un échantillon (Test t moyen sur un échantillon unique)
Conditions applicables : 1. L'indicateur est un indicateur quantitatif et obéit à la distribution normale 2. Petit échantillon
Utilisé pour tester si la moyenne de la population μ représentée par la moyenne de l'échantillon X est différente de la moyenne de la population connue μ₀
Test t moyen pour échantillons appariés (test t apparié)
Conditions applicables : 1. L'indicateur est une valeur de variable quantitative 2. Chaque paire de valeurs de différence d obéit à la distribution normale 3. Petit échantillon
L'essence est le test t sur un échantillon comparant la moyenne de l'échantillon de différence d avec la moyenne de population connue μᵈ = 0
Test t sur deux échantillons indépendants (Test t groupé)
Conditions applicables : 1. L'indicateur est une valeur de variable quantitative 2. Il existe deux groupes d'échantillons, et les deux groupes d'échantillons sont indépendants 3. Les deux populations dont sont issus les deux échantillons obéissent respectivement à la distribution normale 4. La population de les deux populations normalement distribuées Les variances sont égales (variances homogènes) 5. Petit échantillon
Les deux tailles d'échantillon n₁ et n₂ peuvent être égales ou différentes et doivent être aussi égales que possible.
analyse de variance (Essai F)
L'idée de base est de décomposer la variation totale de toutes les valeurs observées en variations partielles correspondantes en fonction des facteurs d'influence. Sur cette base, calculez la valeur statistique F du test d'hypothèse pour obtenir une inférence statistique indiquant s'il existe une différence dans la moyenne globale.
Si F≥Fα/2, alors P≤α, rejetons H₀ et acceptons H₁, on peut reconnaître que les variances des deux populations ne sont pas égales ; sinon, les variances des deux populations sont considérées comme homogènes ;
Conception complètement aléatoire (ANOVA)
Les étapes de base
1. Établir une hypothèse : H₀ : μᴀ=μʙ=μᴄ H₁ : Pas tout de même ou pas tout de même
2. Calculer et lister le tableau d'analyse des écarts
3. Définir la valeur P et tirer des conclusions
Difficulté : Calcul des divisions et des combinaisons
Éliminer les conflits internes et externes (entre et au sein des groupes)
Comparaison par paires (comparaison multiple)
test q (méthode SNK)
L'erreur MS calculée dans un plan complètement aléatoire est requise avant que des comparaisons par paires puissent être effectuées
Test paramétrique
Type de distribution connu, tester les paramètres globaux (sensibles, exigences élevées)
Test du chi carré (test χ²)
S'applique à savoir s'il existe une différence entre deux ou plusieurs taux globaux ou ratios de composition. Les données sont des données variables catégorielles, c'est-à-dire des données qualitatives
Test χ² à quatre tables
2×2 (2 groupes d'objets d'observation, opposant 2 types de résultats)
Degré de liberté ν = (nombre de lignes R-1) × (nombre de colonnes C-1)
La valeur χ² reflète le degré d'accord entre la fréquence réelle et la fréquence théorique.
Conditions applicables : 1. Lorsque n≥40 et tous les T≥5, utilisez la formule de base du test χ² ou la formule spéciale du test χ² pour les données à quatre tables ; 2. Lorsque n≥40 et 1≤T<5, utilisez la formule de correction du test χ² de données à quatre tables ; 3. Lorsque n<40 ou T<1, utilisez la méthode de probabilité exacte de Fisher (méthode de probabilité exacte) avec quatre tableaux de données.
Test χ² apparié
Convient aux données dont la taille de l'échantillon n'est pas très grande
1.b c≥40, formule de base 2.b c<40, formule de correction
Test de somme de rangs non paramétrique
Champ d'application : 1. Distribution inconnue ou non normale 2. Données graduées 3. Aucune valeur définie aux deux extrémités des données
Test de somme de classement (Wilcoxon)
Étapes de base : 1. Établir une hypothèse de test et déterminer le niveau de test 2. Compiler la somme des rangs (somme des rangs) et combiner la statistique de la somme des rangs 3. Déterminer la valeur P et faire des inférences
inférence statistique
Estimation des paramètres
erreur d'échantillonnage
La différence entre une statistique d'échantillon et un paramètre de population causée par l'échantillonnage
⑴Des différences individuelles existent, c'est-à-dire que chaque X– est différent ⑵L'erreur d'échantillonnage aléatoire, c'est-à-dire X– est différente de μ
erreur type de la moyenne (erreur d'échantillonnage absolue)
L'écart type reflète la variation entre les moyennes de l'échantillon
σₓ₋=σ/√n, sₓ₋=s/√n
Plus l’erreur type est petite, plus l’estimation est précise.
La moyenne de l'échantillon X– obéit également à la distribution normale, c'est-à-dire que la moyenne de la population de X– est toujours μ, L'écart type de la moyenne de l'échantillon est σ√n
Estimation des paramètres
fait référence à l'estimation des paramètres de population à partir de statistiques d'échantillon
Méthode d'estimation
estimation ponctuelle
Il s'agit d'utiliser directement une valeur unique comme estimation du paramètre global
L'influence de l'erreur d'échantillonnage n'est pas prise en compte et sa précision ne peut pas être évaluée.
estimation de l'intervalle
Fait référence au calcul d'un intervalle basé sur une probabilité pré-donnée afin qu'il puisse contenir des paramètres globaux inconnus.
La probabilité 1-α donnée à l'avance est appelée crédibilité (généralement 0,95 ou 0,99), L'intervalle calculé est appelé intervalle de crédibilité ou intervalle de confiance.
Deux éléments d'un intervalle de confiance
1. Crédibilité 1-α
refléter l'exactitude
2. Précision
La largeur de l'intervalle reflète la précision. Plus l'intervalle est étroit, plus l'estimation est précise.
Règles de distribution des erreurs d'échantillonnage (estimation par intervalle de la moyenne de la population)
(1) Répartition Z
Conditions applicables : 1. Grand échantillon, n≥50 2. σ est connu
Fonction : refléter les règles de distribution des erreurs d'échantillonnage ou les règles de distribution d'échantillonnage de la moyenne d'un grand échantillon
z=X–-μ/σ√n
(2) distribution t (erreur d'échantillonnage relative)
Conditions applicables : 1. Petit échantillon, n<50 2. σ inconnu (en variables quantitatives)
Plus le degré de liberté ν est grand, plus la courbe de distribution t est proche de la courbe de distribution normale standard.
t se situe dans les 95 %
(X–-1,96σₓ₋, X– 1,96σₓ₋)
test hypothétique
Également connu sous le nom de test de signification, il s'agit d'un autre élément important de l'inférence statistique. Son objectif est de comparer qualitativement s'il existe une différence entre les paramètres globaux ou si la distribution globale est la même.
Les étapes de base
(1) Établir des hypothèses et déterminer les niveaux de tests
Hypothèse nulle/hypothèse nulle/hypothèse nulle [H₀]
Le résultat "négatif" correspond à la "formule de signe égal"
Hypothèse alternative/contre-hypothèse [H₁]
Le résultat « positif » correspond à la « formule d'inégalité »
(2) Sélectionnez les méthodes de test et calculez les statistiques de test
Calculer la valeur P en fonction de la valeur statistique du test de la méthode
Plus P est petit, plus il y a de raisons de rejeter H₀
(3) Faire des inférences statistiques basées sur la valeur P
Si H₀:X–≠μ est accepté, cela est dû à une erreur d'échantillonnage
Si H₀ n'est pas accepté, alors H₁ n'est pas rejeté : X–≠μ₂, ce qui est dû à la différence essentielle
Avis!
1. L’hypothèse concerne la population générale
2. Prenez H₀ comme centre, mais H₀ et H₁ sont indispensables.
3.H₀Habituellement, le contenu est dans un certain état
4. Paramètres pour les tests d'hypothèses unilatéraux et bilatéraux
Niveau d'étalonnage
Également appelé niveau de signification, représenté par α, il s'agit de la valeur de probabilité de la région de rejet prédéterminée. En pratique, α = 0,05 ou α = 0,01 est généralement utilisé.
Trois éléments
①Selon les informations fournies par l'échantillon (c'est-à-dire les indicateurs statistiques descriptifs de l'échantillon)
②Basé sur des règles spécifiques de distribution des erreurs d'échantillonnage
③Avec une certaine probabilité (généralement 95%)
Distribution normale et plage de valeurs de référence médicale
distribution normale
Déterminé par deux paramètres
μ est un paramètre de position qui décrit le niveau moyen de la distribution normale
Déterminer où se situe la distribution normale sur l'axe X
σ est un paramètre de forme qui décrit le degré de variation de la distribution normale.
Déterminer la forme de distribution de la courbe normale
droit régional
①L'aire sous la courbe est la probabilité
②La surface totale sous la courbe est de 1 ou 100 %
③Toutes les courbes normales ont la même aire dans la plage de tout multiple du même écart type autour de μ
distribution normale standard
µ=0,σ=1
Transformation standardisée de variables aléatoires
z = X-μ/σ
Plage de valeurs de référence médicale
Pour toutes les valeurs d'observation individuelles obtenues à partir de la population de référence sélectionnée, des limites percentiles sont établies à l'aide de méthodes statistiques et la plage de fluctuation des valeurs d'observation individuelles est obtenue. Généralement, la plage de référence de 95 % est utilisée.
importance
1. Comme indice de référence pour déterminer cliniquement la normalité et l'anomalie
2. Peut être utilisé pour évaluer le niveau de développement des enfants
Précautions
1. Déterminer une population de référence homogène
2. Sélectionnez un nombre suffisant d'échantillons de référence
3. Contrôler les erreurs de détection
4. Sélectionnez les seuils simples et bilatéraux
Certains indicateurs ne sont anormaux que s'ils sont trop grands ou trop petits
5. Choisissez une plage de pourcentage appropriée
6. Sélectionnez la méthode de calcul de la plage de valeurs de référence
Maîtriser les formules et les processus de calcul
réparation
Taux normalisé
erreur système
erreur de mesure aléatoire
contradiction
Crédibilité ↑, plus l'intervalle de confiance est large
Taille de l’échantillon ↑, plus l’intervalle de confiance est étroit
séquence dynamique
1. Concept : une série d'indicateurs statistiques qui décrivent quelque chose dans une certaine séquence temporelle (Il peut s'agir d'un nombre absolu, d'un nombre relatif ou d'un nombre moyen) Disposez-les dans l'ordre, observez et comparez.
2. Fonction : ① Calculer trois indicateurs et décrire statistiquement les données qualitatives ; ②Utilisez la vitesse de développement moyenne pour prédire les occurrences futures (prémisse : V futur = V maintenant)
Représentation des données
conforme à la distribution normale
(X–±s²)
(Moyenne > Variance)
N'est pas conforme à la distribution normale
M(P₂₅,P₇₅)