Galerie de cartes mentales Analyse de corrélation et de régression linéaire
Contenu de l'analyse de corrélation linéaire et de régression dans les statistiques de médecine préventive. L'analyse de corrélation linéaire et de régression sont des méthodes d'analyse utilisées en statistique pour étudier la relation entre deux ou plusieurs variables.
Modifié à 2024-01-19 15:29:09Cent ans de solitude est le chef-d'œuvre de Gabriel Garcia Marquez. La lecture de ce livre commence par l'analyse des relations entre les personnages, qui se concentre sur la famille Buendía et raconte l'histoire de la prospérité et du déclin de la famille, de ses relations internes et de ses luttes politiques, de son métissage et de sa renaissance au cours d'une centaine d'années.
Cent ans de solitude est le chef-d'œuvre de Gabriel Garcia Marquez. La lecture de ce livre commence par l'analyse des relations entre les personnages, qui se concentre sur la famille Buendía et raconte l'histoire de la prospérité et du déclin de la famille, de ses relations internes et de ses luttes politiques, de son métissage et de sa renaissance au cours d'une centaine d'années.
La gestion de projet est le processus qui consiste à appliquer des connaissances, des compétences, des outils et des méthodologies spécialisés aux activités du projet afin que celui-ci puisse atteindre ou dépasser les exigences et les attentes fixées dans le cadre de ressources limitées. Ce diagramme fournit une vue d'ensemble des 8 composantes du processus de gestion de projet et peut être utilisé comme modèle générique.
Cent ans de solitude est le chef-d'œuvre de Gabriel Garcia Marquez. La lecture de ce livre commence par l'analyse des relations entre les personnages, qui se concentre sur la famille Buendía et raconte l'histoire de la prospérité et du déclin de la famille, de ses relations internes et de ses luttes politiques, de son métissage et de sa renaissance au cours d'une centaine d'années.
Cent ans de solitude est le chef-d'œuvre de Gabriel Garcia Marquez. La lecture de ce livre commence par l'analyse des relations entre les personnages, qui se concentre sur la famille Buendía et raconte l'histoire de la prospérité et du déclin de la famille, de ses relations internes et de ses luttes politiques, de son métissage et de sa renaissance au cours d'une centaine d'années.
La gestion de projet est le processus qui consiste à appliquer des connaissances, des compétences, des outils et des méthodologies spécialisés aux activités du projet afin que celui-ci puisse atteindre ou dépasser les exigences et les attentes fixées dans le cadre de ressources limitées. Ce diagramme fournit une vue d'ensemble des 8 composantes du processus de gestion de projet et peut être utilisé comme modèle générique.
Analyse de corrélation et de régression linéaire
corrélation linéaire
Il s'agit d'une méthode d'analyse statistique qui étudie s'il existe une relation linéaire entre deux variables ainsi que le degré et la direction de la corrélation.
Pour les données bivariées normalement distribuées
étape
Dessinez un nuage de points
Calculer le coefficient de corrélation
coefficient de corrélation linéaire
r représente le coefficient de corrélation de l'échantillon
Valeur sans unité : -1≤ r ≤1
r>0, corrélation positive ; r =1, corrélation positive parfaite ; r<0, corrélation négative ; r = -1, corrélation négative parfaite ; r = 0, corrélation nulle
Plus | r | est proche de 1, meilleure est la corrélation ; Plus | r | est proche de 0, plus la corrélation est mauvaise
ρ représente le coefficient de corrélation global
Test d'hypothèse du coefficient de corrélation
Objectif : tester si le coefficient de corrélation global ρ d'où r provient est 0, afin de déduire si la corrélation entre les deux variables est établie.
méthode
test t
r test (rechercher directement le tableau, aucun calcul requis)
Précautions
(1) Dessinez d’abord un nuage de points avant l’analyse de corrélation ;
(2) Utiliser la corrélation avec prudence lorsque des valeurs aberrantes se produisent, car celles-ci ont un impact plus important sur le coefficient de corrélation ;
(3) L'analyse de corrélation de Pearson convient aux données de distribution normale bivariées ;
(4) La corrélation n'est pas nécessairement une causalité, et la corrélation n'est pas nécessairement une connexion ;
(5) r proche de 0 ne signifie pas qu’il n’y a pas de corrélation entre les deux variables ;
(6) La fusion aveugle de données hiérarchiques est sujette aux artefacts.
analyse de régression
Concept : Obtenez l'équation de régression linéaire de la relation entre les deux variables à travers les données des deux variables et déterminez une droite de régression pour décrire la relation quantitative entre les changements entre les deux variables.
expression générale
Le terme constant a est l'origine de la droite de régression sur l'axe Y
a > 0 signifie que l'intersection de la droite et de l'axe Y est au-dessus de l'origine ; a < 0, signifie que l'intersection de la droite et de l'axe Y est en dessous de l'origine ; a = 0, indiquant que la droite de régression passe par l'origine
Le coefficient de régression b est la pente de la droite de régression
b>0, Y augmente à mesure que X augmente ; b<0, Y diminue à mesure que X augmente ; b = 0, la ligne de régression est parallèle à l'axe X et il n'y a pas de relation linéaire entre Y et X
étape
Dessinez un nuage de points
Calculer le coefficient de régression b et le terme constant a
Test d'hypothèse des coefficients de régression
Objectif : tester si le coefficient de régression global β de b est égal à 0, afin de déduire si l'équation de régression globale est établie.
méthode
analyse de variance
SS est toujours la somme totale des carrés, qui représente la variation totale de Y sans tenir compte de la relation de régression entre Y et X.
Le rendement SS est la somme des carrés de régression, qui reflète la partie de la variation totale de Y qui peut être expliquée par la relation linéaire entre Y et X.
Le résidu SS est la somme résiduelle des carrés, qui reflète l'effet de tous les facteurs sur la variation de Y à l'exception de l'influence linéaire de X sur Y.
test t
tracer une ligne de régression
Précautions
La relation entre deux variables doit être significative ;
La variable dépendante doit suivre une distribution normale ;
L'objectif principal de l'analyse de régression linéaire est la prédiction et le contrôle, et la portée applicable de l'équation de régression est limitée à la plage de valeurs de la variable indépendante ;
Lorsque la tendance changeante des deux variables est non linéaire, il convient d’envisager l’ajustement d’une équation de régression non linéaire.
La relation entre la corrélation linéaire et l'analyse de régression
la différence
Exigences en matière d'informations
Analyse de corrélation : nécessite une distribution normale bivariée
Analyse de régression : variable dépendante Y variable indépendante normalement distribuée X normale ou contrôle
Analyser le contenu
Corrélation : indique s'il existe une relation linéaire entre deux variables
Régression : reflète la relation linéaire entre deux variables
connecter
1. Les signes positifs et négatifs de r et b dans le même ensemble de données sont cohérents, et lorsque r = 0, b =0 ;
2. Les résultats des tests d’hypothèse de r et b pour le même ensemble de données sont cohérents, c’est-à-dire =