心智圖資源庫 醫學統計學
這是一個關於醫學統計學的思維導圖,在醫學領域,關於收集數據、分析數據和由數據得出結論的一組概念、原理和方法的學科。
編輯於2023-12-23 18:28:41Einhundert Jahre Einsamkeit ist das Meisterwerk von Gabriel Garcia Marquez. Die Lektüre dieses Buches beginnt mit der Klärung der Beziehungen zwischen den Figuren. Im Mittelpunkt steht die Familie Buendía, deren Wohlstand und Niedergang, interne Beziehungen und politische Kämpfe, Selbstvermischung und Wiedergeburt im Laufe von hundert Jahren erzählt werden.
Einhundert Jahre Einsamkeit ist das Meisterwerk von Gabriel Garcia Marquez. Die Lektüre dieses Buches beginnt mit der Klärung der Beziehungen zwischen den Figuren. Im Mittelpunkt steht die Familie Buendía, deren Wohlstand und Niedergang, interne Beziehungen und politische Kämpfe, Selbstvermischung und Wiedergeburt im Laufe von hundert Jahren erzählt werden.
Projektmanagement ist der Prozess der Anwendung von Fachwissen, Fähigkeiten, Werkzeugen und Methoden auf die Projektaktivitäten, so dass das Projekt die festgelegten Anforderungen und Erwartungen im Rahmen der begrenzten Ressourcen erreichen oder übertreffen kann. Dieses Diagramm bietet einen umfassenden Überblick über die 8 Komponenten des Projektmanagementprozesses und kann als generische Vorlage verwendet werden.
Einhundert Jahre Einsamkeit ist das Meisterwerk von Gabriel Garcia Marquez. Die Lektüre dieses Buches beginnt mit der Klärung der Beziehungen zwischen den Figuren. Im Mittelpunkt steht die Familie Buendía, deren Wohlstand und Niedergang, interne Beziehungen und politische Kämpfe, Selbstvermischung und Wiedergeburt im Laufe von hundert Jahren erzählt werden.
Einhundert Jahre Einsamkeit ist das Meisterwerk von Gabriel Garcia Marquez. Die Lektüre dieses Buches beginnt mit der Klärung der Beziehungen zwischen den Figuren. Im Mittelpunkt steht die Familie Buendía, deren Wohlstand und Niedergang, interne Beziehungen und politische Kämpfe, Selbstvermischung und Wiedergeburt im Laufe von hundert Jahren erzählt werden.
Projektmanagement ist der Prozess der Anwendung von Fachwissen, Fähigkeiten, Werkzeugen und Methoden auf die Projektaktivitäten, so dass das Projekt die festgelegten Anforderungen und Erwartungen im Rahmen der begrenzten Ressourcen erreichen oder übertreffen kann. Dieses Diagramm bietet einen umfassenden Überblick über die 8 Komponenten des Projektmanagementprozesses und kann als generische Vorlage verwendet werden.
醫學統計學
緒論
什麼是醫學統計學
在醫學領域,關於收集資料、分析資料和由資料得出結論的一組概念、原理和方法的學科。
醫學統計的基本內容
統計工作基本步驟
1.設計
2.收集資料
3.整理資料
4.分析資料
醫學統計中基本概念
同質與變異
同質
指觀察單位或研究間具有相同或相近的性質,通常要求主要研究指標的影響因素相同或基本相同。
變異
指同種測量在總體中不同觀察單位或個體之間的差異。
變數與資料類型
變數
是隨機變數的簡稱,表示觀察對像在性質、數量和程度等方面的特徵。變數的觀測值稱為數據,也稱為變數值。
資料類型
定量數據(計量資料)
定性資料(計數資料)
有序資料(半定量資料或等級資料)
注意辨析
數值型
有計量單位
例如:身高、體重、血壓、溫度等;家庭成員數、脈搏、白血球數等
定性
無計量單位
例如:性別(男/女)、血型(A/B/AB/O)等
定性
各類別有程度或順序上的差異
例如:化驗結果(-/ / / )、治療程度(顯著/有效/改善/無效)等
總體和樣本
整體
指研究對象的全體,它通常由所有的同質觀察單位或個體組成。
樣本
指從總體中選取的有代表性的一部分觀察單位或個體,通常使用隨機選取方法得到。
參數
描述總體特徵的統計指標。
統計量
由樣本計算出的特徵指標。
機率與機率分佈
機率
描述隨機事件出現可能性大小的量化測量。
隨機事件
也稱為「不確定事件」:可能發生,也可能不發生的事件。與「必然事件」對比。
小機率事件
習慣上將P≤0.05的事件稱為小機率事件,表示在一次隨機抽樣中發生的可能性很小
我們認為它很可能不會發生
統計描述
量化數據
頻數圖表
頻數表製作步驟
1.確定組數
2.確定組距
3.確定組限
4.確定組頻
頻數分佈表和直方圖的用途
1.作為陳述資料的形式,可以代替原始資料,以便進一步分析。
2.便於觀察資料的分佈類型。
3.便於發現資料中某些遠離群體的特大或特小值。
4.當樣本量比較大時,可用各組段的頻率作為機率的估計值。
老師PPT版
①揭示頻數分佈類型(是否為常態分佈)
對稱分佈與偏態分佈
②揭示頻數分佈特徵(平均、變異程度)
描述集中趨勢的統計指標
平均數
是描述一組觀察值集中趨勢或平均值的統計指標。包括算數均數、幾何均數和中位數等。
分類
算術均數(X)
適用於常態分佈或近似常態分佈的量化變數值
總體均數μ,樣本均數x–
幾何均數(G)
適用於呈倍數關係的等比資料
計算公式G=lg⁻¹(∑lgX/n)
如抗體滴度、血清凝集效價、細菌數、某些物質濃度等
中位數和百分數
中位數(M)
百分位數
四分位數(Q)
P₂₅、P₇₅
百分位數
Pₓ
當資料為常態分佈時,μ≈M,P₅₀=M
適用於 1.兩端有特大,特小值 2.分佈末端無確切數據 3.總體分佈類型未知
描述變異程度的統計指標
變異程度
一組觀察值之間的差異或變化(或變動)程度大小
分類
極差(R)
適用於偏態分佈,分佈類型未知
四分位數間距(QR)
方差(Var)
適用於常態分佈
總體變異數σ²,樣本變異數s²
離均差平方和(SS)
描述了每個觀測值相對於平均值X–的離散程度
∑(X-X–)²
自由度
ν=n-1
表示在所有的n個離均差平方項中,由於樣本均數X–的限制,只有n-1個離均差平方和是獨立的
標準差
總體標準差σ,樣本標準差s
變異係數(CV)
用於直接比較兩個樣本的變異程度,不受平均值(或參考資料的平均值)影響
是描述相對離散程度大小的統計指標
CV=S/X–×100%
定性數據
相對數
率
表示在某一空間或時間範圍內某現象的發生數與可能發生的總數之比,說明某現像出現的強度或頻率。
說明某段時間某現象發生的強度或頻率,是強度指標
構成比
表示某事物內部各組成部分在整體中所佔的比重,常以百分數表示。
說明構成成分,為構成指標
相對比(比)
是A和B兩個有關聯指標值之比,用以描述兩者的對比水準。
兩者可為絕對數、相對數或平均數,可同性質也可不同性質
常用相對數指標
死亡率
某年某地死亡人口總數/同年該地年平均人口數×1000%
病死率
某期間因某病死亡人數/同期該病的患病人數×100%
發病率
某時期某病新病例數/同期間內平均人口數×比例基數
盛行率
某地某期間某患者病例數/該地同期內平均人口數×比例基數
相對數指標使用的注意問題
1.不要把構成比與率混淆
2.使用相對數時分母不宜過小
3.正確計算合計率
分子、分母分別相加(分母相近時,可直接除數)
4.注意資料的可比較性
使用標準化法,將不同構成變為標準構成再進行比較
5.樣本率或組成比有抽樣誤差
進行假設檢驗,統計推論
假設檢定方法
t檢驗
單樣本t檢定 (單樣本均數t檢定)
適用條件:1.指標為量化指標,服從常態分佈 2.小樣本
用於檢驗樣本均數X–所代表的總體均數μ是否與已知總體均數μ₀有差異
配對樣本均數t檢定 (配對t檢定)
適用條件:1.指標為量化變數值 2.每對差值d服從常態分佈 3.小樣本
實質是差值樣本均數d–與已知總體均數μᵈ=0比較的單樣本t檢驗
兩獨立樣本t檢定 (成組t檢定)
適用條件:1.指標為定量變數值2.有兩組樣本,且兩組樣本是獨立的3.兩個樣本分別來自的兩個總體都服從常態分佈4.兩個常態分佈總體的總體變異數是相等的(方差齊) 5.小樣本
兩樣本量n₁、n₂可等可不等,盡量相等
變異數分析 (F檢驗)
其基本思想是將全部觀測值的總變異依影響因素分解為對應的若干部分變異, 在此基礎上,計算假設檢定的統計量F值,實現總體均數是否有差異的統計推論。
若F≥Fα/2則P≤α,拒絕H₀,接受H₁,可認兩總體變異數不齊:反之,則認為兩總體變異數具有齊性
完全隨機設計 (單因子變異數分析)
基本步驟
1.建立假設:H₀:μᴀ=μʙ=μᴄ H₁:不全相同或全不相同
2.計算,列出變異數分析表
3.界定P值,做結論
難度:計算上的分分合合
消除內、外在矛盾(組間、組內)
兩兩比較(多重比較)
q檢驗(SNK法)
需要完全隨機設計中計算出來的MS誤差,才可以進行兩兩比較
參數檢驗
已知分佈類型,對總體參數檢定(靈敏,要求高)
卡方檢定 (χ²檢驗)
適用於兩個或多個總體比率或構成比之間有無差別 數據為分類變數數據,即定性資料
四表格χ²檢驗
2×2(2組觀察對象,對立2類結果)
自由度ν=(行數R-1)×(列數C-1)
χ²值反映了實際頻數與理論頻數的吻合程度
適用條件: 1.當n≥40且所有的T≥5時,以χ²檢驗的基本公式或四表格資料χ²檢定的專用公式; 2.當n≥40且1≤T<5時,以四表格資料χ²檢驗的矯正公式; 3.當n<40或T<1時,用四表格資料的Fisher確切機率法(精確機率法)。
配對χ²檢驗
適用於樣本量不是很大的資料
1.b c≥40,基本公式 2.b c<40,校正公式
非參數秩和檢定
適用範圍:1.分佈未知或非常態分佈 2.等級資料 3.資料兩端無確定的數值
秩和檢定(Wilcoxon)
基本步驟:1.建立檢定假設,確定檢定水準 2.編秩和(秩次總和)並球秩和統計量 3.確定P值,做出推斷
統計推論
參數估計
抽樣誤差
抽樣造成的樣本統計量與總體參數之間的差異
⑴個體存在差異,即各X–之間不同 ⑵隨機抽樣的誤差,即X–與μ不同
均數的標準誤 (絕對抽樣誤差)
反映樣本均數之間變異的標準差
σₓ₋=σ/√n,sₓ₋=s/√n
標準誤越小說明估計越精確
樣本均數X–也服從常態分佈,即X–的總體均數仍為μ, 樣本均數的標準差為σ√n
參數估計
指由樣本統計量估計總體參數
估計方式
點估計
是使用單一的數值直接作為總體參數的估計值
未考慮抽樣誤差的影響,無法評估其準確程度
區間估計
指按預先給定的機率,計算出一個區間,使它能夠包含未知的總體參數
事先給定的機率1-α稱為可信度(通常取0.95或0.99), 計算得到的區間稱為可信區間或信賴區間
信賴區間的兩個要素
1.可信度1-α
反映準確度
2.精確性
由區間的寬度反映精密度,越窄說明估計越精確
抽樣誤差分佈規律 (總體均數的區間估計)
(一)Z分佈
適用條件:1.大樣本,n≥50 2.σ已知
作用:反映大樣本的樣本均數的抽樣誤差分佈規律法則或抽樣分佈規律
z=X–-μ/σ√n
(二)t分佈 (相對抽樣誤差)
適用條件:1.小樣本,n<50 2.σ未知(定量變數中)
自由度ν越大,t分佈曲線越接近標準常態分佈曲線
t落在95%內
(X–-1.96σₓ₋,X– 1.96σₓ₋)
假設檢定
亦稱顯著性檢驗,是統計推論的另一重要內容,其目的是定性比較總體參數之間有無差別或總體分佈是否相同
基本步驟
(一)建立假設及確定檢驗水準
無效假設/原假設/零假設【H₀】
“陰性”結果,對應"等號式子"
備擇假設/對立假設【H₁】
“陽性”結果,對應"不等號式子"
(二)選擇檢定方法與計算檢定統計量
根據方法檢定統計量值,計算P值
P越小越有理由拒絕H₀
(三)根據P值做出統計推斷
若接受H₀:X–≠μ,則由抽樣誤差所致
若不接受H₀,則不拒絕H₁:X–≠μ₂,則由本質差異所致
注意!
1.假設是針對總體而言的
2.以H₀為中心,但H₀、H₁缺一不可
3.H₀通常內容為某一確定狀態
4.單、雙側假設檢定的設定
校正水準
亦稱顯著水準,以α表示,是預先規定的拒絕域的機率值,實際中一般取α=0.05或α=0.01。
三要素
①根據樣本所提供的資訊(即樣本的統計描述指標)
②基於特定的抽樣誤差分佈規律
③以一定機率(一般為95%)
常態分佈與醫學參考值範圍
常態分佈
由兩個參數決定
μ是位置參數,描述常態分佈的平均水平
決定常態分佈在X軸上的位置
σ是形狀參數,描述常態分佈的變異程度
決定常態曲線的分佈形狀
面積規律
①曲線下的面積即為機率
②曲線下的總面積為1或100%
③所有常態曲線,在μ左右的任意相同標準差倍數的範圍內面積相同
標準常態分佈
μ=0,σ=1
隨機變數的標準化變換
z=X-μ/σ
醫學參考值範圍
從所選的參照總體中獲得的所有個體觀察值,用統計方法建立百分位數界限,由此得到的個體觀察值的波動區間。通常使用的是95%參考值範圍。
意義
1.作為臨床上判定正常與異常的參考指標
2.可以用來評估兒童的發展水平
注意事項
1.確定同質的參照總體
2.選擇足夠例數的參考樣本
3.控制檢測誤差
4.選擇單雙側界值
有些指標僅過大或過小為異常
5.選擇適當的百分數範圍
6.選擇計算參考值範圍的方法
公式以及計算過程要熟練
補
標準化比率
系統誤差
隨機測量誤差
矛盾
可信度↑,信賴區間越寬
樣本量↑,信賴區間越窄
動態數列
1.概念:依照一定時間順序,將一系列描述某事物的統計指標 (可以是絕對數、相對數或平均數)依序排列起來,觀察比較。
2.作用:①計算三種指標,對定性資料進行統計描述; ②用平均發展速度對未來的發生進行預測(前提:V未來=V現在)
數據的表示
符合常態分佈
(X–±s²)
(平均值>方差)
不符合常態分佈
M(P₂₅,P₇₅)