マインドマップギャラリー 統計マインドマップ
これは、漢方薬の研究設計の基本、変数の確率分布、パラメータ推定、統計データの説明などを含む、統計的マインド マッピングに関する記事です。
2023-12-02 19:35:04 に編集されました統計
導入
統計と漢方薬
なぜ中医学統計を学ぶのか
いくつかの基本概念
全体
定義: 研究されたすべての個人 (データ) を含むコレクション
含まれる単位の数に応じて数えられるかどうか
有限な人口
無限の人口
サンプル
定義: 全体から抽出された要素の集合です。
サンプルサイズ: サンプルを構成する要素の数
パラメータ
定義: サンプルの特性を説明するために使用される一般的な数値尺度です。
統計
定義: サンプルの特性を説明するために使用される一般的な数値尺度です。
変数
定義: 現象の特定の特性を説明する概念
変数をデータ型で分割する
カテゴリ変数
定義: 物事のカテゴリを説明する名前
順序変数
定義: 物事の秩序あるカテゴリーを説明する名前
数値変数
定義: 何かの数値的特性を説明する名前
中国伝統医学における統計の応用
中医学統計の学び方
中医学の研究設計の基礎
研究デザインの概要
実験研究の特徴
実験計画法の基本要素
処理要素
主題
実験効果
客観性
正確さ
感度
実験計画法の基本原則
コントラストの原理
プラセボ対照
ブランクコントロール
実験的制御
標準制御
自制心
過去の比較
ランダム原理
リピート原理
実験計画型
完全にランダムなデザイン
ペアデザイン
ランダム化されたブロック設計
要因計画
一般的に使用されるサンプリング方法
単純なランダムサンプリング
層化抽出法
系統的サンプリング(均等サンプリング、機械的サンプリング)
集落抽出
統計の説明
個人差
頻度分布
度数分布表
1. 極端な違いを見つける 2. グループ距離とグループセクションを決定します。 3.度数分布表の作成 4. 頻度と累積頻度を計算する
度数分布プロット
使用
1. データの分布形態と特徴を明らかにする 2. 個々の非常に大きいまたは非常に小さい疑わしい値の発見を容易にする 3. 正常性判定 4. 指標のさらなる計算と統計処理を容易にする
定量的データの統計的説明
中心的な傾向を説明する統計指標
算術平均
標本平均
母集団平均μ
条件: 単峰対称分布データ、特に正規分布データ
幾何平均 (G)
条件: 幾何学的データ、特に対数正規データ
知らせ
観測値・測定値は0にはなりません
観測/測定値は、すべて正またはすべて負の同じ符号を持っている必要があります。
中央値 (M)
一連の観測値を小さいものから大きいものまで並べ替えます。中央の観測値が中央値になります。
中央値は、両端に明確な値がない歪度や頻度分布を記述するのに適しており、高い適用性を持っています。
パーセンタイル
一連の観測値を小さいものから大きいものに並べ替えます。x% 番目の観測値は x 番目のパーセンタイルです。
適用条件
偏った分布データ
不規則に分散されたデータまたは不明確に分散されたデータ
オープンデータ
モード
ほとんどの発生
データ量が大きい場合にのみ意味を持ちます
変動の程度を表す統計指標
非常に貧しい
フルレンジとも呼ばれ、R で表され、一連の観測/測定値における最大値と最小値の差です。
応答の個人差の範囲: 範囲が大きく、ばらつきが大きい、ばらつきが小さい。
アドバンテージ
シンプルな計算と明確な意味
欠点がある
2 つの極値の差を反映するだけであり、不安定です。
四分位範囲Q
観測/測定の真ん中半分の範囲を反映します。
利点: 計算が簡単、範囲よりも安定
短所: すべての観測/測定値の変動がまだ考慮されておらず、まだ十分に安定していません。
主に、明らかに偏った分布データの変動特性を記述するために使用され、統計図と組み合わせて使用されることが多いです。
分散
分散が大きければ、ばらつきも大きくなります
利点: 観測値/測定値のすべての変動を考慮し、比較的安定しています。
短所: 寸法 (つまり単位) が変更され、説明できない場合があります。
標準偏差
平均の単位が同じで値が似ている場合、標準偏差↑ばらつき度↑ほど、平均は代表性が低くなります。
利点: すべての観察/測定値の変動を考慮すると、単位は元の指標と同じであり、比較的安定しています。
変動係数
分散係数とも呼ばれ、CVで表されます。
優れた利点
比較しやすいように単位はありません
適用条件
複数のデータセットの変動の度合いを異なる単位で比較する
複数のデータセットの変動の程度を大きく異なる平均値で比較する
定性データと階層データの統計的記述
絶対数
相対数
一般的に使用される相対数
レート(周波数インジケーター)
レート
特定の空間または時間範囲内で起こり得る現象の総数に対する、現象の発生数の比率を示します。
構成比と割合は異なります。喫煙する人の数に着目する必要はありません。喫煙する人の数に着目する必要があります。
注: 分子と分母の観測単位の意味。
医学で一般的に使用される相対指標
ケース
特定の時点における特定の集団における特定の病気の頻度を示します。通常、長期にわたる慢性疾患の発生または蔓延を示すために使用されます。
計算式: ある病気の有病率 = (ある期間中のある場所におけるある病気の患者数/同じ期間中の同じ場所の平均人口) * 比率ベース
致死率
一定期間における患者の特定の病気による死亡の頻度を示します。
計算式: ある病気の致死率 = (ある期間におけるある病気による死亡者数/同じ期間におけるその病気の患者数) * 100%
入射
一定期間内の特定の集団における特定の病気の新規症例の頻度を示します。
計算式:ある病気の罹患率=(ある期間におけるある病気の新規感染者数/同じ期間の平均人口)×割合ベース
死亡率
特定の年の特定の場所における 1,000 人あたりの死亡者数を反映します。
計算式: 死亡率 = (特定の年における特定の場所の死亡者数/同じ年の同じ場所の平均人口) * 1000
比較する
と比較する
2 つの間の比較レベルを説明するために使用されます
相対リスク (RR)
曝露されたグループの病気または死亡のリスクが非曝露されたグループの何倍であるかを反映し、病気と曝露の関連の強さを示します。
オッズ比 (OR)
症例群と対照群における曝露率と非曝露率のオッズ比を表します。
構成比(構成指数)
物体または現象の内部コンポーネントの割合または分布を示します。
特徴
合計は 100% または 1 に等しくなります
同時に増やしたり減らしたりすることはできません
通常、結果は小数点第 2 位までに保持されます。
アプリケーションノート
分母が小さすぎることはできません
比率とレートを混合することはできません
連結率(合計率)の計算
比較可能性
サンプリングエラー – 仮説検定
正規化レート
2 つの異なるグループの有病率、発生率、死亡率およびその他のデータを比較する場合、グループ内の構成が比率に及ぼす影響を排除するために、標準化された比率を使用できます。
統計表とグラフ
統計表
構造
テーブル番号
タイトル
テーブルの上中央の位置
ライン
一般的には3線式メーターです
番号
述べる
説明が必要な場合は表内に*印を付け、表の下に説明文を記載してください。
概要グラフ
構造
タイトル
写真の下に番号が付いています
グラフドメイン
見出し
見出し
横見出し
垂直見出し
伝説
規模
ユニット
よく使われる
ヒストグラム
散布図
折れ線グラフ
円図
パーセンタイルチャート
仮説テスト
仮説テスト
意義
2 つのサンプル間の差異に基づいて母集団が同じかどうかを推測します
基本的な考え方
矛盾による証明の考え方
基本的な手順
1. 仮説を立ててテストレベルを決定する 2. テスト方法を選択し、テスト統計を計算します。 3. P 値に基づいて統計的推論を行う
t検定
1 サンプルの t 検定
その目的は、標本平均 X で表される母集団平均 μ が既知の母集団平均と異なるかどうかを比較してテストすることです。
対応のあるサンプル平均 t 検定
分類 1. 相同ペアリング: 同じ被験者または同じ検体の 2 つの部分が、2 つの異なる治療を受けるようにランダムに割り当てられます。 2. 異種ペアリング: 交絡因子の影響を排除するために、2 人の同種の被験者がペアになって 2 つの治療を受けます。
2種類のエラー
最初の並べ替え
カテゴリー2
予防
母平均推定と仮説検定
標本誤差と標準誤差
よく使われる方法と手法
方法
パラメトリックテスト
ノンパラメトリック検定
方法
臨界値法
p値法
信頼区間
正規性テストと変数変換
正規性検定
簡単な判断方法
グラフ表示
P-P ダイアグラム
Q-Qダイアグラム
仮説検定法:P値
分散の均一性の検定
F テスト
レヴーンのテスト
パラメータの推定
標本誤差と標本分布
コンセプト
サンプリングによって生じる標本統計量と母集団パラメータの差
標本分布と標本平均値の標準誤差
標準標本平均値の標本分布
標本平均は母集団平均の周囲に分布します
nが増加すると変動の度合いは減少します
変動範囲が小さい
全体の平均と必ずしも一致しない
標準誤差:
サンプル平均誤差のサイズを示し、サンプル平均の信頼性を説明します。
標準誤差 = 標準偏差 / サンプルサイズの平方根
t分布
単峰分布曲線です
自由度 v が唯一のパラメータです
サンプル分布とサンプルレートの標準誤差
母集団平均の推定値
ポイント推定
サンプル統計を使用して母集団パラメータを直接推定する
間隔の推定
信頼区間
区間は、特定の確率または信頼性 (1-α) に従ってパラメータ全体の範囲を推定するために使用されます。この範囲は、通常、パラメータの信用区間または信頼区間 (1-α) と呼ばれます。信頼性または信頼性は 95% または 99% とみなされることがよくあります。
正確さ
信頼度が 1 に近づくほど、精度が高くなります。
正確さ
CL長が短いほど精度が高くなります。
全体の料金の見積もり
母集団率の点推定値としてサンプル率を使用する
変数の確率分布
変数の全体的な特性
正規分布
コンセプト
特徴
単峰性分布、ピーク位置は平均値にあります
濃度、対称性、均一な変動性
μとσに依存
地域分布法
法線曲線と横軸の間の合計面積は常に 1 に等しくなります。
二項分布とポアソン分布
医学的基準値範囲の決定
定義: ほとんどの普通の人
原則として
サンプルサイズは普通の人にとって十分な大きさです
インジケーターの特性に基づいて片面と両面を決定します
適切なパーセンタイル値