マインドマップギャラリー CFAマインドマップ
CFA は、世界の投資業界で最も厳格で価値のある資格である Chartered Financial Analyst を指します。以下の図は、統計、確率、確率分布、仮説検定、サンプリング、推定の基本概念を含む、統計と確率の知識内容を説明しています。
2021-08-01 21:33:31 に編集されました統計と確率
サンプリングと推定
サンプリング
タイプ
1. 層別ランダムサンプリング
2. 単純なランダムサンプリング
まずグループ化してから、単純にサンプリングする
データ
1. 時系列データ
期間中に構造的な変化があった場合、バイアスが生じる可能性があります
2. 断面データ
エラー
1. データマイニングのバイアス
統計的に有意だからといって、経済理論で裏付けられているわけではない
2. サンプル選択のバイアス
生存バイアス
生存者バイアス
3. 先読みバイアス
まだ予測に利用できないデータを使用する
4. 期間バイアス
それは特定の期間内でのみ確立され得、すべての期間に一般化されるわけではありません。
見積もり
ポイント推定
推定器を使用して母集団パラメータを推定する
推定量の望ましい特性 推定量の評価基準
公平性
統計の期待値は母集団パラメータに等しい
効率
不偏標本統計の中で分散が最も小さい
一貫性
サンプルサイズが増加すると、サンプル統計が母集団パラメータに近似する確率が増加します。
標本平均を使用して最適な母集団パラメータを推定する
中心極限定理
統計量の平均の確率分布を説明する
状態
n >= 30
母集団の平均、分散は既知であり、有限です
単純なランダムサンプリングの場合
結論は
標本統計量の平均は [正規分布] に従います。
標本統計量 [平均] は母集団 [平均] です
標本統計量の平均の分散
標本統計量の標準誤差の平均標準誤差 =
[標準偏差]と[標準誤差]の違いに注意してください
信頼区間の推定値
点推定がどれだけ確実に推定値を与えるかの尺度
5% 信頼区間 = 95% 信頼区間
信頼係数の選択 Z 分布 (平均 0、分散 1) および T 分布 (サンプルの分散に置き換えられます)
仮説テスト
ステップ
帰無仮説と対立仮説
統計を決定する
標準化後のサンプル平均は正規分布に従います
重要性と重要な価値
キー値は、帰無仮説を棄却するかどうかを決定する臨界値です。
両側検定と片側検定
それらのテスト統計はすべて同じですが、主な違いは棄却領域です。
p値
帰無仮説を棄却するための最小有意水準
次に、帰無仮説を棄却し、その逆も同様です
タイプ 1 エラーとタイプ 2 エラー
意思決定
統計的有意性と経済的有意性
正規母集団に対する仮説検定
平均
シングル
定数と比較する
状況に応じてz検定かt検定(自由度n-1)を選択
二
独立した
[分散 1] と [分散 2] が等しいと仮定すると、分散は不明です。
自由度は n1 n2-2 です
[分散 1] と [分散 2] が等しくないと仮定すると、分散は不明です。
自由度は非常に複雑です
一対比較テスト
関係があるかどうかを確認する
サンプリングは 2 つのサンプルの平均値の減算です。n1-m1=U1、U1=U0、U1 は U0 と等しくなく、U0 は通常 0 です。
n-1 自由度で t 検定を使用する
相関係数
p=0、線形関係はありません、p は 0 に等しくありません、線形関係はあります
(-1~1)
t 検定の対象となり、変数が 2 つあるため、自由度は n-2 になります。
分散
シングル
それはある定数と等しいでしょうか?
カイ二乗統計量 カイ二乗
自由度はn-1です
二
2 つの分散は等しいですか?
F分布、自由度はn1-1、n2-1
最大の分散を持つものが分子であり、最初の自由度が分子です。したがって、F 値は >=1 になります。
パラメトリックテストとノンパラメトリックテスト
パラメータ
全体的なパラメータに関係します
人口は一定の分布に従うと仮定されます
ノンパラメトリック
全体的な分布は不明であり、サンプル データは特定の分布に従いません。
データはランクに従って分類されており、足し算、引き算、掛け算、割り算はできません。
全体的なパラメータは関係ありません
確率分布
連続確率変数
任意の 1 点を取ると確率は 0 になります
確率密度関数 PDF; 確率密度関数では、特定の区間内の値に焦点が当てられます。
累積分布関数CDF
跳ねる
離散確率変数の応用
ベルヌーリ分布
実験を行ったところ、結果は 2 つだけでした
二項確率変数
多くの実験を行った結果、得られた結果は 2 つだけです
結果はすべて独立しており、確率は同じです。
連続均一分布
不足リスク
確率です
ロイの安全第一比率
比率が高いほど良い
ショーフォールリスクRがリスクフリーレートRと等しい場合、SFレシオはシャープレシオとなります。
対数正規分布
資産価格について説明する
負でない数
正のスキュー (正規分布が右にシフト)
確率変数は正規分布に従うため、対数 x も従う
t 分布
母集団に関する少数のサンプルの推論
df=n-1
信頼区間は正規分布より広い
低いピークと太い尾部の平均 = 0、分散 > 1、尖度 > 3
多変量分布 多変量分布
複数の資産
3 つのパラメータ: 各資産の平均、分散、異なる資産間の相関係数
n 個の資産を仮定すると、相関係数は次のようになります。
モンテカルロシミュレーション
r が正規分布に従うと仮定し、r の可能な値をサンプリングし、それをシミュレーションして最終的な確率を取得し、シナリオ分析を実行します。
短所: 複雑であり、前提が間違っている場合、導き出される結論も間違っています。
ヒストリカル/バックシミュレーション
過去の履歴データに基づいて予測を行う
短所: 構造的な変化がある場合、結局のところ、過去のデータであるため、正確であることを確認することが困難です。
確率
オッズ
同時確率
P(AB) = P(A|B)*P(B)
加算ルール
P(A または B)=P(A) P(B)-P(AB)
総確率の法則
相互排他的かつ横断可能
P (成功) = 90% * しっかり復習した場合は 80% 成功、しっかり復習しなかった場合は 10% * 10% 成功
ベイズの公式
原因と結果
新しい情報が利用可能になったときに確率を変更する
E(x) を期待します
確率変数の分散は実際には期待値です
共分散
両方の資産の方向が変わります
cov=0 の場合、線形関係はありません
値の範囲は、次元に関係なく、負の無限大から正の無限大までです。
相関
(-1~1)
<0 の負の相関
>0正の相関
絶対値が大きいほど相関関係が明確になります
=0 線形関係なし
アレンジと組み合わせ
順番に
注文なし
統計の基本概念
4つの測定スケール
名目売上高
男と女
通常販売
1位、2位
インターバルスケール
1年生、2年生
比率スケール
試験で99点を取った
周波数を表す一般的に使用される 2 つのグラフ
ヒストグラム
周波数ポリゴン
中心傾向
平均
算術平均
幾何平均
複数の期間にわたる平均資産収益率を測定する
調和平均
固定投資の平均コスト
加重平均
中央値
nは奇数です
(n 1)/2
nは偶数です
n/2 と (n 2)/2 の平均
モード
最高周波数
1つ
単峰性
二
二峰性
三つ
三峰性の
存在しない
データが等しくない場合