マインドマップギャラリー 第 23 章 - 統計とデータサイエンス
これは統計とデータ サイエンスに関するマインド マップです。一般的に、統計とはデータを収集、整理、分析し、データから結論を導き出すことです。
2023-11-01 18:48:52 に編集されました統計とデータサイエンス
統計
意味
統計とはデータに関する学問です。要約すると、統計とはデータを収集、整理、分析し、データから結論を導き出すことです。
2つの枝
記述統計
定義: 研究データを収集、整理、記述するための統計的手法。
(1) 必要なデータの入手方法(収集) (2) グラフや数学的手法を使ってデータを整理して表示する方法(整理) (3) データの一般的な特徴をどのように記述するか(説明)
推論統計
意味: サンプルデータを使用して母集団の特徴を推測する方法を研究する統計的手法
1. パラメータの推定
サンプル情報を使用して全体的な特性を推測する
2. 仮説検証
サンプル情報を使用して、全体的な仮説が正しいかどうかを判断します
変数とデータ
変数
定義: 変数は研究対象の属性または特性であり、2 つ以上の可能な値を持つことができます。
量的変数
「数量変数」とも呼ばれ、変数の値が数量になります。会社の売上高、在籍従業員数など
質的変数
カテゴリ変数
変数の値はカテゴリです。会社の属する業界や従業員の性別など
順序変数
変数の値はカテゴリカルであり、連続的です。従業員の教育レベル、満足度など
データ
定義: データは、変数を測定および観察した結果です。データの形式は数値、テキスト、画像などです。
定量的データ
量的変数の観測結果であり、その値を具体的な数値として表現したものです。 たとえば、会社の売上が1000万元だとします。
機密データ
カテゴリとして表現されるカテゴリ変数の観察結果であり、通常は言葉で表現されますが、数値で記述することもできます。 たとえば、「男性」を表すには 1 を使用し、「女性」を表すには 2 を使用します。
シーケンシャルデータ
これは順序変数の観察結果であり、カテゴリとして表現され、通常は言葉で説明されますが、数値で説明することもできます。たとえば、1 は「修士以上」、2 は「学士」、3 は「大学以下」を表します。
データのソース
回収方法別
データ観察
直接の調査または測定によって収集されたデータ。 社会経済現象に関わる統計データのほとんどは、GDP、CPI、住宅価格などの観測データです。
実験データ
実験対象者と実験中にさらされる実験環境を制御することによって収集されたデータ。 たとえば、新製品の耐用年数に関するデータ、新薬の有効性に関するデータなどです。 自然科学分野のデータのほとんどは実験データです
ユーザーの視点に従って
一次データ
直接的な調査や科学実験から得られたデータは、ユーザーにとって直接のデータソースです。 その主な情報源には、調査または観察、実験が含まれます。 【ヒント】社会経済分野における統計調査の主なデータ取得方法は、 これは直接データを入手する重要な方法でもあります。
二次データ
他人の調査または実験から得られたデータ。これはユーザーにとっての間接的なデータ ソースです。
統計調査
重要な機能
まず、調査は計画、方法、手順を伴う活動です。 第二に、調査の結果は収集されたデータに表現されます。
分類
調査対象に応じて 異なる範囲
完全な調査
1. 包括的な統計レポート
2. 国勢調査
(1) 国勢調査: 例外なく国の全人口を対象とした登録調査
(2) 経済センサス: 対象は中華人民共和国の領土内にある 第二次・第三次産業活動に従事されている方 すべての法人、産業活動単位、自営業世帯。
非包括的な調査
調査中のユニットのいくつかについて調査を実施します。 非包括的な統計レポート、サンプリング調査、主要な調査、および典型的な調査が含まれます。
アンケート登録時期に応じて 継続的ですか?
継続的な調査
一定期間内の現象全体の量的変化を観察し、現象の発展過程を説明する。 目的は、一定期間にわたる社会現象の総量を理解することです。 工場での製品生産、原材料投入、エネルギー消費、人口の誕生と死亡など。
結果は「期間の数」であり、累積計算には意味があり、ビデオとして見ることができます。
不連続調査
かなりの期間(通常は1年以上)にわたって実施される調査、 一般に、ある時点における現象全体の状態を研究することです。 生産設備の所有権や耕作地面積など。
結果は「時点の数」であり、累積計算は無意味であり、写真と見なすことができます。
方法
統計レポート
意味:基礎的な統計データを上から下へ一律に並べ、下から上へ段階的に提供する調査方法。 統計報告書は特定のオリジナルデータに基づいており、統一された表形式、統一された指標、統一された提出時間および提出手順に従って記入されなければなりません。
統計レポートの種類: 1. 調査対象の範囲に応じて、包括的な統計レポートと非包括的な統計レポート。 現在の統計レポートのほとんどは包括的なレポートです。 2. 報告期間の長さに応じて、日次報告書、月次報告書、四半期報告書、年次報告書などに分けることができます。 3. 報告書の内容と実施範囲に応じて、国家統計報告書、部門統計報告書、地方統計報告書に分けられます。
国勢調査
意味:特定の目的のために特別に組織された一回限りの包括的な調査。 国勢調査、経済国勢調査、農業国勢調査など。 主に、ある時点における社会経済現象の基本的な全体像を理解するために使用されます。 国が関連政策を策定するための基礎を提供します。
4つの特徴
(1) 国勢調査は通常、1 回または定期的に行われます ①経済センサスは10年に2回、末尾の数字が3または8の年に実施される。 ②国勢調査は10年ごとに実施され、「0」年に実施されます。 ③農業センサスは10年に一度実施され、「6」年ごとに実施されます。
(2) 国勢調査は通常、統一された標準的な調査時間(つまり締め切り)を必要とします。 調査データの重複や漏れを回避し、国勢調査結果の正確性を確保するため [ヒント] 第 5 回、第 6 回、および第 7 回国勢調査の標準時刻は、国勢調査年の 11 月 1 日の 0:00 です。 農業センサスと経済センサスの標準時刻は、センサス年の 1 月 1 日の 0:00 です。 標準時刻は、一般に調査対象が比較的集中し、相対的な変化が小さい時刻として設定されます。
(3) 国勢調査データは一般的により正確であり、高度な標準化が行われています。
(4) 利用範囲は比較的狭く、基本的かつ特殊な現象しか調査できません。
サンプル調査
意味:調査対象の母集団から一部の単位を調査サンプルとして抽出し、サンプル調査結果に基づいて母集団の量的特徴を推測する非全数調査。
特徴: (1) 経済性: 最も重要な利点は、調査のサンプル単位が通常全体の単位の小さな部分であるため、調査の作業負荷が小さいため、多くの人的資源、物的資源、財政的資源、および時間を費やすことができることです。救われます。 (2) 高いタイムリー性:必要な情報を迅速かつタイムリーに入手可能 (3) 幅広い適応性:より広範囲の情報を取得でき、さまざまな分野やさまざまな課題の調査に適しています。 (4) 高精度: サンプル調査のデータ品質は、作業量が少ないため、より慎重に行うことができ、多くの場合誤差が小さくなります。
捜査に集中する
意味: 調査対象の母集団からいくつかの主要なユニットを調査のために選択します。 調査の指標値では、選定された主要ユニットが全体の大部分を占めます。
特徴: 重要な調査は適用範囲が広く、少ない投資でより迅速に実行できます。 特定の現象の主な兆候の基本的な状況や変化傾向を取得します。 この目的では、基本的な状況と開発傾向を理解するだけでよく、包括的なデータを習得する必要はありません。
教材の例: (1)全国の都市部の小売物価の推移をタイムリーに把握するため、全国35の大中都市の小売物価の推移を調査することが重要となります。 (2) 全国の工業企業の付加価値と総資産をタイムリーに把握するには、全国の大・中規模工業企業を対象に集中調査を実施するだけでよい。 (3) たとえば、全国の 5,000 の産業企業を対象とした国家統計局のオンライン直接報告システムは、重要な調査です。
典型的な調査
意味:調査の目的と要件に従って、調査対象の包括的な分析に基づいて、いくつかの典型的または代表的なユニットが調査のために意識的に選択されます。
効果
(1) 総合調査の欠点を補う (2) 一定の条件下で総合調査データの真正性を検証できる たとえば、大規模な国勢調査の後、いくつかの典型的な単位を選択して、統計データの精度をチェックできます。
アドバンテージ
一般的な調査には柔軟性があり、いくつかの一般的なユニットを通じて詳細かつ詳細な統計データを取得できるという利点があります。 定型調査は統計活動に特有の手法ではありませんが、統計処理上不可欠な手法です。 典型的な調査の使用は、現象の全体的な量的特徴を反映することではなく、主に統計に関連する生き生きとした具体的な状況、つまり現象の量とそれらの相互関係に関連する社会状況を理解して、調査を行うことを目的としています。深度統計分析
欠点がある
「代表的な単位を意識的にいくつか選ぶ」という制約があり、人の主観的な理解に大きく左右されます。一方的になることを避けるために、他の調査と組み合わせて使用する必要があります。
統計的品質評価基準
信憑性、正確さ、完全性、 適時性、適用性、経済性 比較、調整、可用性