Галерея диаграмм связей Интеллект-карта социальной статистики
Это интеллектуальная карта социальной статистики. Социальная статистика является прикладной отраслью. Она систематически собирает, систематизирует, анализирует и представляет данные о поведении человека в социальной среде, чтобы выявить характер данных.
Отредактировано в 2023-11-08 18:00:28Проверка согласованности двух распределений населения
Испытание двух связанных образцов
для группы лиц Два этапа до и после поездки Получено из того же измерения Получены два набора данных
Параметрический тест: t-тест Рассчитайте тестовую статистику t/Z, основываясь на принципе малой вероятности.
Для небольших выборок обязательным условием является то, что вся совокупность должна подчиняться нормальному распределению.
Непараметрический тест
подписанный тест, подписанный ранговый тест (Статистическое мышление, если нет изменений в популяции между до и после тестирования, Тогда разница между двумя выборками в основном возникает из-за случайной ошибки, генерируется случайным образом, поэтому n = n-, сумма положительного ранга = сумма отрицательного ранга) Цель тестирования достигается путем сравнения постоянства распределения двух измерений. Общее количество строительных работ при проверке: T=min(T , 丨T-丨)
Испытание двух независимых образцов
Параметрический тест
t-тест Используйте разницу между собственными значениями двух выборок, чтобы Проверьте разницу между собственными значениями двух популяций
1. С помощью среднего (Исследовательская переменная является масштабной переменной))
Проверка разницы между двумя средними совокупными значениями Большая выборка — статистика теста: Z Небольшая выборка – статистика теста: t (Две популяции должны подчиняться нормальному распределению) и иметь равные дисперсии.
2.С помощью частоты (Исследовательские переменные являются категориальными переменными))
Метод проверки разницы частот между двумя популяциями с использованием разницы частот между двумя выборками
Непараметрический тест
Статистическое мышление: две популяции имеют одинаковое распределение, Распределение выборки не будет сильно отличаться, После смешанного ранжирования результаты двух выборок будут появляться поочередно, так что будет путешествие, Сумма ранга не будет слишком большой или слишком маленькой.
проверка суммы рангов
Статистика теста: T (сумма рангов)
запустить тест
Статистика теста: r (количество запусков)
совокупный частотный тест
социальная статистика
База
Вероятность и вероятностные распределения случайных величин
Классические понятия, формула сложения вероятностей, формула умножения, условная вероятность.
Распределение вероятностей дискретных случайных величин
Центральная тенденция и тенденция дисперсии E(X)=Σxipi D(X)=Σ[xi-E(X)]²pi
двухточечное распределение, биномиальное распределение, Гипергеометрическое распределение, распределение Пуассона
Распределение Пуассона, используемое для описания единицы времени (также может быть единицей площади). Распределение вероятностей числа возникновения случайных событий внутри
Распределение вероятностей непрерывных случайных величин
нормальное распределение, стандартное нормальное распределение z-показатель, распределение хи-квадрат, t-распределение
Закон больших чисел, центральная предельная теорема и выборочное распределение.
Закон больших чисел: ①Когда n достаточно велико, частота ≈ вероятность. ② Когда n достаточно велико, выборочное среднее можно использовать для оценки генерального среднего μ
Центральная предельная теорема: n достаточно велико, среднее значение всех комбинаций выборок образует нормальное распределение Нормальное распределение имеет среднее значение μ и дисперсию σ²/n.
Выборочное распределение выборочного среднего
Выборочное распределение частот выборки
P~N(π,π(1-π)/n) P-π/√P(1-P)/n~N(0,1)
Выборочное распределение выборочной дисперсии
Оценка параметров
точечная оценка
Рассчитано на основе выборочных наблюдений выборочные собственные значения для оценки неизвестной суммы собственные значения тела
интервальная оценка
Основные принципы проверки гипотез
По принципу малой вероятности
Используйте статистику X pull
Используйте z-статистику
Использовать значение p
Два типа ошибок при проверке гипотез
отбросить истинную ошибку
Нулевая гипотеза верна, Результат теста был отрицательным Нулевая гипотеза
ложная ошибка
Нулевая гипотеза ложна, но она подтверждена. Размер ложной вероятности связан с близостью нулевой гипотезы к истинной совокупности. ·β=P(x1可X可x2)=P(z2可Z可z2) ·При использовании z-показателя следует использовать среднее значение реальной популяции. z1=(x1-μ1)/s/√n ☆: Псевдовероятность невозможно рассчитать, если общее среднее значение неизвестно.
Основы теории вероятностей➕Основы логической статистики
Проверка характеристик распределения одной популяции
Проверка использования условий параметрического тестирования Установлен ли
Тестирование характеристик распределения категориальных переменных
Тест хи-квадрат
H0:πi=πi0 H1:πi≠πi0 πi0 основан на тестируемом распределении Общий расчет характеристик для каждой категории частоту, чтобы найти ожидаемую частоту, Найдите статистику теста
Тестирование характеристик распределения масштабных переменных
При проведении двухвыборочного t-теста Дисперсионный анализ и регрессионный анализ Предпосылка состоит в том, что вся популяция подчиняется нормальному распределению.
H0:X~N (x выдвинуть, с²) H1: Население не подчиняется нормальному распределению Рассчитать совокупную частоту и ожидание выборки Максимальное абсолютное значение разности функции распределения Большое значение, Д. Сравните с Dα
ПС: 1. Связь между двумя категориальными переменными и проверка гипотез. 2. Связь между двумя масштабными переменными и проверкой гипотез.
Связь и проверка двух категориальных переменных
Коэффициент корреляции непредвиденных обстоятельств
Построение на основе пропорционального метода уменьшения погрешности. может использоваться как мера связи между двумя переменными индикаторы близости
коэффициент λ λ=(E1-E2)/E1
Коэффициент τ (более точно определяющий E1 и E2)
коэффициент ранговой корреляции
Коэффициент ранговой корреляции Спирмена
Коэффициент корреляции гамма-ранга
коэффициент Кендалла τ
d-коэффициент Сомера
гипотетический тест
Тест хи-квадрат
Тест коэффициента корреляции непредвиденных обстоятельств (коэффициент Φ, коэффициент V)
Тест коэффициента ранговой корреляции Спирмена
Тест коэффициента корреляции гамма-ранга
Проверка коэффициента τc и коэффициента d
Связь и проверка двух масштабных переменных
r (коэффициент корреляции)
R степень соответствия R²=r²
F-тест (общий тест уравнения линейной регрессии)
t-тест (тест коэффициентов регрессии)
e (нормальность, однородность дисперсий, среднее = 0)
Связь между категориальными переменными и масштабными переменными и проверка гипотез
Параметрический тест
1. Среднее сравнение
2. Статистические таблицы, гистограммы и линейные графики.
3.эта (коэффициент корреляции)
Проверка гипотез – односторонний дисперсионный анализ
Статистика теста, F=BSS/(m-1)/WSS/(n–m) H0: μ1=μ2=μ3=···мкм H1: Существует по крайней мере одна категория, соответствующая среднему значению масштабной переменной. Значение не равно другим категориям
Равноскедастичность нормальность
Проверка согласованности множественных распределений населения
Тестирование нескольких независимых образцов (Анализ масштабной переменной в сравнении с связь между категориальными переменными)
Непараметрический тест
Односторонний ранговый дисперсионный анализ
Статистика теста: H H подчиняется распределению хи-квадрат с k-1 степенями свободы.
Медианный тест
Тестирование нескольких связанных образцов
двусторонний ранговый дисперсионный анализ
тест Кендалла W