Galería de mapas mentales Capítulo 23 - Estadística y ciencia de datos
Este es un mapa mental sobre estadística y ciencia de datos. La estadística es una disciplina sobre datos. En términos generales, la estadística consiste en recopilar, organizar, analizar datos y sacar conclusiones a partir de ellos.
Editado a las 2023-11-01 18:48:52,This is a mind map about bacteria, and its main contents include: overview, morphology, types, structure, reproduction, distribution, application, and expansion. The summary is comprehensive and meticulous, suitable as review materials.
This is a mind map about plant asexual reproduction, and its main contents include: concept, spore reproduction, vegetative reproduction, tissue culture, and buds. The summary is comprehensive and meticulous, suitable as review materials.
This is a mind map about the reproductive development of animals, and its main contents include: insects, frogs, birds, sexual reproduction, and asexual reproduction. The summary is comprehensive and meticulous, suitable as review materials.
This is a mind map about bacteria, and its main contents include: overview, morphology, types, structure, reproduction, distribution, application, and expansion. The summary is comprehensive and meticulous, suitable as review materials.
This is a mind map about plant asexual reproduction, and its main contents include: concept, spore reproduction, vegetative reproduction, tissue culture, and buds. The summary is comprehensive and meticulous, suitable as review materials.
This is a mind map about the reproductive development of animals, and its main contents include: insects, frogs, birds, sexual reproduction, and asexual reproduction. The summary is comprehensive and meticulous, suitable as review materials.
Estadística y ciencia de datos
Estadísticas
definición
La estadística es una disciplina sobre datos. En resumen, la estadística consiste en recopilar, organizar, analizar datos y sacar conclusiones a partir de ellos.
dos ramas
Estadísticas descriptivas
Definición: Métodos estadísticos para recopilar, organizar y describir datos de investigación.
(1) Cómo obtener los datos requeridos (recopilación) (2) Cómo organizar y mostrar datos usando gráficos o métodos matemáticos (organización) (3) Cómo describir las características generales de los datos (descripción)
Estadística inferencial
Significado: método estadístico que estudia cómo utilizar datos de muestra para inferir características de la población.
1. Estimación de parámetros
Utilice información de muestra para inferir características generales.
2. Prueba de hipótesis
Utilice información de muestra para determinar si la hipótesis general es cierta.
Variables y datos
variable
Definición: Una variable es un atributo o característica del objeto de investigación, que puede tener dos o más valores posibles.
Variables cuantitativas
También llamada "variable de cantidad", el valor de la variable es la cantidad. Como ventas de la empresa, número de empleados registrados.
Variables cualitativas
Variables categóricas
El valor de la variable es la categoría. Como la industria a la que pertenece la empresa y el género de los empleados.
variable ordinal
Los valores de las variables son categóricos y secuenciales. Como el nivel de educación de los empleados, la satisfacción.
datos
Definición: Los datos son el resultado de medir y observar variables. Los datos pueden estar en forma de valores numéricos, texto o imágenes, etc.
Datos cuantitativos
Es el resultado de la observación de una variable cuantitativa y su valor se expresa como un valor numérico específico. Por ejemplo, las ventas de la empresa ascienden a 10 millones de yuanes.
Datos clasificados
Es el resultado de la observación de una variable categórica, expresada como una categoría, generalmente expresada en palabras, pero también puede describirse numéricamente. Por ejemplo, utilice 1 para representar "masculino" y 2 para representar "femenino".
datos secuenciales
Es el resultado de la observación de una variable ordinal, expresada como una categoría, generalmente descrita con palabras, pero también puede describirse con números. Por ejemplo, 1 representa "título de maestría y superior", 2 representa "licenciatura" y 3 representa "título universitario y inferior"
Fuente de datos
Por método de recolección
observación de datos
Datos recopilados mediante encuesta o medición directa. Casi todos los datos estadísticos relacionados con fenómenos socioeconómicos son datos observacionales, como el PIB, el IPC, los precios de la vivienda, etc.
Datos experimentales
Datos recopilados mediante el control de sujetos experimentales y el entorno experimental al que están expuestos durante los experimentos. Por ejemplo, datos sobre la vida útil de un nuevo producto, datos sobre la eficacia de un nuevo fármaco. La mayoría de los datos en el campo de las ciencias naturales son datos experimentales.
Según la perspectiva del usuario
información primaria
Los datos derivados de encuestas directas y experimentos científicos son la fuente directa de datos para los usuarios. Sus principales fuentes incluyen: investigación u observación, experimento. [Consejo] En el ámbito socioeconómico, el principal método de obtención de datos durante las encuestas estadísticas es También es una forma importante de obtener datos de primera mano.
Datos secundarios
Datos derivados de la encuesta o experimento de otra persona. Esta es una fuente indirecta de datos para los usuarios.
encuesta estadística
características importantes
Primero, la investigación es una actividad con planes, métodos y procedimientos; En segundo lugar, los resultados de la investigación se expresan en los datos recopilados.
Clasificación
Según objeto de la encuesta alcance diferente
investigación completa
1. Informes estadísticos completos
2. Censo
(1) Censo: encuesta de registro de toda la población del país sin excepción.
(2) Censo Económico: El objeto se encuentra dentro del territorio de la República Popular China Quienes se dediquen a actividades de la industria secundaria y terciaria Todas las personas jurídicas, unidades de actividad industrial y hogares de trabajadores por cuenta propia.
investigación no exhaustiva
Realizar una encuesta sobre algunas de las unidades bajo investigación. Incluyendo: informes estadísticos no exhaustivos, encuestas por muestreo, encuestas clave y encuestas típicas.
Según el momento del registro de la encuesta. ¿Es continuo?
investigación continua
Observar los cambios cuantitativos del fenómeno general dentro de un cierto período de tiempo y explicar el proceso de desarrollo del fenómeno. El propósito es comprender la cantidad total de fenómenos sociales durante un período de tiempo. Como la producción de productos fabriles, el aporte de materias primas, el consumo de energía, el nacimiento y muerte de la población, etc.
El resultado es el "número de períodos". El cálculo acumulativo es significativo y puede verse como un vídeo.
encuesta discontinua
encuestas realizadas durante un período de tiempo considerable (normalmente más de un año), Generalmente se trata de estudiar el estado del fenómeno general en un momento determinado. Como propiedad de equipos de producción, superficie de tierra cultivada, etc.
El resultado es "número de puntos de tiempo". El cálculo acumulativo no tiene sentido y puede considerarse como una fotografía.
Forma
Informes estadísticos
Significado: método de encuesta que se organiza uniformemente de arriba a abajo y proporciona datos estadísticos básicos paso a paso de abajo hacia arriba. Los informes estadísticos deben basarse en ciertos datos originales y completarse de acuerdo con formatos de tabla unificados, indicadores unificados, tiempo de presentación unificado y procedimientos de presentación.
Tipos de informes estadísticos: 1. Según el diferente alcance de los objetos de la encuesta: informes estadísticos completos e informes estadísticos no exhaustivos. La mayoría de los informes estadísticos actuales son informes completos. 2. Se puede dividir en diferentes tipos según la duración del período del informe: informe diario, informe mensual, informe trimestral, informe anual, etc.; 3. Según el contenido del informe y el alcance de su implementación, se puede dividir en: informes estadísticos nacionales, departamentales y locales.
censo
Significado: Una investigación integral única y especialmente organizada para un propósito específico, Como censo, censo económico, censo agrícola, etc. Se utiliza principalmente para comprender el panorama general básico de los fenómenos sociales y económicos en un momento determinado. Proporcionar una base para que el país formule políticas relevantes.
4 características
(1) Los censos suelen ser únicos o periódicos ①El censo económico se realiza dos veces cada 10 años y se implementa en años, siendo el último número 3 u 8; ②El censo se realiza cada 10 años y se implementa en el año "0"; ③El censo agrícola se realiza una vez cada 10 años y se implementa cada "6" años.
(2) El censo generalmente requiere un tiempo de encuesta estándar unificado (es decir, fecha límite), Evitar la duplicación u omisión de datos de la encuesta y garantizar la exactitud de los resultados del censo. [Consejos] La hora estándar para los censos quinto, sexto y séptimo es las 0:00 del 1 de noviembre del año del censo. La hora estándar para el censo agrícola y el censo económico son las 0:00 horas del 1 de enero del año del censo. El tiempo estándar generalmente se establece como el momento en que los objetos de la encuesta están relativamente concentrados y los cambios relativos son pequeños.
(3) Los datos del censo son generalmente más precisos y tienen un mayor grado de estandarización.
(4) El ámbito de uso es relativamente limitado y solo puede investigar fenómenos básicos y específicos.
encuesta de muestra
Significado: Encuesta no exhaustiva que selecciona algunas unidades de la población de objetos de la encuesta como muestras para la investigación e infiere las características cuantitativas de la población con base en los resultados de la encuesta por muestreo.
Características: (1) Economía: la ventaja más significativa es que, dado que la unidad de muestra de la encuesta suele ser una pequeña parte de la unidad general, la carga de trabajo de la encuesta es pequeña, por lo que se puede necesitar mucha mano de obra, recursos materiales, recursos financieros y tiempo. ser salvado. (2) Alta puntualidad: la información requerida se puede obtener de forma rápida y oportuna (3) Amplia adaptabilidad: puede obtener una gama más amplia de información y es adecuado para investigar diversos campos y diversos temas. (4) Alta precisión: la calidad de los datos de las encuestas por muestreo es a veces mayor que la de las encuestas integrales. Debido a que la carga de trabajo es pequeña, cada vínculo se puede realizar con más cuidado y los errores suelen ser menores.
Centrarse en la investigación
Significado: Seleccione algunas unidades clave de la población de objetos de la encuesta para su investigación. Las unidades clave seleccionadas representan la gran mayoría del total en términos del valor del índice de la encuesta.
Características: Las investigaciones clave tienen un amplio ámbito de aplicación y pueden llevarse a cabo a mayor velocidad con menos inversión. Obtener la situación básica o tendencia cambiante de los principales signos de determinados fenómenos. El propósito sólo requiere comprender la situación básica y las tendencias de desarrollo, y no requiere dominar datos completos.
Ejemplos de materiales didácticos: (1) Para comprender la tendencia de los cambios de los precios minoristas en las ciudades urbanas de todo el país de manera oportuna, podemos investigar los cambios en los precios minoristas en 35 ciudades grandes y medianas de todo el país. (2) Para comprender el valor agregado y los activos totales de las empresas industriales en todo el país de manera oportuna, solo necesitamos realizar una encuesta enfocada en las empresas industriales grandes y medianas en todo el país. (3) Por ejemplo, el sistema de informes directos en línea de la Oficina Nacional de Estadísticas para 5.000 empresas industriales en todo el país es una encuesta clave.
encuesta típica
Significado: Según el objetivo y las necesidades de la investigación, sobre la base de un análisis exhaustivo de los objetos investigados, se seleccionan conscientemente para la investigación una serie de unidades típicas o representativas.
efecto
(1) Compensar las deficiencias de una investigación exhaustiva (2) La autenticidad de los datos completos de la encuesta se puede verificar bajo ciertas condiciones. Por ejemplo, después de un censo importante, puede seleccionar varias unidades típicas para comprobar la exactitud de los datos estadísticos.
ventaja
Las encuestas típicas tienen la ventaja de ser flexibles y pueden obtener datos estadísticos detallados y en profundidad a través de unas pocas unidades típicas. La investigación típica no es un método exclusivo de las actividades estadísticas, pero es un método indispensable en términos de procesos estadísticos. El uso de encuestas típicas no tiene como objetivo reflejar las características cuantitativas generales de los fenómenos, sino principalmente comprender las situaciones específicas vívidas relacionadas con las estadísticas, es decir, las condiciones sociales relacionadas con la cantidad de fenómenos y sus interconexiones, con el fin de realizar investigaciones. análisis estadístico en profundidad
defecto
Restringido a "seleccionar conscientemente una serie de unidades representativas", se ve afectado en gran medida por la comprensión subjetiva de las personas. Debe utilizarse junto con otras encuestas para evitar la unilateralidad.
Criterios de evaluación de la calidad estadística
autenticidad, exactitud, integridad, Oportunidad, aplicabilidad, economía. Comparabilidad, coordinación, disponibilidad.