Galeria de mapas mentais Big data e ciência de dados
Sistema de conhecimento Dama, ciência de dados integra mineração de dados, análise estatística e aprendizado de máquina com integração de dados e combina recursos de modelagem de dados para construir modelos preditivos e explorar padrões de conteúdo de dados.
Editado em 2024-04-07 10:20:07A segunda unidade do Curso Obrigatório de Biologia resumiu e organizou os pontos de conhecimento, abrangendo todos os conteúdos básicos, o que é muito conveniente para todos aprenderem. Adequado para revisão e visualização de exames para melhorar a eficiência do aprendizado. Apresse-se e colete-o para aprender juntos!
Este é um mapa mental sobre Extração e corrosão de mim. O conteúdo principal inclui: Corrosão de metais, Extração de metais e a série de reatividade.
Este é um mapa mental sobre Reatividade de metais. O conteúdo principal inclui: Reações de deslocamento de metais, A série de reatividade de metais.
A segunda unidade do Curso Obrigatório de Biologia resumiu e organizou os pontos de conhecimento, abrangendo todos os conteúdos básicos, o que é muito conveniente para todos aprenderem. Adequado para revisão e visualização de exames para melhorar a eficiência do aprendizado. Apresse-se e colete-o para aprender juntos!
Este é um mapa mental sobre Extração e corrosão de mim. O conteúdo principal inclui: Corrosão de metais, Extração de metais e a série de reatividade.
Este é um mapa mental sobre Reatividade de metais. O conteúdo principal inclui: Reações de deslocamento de metais, A série de reatividade de metais.
Big data e ciência de dados
introdução
triângulo de convergência de informações
conceito básico
ciência de dados
A ciência de dados integra mineração de dados, análise estatística e aprendizado de máquina com integração de dados e combina recursos de modelagem de dados para construir modelos preditivos e explorar padrões de conteúdo de dados.
processo de ciência de dados
Características de big data
1) Grande quantidade de dados (Volume)
2) Atualização rápida de dados (velocidade)
3) Variedade/Variabilidade de tipos de dados
4) Os dados são altamente pegajosos (viscosidade)
5) Volatilidade dos dados (Volatilidade)
6) Baixa precisão dos dados (Veracidade)
lago de dados
Um data lake é um ambiente que pode extrair, armazenar, avaliar e analisar diferentes tipos e grandes quantidades de dados e pode ser usado em diversos cenários.
aprendizado de máquina
Tipo de algoritmo
1) Aprendizagem supervisionada. Com base em regras comuns (como separar e-mails SPAM de e-mails não-SPAM)
2) Aprendizagem não supervisionada. Com base na descoberta desses padrões ocultos (mineração de dados)
3) Aprendizagem por reforço. Realização baseada em metas (por exemplo, derrotar um oponente no xadrez)
Análise Semântica
Use o processamento de linguagem natural (PNL) para analisar frases ou sentenças, detectar emoções semanticamente e revelar mudanças nas emoções para prever possíveis cenários.
análise normativa
A Análise Prescritiva vai um passo além da análise preditiva ao definir ações que afetarão os resultados, em vez de apenas prever resultados com base em ações que já ocorreram.
Análise de dados não estruturados
A análise de dados não estruturados combina mineração de texto, análise de associação, análise de cluster e outras técnicas de aprendizagem não supervisionadas para processar grandes conjuntos de dados.
análise operacional
Operational Analytics também é chamado de BI operacional ou análise de streaming. Seu conceito é derivado da integração de processos operacionais e análise em tempo real.
Visualização de dados
A visualização é o processo de explicação de conceitos, ideias e fatos por meio do uso de imagens ou representações gráficas.
Mashup de dados
Os mashups de dados combinam dados e serviços para exibir visualmente insights ou resultados de análises.
ferramenta
MPP não compartilhou nada de tecnologia e arquitetura
A tecnologia de banco de dados sem compartilhamento de processamento massivamente paralelo (MPP) tornou-se uma plataforma padrão para análise de grandes conjuntos de dados para ciência de dados.
Em um banco de dados MPP, os dados são particionados (distribuídos logicamente) em vários servidores de processamento (nós de computação), cada um com sua própria memória dedicada para processamento de dados locais.