Galeria de mapas mentais Algoritmo de regressão básico para aprendizado de máquina
Ele resume os algoritmos de regressão básicos em aprendizado de máquina, como regressão linear básica, regressão recursiva, regressão linear regularizada, regressão linear esparsa Lasso, regressão de função de base linear, decomposição de valor singular, decomposição de erro de aprendizado de regressão, etc.
Editado em 2023-02-15 23:14:30Microbiologia medica, Infezioni batteriche e immunità riassume e organizza i punti di conoscenza per aiutare gli studenti a comprendere e ricordare. Studia in modo più efficiente!
La teoria cinetica dei gas rivela la natura microscopica dei fenomeni termici macroscopici e le leggi dei gas trovando la relazione tra quantità macroscopiche e quantità microscopiche. Dal punto di vista del movimento molecolare, vengono utilizzati metodi statistici per studiare le proprietà macroscopiche e modificare i modelli di movimento termico delle molecole di gas.
Este é um mapa mental sobre uma breve história do tempo. "Uma Breve História do Tempo" é um trabalho científico popular com influência de longo alcance. Ele não apenas introduz os conceitos básicos da cosmologia e da relatividade, mas também discute os buracos negros e a expansão. Do universo. questões científicas de ponta, como inflação e teoria das cordas.
Microbiologia medica, Infezioni batteriche e immunità riassume e organizza i punti di conoscenza per aiutare gli studenti a comprendere e ricordare. Studia in modo più efficiente!
La teoria cinetica dei gas rivela la natura microscopica dei fenomeni termici macroscopici e le leggi dei gas trovando la relazione tra quantità macroscopiche e quantità microscopiche. Dal punto di vista del movimento molecolare, vengono utilizzati metodi statistici per studiare le proprietà macroscopiche e modificare i modelli di movimento termico delle molecole di gas.
Este é um mapa mental sobre uma breve história do tempo. "Uma Breve História do Tempo" é um trabalho científico popular com influência de longo alcance. Ele não apenas introduz os conceitos básicos da cosmologia e da relatividade, mas também discute os buracos negros e a expansão. Do universo. questões científicas de ponta, como inflação e teoria das cordas.
aprendizado de máquina Algoritmo de regressão básico
aprendizagem de regressão
Características
aprendizagem supervisionada
Conjunto de dados com rótulo y
processo de aprendizado
O processo de determinação dos parâmetros do modelo w
prever ou extrapolar
O processo de cálculo da saída da regressão substituindo novas entradas
regressão linear
regressão linear básica
função linear alvo
Erro na suposição de distribuição gaussiana
Há uma discrepância entre o valor de saída e o valor rotulado
Supondo que a saída do modelo seja o valor esperado, a função de probabilidade da variável aleatória (valor rotulado) yi é
Como as amostras são distribuídas de forma independente e idêntica, a função de densidade de probabilidade conjunta de todos os valores rotulados é
Função de probabilidade para encontrar parâmetros ideais (solução LS de mínimos quadrados)
função de log de verossimilhança
erro soma dos quadrados
solução de máxima verossimilhança
Fórmula de teste de erro quadrático médio
Aprendizagem recursiva para regressão linear
Questões direcionadas
A escala do problema é muito grande e é difícil resolver a matriz
algoritmo de descida gradiente
Pegue todas as amostras para calcular o gradiente médio
gradiente médio
fórmula de recursão
Algoritmo SGD de descida gradiente estocástica (LMS)
Pegue amostras aleatórias para calcular o gradiente
gradiente estocástico
fórmula de recursão
Algoritmo SGD de minilote
Pegue um pequeno lote de amostras para calcular o gradiente médio
gradiente médio
fórmula de recursão
regressão linear regularizada
Questões direcionadas
O número de condição da matriz é muito grande e a estabilidade numérica não é boa.
A natureza do grande número de condição do problema
Alguns vetores coluna de uma matriz são proporcionais ou aproximadamente proporcionais
Existem coeficientes de peso redundantes e ocorre overfitting.
Solução
Deveria “reduzir o número de parâmetros do modelo” ou “regularizar os parâmetros do modelo”
Função objetivo regularizada
Erro soma dos quadrados J (w) hiperparâmetro λ vetor de parâmetro restritivo w
forma
Solução LS de mínimos quadrados regularizados
Interpretação de probabilidade de regressão linear regularizada
A distribuição anterior do vetor de coeficiente de peso w é o MAP bayesiano de "estimativa de probabilidade posterior máxima" sob a distribuição gaussiana
Algoritmo de recursão de gradiente (método de descida de gradiente estocástico de pequenos lotes SGD como exemplo)
Regressão linear de saída múltipla (vetor de saída y)
Questões direcionadas
A saída é um vetor y em vez de um escalar y
Função objetivo da soma dos quadrados dos erros J(W)
Solução LS de mínimos quadrados
Laço de regressão linear esparsa
norma do prazo de regularização
Norma p>1
Nenhuma das coordenadas da solução é 0 e a solução não é esparsa.
Norma p=1
A maioria das coordenadas da solução é 0, as soluções são esparsas e o processamento é relativamente fácil.
Norma p<1
A maioria das coordenadas da solução é 0, as soluções são esparsas e o processamento é difícil.
Problema do laço
contente
Para o problema de minimizar o erro da função soma dos quadrados, uma restrição ||w||1<t é imposta
expressão de regularização
Algoritmo de descida de coordenadas cíclicas do Lasso
pré-processando
Média zero das colunas X da matriz de dados e normalize-as para Z
Solução do Lasso em caso de variável única
Solução laço
Generalização da solução Lasso em casos multivariáveis
Método de descida por coordenadas cíclicas CCD
Primeiro determine um dos parâmetros wj
Calcule os parâmetros que minimizam a soma dos erros quadráticos
Neste momento, outros parâmetros w não são valores ideais, portanto o resultado do cálculo de wj é apenas uma estimativa.
Cálculo de loop
A mesma ideia é usada para calcular outros parâmetros em um loop até que as estimativas dos parâmetros convirjam.
Parte do valor residual ri(j) substitui yi
Matematicamente consistente com univariada
estimativas de parâmetros
Algoritmo LAR do Lasso
Seja aplicável
Resolva o problema de regressão esparsa sob restrições de 1 norma
Correspondente ao problema de regressão regularizada
Classificação
λ=0
Problema de mínimos quadrados padrão
Quanto maior λ
Quanto mais esparso for o vetor w da solução do parâmetro do modelo, mais esparso ele será
regressão de função de base linear
função base
modelo de regressão
Matriz de dados
solução de coeficiente de regressão
decomposição de valor singular
pseudoinverso
Decomposição SVD
Solução do modelo de coeficiente de regressão
Decomposição de erros para aprendizagem de regressão
função de erro
expectativa de erro
Modelo
melhor modelo teórico
Modelo de aprendizagem
decomposição de erro
Complexidade do modelo e decomposição de erros
O modelo é simples
Grande desvio, pequena variação
O modelo é complexo
Pequeno desvio, grande variação
A complexidade apropriada do modelo precisa ser escolhida