Galeria de mapas mentais Pintura de IA
O mapa mental desenhado com base no tutorial SD de base zero do mestre Nenly discute o método de pintura usando tecnologia de inteligência artificial para criar.
Editado em 2024-04-12 10:02:10이것은 (III) 저산소증-유도 인자 프롤릴 하이드 록 실라 제 억제제에 대한 마인드 맵이며, 주요 함량은 다음을 포함한다 : 저산소증-유도 인자 프롤릴 하이드 록 실라 제 억제제 (HIF-PHI)는 신장 빈혈의 치료를위한 새로운 소형 분자 경구 약물이다. 1. HIF-PHI 복용량 선택 및 조정. Rosalasstat의 초기 용량, 2. HIF-PHI 사용 중 모니터링, 3. 부작용 및 예방 조치.
이것은 Kuka Industrial Robots의 개발 및 Kuka Industrial Robot의 모션 제어 지침에 대한 마인드 맵입니다. 주요 내용에는 쿠카 산업 로봇의 역사, 쿠카 산업 로봇의 특성, 쿠카 산업 로봇의 응용 분야, 2. 포장 프로세스에서 쿠카 로봇은 빠르고 일관된 포장 작업을 달성하고 포장 효율성을 높이며 인건비를 줄입니다. 2. 인건비 감소 : 자동화는 운영자에 대한 의존성을 줄입니다. 3. 조립 품질 향상 : 정확한 제어는 인간 오류를 줄입니다.
408 컴퓨터 네트워크가 너무 어렵습니까? 두려워하지 마세요! 나는 피를 구토하고 지식 맥락을 명확히하는 데 도움이되는 매우 실용적인 마인드 맵을 분류했습니다. 컨텐츠는 매우 완전합니다. 네트워크 아키텍처에서 응용 프로그램 계층, TCP/IP 프로토콜, 서브넷 디비전 및 기타 핵심 포인트에 이르기까지 원칙을 철저히 이해하는 데 도움이 될 수 있습니다. 📈 명확한 논리 : Mindmas 보물, 당신은 드문 기회가 있습니다. 서둘러! 이 마인드 맵을 사용하여 408 컴퓨터 네트워크의 학습 경로에서 바람과 파도를 타고 성공적으로 해변을 얻으십시오! 도움이 필요한 친구들과 공유해야합니다!
이것은 (III) 저산소증-유도 인자 프롤릴 하이드 록 실라 제 억제제에 대한 마인드 맵이며, 주요 함량은 다음을 포함한다 : 저산소증-유도 인자 프롤릴 하이드 록 실라 제 억제제 (HIF-PHI)는 신장 빈혈의 치료를위한 새로운 소형 분자 경구 약물이다. 1. HIF-PHI 복용량 선택 및 조정. Rosalasstat의 초기 용량, 2. HIF-PHI 사용 중 모니터링, 3. 부작용 및 예방 조치.
이것은 Kuka Industrial Robots의 개발 및 Kuka Industrial Robot의 모션 제어 지침에 대한 마인드 맵입니다. 주요 내용에는 쿠카 산업 로봇의 역사, 쿠카 산업 로봇의 특성, 쿠카 산업 로봇의 응용 분야, 2. 포장 프로세스에서 쿠카 로봇은 빠르고 일관된 포장 작업을 달성하고 포장 효율성을 높이며 인건비를 줄입니다. 2. 인건비 감소 : 자동화는 운영자에 대한 의존성을 줄입니다. 3. 조립 품질 향상 : 정확한 제어는 인간 오류를 줄입니다.
408 컴퓨터 네트워크가 너무 어렵습니까? 두려워하지 마세요! 나는 피를 구토하고 지식 맥락을 명확히하는 데 도움이되는 매우 실용적인 마인드 맵을 분류했습니다. 컨텐츠는 매우 완전합니다. 네트워크 아키텍처에서 응용 프로그램 계층, TCP/IP 프로토콜, 서브넷 디비전 및 기타 핵심 포인트에 이르기까지 원칙을 철저히 이해하는 데 도움이 될 수 있습니다. 📈 명확한 논리 : Mindmas 보물, 당신은 드문 기회가 있습니다. 서둘러! 이 마인드 맵을 사용하여 408 컴퓨터 네트워크의 학습 경로에서 바람과 파도를 타고 성공적으로 해변을 얻으십시오! 도움이 필요한 친구들과 공유해야합니다!
Pintura de IA
Prefácio
Uma breve análise dos princípios da pintura de IA
Imagem original → Difusão (adicionar ruído) → Gerar (remover ruído)
Requisitos de configuração
Computador (sistema Windows/Mac)
Recomendado para sistemas Win10 ou superiores
Placa gráfica (placa gráfica NVIDIA é preferida)
Placa gráfica discreta (gráficos não essenciais)
O desempenho e a memória da placa gráfica afetarão a experiência operacional
O desempenho afeta a eficiência do desenho
A memória de vídeo afeta o tamanho máximo da resolução dos gráficos de desenho e a escala de treinamento do modelo
lista de configuração
Instalação e operação de Webui e software front-end
Para obter detalhes, consulte o guia de instalação mais recente
https://nenly.notion.site/c5805e7ae26b4683a277c5586ea05904
Recomenda-se baixar o pacote de integração de grandes players nacionais
folhas de outono aaaki
https://www.bilibili.com/video/BV1iM4y1y7OA
Pesquisador Independente-Céu Estrelado
https://www.bilibili.com/video/BV1bT411p7Gt
Caixa de pintura Phantom AI
https://www.bilibili.com/video/BV1Vc411T7Nw/
Precauções para executar o programa
O caminho de instalação não deve conter caracteres chineses
O caminho de instalação é a pasta onde você coloca o Stable Diffusion WebUl e a pasta à qual ele pertence. Se houver caracteres chineses em alguma pasta, alguns erros serão relatados no processo de indexação do caminho. Por exemplo:D:/Programas&Arquivos/AlPainting
Para reduzir a probabilidade de erros, os espaços de entrada devem ser reduzidos tanto quanto possível
Coloque a pasta Webui em uma unidade com mais espaço de armazenamento. Tente não colocá-la na unidade C.
As pastas podem ser copiadas livremente sem afetar o uso.
Terminal de operação e linha de comando
sub tópico
Difusão Estável (SD)
Guia de operação básica
Funções Comuns
Imagem Vicentina
Tu Sheng Tu
Introdução básica às funções da interface
Modelo
Salvar e exportar
As imagens geradas serão salvas automaticamente na pasta local
Navegador de galeria: registra diversas informações de geração de imagens
Visualização de imagem
Veja as imagens geradas usando o navegador da galeria
Ver arquivos locais
Localização: Vá para o diretório raiz do Webui (local de instalação) para encontrar a pasta Outout
txt2img-images: Fotos de Vincent
img2img-images:图生图
imagens extras: Ampliação da resolução da imagem
txt2img-grids: Vincent picture_generate visualizações de várias imagens
img2img-grids: Imagens geradoras de imagens_gerar visualizações de múltiplas imagens
Modelo
Conceito de modelo
"Modelo grande" na pintura de IA geralmente se refere ao Checkpoint
Definição: "conjunto de dados" para treinamento de IA, usado para apoiar desenho e pintura de IA
A origem do conceito Checkpoint
A maioria dos modelos passará por treinamento contínuo, ajuste fino e iteração, e o "ponto de armazenamento" no processo é um modelo grande.
Propriedades básicas
Tamanho: 1 ~ 7G
Formato comum:.ckpt/.safetensor
Modelo pequeno: Outros modelos menores que o modelo grande
Por exemplo: LoRA, Embeddings, Hiperrede, etc.
Desempenhar um papel de "ajuste fino" em modelos grandes
VAE: autoencoder variacional
Compreensão simples da função: semelhante ao "filtro de cores"
Caso o modelo não venha com VAE, o VAE precisa ser configurado corretamente.
Caso contrário: a imagem ficará cinza e branca e a qualidade da geração será preocupante.
Diferentes modelos gerarão diferentes conteúdos e estilos de tela.
Canal de download de modelo
A diferença entre modelos oficiais e modelos de fornos privados
Modelo oficial: Um modelo básico treinado com muito esforço. Suporta as raízes da pintura de A, mas o efeito de renderização é médio.
Modelo de forno privado: Um modelo com características estilizadas que é "ajustado" com base no modelo oficial Treinado por criadores individuais!
Modelos de treinamento, também conhecidos como “alquimia”
Questões de direitos autorais ainda são controversas
Canais para download de vários modelos
Abraçando o rosto: https://huggingface.co/models
Existem muitos sites profissionais sobre aprendizagem profunda e inteligência artificial, mas não são muito intuitivos de encontrar.
Civitai (estação C): https://civitai.com/
O site de compartilhamento de modelos de pintura de IA mais popular do mundo. Além de modelos, também há muitos trabalhos excelentes em exibição.
Como filtrar modelos
Modelo de treinamento e modelo de fusão
Modelo de treinamento: treinado a partir do modelo básico
Modelo de fusão: um novo modelo obtido pela mistura de vários modelos de treinamento
etiqueta de modelo
Campos em que os modelos são “bons”, como fotos da vida real, animação, ilustrações, arquitetura, desenhos animados, 3D, etc.
Aprenda a usar modelos
Ver versão
Alguns modelos podem ter diferentes versões iterativas, geralmente escolha a mais recente.
Ver ModelCard e descrição do modelo
O autor geralmente fornece instruções de uso e recomenda amostradores, VAE, etc.
Veja a imagem de exemplo "Copiando lição de casa"
No site da modelo, geralmente você pode copiar diretamente as palavras das imagens enviadas pelo autor ou outros criadores e aplicá-las
Caminho da pasta do modelo
Diretório raiz Webut/Modelos/Difusões estáveis
Classificação e recomendação de estilo de modelo
Modelo recomendado
Difusão Estável1.4
AbyssOrangeMix (Laranja Abismo)
Pacote de iniciante
BV1Us4y117Rg
Modelo bidimensional: Estilo cômico/ilustração, com textura de pincelada de pintura distinta
Modelos recomendados: AbyssOrangeMix, Counterfeit, Anything, Dreamlike, Diffusion
Modelo real: é mais realista, possui alto grau de simulação e forte capacidade de restaurar o mundo real.
Modelos recomendados: Visão Deliberada e Realista, LOFI
Modelo 2.5D: entre os dois primeiros, próximo ao imaginário do público atual de alguns jogos e animações 3D
Modelos recomendados: NeverEndingDream (NED), Protogen, Guofeng 3
Outros modelos de estilo especializados
Tais como: projeto arquitetônico, design gráfico, etc.
Análise principal de modelos avançados - modelos pequenos
Embeddings: modelo de incorporação de palavras
Pode ser usado para restaurar as características da imagem do personagem
Metáfora: um conjunto de “marcadores” apontando para páginas específicas
Exemplo: O que é "Nekomata" → Gato, Humano, Monstro?
Uso
Instalação: Coloque o modelo no diretório raiz/pasta Embeddings
Chamada: Insira o nome do arquivo do modelo na caixa de prompt positivo/negativo
Desenvolvimento de aplicações
Design de três visualizações: use CharTurnerEmbeddings, além de instruções de frases apropriadas para acionar
Exemplo: Uma reviravolta de personagem de (corneo dva) vestindo um mechabody azul, (CharTurnerV2:1.2)
Incorporação de palavras negativas: resolva o problema de mãos erradas e baixa qualidade de imagem
Basta adicionar o nome do arquivo Embeddings correspondente às palavras negativas do prompt.
Palavra de alerta reversa
Use Clip ou DeepBooru
DeepBooru é recomendado, o Clip costuma ter problemas de conexão
LORA: modelo de adaptação de baixo escalão
Geralmente é usado para restaurar personagens e características de imagem e também pode ser usado para treinar estilos de pintura.
Metáfora: uma “página para colorir” extra no livro
Uso
Instalação: Coloque o modelo no diretório raiz /models/LORA
Zhou Yong: Digite <lora: nome do arquivo do modelo: peso> na caixa de prompt positivo/negativo
Ao usá-lo, você pode controlar o peso para evitar afetar excessivamente o estilo de pintura ou outros elementos.
Hiperrede: superrede
Geralmente usado para treinamento de estilo de pintura
(Poucas pessoas usam agora)
Uso
Instalação: Coloque o modelo no diretório raiz /models/pasta Hypernetwork
Chamada: Digite <hypernet:model file name:weight> na caixa de prompt positivo/negativo
Aplicação e prática LoRA
O nascimento e princípio de LORA
Usado pela primeira vez em modelos de linguagem grandes
“Ajustando” um modelo grande com menos dados
Usado em conjunto com Checkpoint
O limiar de formação é baixo e a ecologia floresce.
Três maneiras básicas de aplicar LORA
Digite via prompt word
Formato: <Lora:nome do arquivo:peso>
Chamado através do menu integrado
Ao lado da opção "Gerar", selecione uma variedade de modelos complementares diferentes (incluindo Embeddings.LoRA e mais)
Clique na guia correspondente para adicionar automaticamente a palavra do prompt à caixa superior
Pode gerenciar miniaturas
Chamado por meio de ramais adicionais
Extensão de redes adicionais
Suporta até cinco LORAs, com ajuste deslizante dos parâmetros de peso
Cinco instruções de aplicação LORA
PersonagemLoRA
Caso: "CyberCoser", Lucy, a Edgewalker
Dicas: LORA pode ser usado com Tagger para destacar as características do personagem e corrigir com precisão a imagem do personagem.
Dicas: Combinar a mesma LORA com modelos grandes de estilos diferentes produzirá efeitos diferentes.
Por exemplo, se você escolher um modelo grande em estilo real, poderá desenhar um efeito de personagem realista.
Estilo de pintura LORA
Caso: estilo Ghibli
Dicas: Vários LORAs podem ser usados em combinação, um é responsável pelo estilo de pintura e o outro é responsável pelos personagens.
ConceitoLoRA
Caso:Gacha splash LORA
Dicas: Leia ModelCard para obter mais sugestões de uso do autor.
Tais como: amostrador, palavras-chave de prompt, parâmetros, etc.
RoupasLoRA
Caso: Garota Mecha
Dicas: Vários LORAs do mesmo tipo podem ser usados em combinação e observar suas “reações químicas” para criar o efeito apropriado.
O peso não deve ser muito alto, caso contrário causará conflito e confusão na imagem.
Elemento específico LORA
Caso: Cyberhelmet Cyberhelmet
Dicas: LORA também pode ser utilizado em redesenhados parciais, de forma que apenas parte do redesenho aplique o efeito LORA
Por exemplo, redesenhe parcialmente a cabeça para obter um "uso de capacete" preciso
Comandos
métodos básicos de escrita
Entrada completa em inglês
baseado em frases
Na maioria das vezes é recomendado dividir frases longas
Um separador (uma vírgula de meia largura em inglês) precisa ser inserido entre as frases.
Quebras de linha são possíveis, mas é melhor não ter separadores em cada linha.
Conceito de palavra imediata
Transmita os requisitos de desenho e deixe a IA entender "o que queremos desenhar"
Classificação imediata de palavras
Palavras positivas: o que esperar
Palavras de prompt de conteúdo
Descreva a cena concretamente
Aparência pessoal (menina, cabelo loiro, cabelo comprido, etc.)
Características da roupa (vestido branco, jeans, camiseta, etc.)
Cenas e ambientes (floresta, árvore, flor branca, dia, luz solar, céu nublado, etc.)
Perspectiva e composição da imagem (close-up, corpo inteiro, distante, etc.)
Outros elementos da tela
palavras de alerta padronizadas
qualidade
Alta qualidade: melhor qualidade, ultradetalhado, obra-prima, alta resolução, 8k
Tipos específicos de alta qualidade: papel de parede CG Unity 8k extremamente detalhado (CG de jogo Unity 8K ultrafino), mecanismo irreal renderizado (renderização de mecanismo irreal)
estilo de pintura
Estilo de ilustração: Pintura, lustração, desenho
Bidimensional: Anime, Quadrinhos, Game CG
Estilo realista: fotorrealista, realista
Palavras de alerta negativas: o que você não quer que aconteça
Palavras de lembrete negativas comuns
Baixa qualidade: como baixa qualidade, baixa resolução
Tons de cinza monocromáticos: como monocromático, tons de cinza
Aparência e formato do corpo: como proporções ruins, feio
Problemas com membros: como falta de mãos, dedos extras
Você pode tentar usar palavras de prompt reverso para gerar alguns elementos adiante
Gramática de peso de palavra imediata
O papel dos pesos: aumentar ou enfraquecer a prioridade de certas palavras imediatas
Ajustar método de ponderação
O primeiro tipo: colchetes
Exemplo: (((flor branca))) - aumentado em 1,1 ^ 3 vezes
Exemplo: {{{flor branca}}} - Melhorado em 1,05^3 vezes
Exemplo: [[[flor branca]]] - enfraquecido em 1,1 ^ 3 vezes
O segundo tipo: colchetes, dois pontos, números
Exemplo: (flor branca:1,5),
Controle entre 0,5-1,5
Evite ajustar muito o peso, caso contrário distorcerá a imagem.
Recomendo "A Maldição"
palavras positivas
(obra-prima: 1,2), melhor qualidade, obra-prima, alta resolução, original, papel de parede extremamente detalhado, iluminação perfeita, (CG extremamente detalhado: 1.2), desenho, pincel,
palavra de prompt reverso
NSFW,(pior qualidade:2),(baixa qualidade:2),(qualidade normal:2),lowres,qualidade normal,((monocromático)),((escala de cinza)),manchas de pele,acnes,manchas de pele,manchas de idade ,(feio:1.331),(duplicado:1.331),(mórbido:1.21),(mutilado:1.21),(travesti:1.331),mãos mutantes,(mãos mal desenhadas:1.5),embaçado,(anatomia ruim:1.21) ,(proporções ruins: 1,331), membros extras, (desfigurados: 1,331), (braços faltando: 1,331), (pernas extras: 1,331), (dedos fundidos: 1,61051), (muitos dedos: 1,61051), (olhos pouco claros: 1.331), abaixa, mãos ruins, falta de dedos, dígito extra, mãos ruins, falta de dedos, (((braços e pernas extras)))
Três dicas de métodos de palavras para iniciantes
1. Tradução do Dafa
Use um software de tradução para converter diretamente sua linguagem natural em palavras imediatas
Descreva uma cena específica primeiro e depois adicione entradas lentamente
2. Use ferramentas
Use a ferramenta de prompt de palavras para completar a escrita da palavra de prompt "selecionando"
Uma caixa de ferramentas: http://www.atoolbox.net/Tool.php?ld=1101
Acelerador de palavras AI: https://ai.dawnmark.cn/
Não fique limitado em seu pensamento pelas entradas existentes
3. Copie o dever de casa
Consulte alguns exemplos de sites modelo e palavras de alerta para registrar o produto final do site.
OpenArt: https://openart.ai
ArtHubAi: https://arthub.ai/
Consulte o conteúdo/palavras de prompt padronizadas conforme necessário
configurações de parâmetros
Etapas de amostragem
Quanto maior o número de etapas de amostragem, mais detalhada será a imagem.
A melhoria acima de 20 etapas é pequena, mas requer poder computacional extra.
Faixa recomendada: entre 10~30 (padrão 20)
Método de amostragem
Vários algoritmos de geração
Recomende os marcados com " " abaixo
Se o modelo tiver um algoritmo de recomendação, use-o primeiro
resolução
A resolução é muito pequena: as imagens são inerentemente desfocadas e sem detalhes
A resolução é muito grande: o cálculo é lento, a memória de vídeo se esgota facilmente e pode haver várias pessoas.
É necessário aprender por tentativa e erro qual resolução pode garantir qualidade e eficiência nas condições atuais do equipamento.
Outras opções
Relevância da palavra do prompt: o grau em que a palavra do prompt é restaurada (faixa de segurança: 7 ~ 12)
Reparação Facial: Verificação Recomendada
Azulejo: Não verifique se você não está fazendo um padrão
Publique fotos em lotes
Plotar continuamente de acordo com o número de lotes
Recomenda-se que a quantidade do lote único seja mantida em 1
Porque o método de fazer múltiplas imagens em um único lote é “juntá-las” em uma imagem grande para gerar
Faixa de redesenho aplicável ao modo gráfico a gráfico
A configuração recomendada é entre 0,6-0,8
O significado da semente aleatória
Correção imediata de palavras
Definição adicional de conteúdo de fundo
( )em segundo plano: defina com precisão o conteúdo de fundo
Profundidade de campo: A profundidade de campo ajuda a criar uma atmosfera fotográfica
semente aleatória
O núcleo do “desenho de cartas”:
Ele será gerado aleatoriamente de forma diferente a cada vez, e o método de geração aleatória é registrado como um conjunto de números, ou seja, uma semente aleatória.
Diferentes sementes aleatórias trazem aleatoriedade, e as mesmas sementes aleatórias alcançam efeitos semelhantes.
Como consertar sementes aleatórias
O navegador da galeria também registra o número de sementes
Mantenha as sementes aleatórias consistentes e modifique as palavras de alerta para obter um estilo de personagem relativamente consistente.
Tu Sheng Tu
princípio
Assim como o texto, as imagens também podem ser enviadas à IA para análise como uma espécie de informação.
A essência do "redesenho" é que após a análise estrutural dos pixels da imagem, o produto final é semelhante à imagem original.
Os passos básicos
Enviar Imagem
Preencha a palavra de alerta
Use palavras rápidas para descrever o conteúdo da tela
Mesmo se você pedir à IA para desenhar através do Tushengtu, ainda precisará de palavras específicas e precisas.
Palavras de prompt padronizadas por tipo de conteúdo
configurações de parâmetros
Redesenhar largura
Quão semelhantes são as fotos originais e as fotos finalizadas?
Se for muito alto, deforma-se facilmente; se for muito baixo, o efeito de "redesenho" não pode ser alcançado.
A configuração recomendada é entre 0,6-0,8
resolução
Priorize manter a consistência com a imagem original
Se a imagem original for muito grande, ela poderá ser reduzida para um intervalo seguro.
Se a proporção do produto acabado for diferente da imagem original
Corte-o primeiro no computador e depois importe-o
Três métodos de corte diferentes fornecem tamanhos adaptáveis
Outros parâmetros
Expanda aplicativos
Transforme retratos reais em duas dimensões
Usar SD tem maior precisão e mais espaço para definição
"Personificação" de naturezas mortas e paisagens
Importe imagens que não sejam pessoas e defina-as com palavras que descrevam as pessoas.
Caracteres bidimensionais "tridimensionais"
Importe imagens de personagens de anime e jogos e defina-os com modelos realistas e palavras de alerta padronizadas e realistas.
Você pode usar o modelo Lora para restaurar as características do personagem de forma mais específica e precisa
Jogabilidade avançada
Redesenho de IA de síntese de imagem
pintura abstrata
Desenhe algumas cores e linhas aleatoriamente e importe-as para a IA para gerar
Aplicação e prática do ControlNet
Análise do princípio ControINet
Use informações específicas para orientá-lo a obter alguns recursos que não podemos controlar com precisão por meio de diagramas de Wensheng e diagramas de Tusheng.
O significado do controle preciso
Se você puder confiar apenas em “cartas de desenho” para produzir o conteúdo necessário, a geração será altamente incontrolável.
A importância do controle preciso: diante de necessidades específicas, somente o “controlável” pode se tornar “produtivo”
Estrutura básica: pré-processador → modelo
O pré-processador pode extrair informações de recursos de imagens
O modelo ControlNet treinado lê essas informações e orienta o processo de geração de Difusão estável
Métodos básicos de aplicação ControlNet
Arraste o infográfico e selecione a combinação correspondente de pré-processador e modelo
Pré-processar a imagem
Clique no botão "Explodir" para visualizar os resultados do pré-processamento
Infográficos pré-processados podem ser salvos e reutilizados
Ao enviar seu infográfico, defina o pré-processamento como "Nenhum"
Explicação detalhada dos parâmetros
Peso de controle: afeta principalmente a “força” de controle
Tempo de inicialização: o momento em que o ControINet "entra em vigor" durante o processo de geração (de 0 a 1)
Modo de controle: Prefira palavras de prompt ou ControlNet
Maneiras de alterar a intensidade do controle:
Aumente os esforços: aumente o peso, reduza o número de etapas iniciais de orientação e aumente o número de etapas finais de orientação e selecione o modo ControlNet "mais importante"
Reduzir a intensidade: reduza o peso, aumente o número de etapas iniciais de orientação e reduza o número de etapas finais de orientação e selecione o modo "palavras de alerta são mais importantes"
No Diagrama Tu Sheng, o Diagrama Tu Sheng original será carregado automaticamente como um gráfico de informações.
Introdução aos cinco principais modelos ControlNet
Openpose: Controle a postura, mãos, detalhes faciais
Vários pré-processadores Openpose diferentes
Mão: ossos da mão
Rosto (somente): pontos característicos faciais
Ful: adicione tudo junto
Profundidade: Controle a composição do espaço (profundidade)
Mapa de profundidade: preto longe, branco perto
Vários pré-processamentos de profundidade diferentes
Leres tem alta precisão e midas é mais comumente usado.
Quanto maior a precisão do pré-processamento, mais tempo geralmente leva.
Canny: contornos da linha de controle
Durante o pré-processamento, o limite controla o número de linhas e não deve ser muito denso.
Aplicação: Desenho de linha para colorir
Dicas: Use Inverter para desenhos de linha com linhas pretas sobre fundo branco e inverta-os para linhas brancas sobre fundo preto para identificação correta.
SoftEdge: controla os contornos das linhas, mas é mais suave e relaxado
Vários pré-processadores SofEdge diferentes
pouca diferença
Comparado com Canny, a restauração de contornos do SoftEdge é mais "vívida" e não muito rígida.
Dicas: “relaxar” adequadamente o controle da ControlNet ajudará a IA a exercer mais sua própria criatividade
Rabisco: geração de tela do guia Graffiti
Você pode extraí-lo de fotos ou desenhá-lo você mesmo
Aplicação: Pintor de Almas
Lógica de múltiplas aplicações ControlNet
Nas configurações, habilite vários ControlNetUnits para usar vários ControlNets
A chave para a lógica combinatória: complementar-se!
Demonstração correta: Canny Depth, usando linhas para preencher os detalhes em profundidade
Demonstração de erro: Canny SoftEdge, também é uma borda de controle. Não há muita diferença entre abrir dois e abrir um.
Três métodos de processamento de zoom nativos da WebUI
Tushengtu: restauração HD
Essência: primeiro gere uma versão de baixa qualidade e depois "redesenhe" para gerar uma versão de alta resolução
É como tirar uma foto de baixa qualidade e fazer uma "imagem de uma foto"
Atualmente é utilizado na maioria dos processos de desenho.
Análise de Vantagens e Desvantagens
Vantagem
Não altera a composição do quadro (corrigido via semente aleatória)
Supere de forma estável problemas causados pela resolução, como multijogador e múltiplas cabeças.
Operação fácil, clara e intuitiva
Desvantagens
Ainda limitado pela memória máxima de vídeo
A velocidade computacional é relativamente lenta
Ocasionalmente, "adicionando drama", aparecem elementos adicionais inexplicáveis
Análise de parâmetros
ganho
aumentar
Defina o tamanho final diretamente
Redesenhar largura
Varia dependendo do algoritmo e geralmente não é definido muito alto.
Recomendado 0,3 ~ 0,5
Seleção de algoritmo
Série latente: rica em detalhes, mas fácil de causar distorção de imagem
Nota: A amplitude de redesenho geralmente não pode ser inferior a 0,5 (caso contrário, aparecerá desfoque)
Série GAN: Mantenha a imagem original semelhante ao máximo, e o efeito detalhado não é tão bom quanto Latente.
Se não tiver certeza, você pode escolher o R-ESRGAN 4X sem pensar.
*Escolha aquele com Anime 6B para a segunda dimensão
As diferenças entre os diferentes algoritmos não são tão grandes quanto se imaginava
Diagrama vicentino: ampliação do SD
Essência: Divida a imagem em pequenos pedaços, redesenhe-os e depois junte-os em uma grande imagem.
Análise de Vantagens e Desvantagens
Vantagem
Pode romper as limitações de memória para obter uma resolução maior (até 4 vezes a largura e a altura)
A imagem é altamente fina e a riqueza de detalhes é excelente.
Desvantagens
O processo de segmentação e redesenho é relativamente incontrolável (enganos semânticos e linhas divisórias)
Pesado e relativamente pouco intuitivo de operar
Ocasionalmente, "adicionando drama", aparecem elementos adicionais inexplicáveis
Análise de parâmetros
Faixa de redesenho: geralmente não mais que 0,5, 0,2 ~ 0,3 é recomendado
Quando ocorrerem problemas com vários jogadores ou com vários cabeçotes, o intervalo de redesenho será reduzido.
Algoritmo de upscaling: igual ao da restauração HD
Pixels sobrepostos (Tile Overlap): A sobreposição entre os ladrilhos, para que a costura da imagem possa ser entendida. O papel da sobreposição: a cola e as tiras de proteção são mais naturais.
Compreendendo o papel da sobreposição: fita adesiva adesiva
Quando a costura parecer muito rígida, aumente os pixels sobrepostos.
Extra: Pós-processamento (mais)
Essência: Melhoria simples da resolução de imagens através de algoritmo de inteligência artificial, sem necessidade de redesenho
Conveniente, eficiente, disponível a qualquer momento, você não perderá dinheiro depois de usá-lo
Análise de Vantagens e Desvantagens
Vantagem
Fácil de usar, simples de operar, pode ser chamado a qualquer momento
Cálculo rápido e sem pressão de redesenho
Não altera em nada o conteúdo da imagem
Desvantagens
O efeito não é muito significativo (um pouco insípido)
(..Este defeito é suficiente)
Análise de parâmetros
O segundo algoritmo de amplificação
Semelhante à lógica de "peso" das palavras imediatas
Você não precisa configurá-lo, apenas usar um algoritmo é suficiente.
Pode ser processado em lotes
Depois que a versão do WebUI foi atualizada para 1.6.0, a função "HD Repair" mudou da caixa de seleção original para um rótulo de expansão/recolhimento. Ela está habilitada no estado expandido e não habilitada no estado recolhido. O método de uso específico é totalmente consistente com o original.
redesenho parcial
Noções básicas de redesenho parcial
Procedimentos operacionais básicos
Carregue as imagens para a área de trabalho "Redesenhar Parcial" ou envie-as para o Redesenho Parcial através do navegador da galeria, etc.
Ajuste o tamanho do pincel para que a área de desenho cubra a parte que precisa ser redesenhada
Ajuste o intervalo de redesenho e vários parâmetros, modifique as palavras do prompt e clique em Gerar para realizar o redesenho.
Essência: redesenhar a imagem e, em seguida, "remontar" a área redesenhada
Análise de parâmetros principais
área de máscara
A parte pintada é a área da máscara
As outras partes são áreas "sem máscara"
conteúdo mascarado
Imagem original: insira como está e adicione ruído e redução de ruído, o efeito de redesenho é mais próximo
Preenchimento: Desfoque fortemente a imagem original e, em seguida, adicione ruído e redução de ruído. A diferença no efeito de redesenho será um pouco maior.
Variáveis de espaço latente e espaço latente em branco: Converta a área da máscara em puro ruído de espaço latente e o efeito de redesenho terá a maior diferença.
Geralmente, é necessária uma faixa de redesenho maior, caso contrário, causará confusão na área de redesenho.
Para imagens diferentes, o efeito pode ser diferente e você precisa tentar mais.
Apenas máscara e imagem completa
Imagem completa: redesenhe a imagem inteira e, em seguida, “repare” as partes borradas.
Apenas máscara: redesenhe a parte manchada e uma pequena área circundante separadamente e, em seguida, "remende" a parte manchada
Desfoque de máscara e pixels reservados
Desfoque da máscara: suavidade das bordas, semelhante ao "enevoamento de seleção"
Pixels reservados: afeta o tamanho da área circundante extraída no modo somente máscara
Outros métodos de redesenho
Redesenho de graffiti (inPaint Sketch)
Use um pincel colorido para pintar, depois pinte novamente a área pintada e adicione a cor pintada à imagem original
Muitas vezes é usado para modificar as partes erradas da imagem, como corrigir a mão errada.
Operação: Primeiro pinte a área da mão da imagem original com uma cor semelhante à do fundo e depois desenhe a imagem da mão com uma cor semelhante à da pele.
Esboço
Aplique com um pincel colorido e redesenhe toda a imagem
A diferença entre redesenhar e graffiti: um é para partes locais e o outro é para o quadro inteiro
Redesenho de máscara (MaskInpaint, Inpaint Upload)
Faça upload de uma imagem de máscara em preto e branco para delinear a área de redesenho
Por padrão: o branco está mascarado, o preto está desmascarado
Você pode usar PS e outro software para recortar imagens, criar imagens de máscara e exportá-las.