Conecte-se
Fazer login

Pintura de IA

O mapa mental desenhado com base no tutorial SD de base zero do mestre Nenly discute o método de pintura usando tecnologia de inteligência artificial para criar.

Editado em 2024-04-12 10:02:10

슈퍼직장인

Trabalhos recentes Ver mais trabalhos>>

(III) 저산소 유도 인자 프롤릴 하이드 록 실라 제 억제제
이것은 (III) 저산소증-유도 인자 프롤릴 하이드 록 실라 제 억제제에 대한 마인드 맵이며, 주요 함량은 다음을 포함한다 : 저산소증-유도 인자 프롤릴 하이드 록 실라 제 억제제 (HIF-PHI)는 신장 빈혈의 치료를위한 새로운 소형 분자 경구 약물이다. 1. HIF-PHI 복용량 선택 및 조정. Rosalasstat의 초기 용량, 2. HIF-PHI 사용 중 모니터링, 3. 부작용 및 예방 조치.
Kuka 산업용 로봇의 개발 및 Kuka 산업 로봇의 모션 제어 명령
이것은 Kuka Industrial Robots의 개발 및 Kuka Industrial Robot의 모션 제어 지침에 대한 마인드 맵입니다. 주요 내용에는 쿠카 산업 로봇의 역사, 쿠카 산업 로봇의 특성, 쿠카 산업 로봇의 응용 분야, 2. 포장 프로세스에서 쿠카 로봇은 빠르고 일관된 포장 작업을 달성하고 포장 효율성을 높이며 인건비를 줄입니다. 2. 인건비 감소 : 자동화는 운영자에 대한 의존성을 줄입니다. 3. 조립 품질 향상 : 정확한 제어는 인간 오류를 줄입니다.
1.1 컴퓨터 네트워크 요약
408 컴퓨터 네트워크가 너무 어렵습니까? 두려워하지 마세요! 나는 피를 구토하고 지식 맥락을 명확히하는 데 도움이되는 매우 실용적인 마인드 맵을 분류했습니다. 컨텐츠는 매우 완전합니다. 네트워크 아키텍처에서 응용 프로그램 계층, TCP/IP 프로토콜, 서브넷 디비전 및 기타 핵심 포인트에 이르기까지 원칙을 철저히 이해하는 데 도움이 될 수 있습니다. 📈 명확한 논리 : Mindmas 보물, 당신은 드문 기회가 있습니다. 서둘러! 이 마인드 맵을 사용하여 408 컴퓨터 네트워크의 학습 경로에서 바람과 파도를 타고 성공적으로 해변을 얻으십시오! 도움이 필요한 친구들과 공유해야합니다!

Pintura de IA

슈퍼직장인

Trabalhos recentes Ver mais trabalhos>>

Recomendado para você
Descrição

Notas de leitura Isso é suficiente para estudar
- 27
- 1
- 1
75zb2rxr@bccto.cc
Mapa mental de influência
- 46
75zb2rxr@bccto.cc
Mapa mental Red Rock
- 29
75zb2rxr@bccto.cc
Um mapa mental simples de Os Analectos de Confúcio
- 42
75zb2rxr@bccto.cc
Gráfico de resumo do capítulo Como o aço foi temperado
- 23
- 1
- 1
75zb2rxr@bccto.cc
Mapa mental Viagem ao Oeste
- 17
75zb2rxr@bccto.cc
Mapa mental Margem da Água
- 24
75zb2rxr@bccto.cc
Notas de leitura da infância
- 32
75zb2rxr@bccto.cc
Mapa do curso de massa e densidade de física do ensino médio
- 25
75zb2rxr@bccto.cc
6 etapas para gerenciar o tempo do projeto
- 27
- 2
75zb2rxr@bccto.cc

Pintura de IA

Prefácio

Uma breve análise dos princípios da pintura de IA

Imagem original → Difusão (adicionar ruído) → Gerar (remover ruído)

Requisitos de configuração

Computador (sistema Windows/Mac)

Recomendado para sistemas Win10 ou superiores

Placa gráfica (placa gráfica NVIDIA é preferida)

Placa gráfica discreta (gráficos não essenciais)

O desempenho e a memória da placa gráfica afetarão a experiência operacional

O desempenho afeta a eficiência do desenho

A memória de vídeo afeta o tamanho máximo da resolução dos gráficos de desenho e a escala de treinamento do modelo

lista de configuração

Instalação e operação de Webui e software front-end

Para obter detalhes, consulte o guia de instalação mais recente

https://nenly.notion.site/c5805e7ae26b4683a277c5586ea05904

Recomenda-se baixar o pacote de integração de grandes players nacionais

folhas de outono aaaki

https://www.bilibili.com/video/BV1iM4y1y7OA

Pesquisador Independente-Céu Estrelado

https://www.bilibili.com/video/BV1bT411p7Gt

Caixa de pintura Phantom AI

https://www.bilibili.com/video/BV1Vc411T7Nw/

Precauções para executar o programa

O caminho de instalação não deve conter caracteres chineses

O caminho de instalação é a pasta onde você coloca o Stable Diffusion WebUl e a pasta à qual ele pertence. Se houver caracteres chineses em alguma pasta, alguns erros serão relatados no processo de indexação do caminho. Por exemplo:D:/Programas&Arquivos/AlPainting

Para reduzir a probabilidade de erros, os espaços de entrada devem ser reduzidos tanto quanto possível

Coloque a pasta Webui em uma unidade com mais espaço de armazenamento. Tente não colocá-la na unidade C.

As pastas podem ser copiadas livremente sem afetar o uso.

Terminal de operação e linha de comando

sub tópico

Difusão Estável (SD)

Guia de operação básica

Funções Comuns

Imagem Vicentina

Tu Sheng Tu

Introdução básica às funções da interface

Modelo

Salvar e exportar

As imagens geradas serão salvas automaticamente na pasta local

Navegador de galeria: registra diversas informações de geração de imagens

Visualização de imagem

Veja as imagens geradas usando o navegador da galeria

Ver arquivos locais

Localização: Vá para o diretório raiz do Webui (local de instalação) para encontrar a pasta Outout

txt2img-images: Fotos de Vincent

img2img-images：图生图

imagens extras: Ampliação da resolução da imagem

txt2img-grids: Vincent picture_generate visualizações de várias imagens

img2img-grids: Imagens geradoras de imagens_gerar visualizações de múltiplas imagens

Modelo

Conceito de modelo

"Modelo grande" na pintura de IA geralmente se refere ao Checkpoint

Definição: "conjunto de dados" para treinamento de IA, usado para apoiar desenho e pintura de IA

A origem do conceito Checkpoint

A maioria dos modelos passará por treinamento contínuo, ajuste fino e iteração, e o "ponto de armazenamento" no processo é um modelo grande.

Propriedades básicas

Tamanho: 1 ~ 7G

Formato comum:.ckpt/.safetensor

Modelo pequeno: Outros modelos menores que o modelo grande

Por exemplo: LoRA, Embeddings, Hiperrede, etc.

Desempenhar um papel de "ajuste fino" em modelos grandes

VAE: autoencoder variacional

Compreensão simples da função: semelhante ao "filtro de cores"

Caso o modelo não venha com VAE, o VAE precisa ser configurado corretamente.

Caso contrário: a imagem ficará cinza e branca e a qualidade da geração será preocupante.

Diferentes modelos gerarão diferentes conteúdos e estilos de tela.

Canal de download de modelo

A diferença entre modelos oficiais e modelos de fornos privados

Modelo oficial: Um modelo básico treinado com muito esforço. Suporta as raízes da pintura de A, mas o efeito de renderização é médio.

Modelo de forno privado: Um modelo com características estilizadas que é "ajustado" com base no modelo oficial Treinado por criadores individuais!

Modelos de treinamento, também conhecidos como “alquimia”

Questões de direitos autorais ainda são controversas

Canais para download de vários modelos

Abraçando o rosto: https://huggingface.co/models

Existem muitos sites profissionais sobre aprendizagem profunda e inteligência artificial, mas não são muito intuitivos de encontrar.

Civitai (estação C): https://civitai.com/

O site de compartilhamento de modelos de pintura de IA mais popular do mundo. Além de modelos, também há muitos trabalhos excelentes em exibição.

Como filtrar modelos

Modelo de treinamento e modelo de fusão

Modelo de treinamento: treinado a partir do modelo básico

Modelo de fusão: um novo modelo obtido pela mistura de vários modelos de treinamento

etiqueta de modelo

Campos em que os modelos são “bons”, como fotos da vida real, animação, ilustrações, arquitetura, desenhos animados, 3D, etc.

Aprenda a usar modelos

Ver versão

Alguns modelos podem ter diferentes versões iterativas, geralmente escolha a mais recente.

Ver ModelCard e descrição do modelo

O autor geralmente fornece instruções de uso e recomenda amostradores, VAE, etc.

Veja a imagem de exemplo "Copiando lição de casa"

No site da modelo, geralmente você pode copiar diretamente as palavras das imagens enviadas pelo autor ou outros criadores e aplicá-las

Caminho da pasta do modelo

Diretório raiz Webut/Modelos/Difusões estáveis

Classificação e recomendação de estilo de modelo

Modelo recomendado

Difusão Estável1.4

AbyssOrangeMix (Laranja Abismo)

Pacote de iniciante

BV1Us4y117Rg

Modelo bidimensional: Estilo cômico/ilustração, com textura de pincelada de pintura distinta

Modelos recomendados: AbyssOrangeMix, Counterfeit, Anything, Dreamlike, Diffusion

Modelo real: é mais realista, possui alto grau de simulação e forte capacidade de restaurar o mundo real.

Modelos recomendados: Visão Deliberada e Realista, LOFI

Modelo 2.5D: entre os dois primeiros, próximo ao imaginário do público atual de alguns jogos e animações 3D

Modelos recomendados: NeverEndingDream (NED), Protogen, Guofeng 3

Outros modelos de estilo especializados

Tais como: projeto arquitetônico, design gráfico, etc.

Análise principal de modelos avançados - modelos pequenos

Embeddings: modelo de incorporação de palavras

Pode ser usado para restaurar as características da imagem do personagem

Metáfora: um conjunto de “marcadores” apontando para páginas específicas

Exemplo: O que é "Nekomata" → Gato, Humano, Monstro?

Uso

Instalação: Coloque o modelo no diretório raiz/pasta Embeddings

Chamada: Insira o nome do arquivo do modelo na caixa de prompt positivo/negativo

Desenvolvimento de aplicações

Design de três visualizações: use CharTurnerEmbeddings, além de instruções de frases apropriadas para acionar

Exemplo: Uma reviravolta de personagem de (corneo dva) vestindo um mechabody azul, (CharTurnerV2:1.2)

Incorporação de palavras negativas: resolva o problema de mãos erradas e baixa qualidade de imagem

Basta adicionar o nome do arquivo Embeddings correspondente às palavras negativas do prompt.

Palavra de alerta reversa

Use Clip ou DeepBooru

DeepBooru é recomendado, o Clip costuma ter problemas de conexão

LORA: modelo de adaptação de baixo escalão

Geralmente é usado para restaurar personagens e características de imagem e também pode ser usado para treinar estilos de pintura.

Metáfora: uma “página para colorir” extra no livro

Uso

Instalação: Coloque o modelo no diretório raiz /models/LORA

Zhou Yong: Digite <lora: nome do arquivo do modelo: peso> na caixa de prompt positivo/negativo

Ao usá-lo, você pode controlar o peso para evitar afetar excessivamente o estilo de pintura ou outros elementos.

Hiperrede: superrede

Geralmente usado para treinamento de estilo de pintura

(Poucas pessoas usam agora)

Uso

Instalação: Coloque o modelo no diretório raiz /models/pasta Hypernetwork

Chamada: Digite <hypernet:model file name:weight> na caixa de prompt positivo/negativo

Aplicação e prática LoRA

O nascimento e princípio de LORA

Usado pela primeira vez em modelos de linguagem grandes

“Ajustando” um modelo grande com menos dados

Usado em conjunto com Checkpoint

O limiar de formação é baixo e a ecologia floresce.

Três maneiras básicas de aplicar LORA

Digite via prompt word

Formato: <Lora:nome do arquivo:peso>

Chamado através do menu integrado

Ao lado da opção "Gerar", selecione uma variedade de modelos complementares diferentes (incluindo Embeddings.LoRA e mais)

Clique na guia correspondente para adicionar automaticamente a palavra do prompt à caixa superior

Pode gerenciar miniaturas

Chamado por meio de ramais adicionais

Extensão de redes adicionais

Suporta até cinco LORAs, com ajuste deslizante dos parâmetros de peso

Cinco instruções de aplicação LORA

PersonagemLoRA

Caso: "CyberCoser", Lucy, a Edgewalker

Dicas: LORA pode ser usado com Tagger para destacar as características do personagem e corrigir com precisão a imagem do personagem.

Dicas: Combinar a mesma LORA com modelos grandes de estilos diferentes produzirá efeitos diferentes.

Por exemplo, se você escolher um modelo grande em estilo real, poderá desenhar um efeito de personagem realista.

Estilo de pintura LORA

Caso: estilo Ghibli

Dicas: Vários LORAs podem ser usados em combinação, um é responsável pelo estilo de pintura e o outro é responsável pelos personagens.

ConceitoLoRA

Caso:Gacha splash LORA

Dicas: Leia ModelCard para obter mais sugestões de uso do autor.

Tais como: amostrador, palavras-chave de prompt, parâmetros, etc.

RoupasLoRA

Caso: Garota Mecha

Dicas: Vários LORAs do mesmo tipo podem ser usados em combinação e observar suas “reações químicas” para criar o efeito apropriado.

O peso não deve ser muito alto, caso contrário causará conflito e confusão na imagem.

Elemento específico LORA

Caso: Cyberhelmet Cyberhelmet

Dicas: LORA também pode ser utilizado em redesenhados parciais, de forma que apenas parte do redesenho aplique o efeito LORA

Por exemplo, redesenhe parcialmente a cabeça para obter um "uso de capacete" preciso

Comandos

métodos básicos de escrita

Entrada completa em inglês

baseado em frases

Na maioria das vezes é recomendado dividir frases longas

Um separador (uma vírgula de meia largura em inglês) precisa ser inserido entre as frases.

Quebras de linha são possíveis, mas é melhor não ter separadores em cada linha.

Conceito de palavra imediata

Transmita os requisitos de desenho e deixe a IA entender "o que queremos desenhar"

Classificação imediata de palavras

Palavras positivas: o que esperar

Palavras de prompt de conteúdo

Descreva a cena concretamente

Aparência pessoal (menina, cabelo loiro, cabelo comprido, etc.)

Características da roupa (vestido branco, jeans, camiseta, etc.)

Cenas e ambientes (floresta, árvore, flor branca, dia, luz solar, céu nublado, etc.)

Perspectiva e composição da imagem (close-up, corpo inteiro, distante, etc.)

Outros elementos da tela

palavras de alerta padronizadas

qualidade

Alta qualidade: melhor qualidade, ultradetalhado, obra-prima, alta resolução, 8k

Tipos específicos de alta qualidade: papel de parede CG Unity 8k extremamente detalhado (CG de jogo Unity 8K ultrafino), mecanismo irreal renderizado (renderização de mecanismo irreal)

estilo de pintura

Estilo de ilustração: Pintura, lustração, desenho

Bidimensional: Anime, Quadrinhos, Game CG

Estilo realista: fotorrealista, realista

Palavras de alerta negativas: o que você não quer que aconteça

Palavras de lembrete negativas comuns

Baixa qualidade: como baixa qualidade, baixa resolução

Tons de cinza monocromáticos: como monocromático, tons de cinza

Aparência e formato do corpo: como proporções ruins, feio

Problemas com membros: como falta de mãos, dedos extras

Você pode tentar usar palavras de prompt reverso para gerar alguns elementos adiante

Gramática de peso de palavra imediata

O papel dos pesos: aumentar ou enfraquecer a prioridade de certas palavras imediatas

Ajustar método de ponderação

O primeiro tipo: colchetes

Exemplo: (((flor branca))) - aumentado em 1,1 ^ 3 vezes

Exemplo: {{{flor branca}}} - Melhorado em 1,05^3 vezes

Exemplo: [[[flor branca]]] - enfraquecido em 1,1 ^ 3 vezes

O segundo tipo: colchetes, dois pontos, números

Exemplo: (flor branca:1,5),

Controle entre 0,5-1,5

Evite ajustar muito o peso, caso contrário distorcerá a imagem.

Recomendo "A Maldição"

palavras positivas

(obra-prima: 1,2), melhor qualidade, obra-prima, alta resolução, original, papel de parede extremamente detalhado, iluminação perfeita, (CG extremamente detalhado: 1.2), desenho, pincel,

palavra de prompt reverso

NSFW,(pior qualidade:2),(baixa qualidade:2),(qualidade normal:2),lowres,qualidade normal,((monocromático)),((escala de cinza)),manchas de pele,acnes,manchas de pele,manchas de idade ,(feio:1.331),(duplicado:1.331),(mórbido:1.21),(mutilado:1.21),(travesti:1.331),mãos mutantes,(mãos mal desenhadas:1.5),embaçado,(anatomia ruim:1.21) ,(proporções ruins: 1,331), membros extras, (desfigurados: 1,331), (braços faltando: 1,331), (pernas extras: 1,331), (dedos fundidos: 1,61051), (muitos dedos: 1,61051), (olhos pouco claros: 1.331), abaixa, mãos ruins, falta de dedos, dígito extra, mãos ruins, falta de dedos, (((braços e pernas extras)))

Três dicas de métodos de palavras para iniciantes

1. Tradução do Dafa

Use um software de tradução para converter diretamente sua linguagem natural em palavras imediatas

Descreva uma cena específica primeiro e depois adicione entradas lentamente

2. Use ferramentas

Use a ferramenta de prompt de palavras para completar a escrita da palavra de prompt "selecionando"

Uma caixa de ferramentas: http://www.atoolbox.net/Tool.php?ld=1101

Acelerador de palavras AI: https://ai.dawnmark.cn/

Não fique limitado em seu pensamento pelas entradas existentes

3. Copie o dever de casa

Consulte alguns exemplos de sites modelo e palavras de alerta para registrar o produto final do site.

OpenArt: https://openart.ai

ArtHubAi: https://arthub.ai/

Consulte o conteúdo/palavras de prompt padronizadas conforme necessário

configurações de parâmetros

Etapas de amostragem

Quanto maior o número de etapas de amostragem, mais detalhada será a imagem.

A melhoria acima de 20 etapas é pequena, mas requer poder computacional extra.

Faixa recomendada: entre 10~30 (padrão 20)

Método de amostragem

Vários algoritmos de geração

Recomende os marcados com " " abaixo

Se o modelo tiver um algoritmo de recomendação, use-o primeiro

resolução

A resolução é muito pequena: as imagens são inerentemente desfocadas e sem detalhes

A resolução é muito grande: o cálculo é lento, a memória de vídeo se esgota facilmente e pode haver várias pessoas.

É necessário aprender por tentativa e erro qual resolução pode garantir qualidade e eficiência nas condições atuais do equipamento.

Outras opções

Relevância da palavra do prompt: o grau em que a palavra do prompt é restaurada (faixa de segurança: 7 ~ 12)

Reparação Facial: Verificação Recomendada

Azulejo: Não verifique se você não está fazendo um padrão

Publique fotos em lotes

Plotar continuamente de acordo com o número de lotes

Recomenda-se que a quantidade do lote único seja mantida em 1

Porque o método de fazer múltiplas imagens em um único lote é “juntá-las” em uma imagem grande para gerar

Faixa de redesenho aplicável ao modo gráfico a gráfico

A configuração recomendada é entre 0,6-0,8

O significado da semente aleatória

Correção imediata de palavras

Definição adicional de conteúdo de fundo

( )em segundo plano: defina com precisão o conteúdo de fundo

Profundidade de campo: A profundidade de campo ajuda a criar uma atmosfera fotográfica

semente aleatória

O núcleo do “desenho de cartas”:

Ele será gerado aleatoriamente de forma diferente a cada vez, e o método de geração aleatória é registrado como um conjunto de números, ou seja, uma semente aleatória.

Diferentes sementes aleatórias trazem aleatoriedade, e as mesmas sementes aleatórias alcançam efeitos semelhantes.

Como consertar sementes aleatórias

O navegador da galeria também registra o número de sementes

Mantenha as sementes aleatórias consistentes e modifique as palavras de alerta para obter um estilo de personagem relativamente consistente.

Tu Sheng Tu

princípio

Assim como o texto, as imagens também podem ser enviadas à IA para análise como uma espécie de informação.

A essência do "redesenho" é que após a análise estrutural dos pixels da imagem, o produto final é semelhante à imagem original.

Os passos básicos

Enviar Imagem

Preencha a palavra de alerta

Use palavras rápidas para descrever o conteúdo da tela

Mesmo se você pedir à IA para desenhar através do Tushengtu, ainda precisará de palavras específicas e precisas.

Palavras de prompt padronizadas por tipo de conteúdo

configurações de parâmetros

Redesenhar largura

Quão semelhantes são as fotos originais e as fotos finalizadas?

Se for muito alto, deforma-se facilmente; se for muito baixo, o efeito de "redesenho" não pode ser alcançado.

A configuração recomendada é entre 0,6-0,8

resolução

Priorize manter a consistência com a imagem original

Se a imagem original for muito grande, ela poderá ser reduzida para um intervalo seguro.

Se a proporção do produto acabado for diferente da imagem original

Corte-o primeiro no computador e depois importe-o

Três métodos de corte diferentes fornecem tamanhos adaptáveis

Outros parâmetros

Expanda aplicativos

Transforme retratos reais em duas dimensões

Usar SD tem maior precisão e mais espaço para definição

"Personificação" de naturezas mortas e paisagens

Importe imagens que não sejam pessoas e defina-as com palavras que descrevam as pessoas.

Caracteres bidimensionais "tridimensionais"

Importe imagens de personagens de anime e jogos e defina-os com modelos realistas e palavras de alerta padronizadas e realistas.

Você pode usar o modelo Lora para restaurar as características do personagem de forma mais específica e precisa

Jogabilidade avançada

Redesenho de IA de síntese de imagem

pintura abstrata

Desenhe algumas cores e linhas aleatoriamente e importe-as para a IA para gerar

Aplicação e prática do ControlNet

Análise do princípio ControINet

Use informações específicas para orientá-lo a obter alguns recursos que não podemos controlar com precisão por meio de diagramas de Wensheng e diagramas de Tusheng.

O significado do controle preciso

Se você puder confiar apenas em “cartas de desenho” para produzir o conteúdo necessário, a geração será altamente incontrolável.

A importância do controle preciso: diante de necessidades específicas, somente o “controlável” pode se tornar “produtivo”

Estrutura básica: pré-processador → modelo

O pré-processador pode extrair informações de recursos de imagens

O modelo ControlNet treinado lê essas informações e orienta o processo de geração de Difusão estável

Métodos básicos de aplicação ControlNet

Arraste o infográfico e selecione a combinação correspondente de pré-processador e modelo

Pré-processar a imagem

Clique no botão "Explodir" para visualizar os resultados do pré-processamento

Infográficos pré-processados podem ser salvos e reutilizados

Ao enviar seu infográfico, defina o pré-processamento como "Nenhum"

Explicação detalhada dos parâmetros

Peso de controle: afeta principalmente a “força” de controle

Tempo de inicialização: o momento em que o ControINet "entra em vigor" durante o processo de geração (de 0 a 1)

Modo de controle: Prefira palavras de prompt ou ControlNet

Maneiras de alterar a intensidade do controle:

Aumente os esforços: aumente o peso, reduza o número de etapas iniciais de orientação e aumente o número de etapas finais de orientação e selecione o modo ControlNet "mais importante"

Reduzir a intensidade: reduza o peso, aumente o número de etapas iniciais de orientação e reduza o número de etapas finais de orientação e selecione o modo "palavras de alerta são mais importantes"

No Diagrama Tu Sheng, o Diagrama Tu Sheng original será carregado automaticamente como um gráfico de informações.

Introdução aos cinco principais modelos ControlNet

Openpose: Controle a postura, mãos, detalhes faciais

Vários pré-processadores Openpose diferentes

Mão: ossos da mão

Rosto (somente): pontos característicos faciais

Ful: adicione tudo junto

Profundidade: Controle a composição do espaço (profundidade)

Mapa de profundidade: preto longe, branco perto

Vários pré-processamentos de profundidade diferentes

Leres tem alta precisão e midas é mais comumente usado.

Quanto maior a precisão do pré-processamento, mais tempo geralmente leva.

Canny: contornos da linha de controle

Durante o pré-processamento, o limite controla o número de linhas e não deve ser muito denso.

Aplicação: Desenho de linha para colorir

Dicas: Use Inverter para desenhos de linha com linhas pretas sobre fundo branco e inverta-os para linhas brancas sobre fundo preto para identificação correta.

SoftEdge: controla os contornos das linhas, mas é mais suave e relaxado

Vários pré-processadores SofEdge diferentes

pouca diferença

Comparado com Canny, a restauração de contornos do SoftEdge é mais "vívida" e não muito rígida.

Dicas: “relaxar” adequadamente o controle da ControlNet ajudará a IA a exercer mais sua própria criatividade

Rabisco: geração de tela do guia Graffiti

Você pode extraí-lo de fotos ou desenhá-lo você mesmo

Aplicação: Pintor de Almas

Lógica de múltiplas aplicações ControlNet

Nas configurações, habilite vários ControlNetUnits para usar vários ControlNets

A chave para a lógica combinatória: complementar-se!

Demonstração correta: Canny Depth, usando linhas para preencher os detalhes em profundidade

Demonstração de erro: Canny SoftEdge, também é uma borda de controle. Não há muita diferença entre abrir dois e abrir um.

Três métodos de processamento de zoom nativos da WebUI

Tushengtu: restauração HD

Essência: primeiro gere uma versão de baixa qualidade e depois "redesenhe" para gerar uma versão de alta resolução

É como tirar uma foto de baixa qualidade e fazer uma "imagem de uma foto"

Atualmente é utilizado na maioria dos processos de desenho.

Análise de Vantagens e Desvantagens

Vantagem

Não altera a composição do quadro (corrigido via semente aleatória)

Supere de forma estável problemas causados pela resolução, como multijogador e múltiplas cabeças.

Operação fácil, clara e intuitiva

Desvantagens

Ainda limitado pela memória máxima de vídeo

A velocidade computacional é relativamente lenta

Ocasionalmente, "adicionando drama", aparecem elementos adicionais inexplicáveis

Análise de parâmetros

ganho

aumentar

Defina o tamanho final diretamente

Redesenhar largura

Varia dependendo do algoritmo e geralmente não é definido muito alto.

Recomendado 0,3 ~ 0,5

Seleção de algoritmo

Série latente: rica em detalhes, mas fácil de causar distorção de imagem

Nota: A amplitude de redesenho geralmente não pode ser inferior a 0,5 (caso contrário, aparecerá desfoque)

Série GAN: Mantenha a imagem original semelhante ao máximo, e o efeito detalhado não é tão bom quanto Latente.

Se não tiver certeza, você pode escolher o R-ESRGAN 4X sem pensar.

*Escolha aquele com Anime 6B para a segunda dimensão

As diferenças entre os diferentes algoritmos não são tão grandes quanto se imaginava

Diagrama vicentino: ampliação do SD

Essência: Divida a imagem em pequenos pedaços, redesenhe-os e depois junte-os em uma grande imagem.

Análise de Vantagens e Desvantagens

Vantagem

Pode romper as limitações de memória para obter uma resolução maior (até 4 vezes a largura e a altura)

A imagem é altamente fina e a riqueza de detalhes é excelente.

Desvantagens

O processo de segmentação e redesenho é relativamente incontrolável (enganos semânticos e linhas divisórias)

Pesado e relativamente pouco intuitivo de operar

Ocasionalmente, "adicionando drama", aparecem elementos adicionais inexplicáveis

Análise de parâmetros

Faixa de redesenho: geralmente não mais que 0,5, 0,2 ~ 0,3 é recomendado

Quando ocorrerem problemas com vários jogadores ou com vários cabeçotes, o intervalo de redesenho será reduzido.

Algoritmo de upscaling: igual ao da restauração HD

Pixels sobrepostos (Tile Overlap): A sobreposição entre os ladrilhos, para que a costura da imagem possa ser entendida. O papel da sobreposição: a cola e as tiras de proteção são mais naturais.

Compreendendo o papel da sobreposição: fita adesiva adesiva

Quando a costura parecer muito rígida, aumente os pixels sobrepostos.

Extra: Pós-processamento (mais)

Essência: Melhoria simples da resolução de imagens através de algoritmo de inteligência artificial, sem necessidade de redesenho

Conveniente, eficiente, disponível a qualquer momento, você não perderá dinheiro depois de usá-lo

Análise de Vantagens e Desvantagens

Vantagem

Fácil de usar, simples de operar, pode ser chamado a qualquer momento

Cálculo rápido e sem pressão de redesenho

Não altera em nada o conteúdo da imagem

Desvantagens

O efeito não é muito significativo (um pouco insípido)

(..Este defeito é suficiente)

Análise de parâmetros

O segundo algoritmo de amplificação

Semelhante à lógica de "peso" das palavras imediatas

Você não precisa configurá-lo, apenas usar um algoritmo é suficiente.

Pode ser processado em lotes

Depois que a versão do WebUI foi atualizada para 1.6.0, a função "HD Repair" mudou da caixa de seleção original para um rótulo de expansão/recolhimento. Ela está habilitada no estado expandido e não habilitada no estado recolhido. O método de uso específico é totalmente consistente com o original.

redesenho parcial

Noções básicas de redesenho parcial

Procedimentos operacionais básicos

Carregue as imagens para a área de trabalho "Redesenhar Parcial" ou envie-as para o Redesenho Parcial através do navegador da galeria, etc.

Ajuste o tamanho do pincel para que a área de desenho cubra a parte que precisa ser redesenhada

Ajuste o intervalo de redesenho e vários parâmetros, modifique as palavras do prompt e clique em Gerar para realizar o redesenho.

Essência: redesenhar a imagem e, em seguida, "remontar" a área redesenhada

Análise de parâmetros principais

área de máscara

A parte pintada é a área da máscara

As outras partes são áreas "sem máscara"

conteúdo mascarado

Imagem original: insira como está e adicione ruído e redução de ruído, o efeito de redesenho é mais próximo

Preenchimento: Desfoque fortemente a imagem original e, em seguida, adicione ruído e redução de ruído. A diferença no efeito de redesenho será um pouco maior.

Variáveis de espaço latente e espaço latente em branco: Converta a área da máscara em puro ruído de espaço latente e o efeito de redesenho terá a maior diferença.

Geralmente, é necessária uma faixa de redesenho maior, caso contrário, causará confusão na área de redesenho.

Para imagens diferentes, o efeito pode ser diferente e você precisa tentar mais.

Apenas máscara e imagem completa

Imagem completa: redesenhe a imagem inteira e, em seguida, “repare” as partes borradas.

Apenas máscara: redesenhe a parte manchada e uma pequena área circundante separadamente e, em seguida, "remende" a parte manchada

Desfoque de máscara e pixels reservados

Desfoque da máscara: suavidade das bordas, semelhante ao "enevoamento de seleção"

Pixels reservados: afeta o tamanho da área circundante extraída no modo somente máscara

Outros métodos de redesenho

Redesenho de graffiti (inPaint Sketch)

Use um pincel colorido para pintar, depois pinte novamente a área pintada e adicione a cor pintada à imagem original

Muitas vezes é usado para modificar as partes erradas da imagem, como corrigir a mão errada.

Operação: Primeiro pinte a área da mão da imagem original com uma cor semelhante à do fundo e depois desenhe a imagem da mão com uma cor semelhante à da pele.

Esboço

Aplique com um pincel colorido e redesenhe toda a imagem

A diferença entre redesenhar e graffiti: um é para partes locais e o outro é para o quadro inteiro

Redesenho de máscara (MaskInpaint, Inpaint Upload)

Faça upload de uma imagem de máscara em preto e branco para delinear a área de redesenho

Por padrão: o branco está mascarado, o preto está desmascarado

Você pode usar PS e outro software para recortar imagens, criar imagens de máscara e exportá-las.