Галерея диаграмм связей Стабильная диффузия
Подробное объяснение Stable Diffusion, введение в установку и развертывание модели/lora/VAE/плагинов/вложений, параметры интерфейса и базовое использование диаграмм Винсента.
Отредактировано в 2024-04-08 21:25:40Стабильная диффузия
1. Установка и развертывание модели/лора/VAE/плагина/встраивания
Три способа установки расширений
1. Перейдите на страницу расширения, нажмите «Доступно», чтобы загрузить список расширений, не забудьте снять флажок [Включить рекламу, языковой пакет, установленный], чтобы просмотреть список плагинов.
Здесь в качестве примера мы возьмем установку редактора 3D Openpose. Поскольку плагинов слишком много, мы можем использовать функцию веб-поиска Ctrl F и ввести openpose для быстрого поиска соответствующих плагинов, а затем нажать «Установить позже». .
2. Найдите URL-адрес плагина. Каждый из них отличается от URL-адреса и скопируйте ссылку для установки.
Этот метод требует знания адреса github плагина.
Рекомендуется использовать два вышеуказанных метода установки. Для успешной установки необходимо включить магию. Однако он нестабильен и может привести к ошибкам установки и неудачным попыткам.
Преимущество заключается в том, что вы можете обновить плагин непосредственно из Extension-Check for Updates.
Вы также можете обновиться прямо из программы запуска «Осенние листья».
3. Если вышеуказанные методы не помогли или плагин не отображается, установите его вручную по пути к плагину. В качестве примера рассмотрим установку плагина Controlnet. Откройте URL-адрес GitHub, где находится плагин Contrglnet. -in находится: https://qithub.com/lllyasviel/ControlNet-v1- 1-nightly
После загрузки разархивируйте его и поместите в папку расширения ovelai-webui\extensions, чтобы перезапустить веб-интерфейс, и вы обнаружите, что плагин установлен.
Недостаток: После обновления необходимо вручную поместить обновленную папку в каталог плагина, и пакет Akiye обновится автоматически.
После установки плагина необходимо перезагрузить weib ui Если он не отображается, попробуйте выключить лаунчер и зайти заново.
Ассоциации между большими моделями, lora, VAE, плагинами и встраиваниями.
Большая модель: тарелки, много видов.
стабильная диффузия\модели\Стабильная-диффузия
Также называется нижней моделью и основной моделью. Модель, оказывающая наибольшее влияние на производительность.
Реальный человек/продукт/двумерный
Объем сравнительно большой, обычно несколько Г.
Лора: богатая еда
стабильная диффузия\модели\Лора
Проще говоря, монтируя Лору, вы можете указать характеристики создаваемого персонажа или стиль.
Ханфу/стиль чернил/три вида/слепой ящик
Объем около 100M
ваэ: приправа, которая сделает еду вкусной
стабильная диффузия\модели|VAE
Под VAE можно просто понимать цветовой профиль или фильтр изображения. Без VAE изображение будет серым.
В настоящее время многие крупные модели имеют встроенный VAE. Некоторые из них его не имеют, поэтому обычно используется 84000, а значение по умолчанию обычно не меняется.
Плагин: Палочки для еды, вилки, давайте лучше питаться
стабильная диффузия\расширения
Например, плагин перевода и ControlNet.
вложения: готовые кулинарные пакеты
стабильная диффузия\вложения
По сути, это означает подсказку упаковки слов, которая часто используется во избежание разрушения структуры человеческого тела, стиля живописи, пространственной структуры и т. д. Если встраивания нет, если вы хотите избежать краха стиля рисования, возможно, вам придется произнести десятки ключевых слов, но теперь при хорошем встраивании вам нужно ввести только слово-подсказку, чтобы создать хорошую картинку.
URL-адрес модели
Нужна магия
Официальный сайт модели C: https://civitai.com/
Обнимающее лицо: ttps://huggingface.co/models?other=stable-diffusion
Никакой магии не требуется
ЛибуЛибуай: http://www.liblibai.com/#/
Алхимический павильон: http://www.liandange.com/models
Осенний лист, без предварительного просмотра, не очень реалистично
2. Параметры интерфейса и базовое использование диаграммы Винсента.
Параметры интерфейса
Большой выбор моделей: выберите модель (базовую модель), которая будет использоваться. Это фактор, который оказывает наибольшее влияние на получаемые результаты, что в основном отражается на стиле изображения.
Vae: просто понимается как фильтр, по умолчанию 84000
Отрегулируйте количество слоев: чем меньше значение слоя клипа, тем ближе описание будет к дескриптору. Чем больше клип, тем выше степень свободы. Значение по умолчанию — 2, менять его не нужно.
Подскажите ввод слова
позитивное ключевое слово
Категория качества изображения: шедевр, лучшее качество, высокое разрешение, высокая детализация, Шедевр, лучшее качество, высокое разрешение, высокая детализация
Предмет: девочка, мальчик, собака, дом.
Атрибуты: длинные светлые волосы, голубые глаза, толстый, худой, серьги, ветровка, юбка, современный стиль, барокко, китайский стиль.
Фон: больница, школа, квартира, улица, прозрачный фон, градиентный фон
Стиль живописи: реалистический стиль, стиль иллюстрации, монохромный, комикс, ретро. Кадры: портрет в полный рост, портрет полураспада, селфи-зеркало, лицо анфас, взгляд на зрителя, лицом в камеру.
Другие : зима, снег, дождь, теплые тона, зелено-оранжевые цвета.
обратное слово-подсказку
Если вы не введете его, качество вывода не будет высоким, а стиль рисования легко рухнет. Вы можете установить его как фиксированный шаблон.
NSFW, обнаженная, обнаженная, порно, (худшее качество, низкое качество: 1.4), deformmediris, деформированные зрачки, (деформированные, искаженные, изуродованные: 1.3), вырезаны из кадра, плохо прорисованы, плохая анатомия, неправильная анатомия, лишняя конечность, отсутствие конечность, плавающие конечности, клонированное лицо (мутированные руки и пальцы: 1.4), отсоединенные конечности, дополнительные ноги, сросшиеся пальцы, слишком много пальцев, длинная шея, мутация, мутировавший, уродливый, отвратительный, ампутация, размытие, артефакты jpeg, водяной знак, водяной знак, текст, подпись, эскиз,
NSFW, Нагота, Нагота, Порно, (Худшее качество, Низкое качество: 1.4), Искаженные радужная оболочка, Искаженные зрачки, (Деформированные, Искаженные, Изуродованные: 1.3), Обрезанные, Вне кадра, Плохо нарисованные, Плохая интерпретация, неверная анатомия дополнительных конечностей , отсутствующие конечности, плавающие конечности, клонированные лица (мутированные руки и пальцы: 1.4), сломанные конечности, лишние ноги, сросшиеся пальцы, слишком много пальцев, длинные шеи, мутации, отвратительная мутация, размытие ампутации, артефакты jpeg, водяной знак, текст водяного знака, подпись , эскиз
Как сохранить шаблоны
Сохранить текущее слово подсказки как стиль по умолчанию.
Время выборки
Стабильная диффузия переводится с китайского: стабильная диффузия. Принцип заключается в том, что оно постепенно добавляет шум к обучающему изображению и, наконец, превращается в совершенно случайное шумовое изображение. Этот процесс подобен капле чернил, брошенной в стакан с водой. Она будет медленно распространяться и в конечном итоге равномерно распределяться в воде. Отсюда и название «диффузия».
Чем больше количество шагов итерации выборки, тем лучше картина, но тем больше время расчета. Без особых требований, вообще говоря, большую часть времени развертывание выборки нужно поддерживать только в пределах от 20 до 30 (там по умолчанию 20). особых изменений после 30 нет.
Метод выборки
Мы знаем, что стабильная диффузия — это метод генерации изображений, основанный на модели диффузии. Его процесс заключается в использовании изображения, полного шума, в качестве эталона для постепенного рассеивания ближе к цели (подсказка). Это работа диффузионного сэмплера. Проще говоря, эти семплеры представляют собой алгоритм, который после каждого шага сравнивает сгенерированное изображение с изображением, запрошенным текстовой подсказкой, а затем добавляет некоторые изменения к шуму, пока он постепенно не достигнет изображения, соответствующего текстовому описанию.
Существует множество методов выборки, определяющих качество изображения, но в настоящее время в основном используются лишь несколько рекомендуемых и широко используемых.
Эйлер а
Самый быстрый метод отбора проб, самый прямой, простой и стабильный пробоотборник.
Требования к количеству шагов выборки очень низкие. В то же время по мере увеличения количества шагов выборки детализация не будет увеличиваться. Состав внезапно изменится, когда количество шагов выборки увеличится до определенного количества. не используйте его в сценариях с высоким уровнем шага.
Подходящие сцены: двухмерные изображения, небольшие сцены.
ДПМ 2С и Каррас
Может сбалансировать скорость и качество и создавать более точные изображения и их детали.
Два измерения
ДПМ СДЭ Каррас
Неплохо по сравнению с 2s. Короче, главная особенность в том, что по сравнению с Эйлером а деталей будет больше при том же разрешении. Например, в маленькую картинку можно впихнуть все тело, но скорость выборки будет медленнее.
Реалистичный стиль, портреты, сложные сцены.
ДДИМ
Он используется редко. Он быстро создает изображения и позволяет быстро создавать высококачественные изображения. Однако, если вы хотите попробовать очень большое количество шагов, вы можете использовать его. По мере увеличения количества шагов можно накладывать детали. .
Подходящие сцены: реалистичные портреты, сложные сцены.
Реставрация лица (как правило, более эффективна для реалистичных портретов, 2D практически бесполезна)
Карта плиток (используется для создания текстуры узора)
Восстановление высокого разрешения
С точки зрения непрофессионала, это означает увеличение изображения путем его перерисовки и добавления некоторых деталей при его увеличении.
Алгоритм усиления: просто используйте значение по умолчанию «Скрытый», для реальных людей: R-ESRGAN 4x, для двумерного использования: R-ESRGAN 4x Anime6B
Амплитуда перерисовки: влияние различных значений амплитуды перерисовки (обычно более подходит 0,4-0,7)
Настройки ширины и высоты
Большинство моделей обучаются с разрешением 512*512, а некоторые — с разрешением 768*768. Поэтому, когда размер вывода относительно велик, например 1024*1024, ИИ попытается вставить в изображение два или три изображения. количество контента на картинке, будут различные сращивания конечностей, несколько людей, не контролируемых записями, несколько ракурсов и т. д. Добавление записей может частично облегчить проблему, но важнее контролировать кадр, сначала рассчитайте маленькую и среднюю картинки, а потом увеличивайте для большой картинки.
Самое главное, что генерация изображений слишком большая, расчет медленный и легко израсходовать видеопамять (рекомендуется генерировать изображения на основе 512 или 768)
Если у вас есть конкретная эталонная картинка, поместите ее в PS и измените пропорциональный размер r так, чтобы значения высоты и ширины оставались в пределах 512-768 пикселей, а другой размер мог быть произвольным. Если вам нужен больший размер, воспользуйтесь функцией восстановления HD.
Квадратное изображение 512*512, на котором будут видны лица и бюсты.
Высокое изображение имеет размер 512*768 и обычно показывает изображения в полный рост стоя и сидя.
Создать партию/количество
Количество сгенерированных изображений = сгенерированная партия * количество каждой партии.
Если конфигурация видеокарты неудовлетворительна, не рекомендуется настраивать параметры количества. Рекомендуется изменить ее. Это позволит быстрее создавать пакетные изображения.
Стабильная диффузия
2. Параметры интерфейса и базовое использование диаграммы Винсента.
Параметры интерфейса
Коэффициент наведения подсказки (шкала CFG)
Чем выше значение CFG, тем послушнее Ai и тем более релевантно сгенерированное изображение слову-подсказке.
CFG относительно безопасен в диапазоне 5–10. Обычно рекомендуется уменьшать или увеличивать значение в зависимости от реальной ситуации.
Обычно по умолчанию: 7 достаточно, точная настройка в соответствии с содержимым экрана.
Чем ниже значение CFG, тем непослушнее Ai и чем свободнее он может играть, тем слабее корреляция между сгенерированным изображением и подсказочным словом.
Случайное начальное число
Важный параметр, используемый для контроля случайности и разнообразия генерируемых результатов.
Нажмите кнопку «Сито», чтобы установить случайное семя на -1, что является случайным.
Нажмите кнопку «Переработать», чтобы установить случайное начальное значение в случайное начальное значение изображения, которое вы смотрите на панели изображений справа.
Случайное начальное значение мутации: отрегулируйте интенсивность мутации (достаточно небольшого значения, например: 0,001).
генерировать
Используйте последние сгенерированные данные изображения (включая положительные и отрицательные слова-подсказки и различные параметры).
Четкие положительные и отрицательные слова-подсказки
Вызов моделей и другого контента
Вставляет выбранный предустановленный стиль после текущего слова-подсказки.
Сохранить шаблон слова подсказки
Если вы хотите изменить ранее сохраненный шаблон слова подсказки, найдите файл стиля в SD-файле, щелкните правой кнопкой мыши, чтобы открыть его в режиме блокнота, и вы можете удалить его. (Примечание. Прежде чем появится окно поиска файла, необходимо сохранить шаблон)
Инструкции по использованию
Если создание изображения не удалось и память заполнена, попробуйте отрегулировать длину, ширину и количество шагов, пока оно не сможет работать нормально.
Уровень силы ключевого слова не должен быть слишком высоким (попробуйте сами и убедитесь).
Никогда не записывайте ключевые слова и минус-слова задом наперед.
Обычно я использую для шагов экрана от 20 до 50 (но при малой видеопамяти большинство из них все равно 30) и интенсивность ключевых слов от 7 до 15.
3. Грамматика и вес подсказок.
Положительные слова-подсказки: По сравнению с Midjourney, его нужно писать точнее и тщательнее, чем больше описаний, тем ближе к желаемому контенту. Чем меньше описаний дает ИИ больше возможностей для свободной игры.
Обратные слова-подсказки: контент, который вы не хотите отображать
Принципы написания
Почти все модели понимают только английские слова.
Все символы должны использовать английскую полуширину, а фразы должны быть разделены запятыми половинной ширины.
Разрывы строк допускаются, но лучше всего в конце каждой строки ставить разделитель (английскую запятую половинной ширины).
Грамматические принципы
Чем раньше слово, тем выше будет вес, например
дерево,1девушка, может быть дерево, рядом с которым стоит девушка
1девушка,дерево, может быть портрет девушки на фоне дерева
Поэтому в большинстве случаев обычно используемый формат слова-подсказки (написание из трех абзацев)
шедевр, лучшее качество, эскиз, 1 девушка, подставка, черная куртка, фон на стене, полный плакатов, по жетону,
Продвинутая грамматика Пошаговое рисование (распространенное название — градиентное смешивание, поэтапное рисование ближе к первоначальному замыслу)
[ tagA : tagB : 0.3 ] Нарисуйте ключевое слово A до 30% прогресса, нарисуйте ключевое слово B после 30% прогресса [cat : Dog :0.6 ] Нарисуйте кошку до 60% прогресса, нарисуйте собаку после 60% прогресса
[собака:дракон:6], в небе, половина тела, крупный план ------Когда значение больше или равно 1, это означает количество шагов * нарисуйте собаку перед шагом, и нарисовать дракона после * прогресса шага. Вы можете пройти контроль количества шагов и отрегулировать соотношение между ними. С помощью различных шагов можно достичь градиента от ключевого слова 1 к ключевому слову 2. Отсюда и общее название градиента.
Раздача заканчивается рисунком [девушка: 5] на берегу моря [ ] Квадратные скобки - это уменьшение веса. Если вы хотите, чтобы кто-то не выделялся и не был важным, добавьте в квадратные скобки того, кто не важен, и добавьте количество шагов (. чем меньше значение, тем меньше вы хотите, чем очевиднее, тем больше значение, тем меньше нежелательных вещей отображается.
Метод письма Качество изображения, слова, описание предмета, фон, композиция
Качественные слова (шедевр, лучшее качество и т. д.)
Описание темы (1девушка, длинные волосы, синее платье, улыбка в камеру и т.д.)
Сцены и окружение (лес, дерево, белый цветок, день, солнечный свет, облачное небо и т. д.)
Перспектива и композиция изображения (крупный план, в полный рост, на расстоянии и т. д.)
Попробуйте написать абзац ключевых слов в соответствии с приведенной выше структурой.
Качество изображения, слово/композиция
шедевр, лучшее качество, 8k, сумасшедшая детализация, замысловатая детализация, ультрадетализация, ультра качество, высокая детализация, бюст
шедевр, лучшее качество, 8k, безумные детали, сложные детали, гипердетализация, гиперкачество, высокая детализация, половина тела,
Описание основного корпуса (немного более подробное)
1 девушка с длинными рыжими волосами, зелеными глазами, в шарфе и полосатом свитере, слегка улыбающаяся в камеру,
1 девушка, длинные рыжие волосы, зеленые глаза, рубашка, джинсы, улыбается в камеру,
Как выглядит фон?
Сложный фон на пляже, ночь, звездное небо
Сложный фон, на пляже, ночью, звездное небо
Если вы не умеете писать, вы можете зайти на сайт c и скопировать для изучения ключевые моменты отличных работ других людей.
При копировании ключевых слов не забудьте проверить, соответствует ли оно локальному имени пакета lora (без этого lora сгенерированные результаты будут противоречивыми).
Вставьте его в поле для ключевых слов вперед и нажмите первую кнопку.
Советы по уменьшению количества взрослых элементов
Положительное: Family_Friendly (отрегулируйте пропорцию, чтобы отрегулировать вес. Чем выше числовая пропорция, тем выше шанс нарисовать детей)
Реверс: nsfw, обнаженная, голая, порно (не подходит для рабочего места, нагота, нагота, порнография), обычно означает ориентированное на взрослых, рекомендуется добавлять nsfw каждый раз, когда рисуете.
Фиксированная стартовая рука
Рекомендуется сохранить его как шаблон для удобства использования в следующий раз.
Простые исходные позиции спереди и сзади.
Положительные подсказки: шедевр лучшего качества, шедевр, лучшего качества.
Обратные слова подсказки: nsfw,(худшее качество, плохое качество:1.3) nsfw,(худшее качество, плохое качество:1.3)
Немного более длинные стартовые позы спереди и сзади.
Позитивные слова-подсказки: шедевр, лучшее качество, 8k, безумные детали, сложные детали, гипердетализация, гиперкачество, высокая детализация, ультрадетализация,
(Шедевр, Лучшее качество, Супер качество, Разрешение 8K, Невероятная детализация, Замысловатая детализация. Супердетализация, Высокая детализация, Ультрадетализация)
Обратные слова-подсказки: NSFW, обнаженная, обнаженная, порно, (худшее качество, низкое качество: 1,4), деформированная радужная оболочка, деформированные зрачки, (деформированные, искаженные, изуродованные: 1,3), обрезанные, вне кадра, плохо прорисованы, плохая анатомия, неправильная анатомия. дополнительная конечность, отсутствующая конечность, плавающие конечности, клонированное лицо (мутированные руки и пальцы: 1,4), разъединенные конечности, дополнительные ноги, сросшиеся пальцы, слишком много пальцев, длинная шея, мутация, мутировавший, уродливый, отвратительный, ампутация, размытость, артефакты jpeg, водяной знак, водяной знак, текст, подпись, эскиз,
NSFW, Нагота, Нагота, Порно, (Плохое качество, Низкое качество: 1.4) Искаженные радужная оболочка, Искаженные зрачки, (Искаженные, Изуродованные: 1.3) Обрезано, Вне кадра, Плохо нарисовано, Плохая конструкция, Неправильные структуры, лишние конечности, отсутствующие конечности , плавающие конечности, клонированные лица, (мутированные руки и пальцы: 1.4) разъединенные конечности, дополнительные ноги, сросшиеся пальцы, дополнительные пальцы, длинные шеи, мутации, мутированные, уродливые, отвратительные, ампутация, размытие, артефакты jpeg, водяные знаки, текст с водяными знаками, подпись, эскиз
--NSFW не подходит для работы картинка не подходит для работы
В дополнение к этим общим словам вы также можете добавить их в соответствии с потребностями изображения. Например, если на созданном изображении присутствует собака, но вы не хотите, чтобы она появлялась на изображении, вы можете добавить «. собака» на обратное слово-подсказку.
Как сделать реалистичные портреты более высокого разрешения
Положительные слова-подсказки: фотография, шедевр, лучшее качество, 8K, HDR, ROWphoto, высокое разрешение, абсурд: 1,2, Kodak portra 400, зернистость пленки, размытый фон, боке: 1,2, блики, (яркие цвета: 1,2). гриль
фотография фотография
шедевр, лучшее качество – превосходного качества (шедевр, лучшее качество).
8K, HDR, фото ROW, высокое разрешение, абсурд: 1,2 Это четко и с высоким разрешением (8K, HDR, фото ROW, высокое разрешение, смешно: 1,2).
Kodak Portra 400, зернистость пленки — характеристика пленки (Kodak Portra 400, зернистость пленки)
размытый фон, боке: 1,2, блики, размытый фон, размытость, ореол
яркий цвет: 1,2 красочный
Введите приведенные выше ключевые слова, чтобы получить более атмосферное ощущение и детализацию.
Подскажите разделитель слов
1. Используйте английские запятые или « » в качестве разделителей (слова-подсказки: стиль рококо, гостиная, большие окна, красное мягкое зерно: 3391285208)
2. До и после разделителя есть пробелы, и это не повлияет.
3. Как и у MJ, чем раньше слово, тем выше его вес.