Галерея диаграмм связей компьютерное зрение, цифровая обработка изображений
Подробное введение в традиционные методы компьютерного зрения, включая базовые знания в области цифровой обработки изображений, восстановления изображений, Для предварительной обработки изображений часто используются сжатие изображений, сегментация изображений и т. д. Надеюсь это поможет!
Отредактировано в 2024-02-04 00:54:17цифровая обработка изображений
Базовые знания в области цифровой обработки изображений.
Введение
«Картинка» — это распределение света, отраженного или переданного объектом. «Изображение» — это впечатление или понимание, формируемое в мозгу человека картинкой, принятой зрительной системой человека.
Изображения – это изображения с визуальными эффектами. Это общий термин для обозначения различных графических изображений и изображений.
Объем информации, содержащейся в изображениях, огромен, и «увидеть стоит сто раз услышать» и «ясно понять с первого взгляда».
Математически изображение можно описать как
I=f(x, y, z, λ, t)
Где x, y, z — пространственные координаты, λ — длина волны, t — время, а I — интенсивность света.
Для статических изображений t является константой. Для монохромных изображений λ является константой. Для плоских изображений z постоянно.
Световые волны: Человеческое восприятие ограничено визуальным диапазоном электромагнитного спектра, тогда как машины обработки изображений могут охватывать почти весь электромагнитный спектр.
Оцифровка изображений
цифровое изображение
Аналоговое изображение представлено числами, а изображение, представленное числами, является цифровым изображением.
Процесс дискретизации аналогового изображения для получения цифрового изображения называется оцифровкой изображения.
процесс
выборка
Пространственно разделить изображение на небольшие области (пиксели), каждый пиксель имеет двумерную координату (целое число).
Влияние
Количественная оценка
Яркость или значение серого каждого пикселя сопоставляется с соответствующим уровнем серого, и каждый уровень серого обычно представляется целым числом.
Если количество квантованных уровней шкалы серого L=256, диапазон значений представляет собой целое число от 0 до 255, и 8 битов могут использоваться для представления значения шкалы серого пикселя изображения в оттенках серого, что называется 8-битным квантованием.
представление цифрового изображения
математическое представление
Бинарное изображение
Изображение в оттенках серого
RGB-изображение
Формат хранения изображений
Формат BMP: растровый файл для систем Windows.
Формат GIF: может хранить несколько изображений (анимаций)
Формат TIF(F): не зависит от ОС и файловой системы, легко заменяется.
Формат JPEG: стандарт сжатия.
Основные свойства изображений
Количество пикселей изображения
Количество пикселей изображения относится к количеству пикселей, содержащихся в растровом изображении по горизонтали и вертикали. Простое увеличение количества пикселей не может улучшить эффект отображения изображения. Эффект отображения изображения определяется количеством пикселей и разрешением дисплея.
Разрешение изображения
Разрешение изображения относится к количеству пикселей, распределенных в изображении на единицу длины печати. Оно в основном используется для характеристики плотности информации цифрового изображения, которая определяет четкость изображения. Чем выше разрешение изображения на единицу площади, тем больше пикселей оно содержит, тем плотнее пиксели и тем выше четкость цифрового изображения.
Размер изображения
Размер изображения определяет объем памяти, необходимый для хранения файла изображения, который обычно измеряется в байтах (B). Формула расчета: количество байтов = (высота растрового изображения × ширина растрового изображения × глубина изображения) / 8. Из формулы расчета видно, что размер хранилища файла изображения напрямую связан с количеством пикселей.
цвет изображения
Цвет изображения относится к наибольшему количеству возможных типов цвета в цифровом изображении. Изменяя пропорции трех основных цветов: красного, зеленого и синего, его можно легко смешать с любым цветом.
глубина изображения
Глубина изображения, также известная как разрядность изображения, обозначает количество бит, занимаемых каждым пикселем изображения. Данные, соответствующие каждому пикселю изображения, обычно могут быть представлены одним или более байтами. Чем глубже глубина данных, тем больше требуется бит и тем богаче соответствующее цветовое представление.
тон изображения
Оттенок изображения — это яркость и темнота различных цветов изображения, соответствующих основным цветам (например, основные цвета цифровых изображений в формате RGB включают красный, зеленый и синий). Регулировка оттенка в повседневной жизни — это настройка цвета). яркость основных цветов. Оттенок варьируется от 0 до 255, включая в общей сложности 256 оттенков. Например, простейшее изображение в оттенках серого делит оттенок на 256 оттенков от белого до черного. В изображениях RGB необходимо охарактеризовать яркость и темноту трех цветов: красного, зеленого и синего. Например, если красный тон углублен, изображение будет иметь тенденцию быть темно-красным, а если зеленый тон — темнее. при углублении изображение будет иметь темно-зеленый цвет.
насыщенность изображения
Насыщенность изображения указывает на чистоту цветов изображения. Насыщенность фотографии естественной сцены зависит от отражающих или проецируемых свойств объекта. При цифровой обработке изображений насыщенность обычно измеряется долей белого света, смешанного с сплошным цветом. Чем больше белого света смешано с сплошным цветом, тем ниже насыщенность и, наоборот, выше насыщенность.
Яркость изображения
Яркость изображения — это яркость и темнота цветов, содержащихся в цифровых изображениях. Это восприятие человеческим глазом яркости и темноты самого объекта. Диапазон значений обычно составляет от 0% до 100%.
контраст изображения
Контраст изображения — это контраст между разными цветами или контраст между светлым и темным в изображении. Чем больше контраст, тем больше разница в яркости между цветами или тем больше разница между черным и белым. Например, увеличение контрастности изображения в оттенках серого сделает разницу между черным и белым в изображении более четкой, что сделает изображение более резким. Когда контраст увеличивается до предела, изображение в оттенках серого становится черно-белым.
иерархия изображений
В системах компьютерного дизайна для более удобной и эффективной обработки материалов изображения их обычно размещают в разных слоях, и изображение можно рассматривать как состоящее из нескольких слоев наложенных друг на друга изображений. Используя программное обеспечение для обработки изображений, каждый слой можно обрабатывать независимо, не затрагивая содержимое изображения других слоев. Когда вы создаете новый файл изображения, система автоматически создает для него фоновый слой, который эквивалентен холсту, на котором можно выполнять другую работу по обработке изображения. Если изображение имеет несколько слоев, каждый слой будет иметь одинаковое количество пикселей, каналов и формата.
Основные отношения между пикселями
основные отношения
Изображение f(x,y) состоит из базовых единичных пикселей. Между пикселями существуют определенные связи, включая окрестности пикселей, смежность и связи, а также расстояние между пикселями. Обычно при указании конкретного пикселя используется строчная буква (например, p).
Область
Соседние пиксели пикселя p образуют окрестность этого пикселя
4 зоны
8 областей
диагональное поле
соседство
Для любых двух пикселей, если один пиксель находится по соседству с другим пикселем и их значения в оттенках серого соответствуют определенным критериям сходства (например, принадлежность к определенному набору значений оттенков серого), то эти два пикселя называются соседними.
4 примыкания
8 примыканий
м, прилегающий
Если выполнено одно из следующих двух условий
q находится в 4-окрестности точки p
q находится в диагональной области p, и никакое значение серого в пикселе на пересечении 4-доменной окрестности q и 4-доменной области p не принадлежит V.
Тогда две точки p и q называются m смежными.
связанный
4-подключен
8-Соединенный
м-подключен
расстояние
Евклидово расстояние
городское расстояние
расстояние до доски
Приложения для цифровой обработки изображений
Промышленное применение
Неразрушающий контроль продукции и компонентов, производимых на производственной линии, например, испытание стеклянных бутылок.
приложения общественной безопасности
Идентификация по отпечаткам пальцев безопасна, надежна и эффективна и имеет широкий спектр применений в сфере общественной безопасности, информационной безопасности, электронной коммерции и других областях.
Аутентификация личности также включает такие изображения, как лицо, радужная оболочка глаза, отпечаток ладони и подпись.
медицинские приложения
Подсчет клеток крови, основное содержание рутинного исследования крови, важные данные о наличии или отсутствии заболевания и тяжести заболевания.
геологические приложения
Технология скважинной камеры позволяет получить крупномасштабный панорамный вид стенки скважины для непосредственного наблюдения за внутренней геологической структурой.
Приложения для экологических испытаний
Идентификация и местоположение пожара. Сопоставьте изображения в видимом свете и инфракрасные изображения, чтобы идентифицировать пожары и определить их местоположение.
Морские применения
Enteromorpha Обнаружение Enteromorpha: использование изображений дистанционного зондирования в качестве источника данных позволяет быстро обнаружить Enteromorpha Enteromorpha.
Обнаружение и отслеживание морской рыбы.
военное применение
Позиционирование цели воздушной разведки.
развлекательные приложения
Изменить лицо
Имидж-инженерия
Обработка изображений
Изображение -> Изображение
Улучшенные визуальные эффекты
Предварительная обработка изображения для снижения шума, повышения контрастности и повышения резкости изображения.
Сбор, получение и хранение изображений, улучшение изображений, восстановление изображений, сжатие (кодирование) изображений (видео).
анализ изображений
Изображение -> Данные
извлечь полезную информацию
Сегментация изображения и целевое описание, выходные данные — данные целевого объекта.
Обнаружение краев, сегментация изображения (разделение фона цели), выражение цели, описание, измерение, анализ цвета, формы, текстуры и движения цели, обнаружение цели, извлечение, отслеживание, идентификация и классификация, распознавание лиц
Понимание изображения
Изображение -> Объяснение
Понимание целевых объектов и их отношений, на выходе — более абстрактные данные.
Регистрация изображений, сопоставление, объединение, трехмерное представление, моделирование, реконструкция, восстановление сцены, понимание изображений, рассуждение, поиск изображений на основе контента
Математическое преобразование изображений
Координатное преобразование пространства
основная концепция
Геометрические преобразования часто называют преобразованиями резиновой пленки, предполагая, что изображение печатается на резиновой пленке, а затем резиновая пленка растягивается в соответствии с заранее определенным набором правил.
Геометрические преобразования изменяют пространственные отношения между пикселями изображения. Он состоит из двух основных операций: пространственного преобразования координат (координатное преобразование) и полутонового значения преобразованного координатного пикселя (полутоновая интерполяция).
Преобразование координат
Уменьшите исходное изображение вдвое в обоих направлениях.
Аффинное преобразование
Обычно используемое преобразование координат при обработке изображений — это аффинное преобразование.
трансформация личности
трансформация перевода
преобразование вращения
масштабная трансформация
сдвиговое преобразование
Разрезать по оси X
Разрезать по оси Y
Прямое и обратное отображение
Прямое сопоставление: если заданы координаты любого пикселя на изображении, положение координат пикселя после геометрического преобразования получается с помощью соответствующего соотношения сопоставления.
Обратное сопоставление: вычисление координатного положения пикселя исходного изображения на основе координат пикселей выходного изображения.
Интерполяция оттенков серого
основная концепция
Чтобы переместить пиксели изображения в новое положение, этим новым позициям также необходимо присвоить значения оттенков серого, то есть интерполяцию оттенков серого.
тип
интерполяция ближайшего соседа
В качестве результата интерполяции выбирается значение серого входного пикселя, ближайшего к положению, которому он сопоставлен.
Недостатки: Когда значение серого соседних пикселей значительно изменится, его тонкая структура станет шероховатой.
билинейная интерполяция
В соответствии со значением серого четырех соседних точек интерполяция выполняется дважды в направлениях x и y. Интерполяционная функция представляет собой уравнение гиперболического параболоида
Это усовершенствование метода ближайшего соседа, при котором гиперболический параболоид аппроксимируется четырьмя соседними известными точками.
Недостатки: метод расчета билинейной интерполяции в целом позволяет получить удовлетворительные результаты, поскольку учитывается влияние четырех соседних точек. Однако этот метод обладает свойствами фильтрации нижних частот, что приводит к потере высокочастотных составляющих и размытию контура изображения. Если вы хотите получить более точный эффект интерполяции в оттенках серого, вы можете использовать коррекцию интерполяции высокого порядка.
бикубическая интерполяция
Интерполировать на основе значения серого 16 соседних точек.
преобразование Фурье
Основные этапы обработки изображений в частотной области
преобразование Фурье
Фурье-преобразование изображения. Вместо того, чтобы получать волну, это преобразует изображение из пространственной области (т. е. исходного пиксельного представления) в частотную область. В частотной области изображение представляется как серия комбинаций волн разной частоты. Это преобразование позволяет нам увидеть распределение различных частотных компонентов в изображении, включая низкочастотные компоненты (представляющие медленно меняющиеся части изображения, такие как гладкие области) и высокочастотные компоненты (представляющие быстроменяющиеся части, такие как края). и подробности).
Фильтрация частотной области
В частотной области вы можете применить к изображению высокочастотный или низкочастотный фильтр.
Подробности см. в разделе «Фильтрация частотной области для улучшения изображения».
Обратное преобразование Фурье
Отфильтрованные данные частотной области затем преобразуются обратно в пространственную область посредством обратного преобразования Фурье. Результатом этого обратного преобразования является модифицированное изображение, отражающее эффект фильтрации в частотной области.
Ряд Фурье и преобразование Фурье
При соблюдении определенных математических условий любую периодическую функцию можно выразить как сумму синусоид разных частот.
При соблюдении определенных математических условий непериодическую функцию можно также выразить как интеграл от синуса, умноженный на взвешенную функцию, то есть преобразование Фурье.
Функциональные характеристики, представленные рядом Фурье или преобразованием Фурье, могут быть полностью восстановлены с помощью обратного преобразования Фурье без потери какой-либо информации.
Одномерное дискретное преобразование Фурье
Двумерное дискретное преобразование Фурье
На спектрограмме полутонового изображения после двумерного преобразования Фурье самая яркая часть соответствует низкочастотной составляющей исходного изображения.
Низкочастотные компоненты: эти компоненты представляют медленно меняющиеся части изображения, такие как общие изменения уровня серого или сглаженные области. В спектрограмме Фурье низкочастотные составляющие обычно сосредоточены в центральной области изображения.
Высокочастотные компоненты. Эти компоненты представляют собой быстро меняющиеся части изображения, такие как края и детали. На спектрограмме высокочастотные компоненты обычно располагаются далеко от центральной точки.
Основные свойства дискретного преобразования Фурье
отделимость
поступательный
циклический
сопряженная симметрия
инвариантность вращения
Пропорциональность
Средняя стоимость
теорема о свертке
улучшение изображения
Основные понятия улучшения изображения
Свойства улучшения изображения
Не вдаваясь в причины ухудшения качества изображения, корректировки производятся на основе характеристик изображения и целей обработки для получения более «лучших» или более «полезных» изображений.
Улучшение изображения предназначено для улучшения качества изображения для определенной прикладной цели, а результаты обработки больше подходят для визуальных характеристик человека или систем распознавания машин.
Метод обработки, который выделяет определенную информацию на изображении в соответствии с конкретными потребностями и в то же время ослабляет или удаляет определенную ненужную информацию.
Обработка улучшения не может увеличить информацию исходного изображения, а может только улучшить способность распознавания определенной информации, и эта обработка может привести к частичной потере другой информации.
основной метод
действовать
метод пространственной области
Метод пространственной области относится к непосредственному выполнению операций над значениями оттенков серого пикселей в пространственной области изображения. Обычно используемые методы включают преобразование оттенков серого, коррекцию гистограммы, свертку шаблона, обработку псевдоцвета и т. д.
метод частотной области
Метод частотной области заключается в повышении значения преобразования изображения в определенной области преобразования изображения, а затем в получении улучшенного изображения посредством обратного преобразования. Это метод косвенной обработки.
Цель
гладкий
Сглаживание оказывает эффект размытия изображения, делая переход изображения естественным и мягким, а также подавляя шум;
Сглаживание, понимаемое с точки зрения частоты, основанной на частотных характеристиках изображения, заключается в сохранении или усилении низкочастотных компонентов изображения и ослаблении или устранении высокочастотных компонентов изображения.
точить
Повышение резкости можно рассматривать как операцию, обратную сглаживанию. Эффект и цель — выделить детали и сделать контур изображения четким и контрастным;
С точки зрения обработки в частотной области повышение резкости — это усиление высокочастотных компонентов изображения.
Эффект
По данным анализа частотных характеристик изображения принято считать, что контрастность и динамический диапазон всего изображения зависят от низкочастотной части информации изображения (относится к общему изображению), а контуры краев и локальные детали в изображении зависят от высокочастотной части.
Поэтому для обработки изображений используются методы двумерной цифровой фильтрации. Например, использование фильтра верхних частот может помочь выделить контуры краев и детали изображения, а использование фильтра нижних частот может сгладить изображение и уменьшить шум.
Обзоры приложений
Довольно субъективно
В практических приложениях для тестирования можно одновременно выбрать несколько алгоритмов улучшения и выбрать алгоритм с лучшими визуальными эффектами, относительно небольшой вычислительной сложностью и соответствием требованиям приложения.
Преобразование оттенков серого
Принцип отображения оттенков серого
Отображение оттенков серого — это точечная операция, основанная на пикселях изображения.
Разработайте определенное правило отображения в соответствии с целью улучшения и выразите его с помощью соответствующей функции отображения.
Функцию сопоставления можно использовать для сопоставления оттенков серого каждого пикселя исходного изображения с новыми оттенками серого.
т=Т(ы)
тип
Инверсия изображения
Значения оттенков серого инвертируются, черный становится белым
Операции инверсии изображения часто используются для улучшения областей изображения с низким содержанием серого, делая их ярче или заметнее.
Если основная часть изображения в оттенках серого светлее, операция инверсии может сделать основную часть темнее.
Чтобы улучшить объекты изображения с помощью более светлых оттенков серого, часто необходимо использовать другие методы улучшения изображения, такие как выравнивание гистограммы или повышение контрастности. Операция инверсии больше подходит для усиления темных деталей изображения.
Увеличьте контраст
Увеличьте контрастность каждой части изображения и фактически увеличьте динамический диапазон между двумя значениями серого на изображении.
сжатие динамического диапазона
Напротив, иногда динамический диапазон исходного изображения слишком велик и превышает допустимый динамический диапазон некоторых устройств отображения. В этом случае, если исходное изображение используется напрямую, некоторые детали могут быть потеряны.
Измените распределение оттенков серого посредством преобразования функции
Регулирует значение оттенков серого для каждого пикселя изображения, применяя математическую функцию.
линейное преобразование
нелинейное преобразование
s=cr^γ
Вверху слева — исходное изображение: c=1, Y — 3,0, 4,0, 5,0 соответственно.
Гистограмма
Определение гистограммы
Гистограмма в оттенках серого — это статистическая диаграмма, которая представляет распределение оттенков серого изображения.
По оси абсцисс — уровень серого, обычно обозначаемый буквой r, а по оси ординат — количество пикселей с этим уровнем серого или вероятность появления этого уровня серого.
Свойства гистограмм
Изображение соответствует гистограмме, но гистограмма не обязательно соответствует только одному изображению.
Гистограмма может только подсчитывать вероятность появления пикселей в оттенках серого и не может отражать положение пикселя на изображении.
Выравнивание гистограммы в основном используется для улучшения общего контраста изображения, а сглаживание и повышение резкости используются для уменьшения и увеличения локального контраста и детализации изображения соответственно.
В некоторых особых случаях выравнивание гистограммы может незначительно изменить контраст или даже немного уменьшить контраст.
Уже однородная гистограмма: если гистограмма изображения уже равномерно распределена или распределение яркости очень близко к равномерному, то выполнение выравнивания гистограммы может не изменить его контрастность.
Особое распределение яркости. В некоторых ситуациях с особым распределением яркости выравнивание гистограммы может привести к потере деталей в некоторых областях, что может привести к снижению контрастности в этих областях.
Чрезвычайная концентрация значений яркости. Если большая часть пикселей изображения сосредоточена на крайних границах диапазона яркости (очень яркие или очень темные), выравнивание гистограммы может привести к снижению контрастности в этих областях.
Гистограмма и распределение изображений в оттенках серого
Выравнивание гистограммы
Распределение оттенков серого изображения должно полностью использовать весь диапазон оттенков серого, а количество пикселей на каждом уровне оттенков серого должно быть примерно равномерно распределено.
Это достигается за счет настройки гистограммы изображения так, чтобы гистограмма выходного изображения распределялась максимально равномерно, тем самым делая распределение яркости в изображении более равномерным.
Не сглаживание и не резкость
Спецификация гистограммы
Серый выравнивает исходную гистограмму
Укажите требуемую гистограмму и вычислите преобразование, которое выравнивает указанную гистограмму.
Сопоставьте исходную гистограмму с указанной гистограммой
В сравнении
Операции между изображениями
арифметические операции
операция сложения
С(х,у)=А(х,у) В(х,у)
Среднее значение M изображений определяется как
g(x,y)=1/M(g0(x,y) g1(x,y) … gM(x,y))
приложение
Удалить «аддитивный» случайный шум
Создание эффектов наложения изображений
Вычитание
C(x,y) = A(x,y) - B(x,y)
приложение
Устранение фоновых эффектов
метод разностной тени
Вычтите изображения одной и той же сцены, снятые в разное время, или изображения одной и той же сцены в разных диапазонах волн, чтобы обнаружить изменения между двумя изображениями одной и той же сцены.
Его можно использовать для управления динамическим мониторингом, обнаружением и отслеживанием движущихся целей, устранением фона изображения, распознаванием целей и т. д.
Умножение
C(x,y) = A(x,y) * B(x,y)
приложение
Частичное отображение изображения
операция дивизии
C(x,y) = A(x,y)/ B(x,y)
приложение
Обычно используется при обработке изображений дистанционного зондирования.
логическая операция
Доступно только для двоичных (0 и 1) изображений.
Классификация
AND (И): записывается как p AND q (также может быть записано как p·q или pq)
Или (ИЛИ): пишется как p OR q (также может быть записано как p q)
ДОПОЛНЕНИЕ (ДОПОЛНЕНИЕ, также часто называемое отрицанием или нет): пишется как НЕ q (также может быть записано как )
пространственная фильтрация
Фильтрация в пространственной области работает непосредственно с пикселями, тогда как фильтрация в частотной области предполагает работу с частотными компонентами изображения.
Операции с соседством с использованием шаблонов в пространстве изображений
Категория 1
Линейный: метод среднего значения по соседству
Фундаментальный
Самый простой алгоритм сглаживания изображения
Сглаживание может выполняться в пространственной области или в частотной области.
Возьмите каждый пиксель изображения в качестве центра, чтобы взять его домен R, и вычислите средневзвешенное значение в оттенках серого всех пикселей по соседству как выходной сигнал центрального пикселя.
основной эффект
Устраните или уменьшите шум и улучшите качество изображения
Размытие изображений, чтобы они выглядели мягкими и естественными.
Процесс реализации
Обычно реализуется с помощью операции свертки шаблона.
Конкретные шаги
Сдвиньте шаблон слева направо и сверху вниз по изображению, и каждая точка положения в шаблоне совпадет с определенным пикселем изображения;
Умножьте коэффициент в каждой позиции шаблона на значение серого пикселя, с которым он совпадает;
Суммируйте все продукты;
Присвойте результат суммирования пикселю, соответствующему центру шаблона.
шаблон формы
Функции
Характер распределения коэффициентов обычно велик в центре и мал в прилегающих районах.
Сумма коэффициентов равна 1, чтобы гарантировать, что общий уровень серого остается неизменным до и после обработки изображения.
Чтобы лучше сохранить край, можно также использовать крестообразные, прямые и другие шаблоны.
Нелинейность: медианная фильтрация
Принцип алгоритма
Используйте окно, содержащее нечетное количество пикселей, для перемещения изображения и замените значение серого в центральной точке окна средним значением серого для каждой точки в окне.
Характеристики алгоритма
Это нелинейная технология обработки.
По сравнению с методом усреднения окрестности, медианная фильтрация может в определенной степени преодолеть размытие деталей изображения, вызванное линейными фильтрами, и особенно эффективна при импульсных помехах и шумах сканирования изображений. При удалении шума можно лучше сохранить четкость краев и деталей изображения.
По краям изображения уровень серого часто меняется ступенчато или наклонно, и медианный фильтр может хорошо поддерживать его без размытия.
Вообще говоря, медианная фильтрация может хорошо сохранять края изображения при фильтрации шума, чего трудно достичь с помощью линейной средней фильтрации.
Кроме того, эффект фильтрации связан с размером окна. Разумный выбор размера окна является ключом к эффективному использованию медианной фильтрации.
Не улучшает контрастность изображения
Категория 2
гладкий
Метод среднего окрестностей
медианный фильтр
точить
основная концепция
Цель: улучшить детализацию краев и контуров сцены на изображении.
Функция: повышение контрастности оттенков серого.
Основы: поскольку края и контуры расположены там, где происходят мутации значений серого, дифференциальная операция заключается в определении скорости изменения значения серого, поэтому алгоритм повышения резкости основан на дифференциальной (разностной) операции.
Оператор: это концепция, широко используемая в математике и физике для описания правила или функции, которая сопоставляет элемент (или набор элементов) с другим элементом (или набором элементов). Операторы могут представлять собой простые математические операции, такие как сложение или умножение, или более сложные операции, такие как дифференцирование, интегрирование или линейные преобразования.
Дифференциальная кривая
метод
градиентный метод
метод Лапласа
Направленная фильтрация
Фильтр линейной резкости
Принадлежит к линейному преобразованию
Идеи алгоритмов
Повышение резкости изображения можно рассматривать как операцию, обратную сглаживанию. Целью является улучшение деталей и краев изображения и уменьшение размытия изображения.
Чтобы добиться повышения резкости, вы можете попытаться извлечь подробную информацию об изображении, которое необходимо улучшить, а затем улучшить его.
Сущность пространственного сглаживания заключается в выполнении локального усреднения изображения, которое является интегральной операцией, соответственно, повышения резкости изображения можно добиться с помощью операции, обратной интегральной – «дифференциальной»;
Дифференциальная операция заключается в определении скорости изменения сигнала. Местами, где изменения происходят быстро, являются детали и края изображения. Добавление дифференциального результата к исходному изображению в определенной пропорции может сделать контур изображения четким и выделить детали.
Дифференциальный оператор первого порядка
Дифференциальный оператор первого порядка
Двумерный дифференциальный оператор первого порядка
Две разностные операции для поиска градиентов
горизонтальная вертикальная разница
перекрестная разница
Односторонний дифференциальный алгоритм первого порядка
концепция
Односторонний дифференциальный алгоритм первого порядка относится к предоставлению информации о ребре в определенном направлении.
Изображение состоит из горизонтального и вертикального направлений. Таким образом, однонаправленный дифференциальный алгоритм фактически обеспечивает заточку в горизонтальном или вертикальном направлении.
Классификация
Алгоритм повышения резкости по горизонтали
Горизонтальная резкость очень проста и достигается с помощью шаблона, который может обнаруживать изменения значений пикселей в горизонтальном направлении.
Алгоритм вертикальной резкости
Это достигается за счет шаблона, способного обнаруживать изменения значений пикселей в вертикальном направлении.
алгоритм перекрестного дифференциала
В результате расчета появляется значение пикселя меньше нуля.
Решение: вы можете сделать простое сопоставление
[гмин,гмакс]→[0,255]
Дифференциальный оператор второго порядка
формула
оператор
оператор Лапласа
Оператор деформации Лапласа
оператор журнала
оператор собаки
Сравнение эффектов выделения ребер между дифференциалом первого и второго порядка
Граница, полученная с помощью оператора Собеля, является относительно грубой границей с меньшим количеством информации о границе, но относительно четкой;
Граница, полученная с помощью оператора Лапласа, является относительно детальной границей. Границы включают в себя множество деталей, но не слишком четкие.
Фильтрация частотной области
фильтр нижних частот
принцип
высокая частота и низкая частота
Низкочастотные компоненты. Низкочастотные компоненты представляют собой медленные пространственные изменения изображения, то есть в этих областях изображения значения пикселей (яркость или цвет) изменяются медленно. Обычно это соответствует большим однородным областям изображения, таким как спокойное небо, стены или другие части без особой текстуры и краев. Низкочастотная составляющая связана с глобальной информацией изображения, такой как яркость фона, цветовой градиент и т. д.
Высокочастотные компоненты. Высокочастотные компоненты представляют собой быстрые пространственные изменения изображения, то есть в этих областях изображения значения пикселей быстро изменяются. Обычно это соответствует детализированным частям изображения, таким как края, текстуры, узоры и шум. Высокочастотные составляющие выявляют локальные особенности изображения, такие как контуры объектов, детали текстур и т. д.
Фильтрация частотной области может использоваться для выборочного улучшения или подавления определенного содержимого изображения. Фильтрация нижних частот может использоваться для уменьшения высокочастотных составляющих и достижения сглаживания изображения.
принадлежит к гладкому
фильтр нижних частот
Идеальный фильтр нижних частот (ILPF)
D0 — частота среза фильтра, которая является неотрицательной величиной.
D(u,v) — расстояние от точки (u,v) на частотной плоскости до начала координат.
Фильтрация нижних частот уменьшает высокочастотные составляющие, ослабляются шумы и края изображения, а изображение размывается.
Идеальный фильтр нижних частот имеет эффект звона
Фильтр нижних частот Баттерворта (BLPF)
По сравнению с идеальным фильтром нижних частот нет явного скачка между полосой пропускания и полосой задерживания фильтра Баттерворта, а переход между высокими и низкими частотами относительно плавный, поэтому полученное выходное изображение не имеет явного звона.
Из характеристической кривой передаточной функции видно, что на хвосте сохраняется определенная высокая частота, поэтому эффект фильтрации шума не так хорош, как у идеального фильтра нижних частот.
Экспоненциальный фильтр нижних частот (ELPF)
Лестничный фильтр нижних частот (TLPF)
Сравнение эффектов фильтра
Результаты низкочастотной фильтрации имеют разную степень размытия. По мере увеличения частоты среза размытие изображения становится светлее.
На той же частоте среза результат обработки ELPF имеет самое легкое размытие, за ним следует BLPF, а самое сильное размытие имеет ILPF.
Когда частота среза низкая, эффекты фильтрации нескольких фильтров совершенно различны. По мере увеличения частоты среза результаты фильтрации постепенно сходятся.
ILPF и TLPF имеют очевидный феномен «звона», а частота колебаний увеличивается с увеличением частоты среза. BLPF и ELPF не имеют явного явления «звона».
фильтр верхних частот
принцип
Края изображения соответствуют высокочастотным компонентам спектра, поэтому для выделения краев изображения можно использовать фильтры верхних частот.
Наложение его на исходное изображение может сделать края более четкими, тем самым повышая резкость изображения.
Относится к заточке
алгоритм
Для фильтра нижних частот, соответствующего гладкой части изображения, может быть получен соответствующий фильтр верхних частот.
Фильтр верхних частот можно выразить как (1-фильтр нижних частот)
Гомоморфная фильтрация
Гомоморфная фильтрация — это специальная технология обработки изображений, которая сочетает в себе свойства сглаживания и повышения резкости изображения, но ее основная цель — не просто сглаживание или повышение резкости изображений. Гомоморфная фильтрация в основном используется для улучшения условий освещения изображения и улучшения качества изображения за счет одновременного повышения контрастности изображения и сжатия динамического диапазона изображения.
Модель отражения освещения
Технология гомоморфной фильтрации — это метод фильтрации, основанный на принципе отображения изображения при отражении освещения.
В частотной области можно одновременно сжимать диапазон яркости изображения и повышать контрастность, что особенно подходит для изображений, вызванных неравномерным освещением.
Изображение, полученное наблюдателем или системой визуализации, обычно зависит от отраженного от цели света, который делится на ① количество видимого света, падающего на сцену; ② количество отраженного света от цели в сцене;
Количество падающего света связано с внешней освещенностью, а коэффициент отражения зависит от характеристик объекта.
Светлые, гладкие поверхности имеют большие коэффициенты отражения.
Темные, шероховатые поверхности имеют малый коэффициент отражения.
Принцип алгоритма
Изображение представлено как произведение компонента освещения и компонента отражения.
Освещенная составляющая медленно меняется в пространстве и в ней преобладают низкочастотные составляющие.
Компонент отражения резко меняется на границе раздела различных объектов в пространстве, отражая изменения поверхности и деталей, и содержит множество высокочастотных компонентов.
Компонент освещения и компонент отражения находятся в разных диапазонах частот. Вы можете использовать логарифмический метод, чтобы заменить их умножение на сложение, а затем использовать разные методы обработки этих двух частей.
Компонент освещения имеет низкую частоту, и низкую частоту можно подавить для устранения неравномерности освещения. В то же время можно улучшить высокочастотные компоненты, чтобы выделить детали изображения.
Обработать экземпляр
При этом он снижает низкие частоты и усиливает высокие, сжимает динамический диапазон изображения и улучшает контраст между различными частями.
Восстановление изображения
Неограниченное восстановление изображений
Процесс деградации изображения можно рассматривать как преобразование
Нахождение f(x,y) из g(x,y) — это процесс нахождения его обратного преобразования
На практике T(-1) имеет множество ситуаций.
T(-1) не существует, т.е. сингулярный
T(-1) существует, но не является уникальным
T(-1) существует и уникален, но небольшие изменения в g(x, y) вызовут большие изменения в f(x, y)
T(-1) существует и единственна, но ее решение слишком сложно или почти неразрешимо.
T(-1) существует, уникален, не имеет некорректных задач и может быть решен.
В случае систем, инвариантных к линейному сдвигу, исходя из матричного выражения вырожденной модели
Шум здесь обобщен. При отсутствии предварительных знаний нам нужно найти оценку f и минимизировать следующую формулу в смысле наименьших квадратов.
Метод обратной фильтрации для восстановления изображения
Метод фильтра Винера
Сжатие изображения
кодирование без потерь
кодирование переменной длины
Кодирование Хаффмана
арифметическое кодирование
кодирование фиксированной длины
кодирование длины серии
кодирование битовой плоскости
LZW-кодирование
кодирование с потерями
Прогнозирующее кодирование
трансформировать кодирование
Сегментация изображений
Обзор сегментации изображений
Зачем разделять
Сегментация заключается в разделении изображения на непересекающиеся области и выделении интересующих областей.
положение дел
Сегментация изображений — это ключевой шаг на пути перехода от обработки изображений к их анализу и пониманию, а также базовая технология компьютерного зрения.
концепция
Сумма (объединение) всех подобластей должна включать все пиксели изображения, либо сегментация должна делить каждый пиксель изображения на определенную подобласть.
Каждый субрегион не перекрывается друг с другом, либо один пиксель не может принадлежать двум регионам одновременно.
Пиксели, принадлежащие одной области, должны иметь одинаковые характеристики, а границы области должны быть четкими.
Пиксели, принадлежащие разным регионам, должны иметь разные характеристики.
Требуется, чтобы пиксели в одной подобласти были связаны.
природа
Внутри региона: сходство
Метод: на основе сходства значений серого пикселей изображения, выбрав порог, найдите область с одинаковым значением серого. Внешний контур области является краем целевого объекта.
Между регионами: разрывы
Метод: в зависимости от разрыва значения серого пикселя изображения сначала найдите точки, линии и края, а затем определите площадь.
Идеи
1) От простого к сложному, постепенно разделите:
2) Контролируйте фоновую среду и уменьшайте сложность сегментации;
3) Сосредоточьтесь на улучшении интересующего объекта и уменьшении взаимодействия ненужных частей.
метод
Класс методов сегментации, основанный на сходстве значений серого внутри региона. Определите область, которой принадлежит каждый пиксель, чтобы сформировать карту области.
метод пороговой сегментации
региональный рост
разделить слияние
Морфологическая сегментация
Класс методов сегментации, основанный на разрыве значений серого между регионами. Метод сегментации на основе границ сначала извлекает границу области, а затем определяет область, ограниченную этой границей.
метод сегментации с обнаружением границ
Преобразование Хафа
Требовать
эффективность
Целостность
Точность
стабильность
пороговая сегментация
Обзор пороговой сегментации
принцип
Изображение содержит: целевой объект и фон; между ними существуют различия в характеристиках оттенков серого; выбор соответствующего порога; определение принадлежности каждого пикселя изображения и, наконец, сегментация для создания двоичного изображения;
шаг
Определите соответствующий порог сегментации
Сравните значение каждого пикселя с пороговым значением, чтобы назначить владельца пикселя.
Классификация порогов
Функции
Расчет прост
Особенно эффективен для сегментации изображений с сильным контрастом между целью и фоном.
Непересекающиеся регионы всегда можно определить с закрытыми и связанными границами.
Может быть обобщен на другие характеристики, такие как текстура, цвет и т. д.
Порог гистограммы
Основная идея
Значения оттенков серого пикселей внутри цели и фона очень похожи, тогда как оттенки серого пикселей по обе стороны от их соединения сильно различаются. Гистограмму изображения можно рассматривать как суперпозицию двух унимодальных гистограмм цели и фона. фон. Если разница в оттенках серого между целью и фоном относительно велика, гистограмма изображения должна быть бимодальной.
Выбор порога
Возьмите значение серого внизу (минимальное значение) гистограммы в качестве порога T.
Существующие проблемы и улучшения
Восприимчив к шумовым помехам, минимальное значение не является желаемым порогом.
Улучшать
Займите фиксированное положение между двумя вершинами, например среднее положение. Поскольку пиковое значение представляет собой типичное значение внутри и за пределами области, оно, как правило, более надежно, чем выбор впадины, и позволяет устранить влияние шума.
Усилить обработку шума, например сглаживание гистограмм и т. д.
оптимальный порог
вопрос
На гистограмме изображения нет двойного пика и явления впадины, или даже если порог имеет двойной пик и явление впадины, точка впадины не является точной пороговой точкой;
Мысль
Минимизируйте вероятность ошибки сегментации, также известную как минимальный порог вероятности ошибки.
конкретные методы
Установите вероятность цели и фона, а также функцию плотности распределения вероятности их серого распределения;
Учитывая пороговое значение t, найдите вероятность ошибки сегментации каждого класса;
Найдите общую вероятность ошибки сегментации e(t) ниже этого порога;
Оптимальный порог T рассчитывается по минимальному значению общей вероятности ошибки сегментации e(t).
Максимальный порог межклассовой дисперсии
Основная идея
Выбранный порог и т. д. максимизирует общую разницу между целью сегментации и фоновой областью. В определенной степени можно считать, что результат сегментации достиг оптимального уровня. Эту разницу между регионами часто называют дисперсией.
Дисперсия является функцией порога k. Когда k изменяется, дисперсия между регионами также изменяется. Выберите k, который максимизирует дисперсию, которая также называется максимальным порогом межклассовой дисперсии.
Процесс решения максимального порога межклассовой дисперсии не требует ручной настройки других параметров и полностью автоматически выбирается компьютером. Он применим не только к сегментации двух регионов, но также может быть распространен на ситуацию с несколькими регионами.
конкретные методы
проходить
сегментация обнаружения границ
Принцип сегментации обнаружения границ
определение края
Коллекция пикселей изображения, которые имеют ступеньку или крышу в оттенках серого.
Классификация кромок
Принцип сегментации обнаружения границ
Сегментация изображения достигается путем нахождения границ различных областей изображения. Это большой класс методов сегментации изображений, основанных на границах.
Оператор обнаружения границ первого порядка
Хороший оператор обнаружения должен соответствовать трем показателям:
Высокая точность: содержит больше истинных и меньше ложных ребер;
Высокая точность: обнаруженные края должны находиться на истинных границах;
Ширина в один пиксель: высокая избирательность, уникальное реагирование на края.
Обычно для обнаружения фронтов используется максимальное значение дифференциала первого порядка.
оператор градиента
То же, что и «Алгоритм перекрестного дифференцирования».
Операторы других направлений
Такие операторы, как Робертс, Превитт и Собел, содержат шаблоны только в двух направлениях и могут обнаружить лишь несколько краевых направлений. Чем больше направлений имеет дифференциальный шаблон, тем больше ребер в большем количестве направлений можно обнаружить.
Оператор Кирша
8 направлений образуют внутренний угол 45°.
Как использовать: 8 шаблонов свернуты с изображением соответственно для обнаружения изменений оттенков серого в 8 направлениях. Направление с наибольшим изменением — это направление края. Первые четыре шаблона направлений оператора Кирша 5×5 следующие:
Хитрый оператор
Функции
Есть проблемы: неточное положение; неодинарная ширина пикселя и т.д.
Действия оператора по обнаружению краев
Сгладьте изображение с помощью шаблона фильтра Гаусса;
Вычислить величину и направление градиента сглаженного изображения;
Примените максимальное подавление к амплитуде градиента;
Убедитесь, что это максимальное значение в направлении градиента.
Обнаружение и связывание краев с помощью алгоритма двойного порога.
Используйте градиент окрестности, чтобы оценить неопределенные части.
Оператор обнаружения границ второго порядка
Обычно точка пересечения нуля дифференциала второго порядка используется для предварительного позиционирования края.
лапласиан
Функции
Это вторая производная, очень чувствительная к шуму.
Величина лапласиана дает двойные края (минимум отрицательный и максимум положительный);
Невозможно определить направление краев (нет шаблона направления);
эффект
Используйте свойства пересечения нуля для предварительного позиционирования края;
Определяет, находится ли пиксель на темной или светлой стороне края.
шаблон
LOG-оператор
Изображение сначала сглаживается, а затем края обнаруживаются с помощью оператора Лапласа, чтобы решить проблему, связанную с чувствительностью дифференциального оператора второго порядка к шуму.
Продолжение и закрытие края
Цель продолжения ребра
Целью соединения ребер является соединение прерывистых ребер для образования замкнутой границы.
Принцип обработки частичного продолжения
Проанализируйте характеристики каждой точки (x, y) в результатах обнаружения границ; соедините все похожие точки в небольшой окрестности (3x3 или 5x5), чтобы сформировать границу области с общими характеристиками;
Преобразование Хафа
постановка задачи
принцип
Используя двойственные отношения между одним пространством и другим пространством, проблема в исходном пространстве преобразуется в двойное пространство для решения, и проблема становится относительно простой в двойном пространстве.
Обнаружение прямых линий
шаг
Этап подготовки
Этап эксплуатации
стадия поиска пика
Существующие проблемы и улучшения
вопрос
Когда прямая линия близка к вертикали, наклон q близок к бесконечности, диапазон поиска очень широк, а объем вычислений велик.
Улучшать
Пространство изображения XY преобразуется в пространство полярных координат.
Функции
Он обладает сильной защитой от помех, а кумулятивный подсчет в пространстве параметров является неотъемлемым процессом.
Он обладает хорошей устойчивостью и имеет очень очевидный пик в точке параметра, который действительно можно найти.
Автоматическое закрытие: всю кривую можно получить из параметров граничной кривой.
Следовательно, преобразование Хафа можно использовать для устранения помех и полного дополнения и соединения кривых.
Разработка приложения
Для обнаружения круга
Для обнаружения эллипсов
Сегментация регионов
региональный рост
Введение проблемы
Некоторые методы сегментации не учитывают определенные условия.
Основная идея регионального роста
Увеличение региона — это метод сегментации снизу вверх.
Сначала определите количество регионов и их характеристики; затем найдите репрезентативное начальное число для каждого региона; используйте начальное число в качестве центра кластеризации для непрерывного объединения соседних пикселей с одинаковыми характеристиками в область. Процесс объединения продолжается до тех пор, пока он не станет невозможным; сливаются и в конечном итоге образуют регионы с различными характеристиками. Этот метод сегментации также называется расширением региона.
Шаги и процессы алгоритма
Сначала найдите исходный пиксель для сегментируемой области в качестве отправной точки роста;
Определить критерий сходства (чтобы определить, выполняются ли условия слияния);
Согласно критерию подобия, пиксели в окрестности исходного пикселя, которые имеют те же или подобные свойства, что и начальный пиксель, объединяются в исходную область;
Рассматривайте новый пиксель как новый исходный пиксель и продолжайте описанный выше процесс до тех пор, пока не останется больше пикселей, соответствующих условиям, тем самым завершая рост региона;
Следуйте этому методу, чтобы завершить рост других областей, пока все изображение не будет полностью сегментировано.
Ключевой вопрос
Выбор точки посева
самый яркий пиксель;
Максимальное значение гистограммы;
Пиксель в центре кластера;
Определение критерия сходства (критерия роста)
Региональная разница в оттенках серого;
Характеристики распределения оттенков серого внутри региона;
Цвет, текстура, размер и форма и т. д.;
Определение условий остановки роста
Критерий увеличения региона: абсолютная разница в значении серого между любым пикселем и начальным значением менее 65.
разделить слияние
постановка задачи
На выращивание региона большое влияние оказывают семена, критерии сходства и т. д.
Идея разделения и слияния
Разделение-слияние — это метод сегментации сверху вниз.
Начиная со всего изображения, оно непрерывно шаг за шагом разбивается, и в то же время соседние области с одинаковыми характеристиками объединяются до тех пор, пока его больше нельзя будет разделить, и, наконец, получается каждая подобласть.
подход разделения-слияния
вызывающий разногласия подход
Квадратируйте шаг за шагом, пока область, которую нужно разделить, не будет разделена на отдельные пиксели.
Практика слияния
Объедините смежные области с одинаковыми характеристиками в одну область.
Конкретные операции
выполнить шпагат;
Проверьте, можно ли объединить все соседние области, и если да, объедините их одну за другой;
Повторяйте первые два шага до тех пор, пока разделение и слияние больше не будут выполняться;
Примечание. При слиянии сначала рассматриваются четыре области одного и того же родительского узла, а затем расширяются до областей того же уровня под другими родительскими узлами.
Описание изображения
Основные понятия описания изображения
Основные черты, характеризующие образ
Изображение сегментируется для получения нескольких областей и границ. Чтобы компьютер мог эффективно идентифицировать цель, основные атрибуты цели и взаимосвязь между целью и целью и фоном должны быть выражены в более кратких и четких числовых значениях. , символы и т. д.
Эти значения, символы и т. д., генерируемые из исходного изображения или сегментированного изображения, называются признаками изображения. Характеристики изображения содержат важную информацию о цели и отражают основные характеристики цели.
Внутренние функции: функции оттенков серого, функции цвета, функции текстуры...
Внешние характеристики: площадь, периметр, округлость и т.д.
Определение описания изображения
Использование характеристик изображения для представления изображения называется описанием изображения, то есть использование чисел или символов для представления соответствующих характеристик каждой цели на изображении или сцене или даже отношений между целями. Конечный результат представляет собой абстрактное выражение. целевые признаки и взаимосвязь между ними.
Цель описания изображения
Получите полезную информацию о цели, опишите и точно измерьте цель, а также заложите основу для анализа и понимания цели.
Основные методы описания изображений
Метод простого описания относится к методу описания, основанному на характеристиках геометрической формы изображения. Обычно используемые методы включают периметр, площадь, положение, направление, прямоугольность и т. д.
Метод описания границ: после того, как изображение сегментировано или алгоритм обнаружения границ используется для получения набора граничных точек целевой области, эти граничные точки необходимо организовать для формирования граничной линии и описать. Этот метод в основном включает в себя метод цепного кода. и метод описания Фурье.
Метод регионального описания — это метод описания изображения на основе оттенков серого, цвета, текстуры и других характеристик изображения, например метод описания инвариантного момента.
простое описание
описание окружности
Определение периметра: длина границы региона.
Роль периметра: объект простой формы может использовать относительно короткий периметр, чтобы окружить занимаемую им область, поэтому периметр можно использовать для различения объектов простой или сложной формы.
Часто используемые способы описания периметра
Длина линии границы (промежутка) между областью и фоном
Пиксели рассматриваются как маленькие квадраты на единицу площади, а область и фон состоят из маленьких квадратов. Периметр — это длина зазора (линии соединения) между областью и фоном.
То есть: периметр p = длина линии пересечения.
количество граничных точек
Выражается количеством граничных пикселей, то есть количеством граничных точек.
То есть: периметр p = количество граничных точек.
Описание района
Определение описания области: количество пикселей в области.
Роль территории: это самая основная характеристика территории, которая описывает ее размер.
Предположим, что размер изображения f(x,y) равен M×N. Для двоичного изображения 1 представляет цель, а 0 — фон. Чтобы найти целевую область, необходимо подсчитать количество пикселей с помощью f(x,y). )=1, то площадь равна:
Описание целевого местоположения
Поскольку цель имеет определенную область, необходимо определить положение цели на изображении. Обычно в качестве целевой позиции определяется центральная точка области.
Центр области относится к центру тяжести изображения. Если качество изображения распределено равномерно, центроид является центроидом.
Для двоичного изображения f(x,y) размера M×N, если 1 представляет цель, а 0 представляет фон, то координаты центроида цели будут следующими:
Описание целевого направления
После определения местоположения цели на изображении необходимо также определить направление цели.
Целевое направление можно определить, найдя наименьшую сумму квадратов расстояний от всех точек цели до прямой линии, которая является целевым направлением.
Описание целевой прямоугольности
Прямоугольность отражает степень, в которой цель заполняет свой описанный прямоугольник, и может быть описана отношением площади цели к площади ее наименьшего описанного прямоугольника.
Ао - площадь цели, а АМЕР - площадь наименьшего вмещающего прямоугольника. Значение R находится между 0 и 1.
Когда цель представляет собой прямоугольник, R принимает максимальное значение 1; когда цель представляет собой круг, значение R равно для тонких и изогнутых целей, значение R становится меньше и близко к 0.
Метод описания цепного кода
Определение цепного кода
Цепной код — это метод представления граничного кодирования, который использует направление границы в качестве основы для кодирования. Для простоты обычно описывается набор граничных точек.
Метод цепного кода
Существует два метода кодирования: 4-цепочечный код и 8-цепочечный код. Конкретный метод: начните с начальной точки, кодируйте вдоль границы, пока не вернетесь в исходную точку, закончите кодирование.
Присвойте каждому сегменту границы код направления.
Выберите начальную точку, начните с начальной точки и кодируйте вдоль границы, пока не вернетесь в начальную точку и не завершите кодирование.
Начальная точка: красная точка.
Направление: по часовой стрелке
4-Код цепи: 000033333322222211110011
Пример 2
Пусть координаты начальной точки s будут (5,5) и используйте коды цепочек с 4 направлениями и коды цепочек с 8 направлениями против часовой стрелки, чтобы представить границы области.
Код четырехсторонней цепи: (5,5)111232323000
Код цепочки на 8 направлений: (5,5)2224556000
Существует проблема
Разные отправные точки приводят к разному кодированию
Вращение приводит к различиям в кодировке
способы улучшения
Нормализация решает проблему начальной точки: если цепной код связан от начала до конца, можно видеть, что цепной код на самом деле представляет собой циклическую последовательность кодирования направления. Следовательно, начальную точку можно выбрать так, чтобы минимизировать целочисленное значение результирующей кодовой последовательности для достижения нормализации цепного кода.
Разница первого порядка решает проблему вращения: используя разность первого порядка цепного кода для замены исходного кода, он обладает инвариантностью вращения. То есть для областей одинаковой формы, повернутых под разными углами, их цепные коды различны, но разностные коды первого порядка каждого цепного кода одинаковы. Это свойство особенно эффективно для распознавания изображений.
Разность первого порядка и нормализация цепного кода могут иметь начальную точку и инвариантность вращения.
Метод описания Фурье
Основная идея
После подтверждения границы, состоящей из наборов точек, форму цели можно определить с помощью границы.
процесс
Связь между выбором M и дескриптором
Значение использования
При меньшем количестве дескрипторов Фурье можно получить общую схему сущности границы.
Эти дескрипторы с информацией о границах можно использовать для различения существенно разных границ.
Функции
Двумерная задача становится одномерной
Улучшено и скорректировано, чтобы быть инвариантным к геометрическим преобразованиям.
Из определения видно, что выбор начальной точки, перемещение, вращение и масштабирование будут влиять на исходную граничную последовательность, тем самым влияя на результат после преобразования Фурье.
Дескриптор Фурье можно улучшить и настроить, чтобы сделать его инвариантным к геометрическим преобразованиям. Конкретные методы следующие: 1) Изменение и поворот начальной точки влияет только на фазу F(u), а не на амплитуду, и им можно пренебречь; 2) Трансляция повлияет на компонент постоянного тока F(u), который можно устранить, удалив DC; 3) Изменения масштаба приведут к общему увеличению или уменьшению F(u), которое можно устранить путем нормализации путем деления на максимальный коэффициент. После вышеуказанной обработки конечный лист Фурье имеет инвариантность геометрического преобразования.
метод описания момента
Основная идея
В некоторых случаях, когда известно распределение серого целевой области на изображении, для характеристики цели можно использовать описание момента.
Характеристики описания момента
Нет необходимости знать границы, достаточно знать оттенки серого пикселей внутри сегментированной области.
момент
Расстояние до центра
инвариантный момент