로그인
로그인

마인드 맵 갤러리 컴퓨터 비전 디지털 이미지 처리

컴퓨터 비전 디지털 이미지 처리

디지털 영상 처리, 영상 복원, 영상 복원에 대한 기본 지식을 포함한 전통적인 컴퓨터 비전 방법에 대한 자세한 소개, 이미지 전처리에는 이미지 압축, 이미지 분할 등이 자주 사용됩니다. 도움이 되었기를 바랍니다!

2024-02-04 00:54:17에 편집됨

슈퍼직장인

최근 작업 더 많은 작업 보기>>

컴퓨터 비전 디지털 이미지 처리

슈퍼직장인

최근 작업 더 많은 작업 보기>>

추천 사항
개요

작업 2.9 마스크의 역할 이해
- 10
슈퍼직장인
완전히 연결된 신경망
- 8
슈퍼직장인
컨벌루션 신경망
- 15
슈퍼직장인
주의 메커니즘
- 7
슈퍼직장인
모델 생성
- 19
슈퍼직장인
컨벌루션, 노이즈 제거, 에지 추출
- 12
슈퍼직장인
클래식 네트워크 분석
- 7
슈퍼직장인
컴퓨터 비전과 딥러닝
- 11
슈퍼직장인

디지털 이미지 처리

디지털 영상처리에 대한 기본지식

소개

"그림"은 물체에 의해 반사되거나 전달되는 빛의 분포입니다. "이미지"는 인간의 시각 시스템에 의해 받아들여지는 그림에 의해 인간의 두뇌에 형성된 인상 또는 이해입니다.

이미지는 모두 시각효과를 가미한 그림으로, 각종 그래픽과 이미지를 총칭하는 용어입니다.

이미지에 담긴 정보의 양은 방대하며, “백 번 들을 가치가 있다”, “한 눈에 명확하게 이해된다”.

이미지는 수학적으로 다음과 같이 설명할 수 있습니다.

나는=f(x, y, z, λ, t)

여기서 x, y, z는 공간 좌표이고, λ는 파장, t는 시간, I는 빛의 강도입니다.

정적 이미지의 경우 t는 일정합니다. 흑백 이미지의 경우 λ는 상수입니다. 평면 이미지의 경우 z는 일정합니다.

광파: 인간의 인식은 전자기 스펙트럼의 가시 대역으로 제한되는 반면, 이미징 기계는 거의 전체 전자기 스펙트럼을 포괄할 수 있습니다.

이미지 디지털화

디지털 이미지

아날로그 이미지는 숫자로 표현되고, 숫자로 표현된 이미지는 디지털 이미지이다.

아날로그 이미지를 이산화하여 디지털 이미지를 얻는 과정을 이미지 디지털화라고 합니다.

프로세스

견본 추출

이미지를 작은 영역(픽셀)으로 공간적으로 나누고, 각 픽셀은 2차원 좌표(정수)를 갖습니다.

영향

정량화하다

각 픽셀의 밝기 또는 회색 값은 해당 회색 레벨에 매핑되며, 각 회색 레벨은 일반적으로 정수로 표시됩니다.

양자화된 계조 레벨의 수 L=256인 경우, 값 범위는 0부터 255까지의 정수이고, 8비트는 계조 이미지 픽셀의 계조 값을 표현하는데 사용될 수 있는데, 이를 8비트 양자화라고 한다.

디지털 이미지 표현

수학적 표현

바이너리 이미지

회색조 이미지

RGB 이미지

이미지 저장 형식

BMP 형식: Windows 시스템용 비트맵 파일

GIF 형식: 여러 이미지(애니메이션)를 저장할 수 있습니다.

TIF(F) 형식: OS 및 FS에 독립적이며 교환이 용이함

JPEG 형식: 압축 표준

이미지의 기본 속성

이미지 픽셀 수

이미지 픽셀 수는 비트맵 이미지에 가로 및 세로로 포함된 픽셀 수를 나타냅니다. 단순히 픽셀 수를 늘리는 것만으로는 이미지의 표시 효과를 향상시킬 수 없습니다. 이미지의 표시 효과는 디스플레이의 픽셀 수와 해상도에 따라 결정됩니다.

이미지 해상도

이미지 해상도는 단위 인쇄 길이당 이미지에 분포된 픽셀 수를 의미하며, 이미지의 선명도를 결정하는 디지털 이미지 정보의 밀도를 특성화하는 데 주로 사용됩니다. 단위 크기 영역에서 이미지의 해상도가 높을수록 포함된 픽셀 수가 많아지고 픽셀의 밀도가 높아지며 디지털 이미지의 선명도가 높아집니다.

이미지 크기

이미지 크기는 이미지 파일을 저장하는 데 필요한 저장 공간을 결정하며 일반적으로 바이트(B) 단위로 측정됩니다. 계산 공식은 바이트 수 = (비트맵 높이 × 비트맵 너비 × 이미지 깊이) / 8입니다. 이미지 파일의 저장 크기는 픽셀 수와 직접적인 관련이 있음을 계산 공식을 통해 알 수 있습니다.

이미지 색상

이미지 색상은 디지털 이미지에서 가능한 가장 많은 색상 유형을 말하며, 빨간색, 녹색, 파란색의 3원색 비율을 변경하여 어떤 색상이든 쉽게 혼합할 수 있습니다.

이미지 깊이

이미지의 비트 심도라고도 알려진 이미지 심도는 이미지의 각 픽셀이 차지하는 비트 수를 나타냅니다. 이미지의 각 픽셀에 해당하는 데이터는 일반적으로 1바이트 이상으로 표현될 수 있습니다. 데이터 깊이가 깊을수록 더 많은 비트가 필요하고 해당 색상 표현이 더 풍부해집니다.

이미지 톤

이미지 색상은 기본 색상에 해당하는 다양한 이미지 색상의 밝기와 어두움을 나타냅니다. 예를 들어 RGB 형식의 디지털 이미지의 기본 색상에는 빨간색, 녹색, 파란색이 포함됩니다. 일상 생활에서 색상의 조정은 다음과 같습니다. 기본 색상의 밝기. 색상 범위는 0부터 255까지이며 총 256개의 색상이 있습니다. 예를 들어 가장 간단한 회색조 이미지는 색상을 흰색에서 검정색까지 256개의 색상으로 나눕니다. RGB 이미지에서는 빨간색, 녹색, 파란색의 세 가지 색상의 명암을 특성화해야 합니다. 예를 들어 빨간색 톤이 짙어지면 이미지가 어두운 빨간색으로 변하는 경향이 있고, 녹색 톤이 짙어지면 이미지가 어두워지는 경향이 있습니다. 심도가 깊어지면 이미지가 짙은 녹색으로 변하는 경향이 있습니다.

이미지 채도

이미지 채도는 이미지의 색상 순도를 나타냅니다. 자연스러운 장면 사진의 채도는 물체의 반사 또는 투영 속성에 따라 달라집니다. 디지털 이미지 처리에서 채도는 일반적으로 단색에 혼합된 백색광의 비율로 측정됩니다. 단색에 혼합된 백색광이 많을수록 채도는 낮아지고, 반대로 채도는 높아집니다.

이미지 밝기

이미지 밝기는 디지털 이미지에 포함된 색상의 밝기와 어두움을 의미합니다. 이는 물체 자체의 밝기와 어둠에 대한 인간의 눈의 인식입니다. 값 범위는 일반적으로 0%~100%입니다.

이미지 대비

이미지 대비는 서로 다른 색상 간의 대비 또는 이미지의 밝은 부분과 어두운 부분의 대비를 나타냅니다. 대비가 클수록 색상 간의 밝기 차이가 커지거나 흑백 간의 차이가 커집니다. 예를 들어, 회색조 이미지의 대비를 높이면 이미지의 검은색과 흰색의 차이가 더 뚜렷해지며 이미지가 더 선명해집니다. 대비를 극도로 높이면 회색조 이미지가 흑백 이미지가 됩니다.

이미지 계층구조

컴퓨터 디자인 시스템에서는 영상 자료를 보다 편리하고 효과적으로 처리하기 위해 일반적으로 서로 다른 레이어에 배치되며, 이미지는 여러 레이어의 이미지가 겹쳐져 구성된 것으로 간주할 수 있습니다. 이미지 처리 소프트웨어를 사용하면 다른 레이어의 이미지 내용에 영향을 주지 않고 각 레이어를 독립적으로 처리할 수 있습니다. 새 이미지 파일을 생성하면 시스템은 자동으로 해당 파일에 대한 배경 레이어를 생성합니다. 이는 다른 이미지 처리 작업을 수행할 수 있는 캔버스와 같습니다. 이미지에 여러 레이어가 있는 경우 각 레이어의 픽셀 수, 채널 및 형식은 동일합니다.

픽셀 간의 기본 관계

기본적인 관계

이미지 f(x,y)는 기본 단위 픽셀로 구성되며, 픽셀 사이에는 픽셀 이웃, 인접 및 연결, 픽셀 간 거리 등 특정 연결이 있습니다. 일반적으로 특정 픽셀을 지정할 때는 소문자(예: p)가 사용됩니다.

영역

픽셀 p의 이웃 픽셀은 이 픽셀의 이웃을 형성합니다.

4개 지역

8개 지역

대각선 필드

인접

임의의 두 픽셀에 대해 한 픽셀이 다른 픽셀 근처에 있고 해당 회색조 값이 특정 유사성 기준(예: 특정 회색조 값 세트에 속함)을 충족하면 두 픽셀이 인접하다고 합니다.

인접지역 4개

8개 인접

m 인접

다음 두 가지 조건 중 하나를 충족하는 경우

q는 p의 4번째 이웃에 있습니다.

q는 p의 대각선 도메인에 있고, q의 4-도메인 이웃과 p의 4-도메인 도메인의 교차점에 있는 픽셀의 회색 값은 V에 속하지 않습니다.

그러면 두 점 p와 q는 m 인접하다고 합니다.

연결됨

4-연결됨

8-연결됨

m-연결

거리

유클리드 거리

도시의 거리

보드 거리

디지털 이미지 처리 애플리케이션

산업용 애플리케이션

유리병 테스트 등 생산 라인에서 생산되는 제품 및 부품에 대한 비파괴 테스트

공공 안전 애플리케이션

지문 인식은 안전하고 신뢰할 수 있으며 효율적이며 공공 보안, 정보 보안, 전자 상거래 및 기타 분야에서 광범위하게 응용됩니다.

개인 신원 인증에는 얼굴, 홍채, 장문, 서명 등의 이미지도 포함됩니다.

의료 응용

정기적인 혈액검사의 주요 내용인 혈구수, 질병의 유무 및 질병의 중증도에 대한 중요한 데이터입니다.

지질학적 응용

시추공 카메라 기술은 구멍 벽의 대규모 파노라마 뷰를 확보하여 내부 지질 구조를 직접 관찰할 수 있습니다.

환경 테스트 애플리케이션

화재 식별 및 위치: 가시광선 이미지와 적외선 이미지를 일치시켜 화재를 식별하고 위치를 파악합니다.

해양 응용

Enteromorpha Enteromorpha 감지: 원격 감지 이미지를 데이터 소스로 사용하여 Enteromorpha Enteromorpha를 신속하게 감지합니다.

해양 어류 탐지 및 추적.

군사 응용

공중 정찰 목표 위치 지정.

엔터테인먼트 애플리케이션

얼굴 바꾸기

이미지 엔지니어링

이미지 처리

이미지 -> 이미지

향상된 시각 효과

노이즈 감소, 대비 향상 및 이미지 선명화를 위한 이미지 전처리

이미지 수집, 획득 및 저장, 이미지 향상, 이미지 복원, 이미지(비디오) 압축(인코딩)

이미지 분석

이미지 -> 데이터

유용한 정보를 추출하다

이미지 분할 및 대상 설명, 출력은 대상 특징 데이터입니다.

엣지 검출, 영상 분할(타겟 배경 분리), 타겟 표현, 묘사, 측정, 타겟 색상, 형태, 질감, 움직임 분석, 타겟 검출, 추출, 추적, 식별 및 분류, 얼굴 인식

이미지 이해

이미지 -> 설명

대상 객체와 그 관계를 이해하면 보다 추상적인 데이터가 출력됩니다.

이미지 등록, 매칭, 융합, 3차원 표현, 모델링, 재구성, 장면 복구, 이미지 이해, 추론, 콘텐츠 기반 이미지 검색

이미지의 수학적 변환

좌표공간 변환

기본 사상

고무 필름에 이미지를 인쇄한 다음 미리 정해진 규칙에 따라 고무 필름을 늘린다는 가정 하에 기하학적 변형을 흔히 고무 필름 변형이라고 합니다.

기하학적 변환은 이미지의 픽셀 간의 공간 관계를 변경합니다. 이는 좌표의 공간 변환(좌표 변환)과 변환된 좌표 픽셀의 회색조 값(회색조 보간)이라는 두 가지 기본 작업으로 구성됩니다.

좌표변환

원본 이미지를 양방향으로 절반으로 줄입니다.

아핀 변환

영상 처리에서 일반적으로 사용되는 좌표 변환은 아핀 변환(affine Transformation)입니다.

정체성 변화

번역 변환

회전 변환

규모 변환

전단변환

X축을 따라 절단

y축을 따라 자르기

순방향 매핑 및 역방향 매핑

순방향 매핑: 이미지의 임의 픽셀 좌표가 주어지면 해당 매핑 관계를 통해 기하학적 변환 후 픽셀 좌표 위치를 얻습니다.

역방향 매핑: 출력 이미지의 픽셀 좌표에서 원본 이미지의 픽셀 좌표 위치를 계산합니다.

그레이스케일 보간

기본 사상

이미지의 픽셀을 새 위치로 재배치하려면 이러한 새 위치에 회색조 값, 즉 회색조 보간도 할당되어야 합니다.

유형

가장 가까운 이웃 보간

매핑된 위치에 가장 가까운 입력 픽셀의 회색 값이 보간 결과로 선택됩니다.

단점: 인접한 픽셀의 회색 값이 크게 변경되면 미세 구조가 거칠어집니다.

이중선형 보간

인접한 4개 점의 회색값에 따라 x, y 방향으로 2번 보간을 수행합니다. 보간 함수는 쌍곡선 포물면 방정식입니다.

이것은 쌍곡선 포물면이 4개의 인접한 알려진 점에 맞춰지는 최근접 이웃 방법의 개선입니다.

단점: 쌍선형 보간 계산 방법은 인접한 네 지점의 영향을 고려했기 때문에 일반적으로 만족스러운 결과를 얻을 수 있습니다. 그러나 이 방법에는 저역 통과 필터링 특성이 있어 고주파 성분이 손실되고 이미지 윤곽이 흐려집니다. 보다 정확한 그레이스케일 보간 효과를 얻으려면 고차 보간 보정을 사용할 수 있습니다.

쌍삼차 보간

인접한 16개 점의 회색 값을 기준으로 보간합니다.

푸리에 변환

주파수 영역 이미지 처리의 기본 단계

푸리에 변환

푸리에 이미지를 변환합니다. 파동을 얻는 대신 이미지를 공간 영역(즉, 원래 픽셀 표현)에서 주파수 영역으로 변환합니다. 주파수 영역에서 이미지는 서로 다른 주파수의 파동의 일련의 조합으로 표현됩니다. 이 변환을 통해 저주파 성분(매끄러운 영역과 같이 이미지에서 천천히 변화하는 부분을 나타냄)과 고주파 성분(가장자리와 같이 빠르게 변화하는 부분을 나타냄)을 포함하여 이미지의 다양한 주파수 성분의 분포를 볼 수 있습니다. 및 세부 사항).

주파수 영역 필터링

주파수 영역에서는 이미지에 고주파 필터 또는 저주파 필터를 적용하도록 선택할 수 있습니다.

자세한 내용은 이미지 향상을 위한 주파수 영역 필터링을 참조하세요.

역푸리에 변환

필터링된 주파수 영역 데이터는 역 푸리에 변환을 통해 다시 공간 영역으로 변환됩니다. 이 역변환의 결과는 주파수 영역 필터링의 효과를 반영하는 수정된 이미지입니다.

푸리에 급수 및 푸리에 변환

특정 수학적 조건을 충족하면 모든 주기 함수는 서로 다른 주파수의 정현파의 합으로 표현될 수 있습니다.

특정 수학적 조건이 충족되면 비주기 함수는 사인에 가중 함수를 곱한 적분, 즉 푸리에 변환으로 표현될 수도 있습니다.

푸리에 급수나 푸리에 변환으로 표현되는 기능적 특성은 역푸리에 변환을 통해 정보 손실 없이 완전히 재구성될 수 있습니다.

1차원 이산 푸리에 변환

2차원 이산 푸리에 변환

2차원 푸리에 변환 후 회색조 이미지의 스펙트로그램에서 가장 밝은 부분은 원본 이미지의 저주파 성분에 해당합니다.

저주파 구성요소: 이러한 구성요소는 전반적인 회색 레벨 변경이나 부드러운 영역과 같이 이미지에서 느리게 변화하는 부분을 나타냅니다. 푸리에 스펙트로그램에서 저주파 성분은 일반적으로 이미지의 중앙 영역에 집중되어 있습니다.

고주파수 구성 요소: 이러한 구성 요소는 가장자리 및 세부 묘사와 같이 이미지에서 빠르게 변화하는 부분을 나타냅니다. 스펙트로그램에서 고주파 성분은 일반적으로 중심점에서 멀리 떨어져 있습니다.

이산 푸리에 변환의 기본 속성

가를 수 있음

번역상의

주기적

공액대칭

회전 불변

비례

평균값

컨벌루션 정리

이미지 향상

이미지 향상의 기본 개념

이미지 향상 속성

이미지 품질 저하의 원인을 조사하지 않고 더 나은 "더 나은" 또는 더 "유용한" 이미지를 얻기 위해 이미지 특성과 처리 목적에 따라 수정이 이루어집니다.

이미지 향상은 특정 응용 목적에 맞게 이미지 품질을 향상시키는 것이며 처리 결과는 인간의 시각적 특성이나 기계 인식 시스템에 더 적합합니다.

특정한 필요에 따라 이미지의 특정 정보를 강조하는 동시에 불필요한 특정 정보를 약화시키거나 제거하는 처리 방법입니다.

강화 처리는 원본 이미지의 정보를 증가시킬 수 없으며 특정 정보의 인식 능력만 향상시킬 수 있으며, 이러한 처리로 인해 다른 정보가 부분적으로 손실될 수 있습니다.

기본 방법

작동하다

공간 영역 방법

공간 영역 방법은 영상 공간 영역에서 픽셀 계조 값에 대한 연산을 직접 수행하는 것을 말하며 일반적으로 사용되는 방법에는 계조 변환, 히스토그램 보정, 템플릿 컨볼루션, 의사 색상 처리 등이 포함됩니다.

주파수 영역 방법

주파수 영역 방법은 영상의 특정 변환 영역에서 영상의 변환값을 강화한 후 역변환을 통해 강화된 영상을 얻는 방법이다.

목적

매끄러운

스무딩은 이미지에 흐림 효과를 주어 이미지 전환을 자연스럽고 부드럽게 만들고 노이즈를 억제합니다.

영상의 주파수 특성을 바탕으로 주파수 관점에서 이해하면, 평활화란 영상의 저주파 성분을 유지 또는 강화하고, 영상의 고주파 성분을 약화시키거나 제거하는 것입니다.

갈다

선명하게 하기는 다듬기의 반대 작업으로 볼 수 있습니다. 효과와 목적은 세부 사항을 강조하고 이미지 윤곽선을 명확하고 대조적으로 만드는 것입니다.

주파수 영역 처리의 관점에서 선명화는 이미지의 고주파 성분을 향상시키는 것입니다.

효과

영상의 주파수 특성 분석에 따르면, 일반적으로 전체 영상의 대비와 동적 범위는 영상 정보의 저주파 부분(전체 영상을 나타냄)에 따라 달라지는 반면, 가장자리 윤곽선과 국부적인 세부 사항은 이미지에서는 고주파 부분에 따라 달라집니다.

따라서 이미지 처리에는 2차원 디지털 필터링 방법이 사용됩니다. 예를 들어 고역 통과 필터를 사용하면 가장자리 윤곽과 이미지 세부 정보를 강조하는 데 도움이 되고, 저역 통과 필터를 사용하면 이미지를 부드럽게 하고 노이즈를 줄일 수 있습니다.

지원서 검토

상당히 주관적임

실제 응용 프로그램에서는 여러 가지 향상 알고리즘을 동시에 선택하여 테스트할 수 있으며 시각적 효과가 더 좋고 계산 복잡성이 상대적으로 적으며 응용 프로그램 요구 사항을 준수하는 알고리즘을 선택할 수 있습니다.

그레이스케일 변환

그레이스케일 매핑 원리

그레이스케일 매핑은 이미지 픽셀을 기반으로 한 포인트 작업입니다.

개선 목적에 따라 특정 매핑 규칙을 설계하고 해당 매핑 기능으로 표현

매핑 기능을 사용하면 원본 이미지의 각 픽셀의 회색조를 새로운 회색조로 매핑할 수 있습니다.

t=T(들)

유형

이미지 반전

그레이스케일 값이 반전되어 검정색이 흰색이 됩니다.

이미지 반전 작업은 종종 이미지의 낮은 회색 영역을 강화하여 더 밝거나 더 두드러지게 만드는 데 사용됩니다.

그레이스케일에서 이미지의 본체가 더 밝을 경우, 반전 작업으로 인해 본체가 더 어두워질 수 있습니다.

밝은 회색조로 이미지 피사체를 향상하려면 히스토그램 균등화 또는 대비 향상과 같은 다른 이미지 향상 기술을 사용해야 하는 경우가 많습니다. 반전 작업은 이미지의 어두운 디테일을 향상시키는 데 더 적합합니다.

대비 향상

이미지 각 부분의 대비를 강화하고 실제로 이미지의 두 회색 값 사이의 동적 범위를 늘립니다.

동적 범위 압축

반대로 원본 이미지의 동적 범위가 너무 커서 일부 디스플레이 장치에서 허용되는 동적 범위를 초과하는 경우가 있습니다. 이 경우 원본 이미지를 직접 사용하면 일부 세부 정보가 손실될 수 있습니다.

함수 변환을 통해 회색조 분포 수정

수학 함수를 적용하여 이미지의 각 픽셀의 회색조 값을 조정합니다.

선형변환

비선형 변환

s=cr^γ

왼쪽 상단은 원본 그림입니다. c=1, Y는 각각 3.0, 4.0, 5.0입니다.

히스토그램

히스토그램 정의

그레이스케일 히스토그램은 이미지의 그레이스케일 분포를 나타내는 통계 차트입니다.

가로축은 회색 레벨이며 일반적으로 r로 표시되며 세로축은 이 회색 레벨을 갖는 픽셀 수 또는 이 회색 레벨이 나타날 확률입니다.

히스토그램의 속성

이미지는 히스토그램에 해당하지만, 히스토그램이 반드시 하나의 이미지에만 해당하는 것은 아닙니다.

히스토그램은 회색조 픽셀의 발생 확률만 계산할 수 있으며 이미지의 픽셀 위치를 반영할 수는 없습니다.

히스토그램 균등화는 주로 이미지의 전체 대비를 향상시키는 데 사용되는 반면, 평활화 및 선명화는 각각 이미지의 국부적 대비와 세부 묘사를 줄이거나 늘리는 데 사용됩니다.

일부 특수한 경우에는 히스토그램 균등화가 대비를 크게 변경하지 않거나 대비를 약간 감소시킬 수도 있습니다.

이미 균일한 히스토그램: 이미지의 히스토그램이 이미 균일하게 분포되어 있거나 밝기 분포가 균일한 분포에 매우 가까운 경우 히스토그램 균등화를 수행해도 대비가 변경되지 않을 수 있습니다.

특수 밝기 분포: 일부 특수 밝기 분포 상황에서는 히스토그램 균등화로 인해 일부 영역에서 디테일 손실이 발생하여 해당 영역의 대비가 감소할 수 있습니다.

휘도 값의 극단적인 집중: 이미지의 많은 픽셀이 휘도 범위의 맨 끝 부분(매우 밝거나 매우 어두움)에 집중되어 있는 경우 히스토그램 균등화로 인해 해당 영역의 대비가 감소할 수 있습니다.

히스토그램 및 이미지 회색조 분포

히스토그램 평준화

이미지의 그레이스케일 분포는 전체 그레이스케일 범위를 최대한 활용해야 하며, 각 그레이스케일 수준의 픽셀 수는 대략 균등하게 분포되어야 합니다.

이는 출력 이미지의 히스토그램이 최대한 균일하게 분포되도록 이미지의 히스토그램을 조정하여 이미지의 밝기 분포를 더욱 균일하게 만드는 방식으로 수행됩니다.

매끄럽게 하거나 선명하게 하지 않음

히스토그램 사양

회색은 원래 히스토그램을 균등화합니다.

필요한 히스토그램을 지정하고 지정된 히스토그램을 균등화하는 변환을 계산합니다.

원본 히스토그램을 지정된 히스토그램에 매핑

비교됨

이미지 간 작업

산술 연산

덧셈 연산

C(x,y)=A(x,y) B(x,y)

M개 이미지의 평균은 다음과 같이 정의됩니다.

g(x,y)=1/M(g0(x,y) g1(x,y) … gM(x,y))

애플리케이션

"추가" 무작위 노이즈 제거

이미지 오버레이 효과 생성

빼기

C(x,y) = A(x,y) - B(x,y)

애플리케이션

배경 효과 제거

차이 그림자 방법

서로 다른 시간에 촬영한 동일한 장면의 이미지 또는 서로 다른 파장대에서 동일한 장면의 이미지를 빼면 동일한 장면의 두 이미지 간의 변화를 감지할 수 있습니다.

동적 모니터링, 움직이는 표적 감지 및 추적, 이미지 배경 제거 및 표적 인식 등을 안내하는 데 사용할 수 있습니다.

곱셈

C(x,y) = A(x,y) * B(x,y)

애플리케이션

이미지의 부분 표시

분할 운영

C(x,y) = A(x,y)/ B(x,y)

애플리케이션

원격탐사 이미지 처리에 일반적으로 사용됨

논리 연산

이진(0 및 1) 이미지에만 사용할 수 있습니다.

분류

AND(AND): p AND q로 표기(p·q 또는 pq로도 표기 가능)

Or (OR): p OR q로 표기 (p q로도 표기 가능)

COMPLEMENT(COMPLEMENT, 종종 부정 여부라고도 함): NOT q로 작성됨( 로 작성할 수도 있음)

공간 필터링

공간 도메인 필터링은 픽셀에서 직접 작동하는 반면, 주파수 도메인 필터링은 이미지의 주파수 구성 요소에 대한 작동을 포함합니다.

이미지 공간에서 템플릿을 사용한 이웃 작업

카테고리 1

선형: 이웃 평균 방법

근본적인

가장 기본적인 이미지 스무딩 알고리즘

스무딩은 공간 영역 또는 주파수 영역에서 수행될 수 있습니다.

이미지의 각 픽셀을 중심으로 삼아 도메인 R을 취하고, 이웃에 있는 모든 픽셀의 회색조 가중 평균을 중심 픽셀의 출력으로 계산합니다.

주효과

노이즈 제거 또는 감소 및 이미지 품질 향상

이미지를 흐리게 하여 부드럽고 자연스럽게 보이도록 합니다.

구현 프로세스

일반적으로 템플릿 컨볼루션 작업의 도움으로 구현됩니다.

특정 단계

이미지에서 템플릿을 왼쪽에서 오른쪽으로, 위에서 아래로 슬라이드하면 템플릿의 각 위치 지점이 이미지의 특정 픽셀과 일치합니다.

템플릿의 각 위치에 있는 계수에 일치하는 픽셀의 회색 값을 곱합니다.

모든 제품을 합산합니다.

템플릿의 중심에 해당하는 픽셀에 합산 결과를 할당합니다.

템플릿 양식

특징

계수 분포 패턴은 일반적으로 중앙이 크고 주변 지역이 작습니다.

계수의 합은 1과 동일하여 이미지 처리 전후에 전체 회색 레벨이 변경되지 않도록 합니다.

가장자리를 더 잘 유지하기 위해 십자형, 직선형 및 기타 템플릿을 사용할 수도 있습니다.

비선형성: 중앙값 필터링

알고리즘 원리

홀수 픽셀을 포함하는 창을 사용하여 이미지를 슬라이드하고 창 중심점의 회색 값을 창에 있는 각 점의 중간 회색 값으로 바꿉니다.

알고리즘 특성

비선형 가공 기술입니다.

이웃 평균 방법과 비교하여 중앙값 필터링은 선형 필터로 인해 발생하는 이미지 세부 사항의 흐려짐을 어느 정도 극복할 수 있으며 특히 펄스 간섭 및 이미지 스캐닝 노이즈에 효과적입니다. 노이즈를 제거하는 동안 가장자리의 선명도와 이미지 디테일을 더 잘 유지할 수 있습니다.

영상의 가장자리 부분은 계조가 계단이나 경사로 변하는 경우가 많은데, 메디안 필터를 사용하면 흐릿함 없이 잘 유지할 수 있습니다.

일반적으로 중앙값 필터링은 선형 평균 필터링으로는 달성하기 어려운 노이즈를 필터링하면서 이미지의 가장자리를 잘 유지할 수 있습니다.

또한 필터링 효과는 창 크기와 관련이 있습니다. 창 크기를 합리적으로 선택하는 것이 중앙값 필터링을 잘 활용하는 열쇠입니다.

이미지 대비가 향상되지 않습니다.

카테고리 2

매끄러운

이웃 평균 방법

중앙값 필터

갈다

기본 사상

목적: 이미지에서 장면의 세부적인 가장자리와 윤곽을 향상시킵니다.

기능: 그레이스케일 대비를 향상시킵니다.

기본 사항: 회색 값 돌연변이가 발생하는 곳에 가장자리와 윤곽이 위치하므로 미분 연산은 회색 값의 변화율을 찾는 것이므로 선명화 알고리즘은 미분(차이) 연산을 기반으로 합니다.

연산자: 요소(또는 요소 집합)를 다른 요소(또는 요소 집합)에 매핑하는 규칙이나 함수를 설명하기 위해 수학과 물리학에서 널리 사용되는 개념입니다. 연산자는 덧셈이나 곱셈과 같은 간단한 수학 연산이거나 미분, 적분, 선형 변환과 같은 더 복잡한 연산일 수 있습니다.

미분 곡선

방법

그라데이션 방법

라플라시안 방법

방향 필터링

선형 샤프닝 필터

선형변환에 속함

알고리즘 아이디어

이미지 선명화는 스무딩의 반대 작업으로 볼 수 있습니다. 목적은 이미지의 세부 묘사와 가장자리를 향상시키고 이미지에 흐림 효과를 제거하는 것입니다.

선명하게 하기의 목적을 달성하려면 향상이 필요한 이미지의 세부 정보를 추출한 다음 향상시켜 볼 수 있습니다.

공간 평활화의 본질은 적분 연산인 이미지에 대한 로컬 평균화를 수행하는 것입니다. 따라서 이미지 선명화는 적분의 역 연산인 "미분"을 사용하여 달성할 수 있습니다.

미분 연산은 신호의 변화율을 찾는 것입니다. 변화가 빠른 곳은 이미지의 디테일과 가장자리입니다. 원본 이미지에 일정한 비율에 따라 차분 결과를 추가하면 이미지의 윤곽이 명확해지고 디테일이 돋보이게 됩니다.

1차 미분 연산자

2차원 1차 미분 연산자

기울기를 찾기 위한 두 가지 차분 연산

수평 수직 차이

교차 차이

단방향 1차 미분 알고리즘

개념

단방향 1차 미분 알고리즘은 특정 방향의 에지 정보를 제공하는 것을 의미합니다.

이미지는 가로와 세로의 두 방향으로 구성됩니다. 따라서 단방향 미분 알고리즘은 실제로 수평 또는 수직 방향으로 선명하게 됩니다.

분류

수평 선명화 알고리즘

수평 선명화는 매우 간단하며 수평 방향의 픽셀 값 변화를 감지할 수 있는 템플릿을 통해 수행됩니다.

수직 선명화 알고리즘

이는 수직 방향의 픽셀 값 변화를 감지할 수 있는 템플릿을 통해 달성됩니다.

교차 차동 알고리즘

계산 결과에 0보다 작은 픽셀 값이 나타납니다.

해결책: 간단한 매핑을 만들 수 있습니다.

[gmin,gmax]→[0,255]

2차 미분 연산자

공식

운영자

라플라시안 연산자

라플라시안 변형 연산자

로그 연산자

개 운영자

1차 미분과 2차 미분 간의 에지 추출 효과 비교

Sobel 연산자로 얻은 경계는 경계 정보가 적고 비교적 거친 경계이지만 비교적 명확합니다.

라플라시안 연산자로 얻은 경계는 비교적 상세한 경계이다. 경계에는 많은 세부 사항이 포함되어 있지만 너무 명확하지는 않습니다.

주파수 영역 필터링

저역 통과 필터

원칙

고주파수와 저주파수

저주파 구성요소: 저주파 구성요소는 이미지의 느린 공간 변화를 나타냅니다. 즉, 이미지의 해당 영역에서 픽셀 값(밝기 또는 색상)이 느리게 변경됩니다. 이는 일반적으로 잔잔한 하늘, 벽 또는 질감과 가장자리가 많지 않은 기타 부분과 같이 이미지의 크고 균일한 영역에 해당합니다. 저주파 성분은 배경 밝기, 색상 그라데이션 등과 같은 이미지의 전체 정보와 관련됩니다.

고주파 성분: 고주파 성분은 이미지의 급격한 공간적 변화를 나타냅니다. 즉, 이미지의 이러한 영역에서 픽셀 값이 빠르게 변합니다. 이는 일반적으로 가장자리, 질감, 패턴 및 노이즈와 같은 이미지의 세부적인 부분에 해당합니다. 고주파 성분은 물체의 윤곽, 질감의 세부 사항 등과 같은 이미지의 국부적 특징을 드러냅니다.

주파수 영역 필터링을 사용하여 이미지의 특정 내용을 선택적으로 강화하거나 억제할 수 있습니다. 저역 통과 필터링을 사용하면 고주파 성분을 줄여 이미지 평활화를 달성할 수 있습니다.

스무스에 속한다

저역 통과 필터

이상적인 저역 통과 필터(ILPF)

D0는 필터의 차단 주파수로, 음수가 아닌 양입니다.

D(u,v)는 주파수 평면의 점 (u,v)에서 원점까지의 거리입니다.

저역 통과 필터링은 고주파 성분을 줄이고 노이즈와 이미지 가장자리가 약해지고 이미지가 흐려집니다.

이상적인 저역 통과 필터에는 링잉 효과가 있습니다.

버터워스 저역 통과 필터(BLPF)

이상적인 저역 통과 필터와 비교할 때 버터워스 필터의 통과 대역과 저지 대역 사이에 뚜렷한 점프가 없으며 고주파와 저주파 사이의 전환이 상대적으로 매끄러우므로 얻은 출력 이미지에 뚜렷한 링잉이 없습니다.

전달 함수의 특성 곡선을 보면 꼬리 부분에 특정 고주파수가 유지되어 노이즈 필터링 효과가 이상적인 저역 통과 필터만큼 좋지 않음을 알 수 있습니다.

지수 저역 통과 필터(ELPF)

래더 로우 패스 필터(TLPF)

필터 효과 비교

저역 통과 필터링의 결과는 차단 주파수가 증가함에 따라 이미지의 흐림 정도가 다양해집니다.

동일한 차단 주파수에서 ELPF 처리 결과의 블러가 가장 가벼우며 그 다음이 BLPF, ILPF의 블러가 가장 짙습니다.

차단 주파수가 낮으면 여러 필터의 필터링 효과가 상당히 다릅니다. 차단 주파수가 높아질수록 필터링 결과는 점차적으로 수렴됩니다.

ILPF와 TLPF에는 뚜렷한 "링잉" 현상이 있으며, 차단 주파수가 증가함에 따라 발진 주파수가 증가합니다. BLPF와 ELPF에는 뚜렷한 "링잉" 현상이 없습니다.

하이패스 필터

원칙

이미지 가장자리는 스펙트럼의 고주파 성분에 해당하므로 고역 통과 필터를 사용하여 이미지 가장자리를 추출할 수 있습니다.

원본 이미지와 겹쳐서 가장자리를 더 선명하게 만들어 이미지를 선명하게 만들 수 있습니다.

샤프닝에 속합니다

연산

영상의 매끄러운 부분에 해당하는 저역 통과 필터에 대해 해당 고역 통과 필터를 얻을 수 있습니다.

고역통과 필터는 다음과 같이 표현될 수 있습니다. (1-저역통과 필터)

동형 필터링

동형 필터링(Homomorphic Filtering)은 이미지 평활화와 선명화 속성을 모두 포함하는 특수한 이미지 처리 기술이지만, 그 주요 목적은 이미지를 매끄럽게 하거나 선명하게 만드는 것만이 아닙니다. 동형 필터링은 영상의 명암비를 높이는 동시에 영상의 동적 범위를 압축하여 영상의 조명 조건을 개선하고 영상 품질을 향상시키는 데 주로 사용됩니다.

조명 반사 모델

동형 필터링 기술은 이미지의 조명 반사 이미징 원리를 기반으로 하는 필터링 방법입니다.

주파수 영역에서는 영상의 밝기 범위를 압축하는 동시에 대비를 향상시키는 것이 가능하며, 이는 고르지 못한 조명으로 인해 발생하는 영상에 특히 적합합니다.

관찰자 또는 이미징 시스템에 의해 획득된 이미지는 일반적으로 대상의 반사광에 따라 달라지며, 이는 ① 장면에 입사되는 가시광선의 양 ② 장면의 대상에서 반사되는 빛의 양으로 구분됩니다.

입사광의 양은 외부 조명과 관련이 있으며 반사 계수는 물체의 특성에 따라 달라집니다.

밝은 색상의 매끄러운 표면은 반사 계수가 큽니다.

어두운 색상의 거친 표면은 반사 계수가 작습니다.

알고리즘 원리

이미지는 조명 성분과 반사 성분의 곱으로 표현됩니다.

조명 구성요소는 공간에서 천천히 변화하며 저주파 구성요소가 지배합니다.

반사 성분은 공간에 있는 다양한 물체의 경계면에서 급격하게 변화하여 표면 변화와 세부 사항을 반영하며 많은 고주파 성분을 포함합니다.

조명 구성 요소와 반사 구성 요소는 서로 다른 주파수 대역에 있습니다. 로그 방법을 사용하여 곱셈을 덧셈으로 변경한 다음 이 두 부분에 대해 서로 다른 처리를 사용할 수 있습니다.

조명 성분은 저주파에 있으며, 저주파를 억제하여 조명의 불균일성을 제거할 수 있습니다. 동시에 고주파 성분을 강화하여 이미지 세부 사항을 강조할 수 있습니다.

인스턴스 처리

동시에 저주파를 줄이고 고주파를 강화하며 이미지의 동적 범위를 압축하고 다양한 부분 간의 대비를 향상시킵니다.

이미지 복원

무제한 이미지 복구

이미지 저하 과정은 변환으로 간주될 수 있습니다.

g(x,y)에서 f(x,y)를 찾는 것은 역변환을 찾는 과정입니다.

실제로 T(-1)에는 많은 상황이 있습니다.

T(-1)은 존재하지 않습니다. 즉, 단수입니다.

T(-1)이 존재하지만 고유하지 않습니다.

T(-1)은 존재하고 고유하지만 g(x, y)의 작은 섭동으로 인해 f(x, y)에 큰 변화가 발생합니다.

T(-1)은 존재하고 고유하지만 해가 너무 복잡하거나 거의 풀 수 없습니다.

T(-1)은 존재하고 고유하며 잘못된 문제가 없으며 해결 가능합니다.

선형 이동 불변 시스템의 경우 퇴화 모델의 행렬 표현에서 시작합니다.

여기서 잡음은 사전 지식이 없는 경우 f의 추정치를 구하고 최소 제곱 의미에서 다음 공식을 최소화해야 합니다.

이미지 복원을 위한 역필터링 방식

위너 필터 방식

이미지 압축

무손실 인코딩

가변 길이 인코딩

허프만 코딩

산술 코딩

고정 길이 인코딩

실행 길이 인코딩

비트 평면 인코딩

LZW 인코딩

손실 코딩

예측 코딩

변환 코딩

이미지 분할

이미지 분할 개요

분할 이유

Segmentation은 영상을 겹치지 않는 영역으로 나누어 관심 영역을 추출하는 것입니다.

상태

이미지 분할은 이미지 처리에서 이미지 분석 및 이해로 전환하는 핵심 단계이자 기본적인 컴퓨터 비전 기술이기도 합니다.

개념

모든 하위 영역의 합(합집합)에는 이미지의 모든 픽셀이 포함되어야 하며, 분할은 이미지의 각 픽셀을 특정 하위 영역으로 나누어야 합니다.

각 하위 영역은 서로 겹치지 않거나 하나의 픽셀이 동시에 두 영역에 속할 수 없습니다.

동일한 영역에 속하는 픽셀은 동일한 특성을 가져야 하며 영역 경계가 명확해야 합니다.

서로 다른 지역에 속하는 픽셀은 서로 다른 특성을 가져야 합니다.

동일한 하위 영역의 픽셀을 연결해야 합니다.

자연

지역 내: 유사성

방법: 영상 픽셀의 회색값 유사성을 바탕으로 임계값을 선택하여 유사한 회색값을 갖는 영역을 찾습니다. 영역의 외곽선이 대상 개체의 가장자리입니다.

지역 간: 불연속성

방법: 이미지 픽셀의 회색 값의 불연속성에 따라 먼저 점, 선 및 가장자리를 찾은 다음 영역을 결정합니다.

아이디어

1) 간단한 것부터 어려운 것까지 점차적으로 나눕니다.

2) 배경 환경을 제어하고 분할의 어려움을 줄입니다.

3) 관심 대상을 강화하고 관련 없는 부분의 간섭을 줄이는 데 중점을 둡니다.

방법

영역 내 회색 값의 유사성을 기반으로 하는 분할 방법 클래스입니다. 각 픽셀이 속한 영역을 결정하여 영역 지도를 형성합니다.

임계값 분할 방법

지역 성장

분할 병합

형태학적 분할

영역 간의 회색값 불연속성을 기반으로 하는 분할 방법의 클래스입니다. 모서리 기반 분할 방법은 먼저 영역 경계를 추출한 후 경계로 둘러싸인 영역을 결정합니다.

가장자리 감지 분할 방법

허프 변환

필요하다

유효성

전체

정확성

안정

임계값 세분화

임계값 분할 개요

원칙

이미지에는 다음이 포함됩니다. 둘 사이의 회색조 특성에 차이가 있습니다. 이미지의 각 픽셀의 소유권을 결정하고 최종적으로 이진 이미지를 생성합니다.

단계

적절한 분할 임계값 결정

각 픽셀 값을 임계값과 비교하여 픽셀 소유권 할당

임계값 분류

특징

계산은 간단하다

대상과 배경 사이의 대비가 강한 이미지 분할에 특히 효과적입니다.

겹치지 않는 영역은 항상 닫히고 연결된 경계로 정의할 수 있습니다.

질감, 색상 등과 같은 다른 특성으로 일반화될 수 있습니다.

히스토그램 임계값

기본 아이디어

대상과 배경 내부의 픽셀 회색조 값은 매우 유사한 반면, 접합 양쪽의 픽셀 회색조는 매우 다릅니다. 이미지의 히스토그램은 기본적으로 대상과 배경의 두 개의 단봉 히스토그램이 중첩된 것으로 간주할 수 있습니다. 배경. 대상과 배경 사이의 회색조 차이가 상대적으로 큰 경우 이미지의 히스토그램은 이중 모드여야 합니다.

임계값 선택

히스토그램 하단의 회색 값(최소값)을 임계값 T로 사용합니다.

기존 문제점 및 개선사항

잡음 간섭에 취약하므로 최소값은 원하는 임계값이 아닙니다.

개선하다

중간 위치와 같이 두 봉우리 사이에 고정된 위치를 취합니다. 피크값은 해당 지역 내부와 외부의 대표적인 값을 나타내기 때문에 일반적으로 계곡을 선택하는 것보다 신뢰도가 더 높으며 노이즈의 간섭을 제거할 수 있습니다.

히스토그램 평활화 등 노이즈 처리를 강화합니다.

최적의 임계값

질문

영상 히스토그램에는 이중 피크와 밸리 현상이 없거나, 임계값에 이중 피크와 밸리 현상이 있더라도 밸리 지점은 정확한 임계점이 아닙니다.

생각

최소 오류 확률 임계값이라고도 알려진 분할 오류 확률을 최소화합니다.

특정 방법

대상과 배경의 확률과 회색 분포 확률 밀도 함수를 설정합니다.

임계값 t가 주어지면 각 클래스의 분할 오류 확률을 찾습니다.

이 임계값 아래에서 총 분할 오류 확률 e(t)를 찾습니다.

최적 임계값 T는 전체 분할 오류 확률 e(t)의 최소값으로부터 계산됩니다.

최대 클래스 간 변동 임계값

기본 아이디어

선택된 임계값 등은 분할 대상과 배경 영역 간의 전체적인 차이를 최대화하여 어느 정도 분할 결과가 최적 수준에 도달했다고 볼 수 있습니다. 지역 간의 이러한 차이는 종종 분산으로 설명됩니다.

분산은 임계값 k의 함수입니다. k가 변경되면 영역 간 분산도 변경됩니다. 분산을 최대화하는 k를 선택합니다. 이를 최대 클래스 간 분산 임계값이라고도 합니다.

최대 클래스 간 분산 임계값을 해결하는 과정에서는 다른 매개변수를 수동으로 설정할 필요가 없으며 컴퓨터에 의해 완전히 자동으로 선택됩니다. 이는 두 지역의 분할에만 적용 가능한 것이 아니라 여러 지역의 상황에도 확장될 수 있습니다.

특정 방법

통과하다

가장자리 감지 분할

가장자리 감지 분할의 원리

가장자리 정의

회색조로 계단이나 지붕이 변경되는 이미지의 픽셀 모음입니다.

모서리 분류

가장자리 감지 분할의 원리

이미지 분할은 이미지에서 서로 다른 영역의 경계를 찾아 수행됩니다. 경계를 기반으로 한 대규모 이미지 분할 방법입니다.

1차 에지 검출 연산자

훌륭한 탐지 운영자는 세 가지 지표를 충족해야 합니다.

높은 정확도: 더 많은 실제 가장자리를 포함하고 더 적은 거짓 가장자리를 포함합니다.

높은 정확도: 감지된 가장자리는 실제 경계에 있어야 합니다.

단일 픽셀 너비: 매우 선택적이고 가장자리에 고유하게 반응합니다.

일반적으로 1차 미분의 최대값은 가장자리를 감지하는 데 사용됩니다.

그라데이션 연산자

"교차 미분 알고리즘"과 동일

기타 방향 연산자

Roberts, Prewitt 및 Sobel과 같은 연산자는 두 방향의 템플릿만 포함하며 가장자리 방향을 거의 감지할 수 없습니다. 차등 템플릿의 방향이 많을수록 더 많은 방향의 가장자리를 더 많이 감지할 수 있습니다.

키르쉬(Kirsch) 연산자

8개 방향이 45°의 끼인 각도를 형성합니다.

사용 방법: 8개의 템플릿이 각각 이미지와 컨볼루션되어 8개 방향의 회색조 변화를 감지합니다. 가장 큰 변화가 있는 방향은 가장자리의 방향입니다. 5×5 Kirsch 연산자의 처음 4개 방향 템플릿은 다음과 같습니다.

캐니 오퍼레이터

특징

문제가 있습니다: 부정확한 위치, 단일 픽셀 너비 등.

작업자가 가장자리를 감지하는 단계

가우스 필터 템플릿을 사용하여 이미지를 매끄럽게 만듭니다.

평활화된 이미지의 기울기 크기와 방향을 계산합니다.

경사 진폭에 최대 억제를 적용합니다.

그라데이션 방향의 최대값인지 확인하세요.

이중 임계값 알고리즘을 사용하여 에지를 감지하고 연결합니다.

불확실한 부분을 판단하려면 이웃 기울기를 사용하십시오.

2차 에지 검출 연산자

일반적으로 2차 미분의 영교차점은 에지 사전 위치 지정에 사용됩니다.

라플라시안

특징

이는 2차 미분이며 소음에 매우 민감합니다.

라플라시안의 크기는 이중 모서리(최소 음수 및 최대 양수)를 생성합니다.

모서리 방향을 감지할 수 없습니다(방향 템플릿 없음).

효과

가장자리 사전 위치 지정을 위해 제로 크로싱 특성을 활용합니다.

픽셀이 가장자리의 어두운 면에 있는지 아니면 밝은 면에 있는지 결정합니다.

주형

로그 연산자

2차 미분 연산자가 잡음에 민감한 문제를 극복하기 위해 먼저 영상을 평활화한 후 라플라스 연산자를 사용하여 가장자리를 검출합니다.

가장자리 연속 및 폐쇄

가장자리 연속의 목적

모서리 결합의 목적은 불연속 모서리를 연결하여 닫힌 경계를 형성하는 것입니다.

부분 연속 처리의 원리

에지 감지 결과에서 각 점(x, y)의 특성을 분석하고, 작은 이웃(3x3 또는 5x5)의 유사한 점을 모두 연결하여 공통 특성을 갖는 영역의 경계를 형성합니다.

허프 변환

문제의 진술

원칙

한 공간과 다른 공간의 이중적 관계를 이용하여 원래 공간의 문제를 이중공간으로 전환하여 해결하고, 이중공간에서는 문제가 상대적으로 단순해진다.

직선 감지

단계

준비 단계

운영단계

정점을 찾는 단계

기존 문제점 및 개선사항

질문

직선이 수직에 가까우면 기울기 q가 무한대에 가까우며 검색 범위가 매우 넓고 계산량이 많습니다.

개선하다

이미지 XY 공간은 극좌표 공간으로 변환됩니다.

특징

강력한 간섭 방지 기능이 있으며 매개변수 공간의 누적 계산은 통합 프로세스입니다.

이는 견고성이 우수하고 실제로 발견되는 매개변수 지점에서 매우 분명한 피크를 갖습니다.

자동 폐쇄: 경계 곡선의 매개변수로부터 전체 곡선을 얻을 수 있습니다.

따라서 Hough 변환을 사용하여 간섭을 제거하고 곡선 보완 및 연결을 완료할 수 있습니다.

응용 프로그램 개발

원 검출용

타원 감지용

지역 세분화

지역 성장

문제 소개

일부 분할 방법은 특정 조건을 고려하지 않습니다.

지역발전의 기본이념

지역 성장은 상향식 분할 방법입니다.

먼저 영역의 수와 해당 특성을 결정한 다음 시드를 클러스터링 센터로 사용하여 이미지에서 동일한 특성을 가진 인접한 픽셀을 영역에 계속 병합합니다. 병합 프로세스는 계속됩니다. 병합되어 최종적으로 서로 다른 특성을 갖는 영역을 형성합니다. 이 분할 방법을 영역 확장이라고도 합니다.

알고리즘 단계 및 프로세스

먼저 분할할 영역의 성장 시작점으로 시드 픽셀을 찾습니다.

유사성 기준 결정(합병 조건 충족 여부 결정)

유사성 기준에 따르면, 시드와 동일하거나 유사한 속성을 갖는 시드 픽셀 주변의 픽셀이 시드 영역으로 병합됩니다.

새로운 픽셀을 새로운 시드 픽셀로 취급하고 조건을 충족하는 픽셀이 더 이상 포함될 수 없을 때까지 위의 프로세스를 계속하여 영역의 성장을 완료합니다.

전체 이미지가 완전히 분할될 때까지 다른 영역의 성장을 완료하려면 이 방법을 따르십시오.

핵심 문제

시드 포인트 선택

가장 밝은 픽셀;

히스토그램 최대값;

클러스터 중심의 픽셀;

유사성 기준(성장 기준) 결정

지역적 회색조 차이;

지역 내 그레이스케일 분포 특성;

색상, 질감, 크기 및 모양 등

성장 정지 조건 결정

영역 성장 기준: 모든 픽셀과 시드 사이의 회색 값의 절대 차이는 65보다 작습니다.

분할 병합

문제의 진술

지역 재배는 종자, 유사성 기준 등에 의해 크게 영향을 받습니다.

분할과 병합의 아이디어

분할-병합은 하향식 분할 방법입니다.

전체 이미지에서 시작하여 단계적으로 연속적으로 분할하고, 동시에 더 이상 분할할 수 없을 때까지 동일한 특성을 갖는 인접한 영역을 병합하여 최종적으로 각 하위 영역을 얻습니다.

분할-병합 접근법

분열적인 접근 방식

분할할 영역이 개별 픽셀로 분할될 때까지 쿼드 단계로 진행됩니다.

병합의 실천

동일한 특성을 지닌 인접한 영역을 하나의 영역으로 병합합니다.

특정 작업

분할을 수행합니다.

인접한 영역을 모두 병합할 수 있는지 확인하고, 그렇다면 하나씩 병합합니다.

분할 및 병합을 더 이상 수행할 수 없을 때까지 처음 두 단계를 반복합니다.

참고: 병합 시 일반적으로 동일한 상위 노드 아래 4개 영역을 먼저 고려한 후 다른 상위 노드 아래 동일한 수준의 영역으로 확장합니다.

이미지 설명

이미지 설명의 기본 개념

이미지를 특징짓는 주요 특징

컴퓨터가 타겟을 효과적으로 식별하기 위해서는 이미지를 분할하여 타겟의 주요 속성과 타겟과 타겟 및 배경의 관계를 보다 간결하고 명확한 수치로 표현해야 합니다. , 기호 등

원본 이미지나 분할된 이미지에서 생성된 이러한 값, 기호 등을 이미지 특징이라고 합니다. 이미지 특징에는 대상에 대한 중요한 정보가 포함되어 있으며 대상의 주요 특성을 반영합니다.

내부 기능: 그레이스케일 기능, 색상 기능, 텍스처 기능...

외부 특성: 면적, 둘레, 원형도 등

이미지 설명 정의

이미지 특징을 사용하여 이미지를 표현하는 것을 이미지 설명이라고 합니다. 즉, 이미지나 장면에 있는 각 대상의 관련 특징을 나타내기 위해 숫자나 기호를 사용하거나 심지어 대상 간의 관계까지 표현하는 것이 최종 결과입니다. 대상 기능과 이들 사이의 관계.

이미지 설명 목적

대상에 대한 유용한 정보를 획득하고 대상을 기술하고 정확하게 측정하며 대상 분석 및 이해의 기반을 마련합니다.

이미지 설명의 기본 방법

단순묘사법은 영상의 기하학적인 형태적 특성을 바탕으로 서술하는 방법으로 둘레, 면적, 위치, 방향, 직사각형 등이 주로 사용된다.

경계 기술 방법: 영상을 분할하거나 가장자리 검출 알고리즘을 사용하여 대상 영역의 경계점 집합을 얻은 후 이러한 경계점을 구성하여 경계선을 형성해야 하며 이 방법에는 주로 체인 코드 방법이 포함됩니다. 그리고 푸리에 설명 방법이 있습니다.

지역적 기술 방법은 불변 순간 기술 방법과 같이 이미지 내의 계조, 색상, 질감 및 기타 특징을 기반으로 이미지를 기술하는 방법입니다.

간단한 설명

둘레 설명

경계 정의: 지역의 경계 길이.

둘레의 역할: 단순한 모양의 물체는 상대적으로 짧은 둘레를 사용하여 자신이 차지하는 영역을 둘러쌀 수 있으므로 둘레를 사용하여 모양이 단순한 물체와 복잡한 물체를 구별할 수 있습니다.

둘레를 설명하는 데 일반적으로 사용되는 방법

영역과 배경 사이의 경계선(간격)의 길이

픽셀은 단위 면적당 작은 정사각형으로 간주되며 영역과 배경 모두 작은 정사각형으로 구성됩니다. 둘레는 영역과 배경 사이의 간격(접합선)의 길이입니다.

즉, 둘레 p = 교차선의 길이

경계점 수

경계 픽셀의 개수, 즉 경계점의 개수로 표현

즉, 둘레 p = 경계점 수

지역 설명

영역 설명 정의: 영역의 픽셀 수입니다.

영역의 역할: 영역의 크기를 설명하는 영역의 가장 기본적인 특성입니다.

이미지 f(x,y)의 크기가 M×N이라고 가정합니다. 이진 이미지의 경우 1은 대상을 나타내고 0은 배경을 나타냅니다. 대상 영역을 찾으려면 f(x,y)로 픽셀 수를 계산해야 합니다. )=1이면 면적은 다음과 같습니다.

대상 위치 설명

대상에는 일정한 영역이 있으므로 영상에서 대상의 위치를 정의할 필요가 있으며, 일반적으로 해당 영역의 중심점을 대상 위치로 정의합니다.

영역 중심은 그래픽의 중심을 의미합니다. 이미지 품질이 고르게 분포된 경우 중심이 중심입니다.

M×N 크기의 이진 이미지 f(x,y)에 대해 1이 대상을 나타내고 0이 배경을 나타내는 경우 대상의 중심 좌표는 다음과 같습니다.

목표 방향 설명

이미지에서 대상의 위치를 결정한 후에는 대상의 방향도 결정해야 합니다.

목표 방향은 목표 위의 모든 점에서 목표 방향인 직선까지의 거리의 최소 제곱합을 구하여 결정할 수 있습니다.

대상 직사각형 설명

직사각형은 대상이 외접 직사각형을 채우는 정도를 반영하며 대상의 면적과 가장 작은 외접 직사각형의 면적의 비율로 설명할 수 있습니다.

Ao는 대상의 면적이고 AMER는 가장 작은 둘러싸는 직사각형의 면적입니다. R 값은 0과 1 사이입니다.

대상이 직사각형인 경우 R은 최대값 1을 취하고, 대상이 원인 경우 R 값은 가늘고 구부러진 대상의 경우 R 값이 작아지고 0에 가까워집니다.

체인코드 설명방법

체인코드 정의

체인 코드(Chain Code)는 경계 방향을 인코딩의 기준으로 삼는 경계 인코딩의 표현 방식이다. 단순화를 위해 일반적으로 경계점 세트를 설명합니다.

체인코드 방법

인코딩 방법에는 4체인 코드와 8체인 코드 두 가지가 있습니다. 구체적인 방법: 시작점에서 시작하여 경계를 따라 코딩하고 시작점으로 돌아올 때까지 코딩을 종료합니다.

각 경계 세그먼트에 방향 코드 제공

시작점을 선택하고 시작점부터 시작하여 시작점으로 돌아올 때까지 경계선을 따라 인코딩하여 인코딩을 종료합니다.

시작점: 빨간 점

방향: 시계방향

4-체인 코드: 000033333322222211110011

실시예 2

시작점 s의 좌표를 (5,5)로 하고, 4방향 체인코드와 8방향 체인코드를 반시계방향으로 사용하여 영역경계를 표현한다.

4방향 체인 코드: (5,5)111232323000

8방향 체인 코드: (5,5)2224556000

문제가 있습니다

시작점이 다르면 코딩도 달라집니다

회전으로 인해 인코딩 차이가 발생함

개선 방법

정규화는 시작점 문제를 해결합니다. 체인 코드가 처음부터 끝까지 연결되어 있으면 체인 코드가 실제로 방향 인코딩의 순환 시퀀스임을 알 수 있습니다. 따라서, 체인 코드의 정규화를 달성하기 위해 결과 코딩 시퀀스의 정수 값을 최소화하도록 시작점을 선택할 수 있습니다.

1차 차이는 회전 문제를 해결합니다. 체인 코드의 1차 차이를 사용하여 원래 코드를 대체하면 회전 불변성을 갖습니다. 즉, 같은 모양의 영역을 다른 각도로 회전시키면 그 체인 코드는 다르지만, 각 체인 코드의 1차 차이 코드는 동일하다는 특성은 영상 인식에 특히 효과적입니다.

체인 코드의 1차 차분과 정규화는 시작점과 회전 불변성을 가질 수 있습니다.

푸리에 기술 방법

기본 아이디어

포인트 세트로 구성된 경계가 확인되면 경계를 이용하여 대상의 형상을 식별할 수 있습니다.

프로세스

M의 선택과 디스크립터 사이의 관계

사용가치

더 적은 수의 푸리에 설명자를 사용하면 경계 본질의 전체 윤곽을 얻을 수 있습니다.

경계 정보가 포함된 이러한 설명자는 상당히 다른 경계를 구별하는 데 사용될 수 있습니다.

특징

2차원 문제가 1차원이 되다

기하학적 변환에 불변하도록 개선 및 조정되었습니다.

정의에서 시작점 선택, 이동, 회전 및 크기 조정이 모두 원래 경계 시퀀스에 영향을 미쳐 푸리에 변환 후 결과에 영향을 미친다는 것을 알 수 있습니다.

푸리에 설명자는 기하학적 변환에 불변하도록 개선 및 조정될 수 있습니다. 구체적인 방법은 다음과 같습니다. 1) 시작점의 변경 및 회전은 진폭이 아닌 F(u)의 위상에만 영향을 미치므로 무시할 수 있습니다. 2) 변환은 DC를 제거하여 제거할 수 있는 F(u)의 DC 구성 요소에 영향을 미칩니다. 3) 스케일 변화는 F(u)의 전체 확대 또는 축소를 유발하며, 이는 최대 계수로 나누어 정규화함으로써 제거될 수 있습니다. 위의 처리를 거쳐 최종 푸리에 리프는 기하학적 변환의 불변성을 갖게 됩니다.

순간 설명 방법

기본 아이디어

어떤 경우에는 이미지에서 대상 영역의 회색 분포가 알려진 경우 순간 설명을 사용하여 대상을 특성화할 수 있습니다.

순간 설명 특성

경계를 알 필요는 없으며 분할된 영역 내부 픽셀의 회색조 조건만 알면 됩니다.

순간

중심 거리

불변의 순간