ログイン
サインイン

マインドマップギャラリーコンピュータビジョンデジタル画像処理

コンピュータビジョンデジタル画像処理

デジタル画像処理、画像復元、画像の前処理には、画像圧縮、画像セグメンテーションなどがよく使用されます。お役に立てれば！

2024-02-04 00:54:17 に編集されました

PlotWizard

最近の作品その他の作品を表示>>

The Crown Royal Family Tree
Explore the intricate lineage of the Crown Royal Family Tree, showcasing the House of Windsor and its notable members. From Queen Elizabeth II and Prince Philip's legacy to their childrenKing Charles III, Princess Anne, Prince Andrew, and Prince Edwarddiscover the marriages and offspring that shape the modern monarchy. Notable branches include the heir apparent, Prince William, and his brother, Prince Harry, alongside their families. Delve into Prince Philip's roots in the House of Glücksburg, connecting British royalty to Denmark and Greece. Join us in tracing this remarkable royal heritage!
How to Use OpenClaw
This is a panoramic infographic—currently sweeping across the web—illustrating the comprehensive applications of OpenClaw, a popular open-source AI agent platform. It systematically introduces this intelligent agent framework—affectionately dubbed "Lobster Farming"—helping readers quickly grasp its core value, technical features, application scenarios, and security protocols. It serves as an excellent introductory guide and practical manual.
一圖瞭解“養龍蝦”
這是一張最近風靡全網關於熱門開源AI代理平台OpenClaw的全網應用全景圖解。它系統性地介紹了這款被稱為「養龍蝦」的智慧體框架，幫助讀者快速理解其核心價值、技術特性、應用場景及安全規範，是一份極佳的入門指南與實操手冊。此圖主要針對希望利用AI建構自動化工作流程的技術從業人員、中小企業主及效率追求者，透過9大模組層層遞進，全面剖析了OpenClaw從概念到落地的整個過程。圖中核心內容首先釐清了「養龍蝦」指涉的是OpenClawd開源智能體，並強調其本質是「AI基建」而非一般聊天機器人。隨後詳細比較其與傳統AI助理的區別，擁有記憶管理、權限控制、會話隔離和異常恢復四大基礎能力，支援跨平台存取和多模型相容（如GPT、Claude、Ollama）。同時，圖解提供了完整的部署方案（雲端/本地/Docker），並列舉了辦公室自動化、內容創作、資料收集等五大應用程式場景。此外，還展示了其火爆程度、政府與大廠佈局、安全部署建議及適合/不適合的人群分類。幫助你快速掌握OpenClaw技術架構與應用價值，指導個人或企業建構AI自動化系統，規避資料外洩與權限失控風險，是學習「執行式AI」轉型的權威參考圖譜。

コンピュータビジョンデジタル画像処理

PlotWizard

最近の作品その他の作品を表示>>

おすすめ
アウトライン

タスク 2.9 マスクの役割を理解する
- 20
PlotWizard
完全に接続されたニューラルネットワーク
- 11
WSUJfrxa
畳み込みニューラルネットワーク
- 9
WSUJfrxa
注意メカニズム
- 11
WSUJfrxa
モデルの生成
- 5
WSUJfrxa
コンボリューション、ノイズ除去、エッジ抽出
- 5
WSUJfrxa
古典的なネットワーク分析
- 13
WSUJfrxa
コンピュータービジョンとディープラーニング
- 8
WSUJfrxa
主要な深層学習モデル
- 14
Mason·Carter
BEVのセンシング方向の学習シーケンス
- 19
21_ethanSawyer

デジタル画像処理

デジタル画像処理の基礎知識

導入

「画像」とは、物体によって反射または透過される光の分布であり、「イメージ」とは、人間の視覚系によって受け入れられる画像によって人間の脳に形成される印象または理解です。

画像とは視覚効果を持った絵のことで、さまざまなグラフィックや画像の総称です。

映像に含まれる情報量は膨大で、「百聞は一見に如かず」「一目でよくわかる」。

画像は数学的に次のように説明できます。

I=f(x, y, z, λ, t)

ここで、x、y、z は空間座標、λ は波長、t は時間、I は光の強度です。

静止画像の場合、t は一定です。モノクロ画像の場合、λ は定数です。平面画像の場合、z は一定です。

光波: 人間の知覚は電磁スペクトルの視覚帯域に限定されていますが、画像処理装置は電磁スペクトルのほぼ全体をカバーできます。

画像のデジタル化

デジタル画像

アナログ画像は数字で表され、数字で表された画像はデジタル画像です。

アナログ画像を離散化してデジタル画像を取得するプロセスは、画像デジタル化と呼ばれます。

プロセス

サンプリング

画像を空間的に小さな領域 (ピクセル) に分割し、各ピクセルは 2 次元座標 (整数) を持ちます。

影響

定量化する

各ピクセルの明るさまたはグレー値は、対応するグレーレベルにマッピングされ、各グレーレベルは一般に整数で表されます。

量子化されたグレースケールレベルの数 L=256 の場合、値の範囲は 0 ～ 255 の整数であり、8 ビットを使用してグレースケール画像ピクセルのグレースケール値を表すことができます。これは 8 ビット量子化と呼ばれます。

デジタル画像表現

数学的表現

バイナリ画像

グレースケール画像

RGB画像

画像の保存形式

BMP 形式: Windows システム用のビットマップファイル

GIF形式：複数の画像（アニメーション）を保存可能

TIF(F)形式：OSやFSに依存せず、交換が容易

JPEG形式：圧縮規格

画像の基本的なプロパティ

画像のピクセル数

画像のピクセル数とは、ビットマップ画像に含まれる水平方向と垂直方向のピクセル数を指します。単純に画素数を増やすだけでは画像の表示効果を向上させることはできません。画像の表示効果はディスプレイの画素数と解像度によって決まります。

画像解像度

画像解像度は、単位印刷長さあたりの画像内に分布するピクセル数を指し、主にデジタル画像情報の密度を特徴付けるために使用され、画像の鮮明さを決定します。単位サイズの領域では、画像の解像度が高くなるほど、画像に含まれるピクセルの数が増え、ピクセルの密度が高まり、デジタル画像の鮮明度が高くなります。

画像サイズ

画像サイズによって、画像ファイルの保存に必要な記憶領域が決まります。計算式は、通常、バイト (B) 単位で測定されます。バイト数 = (ビットマップの高さ × ビットマップの幅 × 画像の深さ) / 8 です。計算式から、画像ファイルの保存サイズはピクセル数に直接関係していることがわかります。

イメージカラー

画像の色とは、デジタル画像内で可能な最大数の色の種類を指し、赤、緑、青の 3 つの原色の比率を変更することで、任意の色に簡単に混合できます。

画像の深さ

画像深度は、画像のビット深度とも呼ばれ、画像内の各ピクセルが占めるビット数を指します。画像の各ピクセルに対応するデータは、通常、1 バイト以上で表すことができ、データ深度が深くなるほど、より多くのビットが必要になり、対応する色の表現がより豊富になります。

イメージトーン

画像の色相とは、原色に対応するさまざまな画像の色の明暗を指します（たとえば、RGB 形式のデジタル画像の原色には、赤、緑、青が含まれます）。日常生活における色相の調整は、色相の調整です。原色の明るさ。色相の範囲は 0 ～ 255 で、合計 256 個の色相が含まれます。たとえば、最も単純なグレースケールイメージは、色相を白から黒までの 256 個の色相に分割します。 RGB画像では、赤、緑、青の3色の明暗を特徴づける必要があり、例えば赤の色調を濃くすると赤っぽい画像になり、緑の色調を濃くすると赤味が強くなる傾向があります。深くすると、画像は濃い緑色になる傾向があります。

画像の彩度

画像の彩度は、画像内の色の純度を示します。自然風景の写真の彩度は、オブジェクトの反射または投影の特性によって異なります。デジタル画像処理では、彩度は通常、単色に混ざる白色光の割合によって測定され、単色に混ざる白色光が多いほど彩度は低くなり、逆に彩度は高くなります。

画像の明るさ

画像の明るさは、デジタル画像に含まれる色の明るさと暗さを指します。値の範囲は通常 0% ～ 100% です。

画像のコントラスト

画像のコントラストとは、画像内の異なる色のコントラスト、または画像内の明暗のコントラストを指します。コントラストが大きいほど、色の間の明るさの違い、または黒と白の違いが大きくなります。たとえば、グレースケール画像のコントラストを高めると、画像内の黒と白の違いがより明確になり、画像がより鮮明に見えます。コントラストを極限まで高めると、グレースケール画像が白黒画像になります。

画像階層

コンピュータのデザインシステムでは、画像素材をより便利かつ効果的に処理するために、通常、画像素材は異なるレイヤーに配置され、画像は複数の画像が重ね合わされて構成されているとみなすことができます。画像処理ソフトウェアを使用すると、他のレイヤーの画像内容に影響を与えることなく、各レイヤーを独立して処理できます。新しい画像ファイルを作成すると、システムはその背景レイヤーを自動的に作成します。これは、他の画像処理作業を実行できるキャンバスに相当します。画像に複数のレイヤーがある場合、各レイヤーのピクセル数、チャネル数、形式は同じになります。

ピクセル間の基本的な関係

基本的な関係

画像 f(x,y) は、ピクセル間の距離だけでなく、ピクセルの近傍、隣接関係、接続など、ピクセル間に特定の接続が存在します。通常、特定のピクセルを指定する場合は、小文字 (p など) が使用されます。

エリア

ピクセル p の隣接ピクセルは、このピクセルの近傍を形成します。

4つのエリア

8エリア

対角線フィールド

隣接

任意の 2 つのピクセルについて、1 つのピクセルが別のピクセルの近傍にあり、それらのグレースケール値が特定の類似性基準 (特定のグレースケール値セットに属するなど) を満たす場合、その 2 つのピクセルは隣接していると言われます。

4 つの隣接関係

8 つの隣接関係

m隣

以下の2つの条件のうちどちらかが満たされた場合

q は p の 4 近傍にあります

q は p の対角ドメイン内にあり、q の 4 ドメイン近傍と p の 4 ドメインドメインの交点にあるピクセルにはグレー値が V に属しません。

このとき、2 つの点 p と q は m 個に隣接していると言われます。

接続されています

4接続

8接続

m接続

距離

ユークリッド距離

都市間距離

ボードの距離

デジタル画像処理アプリケーション

産業用途

ガラス瓶の検査など、生産ラインで生産される製品や部品の非破壊検査

公安アプリケーション

指紋認証は安全で信頼性が高く、効率的であり、公安、情報セキュリティ、電子商取引などの分野で幅広い用途に使用されています。

個人認証には、顔、虹彩、掌紋、署名などの画像も含まれます。

医療用途

定期的な血液検査の主な内容である血球数は、病気の有無や病気の重症度を知るための重要なデータです。

地質学的応用

ボーリング孔カメラ技術は、孔壁の大規模なパノラマビューを取得し、内部の地質構造を直接観察することができます。

環境試験用途

火災の識別と位置: 可視光画像と赤外線画像を照合して火災を識別し、その位置を特定します。

海洋用途

Enteromorpha Enteromorpha 検出: リモートセンシング画像をデータソースとして使用し、Enteromorpha Enteromorpha の迅速な検出を実現します。

海水魚の検出と追跡。

軍事用途

航空偵察目標の位置決め。

エンターテイメントアプリケーション

顔を変える

画像工学

画像処理

画像 -> 画像

視覚効果の向上

ノイズ低減、コントラスト強調、画像鮮明化のための画像前処理

画像収集、取得および保存、画像強調、画像復元、画像（ビデオ）圧縮（エンコード）

画像解析

画像 -> データ

有益な情報を抽出する

画像のセグメンテーションとターゲットの説明、出力はターゲットの特徴データです

エッジ検出、画像セグメンテーション（対象背景の分離）、対象の表情、表現、計測、対象の色、形状、質感、動きの解析、対象の検出、抽出、追跡、識別・分類、顔認識

イメージ理解

画像→説明

ターゲットオブジェクトとその関係を理解すると、より抽象的なデータが出力されます

画像の登録、マッチング、融合、3 次元表現、モデリング、再構成、シーン復元、画像理解、推論、コンテンツベースの画像検索

画像の数学的変換

座標空間変換

基本的な考え方

幾何学的変換は、ゴムフィルム変換と呼ばれることがよくあります。これは、画像がゴムフィルム上に印刷され、ゴムフィルムが所定の規則に従って引き伸ばされると想定されています。

幾何学的変換は、画像内のピクセル間の空間関係を変更します。これは、座標の空間変換 (座標変換) と、変換された座標ピクセルのグレースケール値 (グレースケール補間) の 2 つの基本操作で構成されます。

座標変換

元の画像を両方向に半分に縮小します

アフィン変換

画像処理でよく使われる座標変換はアフィン変換です

アイデンティティ変換

翻訳変換

回転変換

スケール変換

せん断変形

X軸に沿ってカットします

Y軸に沿ってカットする

前方マッピングと後方マッピング

順方向マッピング: 画像上の任意のピクセルの座標が与えられると、対応するマッピング関係を通じて幾何学的変換後のピクセル座標位置が取得されます。

バックワードマッピング: 出力画像のピクセル座標からソース画像のピクセルの座標位置を計算します。

グレースケール補間

基本的な考え方

画像上のピクセルを新しい位置に再配置するには、これらの新しい位置にグレースケール値を割り当てる必要があります (つまり、グレースケール補間)。

タイプ

最近傍補間

マッピングされる位置に最も近い入力ピクセルのグレー値が補間結果として選択されます。

短所: 隣接するピクセルのグレー値が大きく変化すると、その微細な構造が粗くなります。

双一次補間

隣接する 4 つの点のグレー値に応じて、x 方向と y 方向に 2 回補間が実行されます。補間関数は双曲放物面方程式です。

これは最近傍法を改良したもので、双曲放物面を 4 つの隣接する既知の点に当てはめます。

短所: 双一次補間計算法は、隣接する 4 点の影響を考慮しているため、一般に良好な結果が得られます。ただし、この方法にはローパスフィルター特性があるため、高周波成分が失われ、画像の輪郭がぼやけてしまいます。より正確なグレースケール補間効果を得たい場合は、高次の補間補正を使用できます。

バイキュービック補間

隣接する 16 点のグレー値に基づいて補間します

フーリエ変換

周波数領域画像処理の基本手順

フーリエ変換

画像をフーリエ変換します。これは、波を取得するのではなく、画像を空間領域 (つまり、元のピクセル表現) から周波数領域に変換します。周波数領域では、画像は異なる周波数の波の一連の組み合わせとして表されます。この変換により、低周波成分 (滑らかな領域など、画像のゆっくりと変化する部分を表す) や高周波成分 (エッジなどの急速に変化する部分を表す) を含む、画像内のさまざまな周波数成分の分布を確認できるようになります。と詳細）。

周波数領域フィルタリング

周波数ドメインでは、画像に高周波フィルターまたは低周波フィルターを適用することを選択できます。

詳細については、「画像強化のための周波数ドメインフィルタリング」を参照してください。

逆フーリエ変換

フィルタリングされた周波数領域データは、逆フーリエ変換によって空間領域に変換されます。この逆変換の結果は、周波数領域フィルタリングの効果を反映する修正された画像です。

フーリエ級数とフーリエ変換

特定の数学的条件を満たすと、あらゆる周期関数は、異なる周波数の正弦波の合計として表現できます。

特定の数学的条件が満たされる場合、非周期関数は、重み付き関数を乗算したサインの積分、つまりフーリエ変換として表すこともできます。

フーリエ級数やフーリエ変換で表される関数特性は、逆フーリエ変換によって情報を失うことなく完全に復元できます。

1次元離散フーリエ変換

2次元離散フーリエ変換

2次元フーリエ変換後のグレースケール画像のスペクトログラムでは、最も明るい部分が元画像の低周波成分に相当します。

低周波コンポーネント: これらのコンポーネントは、全体的なグレーレベルの変化や滑らかな領域など、画像のゆっくりと変化する部分を表します。フーリエスペクトログラムでは、通常、低周波成分が画像の中央領域に集中します。

高周波成分: これらの成分は、エッジや細部など、画像の急速に変化する部分を表します。スペクトログラムでは、通常、高周波成分は中心点から遠く離れたところに位置します。

離散フーリエ変換の基本特性

分離性

翻訳的な

周期的な

共役対称性

回転不変性

比例性

平均値

畳み込み定理

画像補正

画像補正の基本概念

画像拡張プロパティ

画像劣化の原因を深く掘り下げることなく、画像の特性と処理目的に基づいて補正を行い、より良い「より良い」またはより「有用な」画像を取得します。

画像強調とは、特定のアプリケーション目的のために画質を向上させることであり、処理結果は人間の視覚特性や機械認識システムにより適したものになります。

特定のニーズに応じて画像内の特定の情報を強調し、同時に特定の不要な情報を弱めたり削除したりする処理方法。

強調処理は元の画像の情報を増やすことはできず、特定の情報の認識能力を向上させるだけであり、この処理により他の情報が部分的に失われる可能性があります。

基本的な方法

操作する

空間領域法

空間ドメイン法とは、画像空間ドメイン内のピクセルのグレースケール値に対して直接操作を実行することを指し、一般的に使用される方法には、グレースケール変換、ヒストグラム補正、テンプレート畳み込み、擬似カラー処理などが含まれます。

周波数領域法

周波数領域法は、画像の特定の変換領域で画像の変換値を強化し、逆変換を通じて強化された画像を取得する間接的な処理方法です。

目的

スムーズ

スムージングは画像にぼかし効果を与え、画像の遷移を自然で柔らかくし、ノイズを抑制します。

スムージングは、画像の周波数特性に基づいて周波数の観点から理解され、画像の低周波成分を維持または強調し、画像の高周波成分を弱めまたは除去することです。

研ぐ

シャープ化は、スムージングの逆の操作と見なすことができます。その効果と目的は、細部を強調し、画像の輪郭を明確でコントラストのあるものにすることです。

周波数領域処理の観点から見ると、シャープ化とは、画像内の高周波成分を強調することです。

効果

画像の周波数特性分析によると、画像全体のコントラストとダイナミックレンジは画像情報の低周波部分（画像全体を指します）に依存し、エッジの輪郭や局所的な詳細は画像情報の低周波部分に依存すると一般に考えられています。画像の高周波部分に依存します。

したがって、画像処理には 2 次元デジタルフィルタリング手法が使用されます。たとえば、ハイパスフィルタを使用するとエッジの輪郭や画像の詳細を強調することができ、ローパスフィルタを使用すると画像を滑らかにしてノイズを低減できます。

アプリケーションのレビュー

かなり主観的

実際のアプリケーションでは、テスト用に複数の拡張アルゴリズムを同時に選択でき、より優れた視覚効果、比較的小さい計算量、およびアプリケーション要件への準拠を備えたアルゴリズムを選択できます。

グレースケール変換

グレースケールマッピングの原理

グレースケールマッピングは画像ピクセルに基づく点操作です

拡張目的に応じて特定のマッピングルールを設計し、対応するマッピング関数で表現します

マッピング機能を使用して、元の画像の各ピクセルのグレースケールを新しいグレースケールにマッピングできます。

t=T(s)

タイプ

画像反転

グレースケール値が反転し、黒が白になります

画像反転操作は、画像内の低グレー領域を強調して、明るくしたり目立つようにするためによく使用されます。

画像の本体がグレースケールで明るい場合、反転操作により本体が暗くなる場合があります。

明るいグレースケールで画像の被写体を強調するには、ヒストグラム等化やコントラスト強調など、他の画像強調技術を使用することが必要になることがよくあります。反転操作は、画像内の暗い細部を強調する場合により適しています。

コントラストを強調する

画像の各部分のコントラストを強化し、画像内の 2 つのグレー値の間のダイナミックレンジを実際に増加させます。

ダイナミックレンジ圧縮

逆に、元の画像のダイナミックレンジが大きすぎて、一部の表示デバイスの許容ダイナミックレンジを超える場合があります。この場合、元の画像をそのまま使用すると、一部のディテールが失われる可能性があります。

関数変換によるグレースケール分布の変更

数学関数を適用して、画像内の各ピクセルのグレースケール値を調整します。

線形変換

非線形変換

s=cr^γ

左上は元の画像です。c=1、Y はそれぞれ 3.0、4.0、5.0 です。

ヒストグラム

ヒストグラムの定義

グレースケールヒストグラムは、画像のグレースケール分布を表す統計グラフです。

横軸は一般に r で表されるグレーレベル、縦軸はこのグレーレベルを持つピクセルの数、またはこのグレーレベルが現れる確率です。

ヒストグラムの性質

画像はヒストグラムに対応しますが、ヒストグラムは必ずしも 1 つの画像のみに対応するとは限りません。

ヒストグラムは、グレースケールピクセルの発生確率をカウントすることしかできず、画像内のピクセルの位置を反映することはできません。

ヒストグラム等化は主に画像の全体的なコントラストを向上させるために使用され、スムージングとシャープ化はそれぞれ画像の局所的なコントラストと詳細を減少および増加させるために使用されます。

一部の特殊なケースでは、ヒストグラム等化によってコントラストが大幅に変化しない場合や、コントラストがわずかに低下する場合もあります。

すでに均一なヒストグラム: 画像のヒストグラムがすでに均一に分布している場合、または輝度分布が均一分布に非常に近い場合は、ヒストグラム等化を実行してもコントラストが変わらない可能性があります。

特殊な輝度分布: 一部の特殊な輝度分布状況では、ヒストグラム均等化により一部の領域でディテールが失われ、これらの領域のコントラストが低下する可能性があります。

輝度値の極端な集中: 画像内のピクセルの大部分が輝度範囲の端 (非常に明るいまたは非常に暗い) に集中している場合、ヒストグラムの均等化によってこれらの領域のコントラストが低下する可能性があります。

ヒストグラムと画像のグレースケール分布

ヒストグラムの等化

画像のグレースケール分布は、グレースケール範囲全体を最大限に活用し、各グレースケールレベルのピクセル数がほぼ均等に分布している必要があります。

これは、出力画像のヒストグラムが可能な限り均一に分布するように画像のヒストグラムを調整することで実現され、それによって画像内の輝度分布がより均一になります。

スムージングやシャープ化を行わない

ヒストグラム仕様

グレーは元のヒストグラムを均等化します

必要なヒストグラムを指定し、指定されたヒストグラムを等化する変換を計算します。

元のヒストグラムを指定されたヒストグラムにマッピングします

比較した

画像間の操作

算術演算

加算演算

C(x,y)=A(x,y) B(x,y)

M 個の画像の平均は次のように定義されます。

g(x,y)=1/M(g0(x,y) g1(x,y) … gM(x,y))

応用

「付加的な」ランダムノイズを除去する

画像オーバーレイ効果を生成する

引き算

C(x,y) = A(x,y) - B(x,y)

応用

背景の影響を排除する

差分シャドウ法

異なる時間に撮影された同じシーンの画像、または異なる波長帯の同じシーンの画像を差し引いて、同じシーンの 2 つの画像間の変化を検出します。

動的モニタリング、移動ターゲットの検出と追跡、画像の背景除去とターゲット認識などのガイドに使用できます。

乗算

C(x,y) = A(x,y) * B(x,y)

応用

画像の部分表示

除算演算

C(x,y) = A(x,y)/ B(x,y)

応用

リモートセンシングの画像処理でよく使われる

論理演算

バイナリ (0 および 1) イメージでのみ使用可能

分類

AND (AND): p AND q と書きます (p・q または pq と書くこともできます)

または (OR): p OR q と書きます (p q と書くこともできます)

COMPLEMENT (COMPLEMENT、否定または否とも呼ばれることが多い): NOT q と書かれます ( と書くこともできます)

空間フィルタリング

空間領域フィルタリングはピクセルに直接作用しますが、周波数領域フィルタリングは画像の周波数成分に作用します。

画像空間でのテンプレートを使用した近傍演算

カテゴリー1

線形: 近傍平均法

基本的

最も基本的な画像平滑化アルゴリズム

平滑化は空間領域または周波数領域で実行できます。

画像内の各ピクセルを中心としてそのドメイン R を取得し、近傍のすべてのピクセルのグレースケール加重平均を中心ピクセルの出力として計算します。

主効果

ノイズを除去または低減し、画質を向上させます。

画像をぼかして柔らかく自然に見せます

実装プロセス

通常、テンプレートの畳み込み演算を使用して実装されます。

具体的な手順

テンプレートを画像内で左から右、上から下にスライドすると、テンプレート内の各位置ポイントが画像内の特定のピクセルと一致します。

テンプレートの各位置の係数に、一致するピクセルのグレー値を掛けます。

すべての積を合計します。

加算結果をテンプレートの中心に対応するピクセルに割り当てます。

テンプレートフォーム

特徴

一般に係数の分布パターンは中央が大きく、周囲が小さくなります。

係数の合計は 1 に等しいため、画像処理の前後で全体のグレーレベルが変わらないことが保証されます。

エッジをより良く維持するために、十字型、直線型などのテンプレートを使用することもできます。

非線形性: メディアンフィルタリング

アルゴリズム原理

奇数のピクセルを含むウィンドウを使用して画像内をスライドし、ウィンドウの中心点のグレー値をウィンドウ内の各点のグレー値の中央値に置き換えます。

アルゴリズムの特徴

非線形処理技術です

メディアンフィルタリングは、近傍平均法と比較して、線形フィルタによる画像の細部のぼやけをある程度克服することができ、特にパルス干渉や画像スキャンノイズに対して効果的です。ノイズを除去しながら、エッジと画像の詳細の鮮明さをより適切に維持できます。

画像のエッジでは、グレーレベルが段階的または傾斜的に変化することがよくありますが、メディアンフィルターを使用すると、ぼやけることなくグレーレベルを適切に維持できます。

一般に、メディアンフィルタリングでは、ノイズをフィルタリングしながら画像のエッジを適切に維持できますが、線形平均フィルタリングではこれを達成するのは困難です。

さらに、フィルタリングの効果はウィンドウのサイズに関係します。メディアンフィルタリングを有効に活用するには、ウィンドウサイズを適切に選択することが重要です。

画像のコントラストは向上しません

カテゴリー2

スムーズ

近傍平均法

メディアンフィルター

研ぐ

基本的な考え方

目的: 画像内のシーンの詳細なエッジと輪郭を強調します。

機能: グレースケールのコントラストを強調します。

基本: エッジと輪郭はグレー値の突然変異が発生する場所に位置するため、微分演算はグレー値の変化率を見つけることであるため、鮮明化アルゴリズムは微分 (差分) 演算に基づいています。

演算子: 要素 (または要素のセット) を別の要素 (または要素のセット) にマップする規則または関数を記述するために、数学および物理学で広く使用されている概念です。演算子は、加算や乗算などの単純な数学演算の場合もあれば、微分、積分、線形変換などのより複雑な演算の場合もあります。

微分曲線

方法

勾配法

ラプラシアン法

方向性フィルタリング

線形鮮鋭化フィルター

線形変換に属する

アルゴリズムのアイデア

画像の鮮明化は、スムージングの逆の操作と見なすことができます。その目的は、画像の細部とエッジを強調し、画像のぼけを取り除くことです。

シャープネスの目的を達成するには、強調する必要がある画像の詳細情報を抽出して、それを強調することができます。

空間平滑化の本質は、画像に対して局所的な平均化を実行することであり、これは積分演算であるため、画像の鮮明化は積分の逆演算、つまり「微分」を使用して実現できます。

微分演算とは、信号の変化率を求めることです。変化が速い場所は、画像の細部とエッジです。微分結果を元の画像に一定の割合で加算することで、画像の輪郭を鮮明にし、細部を際立たせることができます。

一階微分演算子

2次元一階微分演算子

勾配を求めるための 2 つの差分演算

水平垂直差

クロスディファレンス

一方向一次微分アルゴリズム

コンセプト

一方向一次微分アルゴリズムとは、特定の方向のエッジ情報を与えることを指します。

画像は水平方向と垂直方向で構成されます。したがって、一方向微分アルゴリズムは実際には水平方向または垂直方向に鮮明化します。

分類

水平シャープ化アルゴリズム

水平シャープ化は非常にシンプルで、水平方向のピクセル値の変化を検出できるテンプレートによって実現されます。

垂直シャープ化アルゴリズム

これは、垂直方向のピクセル値の変化を検出できるテンプレートによって実現されます。

相互微分アルゴリズム

計算結果にゼロ未満のピクセル値が表示されます。

解決策: 簡単なマッピングを作成できます。

[gmin,gmax]→[0,255]

2階微分演算子

式

オペレーター

ラプラシアン演算子

ラプラシアン変形演算子

ログ演算子

犬操縦士

1次微分と2次微分のエッジ抽出効果の比較

Sobel オペレーターによって取得された境界は、比較的大まかな境界であり、境界情報は少ないですが、比較的明確です。

ラプラシアン演算子により得られる境界は、比較的詳細な境界である。境界には多くの詳細が含まれていますが、あまり明確ではありません。

周波数領域フィルタリング

ローパスフィルタ

原理

高周波と低周波

低周波成分: 低周波成分は、画像内のゆっくりとした空間変化を表します。つまり、画像のそれらの領域では、ピクセル値 (明るさまたは色のいずれか) がゆっくりと変化します。これは通常、穏やかな空、壁、またはテクスチャやエッジがあまりない部分など、画像内の大きくて均一な領域に対応します。低周波成分は、背景の明るさ、色のグラデーションなど、画像内の全体的な情報に関連します。

高周波成分: 高周波成分は、画像内の急速な空間変化を表します。つまり、画像のこれらの領域では、ピクセル値が急速に変化します。これは通常、エッジ、テクスチャ、パターン、ノイズなどの画像の詳細な部分に対応します。高周波成分により、オブジェクトの輪郭やテクスチャの詳細など、画像内の局所的な特徴が明らかになります。

周波数領域フィルタリングを使用すると、画像の特定の内容を選択的に強調または抑制することができます。ローパスフィルターを使用して高周波成分を削減し、画像を滑らかにすることができます。

スムースに属します

ローパスフィルタ

理想ローパスフィルター (ILPF)

D0 はフィルターのカットオフ周波数であり、負ではない量です。

D(u,v) は周波数平面上の点 (u,v) から原点までの距離です。

ローパスフィルタリングにより高周波成分が低減され、ノイズや画像のエッジが弱まり、画像がぼやけます。

リンギング効果のある理想的なローパスフィルター

バターワースローパスフィルター (BLPF)

理想的なローパスフィルターと比較すると、バターワースフィルターの通過帯域と阻止帯域の間に明らかなジャンプはなく、高周波数と低周波数の間の遷移が比較的スムーズであるため、得られる出力イメージには明らかなリンギングがありません。

伝達関数の特性曲線を見ると、テール部分に一定の高周波が残っており、理想的なローパスフィルターほどノイズ除去効果が高くないことがわかります。

指数ローパスフィルター (ELPF)

ラダーローパスフィルター(TLPF)

フィルター効果の比較

ローパスフィルター処理の結果には、さまざまな程度のぼけが含まれます。カットオフ周波数が増加すると、画像のぼかしは明るくなります。

同じカットオフ周波数では、ELPF 処理の結果のブラーが最も軽く、次に BLPF が続き、ILPF のブラーが最も重くなります。

カットオフ周波数が低い場合、いくつかのフィルターのフィルター効果はまったく異なります。カットオフ周波数が増加するにつれて、フィルター結果は徐々に収束します。

ILPF と TLPF には明らかな「リンギング」現象があり、BLPF と ELPF には明らかな「リンギング」現象がありません。

ハイパスフィルタ

原理

画像のエッジはスペクトルの高周波成分に対応するため、ハイパスフィルターを使用して画像のエッジを抽出できます。

元の画像と重ねるとエッジが鮮明になり、画像が鮮明になります。

研ぎに所属

アルゴリズム

画像の滑らかな部分に対応するローパスフィルターについては、対応するハイパスフィルターを取得できます。

ハイパスフィルターは (1-ローパスフィルター) と表現できます。

準同型フィルタリング

準同型フィルタリングは、画像の平滑化と鮮明化の両方のプロパティを含む特殊な画像処理テクノロジですが、その主な目的は画像を平滑化または鮮明化することだけではありません。準同型フィルタリングは主に、画像のコントラストを高め、画像のダイナミックレンジを圧縮することにより、画像の照明条件を改善し、画質を向上させるために使用されます。

照明反射モデル

準同型フィルタリング技術は、画像の照明反射結像原理に基づいたフィルタリング手法です。

周波数領域では、画像の輝度範囲の圧縮とコントラストの向上を同時に行うことができるため、照明の不均一によるイメージングに特に適しています。

観察者または撮像システムによって得られる画像は、一般に、ターゲット上の反射光に依存します。これは、①シーンに入射する可視光の量、②シーン内のターゲットからの反射光の量に分けられます。

入射光の量は外部照明に関係し、反射係数は物体の特性に依存します。

明るい色の滑らかな表面は反射係数が大きい

濃い色の粗い表面は反射係数が小さい

アルゴリズム原理

画像は照明成分と反射成分の積として表されます。

照明成分は空間内でゆっくりと変化し、低周波成分が大半を占めます。

反射成分は、空間内のさまざまな物体の境界面で大きく変化し、表面の変化や細部を反射し、多くの高周波成分を含みます。

照明成分と反射成分は異なる周波数帯域にあり、対数法を使用してそれらの乗算を加算に変更し、これら 2 つの部分に異なる処理を使用できます。

照明成分は低周波であり、低周波を抑えることで照明ムラをなくすことができます。同時に、高周波成分を強調して画像の細部を強調することができます。

ハンドルインスタンス

同時に、低周波を減らし高周波を強調し、画像のダイナミックレンジを圧縮し、さまざまな部分のコントラストを向上させます。

画像修復

制約のない画像回復

画像の劣化過程は変化とみなすことができます。

g(x,y) から f(x,y) を求めることは、その逆変換を求めるプロセスです

実際には、T(-1) には多くの状況があります。

T(-1) は存在しません、つまり特異です

T(-1) は存在しますが、一意ではありません

T(-1) は存在し、一意ですが、g(x, y) の小さな摂動が f(x, y) に大きな変化を引き起こします。

T(-1) は存在し、ユニークですが、その解決策は複雑すぎるか、ほとんど解決できません。

T(-1) は存在し、一意であり、不正設定問題がなく、解決可能です

線形シフト不変系の場合、縮退モデルの行列表現からスタート

ここでのノイズは一般化されており、事前知識がない場合、f の推定値を見つけて、最小二乗の意味で次の式を最小化する必要があります。

画像を復元する逆フィルタリング方法

ウィーナーフィルター方式

画像圧縮

ロスレスエンコーディング

可変長エンコーディング

ハフマン符号化

算術符号化

固定長エンコーディング

ランレングスエンコーディング

ビットプレーンエンコーディング

LZWエンコーディング

非可逆コーディング

予測コーディング

変換コーディング

画像のセグメンテーション

画像セグメンテーションの概要

なぜ分割するのか

セグメンテーションとは、画像を重複しない領域に分割し、関心のある領域を抽出することです。

状態

画像セグメンテーションは、画像処理から画像分析および理解への移行における重要なステップであり、基本的なコンピュータビジョンテクノロジでもあります。

コンセプト

すべてのサブ領域の合計 (和集合) には画像内のすべてのピクセルが含まれる必要があります。または、セグメンテーションでは画像内の各ピクセルが特定のサブ領域に分割される必要があります。

各サブ領域は互いに重なり合わず、または 1 つのピクセルが同時に 2 つの領域に属することはできません。

同じ領域に属するピクセルは、いくつかの同じ特性を持ち、領域の境界が明確である必要があります。

異なる領域に属するピクセルは、いくつかの異なる特性を持つ必要があります。

同じサブ領域内のピクセルが接続されている必要があります。

自然

領域内: 類似性

方法: 画像ピクセルのグレー値の類似性に基づいて、しきい値を選択して、類似したグレー値を持つ領域を見つけます。領域の外側の輪郭がターゲットオブジェクトのエッジです。

領域間: 不連続性

方法: 画像ピクセルのグレー値の不連続性に従って、最初に点、線、エッジを見つけてから、領域を決定します。

アイデア

1) 簡単なものから難しいものまで、段階的に分割します。

2) バックグラウンド環境を制御し、セグメンテーションの困難さを軽減します。

3) 関心のあるオブジェクトを強調し、無関係な部分の干渉を減らすことに焦点を当てます。

方法

領域内のグレー値の類似性に基づくセグメンテーション手法のクラス。各ピクセルが属する領域を決定して領域マップを形成します

閾値分割法

地域の成長

分割マージ

形態学的セグメンテーション

領域間のグレー値の不連続性に基づくセグメンテーション手法のクラス。エッジベースのセグメンテーション方法では、最初に領域の境界を抽出し、次に境界によって囲まれる領域を決定します。

エッジ検出セグメンテーション法

ハフ変換

必要とする

効果

全体性

正確さ

安定性

しきい値セグメンテーション

しきい値セグメンテーションの概要

原理

画像には、ターゲットと背景のグレースケール特性の違い、画像内の各ピクセルの所有権の決定、および最終的にバイナリ画像を生成するためのセグメント化が含まれます。

ステップ

適切なセグメンテーションのしきい値を決定する

各ピクセル値をしきい値と比較して、ピクセルの所有権を割り当てます。

閾値の分類

特徴

計算は簡単です

ターゲットと背景のコントラストが強い画像セグメンテーションに特に効果的です。

重なり合わない領域は、常に閉じた接続された境界で定義できます。

テクスチャ、色などの他の機能に一般化できます。

ヒストグラムのしきい値

基本的な考え方

ターゲットと背景の内部のピクセルグレースケール値は非常に似ていますが、それらの接合部の両側のピクセルグレースケールは大きく異なります。画像のヒストグラムは、基本的にターゲットと背景の 2 つの単峰ヒストグラムを重ね合わせたものと見なすことができます。背景。ターゲットと背景の間のグレースケールの差が比較的大きい場合、画像のヒストグラムは二峰性になるはずです。

しきい値の選択

ヒストグラムの下部のグレー値 (最小値) をしきい値 T とします。

既存の問題点と改善点

ノイズ干渉の影響を受けやすいため、最小値は望ましいしきい値ではありません。

改善する

2 つのピークの間の固定位置 (中央の位置など) をとります。ピーク値はエリア内外の代表値を表すため、一般に谷を選択するよりも信頼性が高く、ノイズの干渉を排除できます。

ヒストグラムの平滑化等のノイズ処理を強化します。

最適なしきい値

質問

画像ヒストグラムに二重山谷現象がないか、閾値に二重山谷現象があったとしても谷点は正確な閾値点ではない。

考え

セグメンテーションエラーの確率を最小限に抑えます。最小エラー確率しきい値とも呼ばれます。

具体的な方法

ターゲットと背景の確率とそのグレー分布の確率密度関数を設定します。

しきい値 t を指定して、各クラスのセグメンテーションエラーの確率を求めます。

このしきい値の下で合計セグメンテーションエラー確率 e(t) を求めます。

最適な閾値 T は、総分割エラー確率 e(t) の最小値から計算されます。

クラス間分散の最大しきい値

基本的な考え方

選択された閾値などは、領域分割対象と背景領域との間の全体的な差異を最大化するものであり、領域分割結果はある程度最適なレベルに達していると考えることができる。領域間のこの違いは、分散によって説明されることがよくあります。

分散はしきい値 k の関数です。k が変化すると、領域間の分散も変化します。これは、最大クラス間分散しきい値とも呼ばれます。

最大クラス間分散しきい値を解決するプロセスでは、他のパラメーターを手動で設定する必要はなく、コンピューターによって完全に自動的に選択されます。これは 2 つの領域のセグメンテーションに適用できるだけでなく、複数の領域の状況にも拡張できます。

具体的な方法

合格

エッジ検出セグメンテーション

エッジ検出セグメンテーションの原理

エッジの定義

グレースケールで段差や屋根の変化がある画像内のピクセルのコレクション。

エッジの分類

エッジ検出セグメンテーションの原理

画像のセグメンテーションは、画像内のさまざまな領域の境界を見つけることによって実現されます。これは、境界に基づく画像セグメンテーション手法の大きなクラスです。

一次エッジ検出演算子

優れた検出オペレーターは、次の 3 つの指標を満たす必要があります。

高精度: より多くの真のエッジが含まれ、より少ない偽エッジが含まれます。

高精度: 検出されたエッジは真の境界上にある必要があります。

単一ピクセル幅: 選択性が高く、エッジに独自に反応します。

通常、エッジの検出には一次微分の最大値が使用されます。

勾配演算子

「交差微分アルゴリズム」と同じ

その他の方向演算子

Roberts、Prewitt、Sobel などのオペレータには 2 方向のテンプレートのみが含まれており、検出できるエッジ方向はほとんどありません。差分テンプレートの方向が多いほど、より多くの方向のエッジを検出できます。

キルシュ演算子

8 方向は 45° の夾角を形成します

使用方法: 8 つのテンプレートをそれぞれ画像と畳み込み、8 方向のグレースケールの変化を検出します。最も大きな変化を持つ方向はエッジの方向です。 5×5 キルシュ演算子の最初の 4 つの方向テンプレートは次のとおりです。

キャニーオペレーター

特徴

不正確な位置、単一ピクセル幅などの問題があります。

オペレーターがエッジを検出する手順

ガウスフィルターテンプレートを使用して画像を滑らかにします。

平滑化された画像の勾配の大きさと方向を計算します。

勾配振幅に最大抑制を適用します。

勾配方向の最大値であることを確認してください。

二重閾値アルゴリズムによるエッジの検出とリンク。

不確実な部分を判断するには近傍勾配を使用します。

2次エッジ検出演算子

通常、2 次微分のゼロクロス点はエッジの事前位置決めに使用されます。

ラプラシアン

特徴

これは二次導関数であり、ノイズに非常に敏感です。

ラプラシアンの大きさにより、二重エッジ (最小の負と最大の正) が生成されます。

エッジの方向を検出できません (方向テンプレートがありません)。

効果

エッジの事前位置決めにゼロクロッシング特性を利用します。

ピクセルがエッジの暗い側にあるか明るい側にあるかを決定します。

テンプレート

LOG演算子

最初に画像が平滑化され、次にラプラス演算子を使用してエッジが検出され、2 次微分演算子がノイズに敏感であるという問題が解決されます。

エッジの継続と閉鎖

エッジ継続の目的

エッジ結合の目的は、不連続なエッジを接続して閉じた境界を形成することです。

部分連続処理の原理

エッジ検出結果の各点 (x、y) の特性を分析し、小さな近傍 (3x3 または 5x5) 内のすべての類似点を接続して、共通の特性を持つ領域の境界を形成します。

ハフ変換

問題の声明

原理

ある空間と別の空間の双対関係を利用して、元の空間の問題を双対空間に変換して解くと、双対空間では問題が比較的単純になります。

直線を検出

ステップ

準備段階

運用段階

頂点を目指すステージ

既存の問題点と改善点

質問

直線が垂直に近い場合、傾きqは無限大に近くなり、探索範囲が非常に広くなり、計算量が多くなる。

改善する

画像の XY 空間は極座標空間に変換されます。

特徴

強力な抗干渉能力があり、パラメータ空間での累積カウントは統合されたプロセスです。

優れた堅牢性を備えており、実際に検出されるパラメータ点に非常に明白なピークがあります。

自動閉鎖: 境界曲線のパラメータから曲線全体を取得できます。

したがって、ハフ変換を使用して干渉を排除し、曲線の補完と接続を完了することができます。

アプリケーション開発

円検出用

楕円の検出用

領域のセグメンテーション

地域の成長

問題の紹介

一部のセグメンテーション方法では、特定の条件が考慮されません。

地域成長の基本的な考え方

領域拡張はボトムアップのセグメンテーション方法です。

まず領域の数とその特性を決定し、次にそのシードをクラスタリングの中心として使用して、画像内の同じ特性を持つ隣接するピクセルを領域にマージし続けます。それらは融合し、最終的には異なる特性を持つ領域を形成します。この分割方法は領域拡張とも呼ばれます。

アルゴリズムのステップとプロセス

まず、成長の開始点としてセグメント化される領域のシードピクセルを見つけます。

類似性基準を決定します (合併の条件が満たされているかどうかを決定するため)。

類似性基準に従って、シードと同じまたは類似の特性を持つシードピクセルの近傍のピクセルがシード領域にマージされます。

新しいピクセルを新しいシードピクセルとして扱い、条件を満たすピクセルが含まれなくなるまで上記のプロセスを継続し、領域の成長を完了します。

この方法に従って、画像全体が完全にセグメント化されるまで他の領域の拡大を完了します。

重要な問題

シードポイントの選択

最も明るいピクセル。

ヒストグラムの最大値。

クラスター中心のピクセル。

類似性基準（成長基準）の決定

地域的なグレースケールの違い。

領域内のグレースケール分布特性。

色、質感、サイズ、形状など。

成長停止条件の決定

領域成長基準: ピクセルとシードの間のグレー値の絶対差が 65 未満である。

分割マージ

問題の声明

領域の成長は、シード、類似性基準などによって大きく影響されます。

分割と統合の考え方

分割/マージはトップダウンのセグメンテーション方法です。

画像全体を開始して段階的に連続的に分割し、同時に同じ特徴を持つ隣接する領域を分割できなくなるまで結合し、最終的に各部分領域を取得します。

分割・マージアプローチ

分裂的なアプローチ

分割する領域が個々のピクセルに分割されるまで、段階的にクワッドします。

融合の実践

同じ特性を持つ隣接するエリアを 1 つのエリアにマージします。

具体的な操作

分割を実行します。

隣接するすべての領域を結合できるかどうかを確認し、結合できる場合は 1 つずつ結合します。

分割と結合が実行できなくなるまで、最初の 2 つの手順を繰り返します。

注: マージする場合、通常、同じ親ノードの下にある 4 つのエリアが最初に考慮され、次に他の親ノードの下にある同じレベルのエリアに拡張されます。

画像の説明

画像記述の基本概念

画像を特徴づける主な特徴

画像をセグメント化していくつかの領域と境界を取得します。コンピュータがターゲットを効果的に識別するには、ターゲットの主な属性と、ターゲットとターゲットおよび背景との関係を、より簡潔かつ明確な数値で表現する必要があります。、記号など。

原画像や分割画像から生成されるこれらの値や記号などを画像特徴量と呼びます。画像の特徴にはターゲットに関する重要な情報が含まれており、ターゲットの主な特徴を反映しています。

内部機能: グレースケール機能、カラー機能、テクスチャ機能など。

外部特性: 面積、周囲長、真円度など...

画像説明の定義

画像の特徴を使用して画像を表現することは、画像の記述と呼ばれます。つまり、数値や記号を使用して、画像またはシーン内の各ターゲットの関連する特徴、さらにはターゲット間の関係を表現します。最終結果は、抽象的な表現になります。ターゲットの特徴とそれらの間の関係。

画像説明の目的

ターゲットに関する有用な情報を入手し、ターゲットを説明して正確に測定し、ターゲットの分析と理解の基礎を築きます。

画像記述の基本的な方法

単純な記述方法とは、画像の幾何学的形状の特徴に基づいて記述する方法を指し、一般的に使用される方法には、周長、面積、位置、方向、長方形などがあります。

境界記述法: 画像をセグメント化するか、エッジ検出アルゴリズムを使用してターゲット領域の境界点セットを取得した後、これらの境界点を整理して境界線を形成し、記述する必要があります。この方法には主にチェーンコード法が含まれます。そしてフーリエ記述法を待ちます。

領域記述法は、不変モーメント記述法など、画像内のグレースケール、色、テクスチャ、およびその他の特徴に基づいて画像を記述する方法です。

簡単な説明

円周の説明

周囲の定義: 領域の境界の長さ。

境界線の役割: 単純な形状のオブジェクトは、それが占める領域を比較的短い境界線で囲むことができるため、境界線を使用して単純な形状のオブジェクトと複雑な形状のオブジェクトを区別できます。

周囲を表す一般的に使用される方法

領域と背景の境界線（隙間）の長さ

ピクセルは単位面積あたりの小さな正方形とみなされ、領域も背景も小さな正方形で構成されます。外周とは、領域と背景の間のギャップ（接合線）の長さです。

つまり、周囲長 p = 交線の長さ

境界点の数

境界画素数、つまり境界点の数で表されます。

つまり: 周長 p = 境界点の数

エリアの説明

エリア記述定義: エリア内のピクセル数。

エリアの役割: エリアの最も基本的な特性であり、エリアのサイズを表します。

画像のサイズ f(x,y) が M×N であるとします。バイナリ画像の場合、1 はターゲットを表し、0 は背景を表します。ターゲット領域を見つけるには、f(x,y) のピクセル数を数えます。 )=1 の場合、面積は次のようになります。

ターゲットの場所の説明

ターゲットには一定の領域があるため、画像内でのターゲットの位置を定義する必要があり、一般的にはその領域の中心点がターゲット位置として定義されます。

エリア中心とは、画質が均一に分布している場合のグラフィックの重心を指します。

サイズ M×N のバイナリイメージ f(x,y) の場合、1 がターゲットを表し、0 が背景を表す場合、ターゲットの重心座標は次のようになります。

目標方向の説明

画像内のターゲットの位置を決定したら、ターゲットの方向も決定する必要があります。

ターゲットの方向は、ターゲット上のすべての点からターゲットの方向である直線までの距離の最小の二乗和を見つけることによって決定できます。

ターゲットの長方形の説明

長方形度は、ターゲットがその外接長方形をどの程度埋めるかを反映し、ターゲットの面積とその最小の外接長方形の面積の比で表すことができます。

Ao はターゲットの面積、AMER は最小の外接長方形の面積です。 R 値は 0 ～ 1 です。

ターゲットが長方形の場合、R の値は最大 1 になります。ターゲットが円形の場合、R の値は小さくなり、0 に近づきます。

チェーンコードの記述方法

チェーンコードの定義

チェーンコードは、境界エンコードの表現方法であり、境界の方向をエンコードの基準として使用します。簡単にするために、境界点のセットを一般的に説明します。

チェーンコード方式

エンコード方式には4チェーンコードと8チェーンコードの2種類があります。具体的な方法: 開始点から開始し、境界に沿ってコーディングし、開始点に戻るまでコーディングを終了します。

各境界セグメントに方向コードを与える

開始点を選択し、開始点から開始して、開始点に戻ってエンコードを終了するまで境界に沿ってエンコードします。

開始点: 赤い点

方向: 時計回り

4チェーンコード: 000033333322222211110011

例 2

始点sの座標を(5,5)とし、反時計回りに4方向チェーンコードと8方向チェーンコードを用いて領域境界を表現します。

4ウェイチェーンコード: (5,5)111232323000

8方向チェーンコード: (5,5)2224556000

問題があります

開始点が異なるとコーディングも異なります

回転によりエンコーディングの違いが生じる

改善する方法

正規化は開始点の問題を解決します。チェーンコードが最初から最後まで接続されている場合、チェーンコードは実際には方向エンコーディングの循環シーケンスであることがわかります。したがって、チェーンコードの正規化を達成するために、結果として得られるコードシーケンスの整数値を最小化するように開始点を選択できます。

一次差分は回転の問題を解決します。チェーンコードの一次差分を使用して元のコードを置き換えることで、回転不変性が得られます。つまり、同じ形状を異なる角度で回転させた領域では、チェーンコードは異なりますが、各チェーンコードの一次差分コードは同じであるという性質は、画像認識に特に有効です。

チェーンコードの一次差分と正規化は、開始点と回転の不変性を持つことができます。

フーリエ記述法

基本的な考え方

点集合からなる境界が確認できれば、その境界を利用して対象物の形状を特定することができます。

プロセス

M の選択と記述子の関係

使用価値

フーリエ記述子が少ないほど、境界本質の全体的な輪郭を取得できます。

境界情報を含むこれらの記述子を使用すると、大きく異なる境界を区別できます。

特徴

二次元の問題が一次元になる

幾何学的変換に対して不変となるように改良および調整されました

この定義から、開始点、平行移動、回転、およびスケーリングの選択はすべて元の境界シーケンスに影響を及ぼし、それによってフーリエ変換後の結果に影響を与えることがわかります。

フーリエ記述子は、幾何学的変換に対して不変になるように改良および調整できます。具体的な方法は次のとおりです。 1) 開始点の変更と回転は F(u) の位相にのみ影響し、振幅には影響しないため、無視できます。 2) 変換は F(u) の DC 成分に影響しますが、DC を除去することで除去できます。 3) スケールの変更により F(u) が全体的に拡大または縮小されますが、これは最大係数で除算して正規化することで除去できます。以上の処理を経て、最終的なフーリエリーフは幾何変換の不変性を有することになる。

瞬間記述法

基本的な考え方

場合によっては、画像内のターゲット領域のグレー分布がわかっている場合、モーメント記述を使用してターゲットを特徴付けることができます。

モーメント記述特性

境界を知る必要はなく、セグメント化された領域内のピクセルのグレースケール状態だけを知る必要があります。

一瞬

中心距離

不変モーメント