マインドマップギャラリー モデルの生成
生成ネットワーク GAN モデルの詳細な紹介、教師なし学習、生成モデル、モデル分類、および古典的なネットワークの知識を共有するこのブレイン マップが役立つことを願っています。
これはバクテリアに関するマインドマップであり、その主な内容には、概要、形態、種類、構造、生殖、分布、アプリケーション、および拡張が含まれます。概要は包括的で綿密で、レビュー資料として適しています。
これは、植物の無性生殖に関するマインドマップであり、その主な内容には、概念、胞子の生殖、栄養生殖、組織培養、芽が含まれます。概要は包括的で綿密で、レビュー資料として適しています。
これは、動物の生殖発達に関するマインドマップであり、その主な内容には、昆虫、カエル、鳥、性的生殖、無性生殖が含まれます。概要は包括的で綿密で、レビュー資料として適しています。
コンピュータビジョンデジタル画像処理
ニューラルネットワークの動作過程を詳しく解説
畳み込みニューラル ネットワーク (CNN)
完全に接続されたニューラルネットワーク
畳み込みニューラル ネットワーク
ニューラル ネットワーク モデルの一般的なタイプとアプリケーション
ニューラル ネットワークとディープラーニング リカレント ニューラル ネットワーク
ニューラル ネットワークとディープラーニング 畳み込みニューラル ネットワーク
ニューラルネットワークとディープラーニングの基礎
改良されたシグモイド畳み込みニューラル ネットワークに基づく手書き数字認識
モデルの生成
教師なし学習
データ
ラベルなし
低い取得コスト
目標
データに隠されたパターンや構造を見つける
例
クラスタリング
K 平均法
次元削減
主成分分析
特徴学習
自動エンコーディング
密度推定
トレーニング セットを指定して、トレーニング セットと同じ分布を持つ新しいサンプルを生成します。
教師なし学習における中心的な問題
典型的なアイデア
密度推定値を表示
Px の定義と解決
暗黙的な密度推定
明示的な定義なしでモデル P を学習する
モデルの分類
ピクセルRNN/CNN
連鎖基準を使用して、画像 x の生成確率を各ピクセルの生成確率の積に変換します。
これは非常に複雑なので、モデル化するにはニューラル ネットワークが必要です。
·
特徴
アドバンテージ
尤度関数を正確に計算できる
尤度関数の値を使用してモデルのパフォーマンスを効果的に評価できます
欠点がある
シーケンスの生成が遅い
変分オートエンコーダー (VAE)
自動エンコーディングは再構成を使用して、低次元の特徴をトレーニングして表現します。
変分エンコーダ VAE
想定される
入力 z はベクトルであり、正規分布に従います。
z の各次元は属性を表します
モデルを生成する主な方法
q(z|x) を計算でき、この特徴表現は他の多くのタスクで使用できます。
最尤関数の下限は効果的に機能しますが、モデル自体の評価は PixelCNN ほど簡単ではありません
GAN と比較して、不鮮明で低品質のサンプルが生成されます
GAN は敵対的モデルを生成します
質問
トレーニング サンプル分布から新しいデータをサンプリングしたいと考えていますが、この分布は高次元であるだけでなく非常に複雑であるため、直接実装することが困難です。
解決する
一様分布などの単純な分布をサンプリングし、それをトレーニング サンプル分布に変換するためのマッピングを学習します。
構成
ネットワークの生成
できるだけ現実的な画像を生成して、差別者を騙すことが期待されています。
差別ネットワーク
本物の写真と偽物の写真を正確に区別できるようになりたい
ミニマックス法を用いた共同訓練
交互に完了
ディスクリミネーター
ビルダー
視覚化
生成された擬似サンプルは実際のサンプルの分布に可能な限り近似するため、識別器は真と偽の区別がつかない状態になります。
クラシックネットワーク
畳み込み敵対的生成ネットワーク DCGAN
トレーニングプロセス中の状態は安定しており、高品質の画像の生成を効果的に実現します。
ルール(経験的)
プーリング層の代わりに畳み込みを使用する
完全に接続された層を削除する
バッチ正規化を使用する
適切なアクティベーション関数を使用する
生成ネットワークには ReLU が使用され、出力層には Tanh が使用されます。
識別子は LeaklyReLU を使用します
GAN最適化問題 LSGAN、WGAN
生成されたサンプルと実際のサンプルが重複しない場合、JS の発散は常に log2 になります。
LSGAN目的関数
sigmod 関数を線形回帰関数に変更します。
ウィガン
距離測定
ブルドーザーの距離
ネットワークを希望の方向にトレーニングする
条件付き GAN
従来のニューラル ネットワークの出力結果は各トレーニング結果に可能な限り近いため、生成された画像が非常にぼやけ、さらには区別できなくなります。
出力内容は多様かつ制御可能であることが期待される
目的関数
実行計画
cGAN
SGAN
ACGAN(一般的に使用される)
Lc は分類損失、Ls は真偽識別損失
インフォガン
隠れた変数を制御して、明確な物理的定義を持たせる
テキストから画像へ
スタックGAN
画像から画像へ
イガン
ピクスツーピクス
サイクルガン
スターGAN
1 つのネットワークで 5 つのスタイルが生成される