Anni '50: Frank Rosenblatt propone il Perceptron, uno dei primi modelli di rete neurale.
Anni '80: Yann LeCun e altri proposero LeNet-5, che fu la prima CNN applicata con successo al riconoscimento delle cifre scritte a mano.
1998: Yann LeCun e altri svilupparono ulteriormente LeNet-5 e proposero una versione migliorata di LeNet-5 per il riconoscimento dei codici postali scritti a mano.
2012: Alex Krizhevsky e altri propongono AlexNet, la prima CNN a ottenere risultati rivoluzionari nella ImageNet Large-Scale Visual Recognition Challenge (ILSVRC).
2014: VGGNet ha ottenuto risultati migliori in ILSVRC, dimostrando i vantaggi di strutture di rete più profonde.
2014: Google propone l'architettura Inception (GoogLeNet), che migliora l'efficienza computazionale della rete introducendo il modulo Inception.
2015: Microsoft ha proposto ResNet (Residual Network), che ha risolto il problema del gradiente evanescente nell'addestramento della rete profonda attraverso connessioni residue.
Finora: la CNN continua ad evolversi, con l'emergere di nuove strutture di rete come EfficientNet e Vision Transformer, nonché con l'ulteriore ottimizzazione in diversi campi di applicazione.