Galleria mappe mentale DBSCAN
Algoritmo di clustering di densità, inclusa la definizione, diversi concetti coinvolti in DBSCAN, passaggi dell'algoritmo, Vantaggi e svantaggi di DBSCAN, ecc.
Modificato alle 2023-12-23 14:05:37個人求職簡歷模板的暗黑配色方案,包括個人簡介、職業規劃、行業經驗、自我評價等多個部分,讓你的簡歷更出彩。使用模板可以極大地提高效率,用戶不需要從頭開始設計結構和內容,只需在模板的基礎上填寫或添加自己的信息即可,這樣可以節省大量的時間和精力,歡迎參考使用!持續分享給大家……
Se non sai come scrivere un articolo, sarai nei guai come manager dei sistemi informativi. Una guida passo passo su come scrivere un documento sulla gestione del rischio. Se ne hai bisogno, ritiralo velocemente!
Il programma dietetico formula un programma dietetico scientifico e ragionevole per soddisfare i nutrienti e l'energia richiesti dal corpo, mantenendo così una buona salute e una buona postura.
個人求職簡歷模板的暗黑配色方案,包括個人簡介、職業規劃、行業經驗、自我評價等多個部分,讓你的簡歷更出彩。使用模板可以極大地提高效率,用戶不需要從頭開始設計結構和內容,只需在模板的基礎上填寫或添加自己的信息即可,這樣可以節省大量的時間和精力,歡迎參考使用!持續分享給大家……
Se non sai come scrivere un articolo, sarai nei guai come manager dei sistemi informativi. Una guida passo passo su come scrivere un documento sulla gestione del rischio. Se ne hai bisogno, ritiralo velocemente!
Il programma dietetico formula un programma dietetico scientifico e ragionevole per soddisfare i nutrienti e l'energia richiesti dal corpo, mantenendo così una buona salute e una buona postura.
DBSCAN
introduzione
Idea dell'algoritmo: per ogni punto centrale, se la densità della sua area adiacente è maggiore della soglia, aggiungilo a un cluster vicino ad esso.
Diversi concetti coinvolti in DBSCAN
Quartiere Eps: dato un oggetto p e un raggio d, disegna una palla con l'oggetto p come centro e raggio d:
Punto fondamentale: dato un oggetto p e un numero minpts, il numero di oggetti nelle sue vicinanze è maggiore di minpts:
Punto di confine: dato un oggetto p e un numero minpts, il numero di oggetti nelle sue vicinanze è inferiore a minpts, ma è all'interno dell'area di altri punti centrali.
Punto anomalo: dato un oggetto p e un numero minpts, il numero di oggetti nelle sue vicinanze è inferiore a minpts e non si trova nell'area di altri punti centrali.
Raggiungibilità diretta della densità: il punto centrale di qualsiasi punto dati nelle sue vicinanze è direttamente raggiungibile dalla densità:
La densità è raggiungibile: dal punto centrale p a un punto q nelle sue vicinanze, cioè p->q; dal punto centrale q a un punto n nelle sue vicinanze, cioè q->n; n è detta densità raggiungibile
Densità connessa: Se esiste un punto centrale o, o->p o->q, allora p e q si dicono densità connesse:
Passi dell'algoritmo
Passaggio 1: attraversare e contrassegnare tutti i punti campione
Passaggio 2: seleziona qualsiasi punto senza un'etichetta cluster
Punto centrale: integra tutti i punti campione con densità raggiungibile in un nuovo cluster
Punto di confine: salta il punto di confine e scansiona il punto campione successivo
Passaggio 3: ripetere il passaggio 2 finché tutti i punti non vengono scansionati
Vantaggi e svantaggi di DBSCAN
vantaggio
Non sensibile al rumore
Si possono trovare gruppi di forme arbitrarie
Non è necessario impostare manualmente il numero di cluster
discordanza
Il modello è molto sensibile ai parametri Eps e minpts
Quando la densità dei dati non è uniforme e la spaziatura dei cluster differisce notevolmente, la qualità del clustering è scarsa.
ottimizzazione
Per questioni sensibili ai parametri
Metodo: introducendo la distanza centrale e la distanza raggiungibile, l'algoritmo di clustering viene reso insensibile ai parametri di input. Cioè, l'algoritmo OPTICS
OTTICA
Idea di algoritmo: calcolare la distanza raggiungibile di tutti i campioni per compensare la sensibilità del parametro Eps
diversi concetti
Distanza del nucleo: la distanza minima che soddisfa i minpts
Distanza raggiungibile: il valore più piccolo della distanza euclidea tra il punto campione e il punto centrale e la distanza centrale del punto centrale
Passi dell'algoritmo
Passaggio 1: dato il set di dati D, creare due code, la coda ordinata O e la coda dei risultati R (la coda ordinata viene utilizzata per archiviare gli oggetti principali e la loro densità diretta di oggetti e sono disposte in ordine crescente in base alla distanza raggiungibile; Il risultato la coda viene utilizzata per memorizzare l'ordine di uscita dei punti campione. La coda ordinata può essere intesa come i dati da elaborare, mentre la coda dei risultati contiene i dati elaborati.)
Passaggio 2: se tutti i punti in D sono stati elaborati o non sono presenti punti fondamentali, l'algoritmo termina. Altrimenti, seleziona un punto campione p che non è elaborato (ovvero, non nella coda dei risultati R) ed è un oggetto principale, inserisci prima p nella coda dei risultati R ed elimina p da D. Quindi trova tutte le densità di p in D direttamente nel punto campione x e calcola la distanza raggiungibile da x a p. Se x non è nella coda ordinata O, inserisci x e la distanza raggiungibile in O. Se x è in O , quindi se la nuova distanza raggiungibile di x è inferiore, aggiorna la distanza raggiungibile di x e infine riordina i dati in O in base alla distanza raggiungibile da piccolo a grande.
Passo 3: Se la coda ordinata O è vuota, torna al passo 2, altrimenti togli il primo punto campione y in O (cioè il punto campione con la distanza più piccola raggiungibile), inseriscilo in R e rimuovilo da D e O cancellano y. Se y non è un oggetto centrale, ripetere il passaggio 3 (ovvero, trovare il punto campione con la distanza raggiungibile più piccola dei dati rimanenti in O; se y è un oggetto centrale, trovare tutte le densità di y in D che raggiungono il punti campione e calcolare la distanza raggiungibile, quindi seguire il passaggio 2 per aggiornare la densità di tutti i punti y fino ai punti campione in O
Passaggio 4: ripetere i passaggi 2 e 3 fino al termine dell'algoritmo e infine ottenere un risultato di output ordinato e la corrispondente distanza raggiungibile.
Per esempio
Il set di dati noto è mostrato nella figura:
Passaggio 1: calcolare la distanza raggiungibile dal punto centrale agli altri punti
Passaggio 2: ordinare la distanza raggiungibile, selezionare punti campione più piccoli e ripetere il passaggio uno:
Passaggio 3: produrre gli oggetti principali e le relative distanze raggiungibili e dividerli in cluster Oggetti principali: [0, 1, 3, 6, 5, 2, 4], distanze raggiungibili: [inf, 3.16227766, 4.12310563, 1.41421356, 1. ,3.60555128, 1.41421356]