Lompat ke isi

Hierarchical Clustering

Dari Wiki Berbudi

Hierarchical clustering adalah metode clustering yang membangun hirarki kelompok data berdasarkan kemiripan antar objek. Algoritma ini digunakan untuk menghasilkan struktur pohon atau dendrogram yang menunjukkan hubungan antar kluster secara bertingkat.

Jenis Hierarchical Clustering

Terdapat dua pendekatan utama dalam hierarchical clustering: agglomerative (bottom-up) dan divisive (top-down). Agglomerative dimulai dengan setiap objek sebagai kluster terpisah dan menggabungkannya secara bertahap berdasarkan kemiripan. Divisive dimulai dengan seluruh data sebagai satu kluster, lalu membaginya secara bertahap.

Proses Clustering Hirarkis

Proses clustering hirarkis melibatkan perhitungan jarak antar kluster menggunakan metode seperti single linkage, complete linkage, atau average linkage. Hasil akhir biasanya divisualisasikan dalam bentuk pohon dendrogram yang memudahkan identifikasi kluster pada berbagai tingkat kemiripan.

Aplikasi dan Kelebihan

Hierarchical clustering digunakan dalam taksonomi biologis, analisis perilaku pengguna, dan pengelompokan dokumen. Keuntungan utamanya adalah tidak perlu menentukan jumlah kluster di awal, namun kelemahannya adalah kurang efisien untuk jumlah data yang sangat besar.