Hierarchical Clustering
Hierarchical clustering adalah metode clustering yang membangun hirarki kelompok data berdasarkan kemiripan antar objek. Algoritma ini digunakan untuk menghasilkan struktur pohon atau dendrogram yang menunjukkan hubungan antar kluster secara bertingkat.
Jenis Hierarchical Clustering
Terdapat dua pendekatan utama dalam hierarchical clustering: agglomerative (bottom-up) dan divisive (top-down). Agglomerative dimulai dengan setiap objek sebagai kluster terpisah dan menggabungkannya secara bertahap berdasarkan kemiripan. Divisive dimulai dengan seluruh data sebagai satu kluster, lalu membaginya secara bertahap.
Proses Clustering Hirarkis
Proses clustering hirarkis melibatkan perhitungan jarak antar kluster menggunakan metode seperti single linkage, complete linkage, atau average linkage. Hasil akhir biasanya divisualisasikan dalam bentuk pohon dendrogram yang memudahkan identifikasi kluster pada berbagai tingkat kemiripan.
Aplikasi dan Kelebihan
Hierarchical clustering digunakan dalam taksonomi biologis, analisis perilaku pengguna, dan pengelompokan dokumen. Keuntungan utamanya adalah tidak perlu menentukan jumlah kluster di awal, namun kelemahannya adalah kurang efisien untuk jumlah data yang sangat besar.