Evaluasi Clustering
Evaluasi clustering adalah proses untuk menilai kualitas hasil pengelompokan data. Tidak seperti supervised learning, clustering tidak memiliki label data yang benar, sehingga evaluasi dilakukan menggunakan metrik internal dan eksternal.
Metrik Evaluasi Internal
Metrik internal mengevaluasi kualitas kluster berdasarkan data itu sendiri. Contoh metrik internal adalah Silhouette Score, Dunn Index, dan Within-Cluster Sum of Squares (WCSS). Metrik ini mengukur seberapa rapat data dalam satu kluster dan seberapa terpisah antar kluster.
Metrik Evaluasi Eksternal
Metrik eksternal membandingkan hasil clustering dengan label ground truth yang diketahui (jika ada), seperti Adjusted Rand Index dan Normalized Mutual Information. Metrik ini jarang digunakan karena clustering umumnya tidak memiliki label data.
Tantangan Evaluasi
Evaluasi clustering seringkali subjektif karena tidak ada jawaban benar yang mutlak. Oleh karena itu, pemilihan metrik evaluasi harus disesuaikan dengan tujuan penggunaan clustering dan karakteristik data.