Evaluasi Clustering

Evaluasi clustering adalah proses untuk menilai kualitas hasil pengelompokan data. Tidak seperti supervised learning, clustering tidak memiliki label data yang benar, sehingga evaluasi dilakukan menggunakan metrik internal dan eksternal.

Metrik Evaluasi Internal

Metrik internal mengevaluasi kualitas kluster berdasarkan data itu sendiri. Contoh metrik internal adalah Silhouette Score, Dunn Index, dan Within-Cluster Sum of Squares (WCSS). Metrik ini mengukur seberapa rapat data dalam satu kluster dan seberapa terpisah antar kluster.

Metrik Evaluasi Eksternal

Metrik eksternal membandingkan hasil clustering dengan label ground truth yang diketahui (jika ada), seperti Adjusted Rand Index dan Normalized Mutual Information. Metrik ini jarang digunakan karena clustering umumnya tidak memiliki label data.

Tantangan Evaluasi

Evaluasi clustering seringkali subjektif karena tidak ada jawaban benar yang mutlak. Oleh karena itu, pemilihan metrik evaluasi harus disesuaikan dengan tujuan penggunaan clustering dan karakteristik data.