Prinsip Matematika di Balik K-Means
K-Means merupakan algoritma yang berakar pada prinsip matematika dan statistika. Pemahaman tentang dasar matematika di balik K-Means penting untuk mengoptimalkan penggunaannya dalam analisis data dan machine learning.
Fungsi Objektif
Tujuan utama K-Means adalah meminimalkan jumlah total jarak Euclidean kuadrat antara setiap data dengan centroid cluster-nya. Fungsi objektif ini dikenal sebagai Within-Cluster Sum of Squares (WCSS) dan menjadi dasar iterasi dalam algoritma.
Jarak dan Centroid
Pemilihan jarak Euclidean sebagai metrik utama memungkinkan K-Means untuk secara efisien membagi data ke dalam cluster. Centroid dihitung sebagai rata-rata dari semua data dalam cluster, sehingga hasil pengelompokan sangat bergantung pada distribusi data.
Konvergensi dan Kompleksitas
Secara matematis, algoritma K-Means akan selalu konvergen, meskipun bisa mencapai solusi lokal yang bukan merupakan global optimum. Kompleksitas waktu algoritma ini adalah O(nkt), di mana n adalah jumlah data, k adalah jumlah cluster, dan t adalah jumlah iterasi.