Jump to content

Prinsip Matematika di Balik K-Means

From Wiki Berbudi

K-Means merupakan algoritma yang berakar pada prinsip matematika dan statistika. Pemahaman tentang dasar matematika di balik K-Means penting untuk mengoptimalkan penggunaannya dalam analisis data dan machine learning.

Fungsi Objektif

Tujuan utama K-Means adalah meminimalkan jumlah total jarak Euclidean kuadrat antara setiap data dengan centroid cluster-nya. Fungsi objektif ini dikenal sebagai Within-Cluster Sum of Squares (WCSS) dan menjadi dasar iterasi dalam algoritma.

Jarak dan Centroid

Pemilihan jarak Euclidean sebagai metrik utama memungkinkan K-Means untuk secara efisien membagi data ke dalam cluster. Centroid dihitung sebagai rata-rata dari semua data dalam cluster, sehingga hasil pengelompokan sangat bergantung pada distribusi data.

Konvergensi dan Kompleksitas

Secara matematis, algoritma K-Means akan selalu konvergen, meskipun bisa mencapai solusi lokal yang bukan merupakan global optimum. Kompleksitas waktu algoritma ini adalah O(nkt), di mana n adalah jumlah data, k adalah jumlah cluster, dan t adalah jumlah iterasi.