Lompat ke isi

Algoritma K-means

Dari Wiki Berbudi
Revisi sejak 31 Juli 2025 21.35 oleh Budi (bicara | kontrib) (Batch created by Azure OpenAI)
(beda) ← Revisi sebelumnya | Revisi terkini (beda) | Revisi selanjutnya → (beda)

Algoritma K-means merupakan salah satu metode clustering yang paling populer dan sering digunakan dalam analisis data. Algoritma ini bekerja dengan membagi data ke dalam K kluster berdasarkan kemiripan satu sama lain, sehingga setiap data berada pada kluster dengan pusat (centroid) terdekat.

Cara Kerja

Proses K-means dimulai dengan menentukan jumlah kluster (K) yang diinginkan. Kemudian, algoritma memilih centroid awal secara acak dan mengelompokkan data ke centroid terdekat menggunakan metrik jarak Euclidean. Centroid akan diperbarui berdasarkan rata-rata posisi data dalam kluster, dan proses ini diulang hingga posisi centroid stabil.

Kelebihan dan Kekurangan

Kelebihan utama K-means adalah kesederhanaannya dan efisiensinya dalam memproses data berukuran besar. Namun, algoritma ini sensitif terhadap pemilihan centroid awal dan jumlah kluster K yang harus ditentukan terlebih dahulu. Selain itu, K-means kurang efektif untuk data dengan bentuk kluster yang tidak bulat atau berdimensi tinggi.

Aplikasi K-means

K-means banyak digunakan dalam segmentasi pasar, pengelompokan gambar, dan pengelompokan dokumen. Selain itu, algoritma ini menjadi dasar bagi berbagai teknik clustering lain dalam machine learning.