Jump to content

Implementasi K-Means pada Python

From Wiki Berbudi

Implementasi K-Means di Python (bahasa pemrograman) sangat populer berkat ketersediaan pustaka seperti scikit-learn. Hal ini memudahkan para praktisi data science dan machine learning untuk menerapkan K-Means pada berbagai jenis data secara efisien.

Pustaka scikit-learn

scikit-learn menyediakan kelas KMeans yang sangat mudah digunakan. Pengguna cukup menentukan jumlah cluster dan beberapa parameter lain, lalu memanggil metode fit pada dataset yang diinginkan. Pustaka ini juga menyediakan metode untuk mengevaluasi hasil clustering.

Proses Implementasi

Langkah-langkah umum implementasi meliputi impor pustaka, persiapan data, inisialisasi objek KMeans, pelatihan model, dan visualisasi hasil. Selain itu, pengguna dapat memanfaatkan fungsi evaluasi seperti inertia_ untuk mengukur kualitas cluster.

Contoh Kode

Berikut adalah contoh kode sederhana untuk mengimplementasikan K-Means di Python:

```python from sklearn.cluster import KMeans import numpy as np X = np.array([[1, 2], [1, 4], [1, 0], [10, 2], [10, 4], [10, 0]]) kmeans = KMeans(n_clusters=2, random_state=0).fit(X) print(kmeans.labels_) ```

Contoh di atas menunjukkan proses clustering sederhana untuk dua cluster pada data dua dimensi.