Lompat ke isi

NaN pada Machine Learning

Dari Wiki Berbudi

NaN memegang peranan penting dalam dunia machine learning, khususnya pada tahap preprocessing data. Keberadaan NaN dalam dataset dapat mempengaruhi hasil pelatihan model dan akurasi prediksi jika tidak ditangani secara tepat.

Tantangan NaN dalam Dataset

Banyak algoritma Pembelajaran Mesin tidak dapat bekerja dengan baik jika terdapat NaN dalam data. Oleh karena itu, langkah penanganan seperti imputasi atau penghapusan baris/kolom yang mengandung NaN menjadi krusial sebelum proses pelatihan.

Teknik Imputasi NaN

Imputasi adalah proses mengganti NaN dengan nilai lain, seperti rata-rata, median, atau modus dari kolom terkait. Beberapa library seperti scikit-learn menyediakan fungsi khusus untuk melakukan imputasi secara otomatis.

Pengaruh NaN terhadap Model

Jika dibiarkan, NaN dapat menyebabkan model machine learning gagal belajar pola dari data atau menghasilkan prediksi yang tidak akurat. Oleh karena itu, pemahaman tentang NaN sangat penting bagi praktisi machine learning.