Stratified K-Fold Cross-Validation adalah varian dari K-Fold Cross-Validation yang dirancang khusus untuk menangani masalah dataset dengan distribusi kelas yang tidak seimbang. Teknik ini banyak digunakan dalam permasalahan classification di mana proporsi kelas sangat penting untuk dijaga.

Konsep Stratifikasi

Pada Stratified K-Fold, pembagian data ke dalam fold dilakukan sedemikian rupa sehingga proporsi kelas di setiap fold mencerminkan proporsi kelas pada dataset asli. Hal ini memastikan bahwa setiap fold merupakan representasi yang baik dari keseluruhan data.

Manfaat untuk Data Tidak Seimbang

Teknik ini sangat berguna ketika bekerja dengan dataset yang memiliki jumlah sampel yang tidak merata antar kelas, seperti dalam kasus imbalanced dataset. Dengan stratifikasi, hasil evaluasi model menjadi lebih adil dan tidak bias terhadap kelas mayoritas.

Penggunaan dalam Praktik

Stratified K-Fold Cross-Validation tersedia pada berbagai library machine learning, seperti scikit-learn. Praktisi dapat dengan mudah menerapkannya untuk memastikan evaluasi model yang lebih akurat pada data klasifikasi.