Pembelajaran Berpenguatan vs Pembelajaran Terawasi

Revisi sejak 8 Agustus 2025 02.21 oleh Budi (bicara | kontrib) (Text replacement - "pembelajaran mesin" to "Pembelajaran Mesin")
(beda) ← Revisi sebelumnya | Revisi terkini (beda) | Revisi selanjutnya → (beda)

Pembelajaran berpenguatan dan pembelajaran terawasi adalah dua pendekatan utama dalam Pembelajaran Mesin. Keduanya memiliki tujuan dan metode pembelajaran yang berbeda sesuai dengan karakteristik masalah yang dihadapi.

Pembelajaran Terawasi

Dalam pembelajaran terawasi, model belajar dari dataset berlabel untuk memetakan input ke output. Contoh umum adalah klasifikasi dan regresi.

Karakteristik RL

Sementara itu, pembelajaran berpenguatan melibatkan agen yang belajar dari umpan balik lingkungan berupa reward, tanpa adanya label eksplisit untuk setiap tindakan. Agen harus mengeksplorasi dan mengeksploitasi untuk menemukan strategi terbaik.

Perbandingan dan Aplikasi

Perbedaan utama antara kedua pendekatan ini terletak pada sumber umpan balik dan proses belajar. Pembelajaran terawasi cocok untuk masalah prediksi, sedangkan pembelajaran berpenguatan unggul pada masalah pengambilan keputusan berurutan.