Pembelajaran Berpenguatan: Perbedaan antara revisi
Batch created by Azure OpenAI |
k Text replacement - "pembelajaran mesin" to "Pembelajaran Mesin" Tag: Suntingan perangkat seluler Suntingan peramban seluler |
||
Baris 1: | Baris 1: | ||
Pembelajaran berpenguatan adalah sebuah cabang dari [[ | Pembelajaran berpenguatan adalah sebuah cabang dari [[Pembelajaran Mesin]] (machine learning) yang fokus pada bagaimana agen mengambil keputusan dalam sebuah lingkungan untuk memaksimalkan suatu nilai kumulatif. Berbeda dengan pembelajaran terawasi dan tidak terawasi, pembelajaran berpenguatan melibatkan interaksi agen dengan lingkungan melalui aksi dan menerima [[umpan balik]] berupa [[reward]] (ganjaran) atau hukuman. Konsep ini banyak diterapkan dalam berbagai bidang seperti [[robotika]], [[permainan komputer]], serta [[sistem rekomendasi]]. | ||
==Konsep Dasar== | ==Konsep Dasar== |