Halaman yang memiliki pranala ke "Temporal Difference (TD) Learning"
Halaman-halaman berikut ini memiliki pranala ke Temporal Difference (TD) Learning:
Menampilkan 5 butir
- Perbandingan Monte Carlo dan Temporal Difference (← pranala)
- Algoritma SARSA dalam Temporal Difference (← pranala)
- Q-learning: Pendekatan Off-Policy dalam TD Learning (← pranala)
- Actor-Critic: Gabungan Policy Gradient dan TD Learning (← pranala)
- Peran Eksplorasi dan Eksploitasi dalam Metode Monte Carlo dan TD (← pranala)