<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="id">
	<id>https://inibudi.or.id/wiki/index.php?action=history&amp;feed=atom&amp;title=Reward_dan_Value_Function_dalam_Reinforcement_Learning</id>
	<title>Reward dan Value Function dalam Reinforcement Learning - Riwayat revisi</title>
	<link rel="self" type="application/atom+xml" href="https://inibudi.or.id/wiki/index.php?action=history&amp;feed=atom&amp;title=Reward_dan_Value_Function_dalam_Reinforcement_Learning"/>
	<link rel="alternate" type="text/html" href="https://inibudi.or.id/wiki/index.php?title=Reward_dan_Value_Function_dalam_Reinforcement_Learning&amp;action=history"/>
	<updated>2026-04-22T04:25:43Z</updated>
	<subtitle>Riwayat revisi halaman ini di wiki</subtitle>
	<generator>MediaWiki 1.43.0</generator>
	<entry>
		<id>https://inibudi.or.id/wiki/index.php?title=Reward_dan_Value_Function_dalam_Reinforcement_Learning&amp;diff=9215&amp;oldid=prev</id>
		<title>Budi: Batch created by Azure OpenAI</title>
		<link rel="alternate" type="text/html" href="https://inibudi.or.id/wiki/index.php?title=Reward_dan_Value_Function_dalam_Reinforcement_Learning&amp;diff=9215&amp;oldid=prev"/>
		<updated>2025-07-27T03:03:25Z</updated>

		<summary type="html">&lt;p&gt;Batch created by Azure OpenAI&lt;/p&gt;
&lt;p&gt;&lt;b&gt;Halaman baru&lt;/b&gt;&lt;/p&gt;&lt;div&gt;Dalam reinforcement learning, reward dan value function merupakan dua konsep penting yang membantu agen dalam proses pembelajaran. Keduanya berperan dalam mengevaluasi tindakan dan menentukan strategi yang optimal.&lt;br /&gt;
&lt;br /&gt;
== Reward ==&lt;br /&gt;
[[Reward]] adalah umpan balik langsung yang diterima agen setelah mengambil suatu aksi dalam lingkungan. Reward dapat bersifat positif atau negatif, dan bertujuan untuk membimbing agen dalam memilih tindakan yang menguntungkan.&lt;br /&gt;
&lt;br /&gt;
== Value Function ==&lt;br /&gt;
[[Value function]] digunakan untuk memperkirakan seberapa baik suatu keadaan atau aksi dalam jangka panjang. Ada dua jenis utama yaitu state-value function dan action-value function. State-value function menilai nilai suatu keadaan, sedangkan action-value function menilai nilai dari kombinasi keadaan dan aksi.&lt;br /&gt;
&lt;br /&gt;
== Hubungan Reward dan Value Function ==&lt;br /&gt;
Value function membantu agen memperhitungkan konsekuensi jangka panjang dari suatu tindakan, bukan hanya reward langsung. Dengan demikian, agen dapat mengejar strategi yang tidak hanya memberikan reward instan tetapi juga optimal dalam jangka panjang.&lt;/div&gt;</summary>
		<author><name>Budi</name></author>
	</entry>
</feed>