←Membuat halaman berisi 'Pohon keputusan adalah salah satu metode pembelajaran mesin dan statistika yang digunakan untuk membantu proses pengambilan keputusan dengan memodelkan kemungkinan hasil dari serangkaian pilihan. Representasi ini berbentuk diagram bercabang yang menyerupai struktur pohon, di mana setiap simpul merepresentasikan suatu kondisi atau pertanyaan, dan setiap cabang merepresentasikan hasil atau keputusan yang mungkin diambil. Pohon keputusan banyak digunakan dal...'
 
Tidak ada ringkasan suntingan
 
Baris 8: Baris 8:
== Struktur dan Terminologi ==
== Struktur dan Terminologi ==
Beberapa istilah penting dalam pohon keputusan meliputi:
Beberapa istilah penting dalam pohon keputusan meliputi:
# **Root node**: simpul awal yang mewakili seluruh dataset.
# '''Root node''': simpul awal yang mewakili seluruh dataset.
# **Splitting**: proses pembagian dataset menjadi subset berdasarkan kondisi tertentu.
# '''Splitting''': proses pembagian dataset menjadi subset berdasarkan kondisi tertentu.
# **Leaf/terminal node**: simpul akhir yang tidak dibagi lagi.
# '''Leaf/terminal node''': simpul akhir yang tidak dibagi lagi.
# **Branch/sub-tree**: bagian dari pohon yang menghubungkan simpul-simpul.
# '''Branch/sub-tree''': bagian dari pohon yang menghubungkan simpul-simpul.
# **Pruning**: proses menghilangkan cabang yang tidak perlu untuk mengurangi kompleksitas model.
# '''Pruning''': proses menghilangkan cabang yang tidak perlu untuk mengurangi kompleksitas model.


Struktur ini memungkinkan pengguna untuk mengikuti jalur logis dari simpul akar hingga sampai pada keputusan akhir. Setiap jalur dalam pohon dapat diinterpretasikan sebagai aturan "jika–maka".
Struktur ini memungkinkan pengguna untuk mengikuti jalur logis dari simpul akar hingga sampai pada keputusan akhir. Setiap jalur dalam pohon dapat diinterpretasikan sebagai aturan "jika–maka".
Baris 26: Baris 26:
== Algoritme yang Digunakan ==
== Algoritme yang Digunakan ==
Beberapa algoritme populer untuk membangun pohon keputusan antara lain:
Beberapa algoritme populer untuk membangun pohon keputusan antara lain:
# **ID3 (Iterative Dichotomiser 3)**: menggunakan ukuran [[information gain]] untuk pemilihan atribut.
# '''ID3 (Iterative Dichotomiser 3)''': menggunakan ukuran [[information gain]] untuk pemilihan atribut.
# **C4.5**: pengembangan dari ID3, menggunakan [[gain ratio]] dan mendukung data numerik maupun kategorikal.
# '''C4.5''': pengembangan dari ID3, menggunakan [[gain ratio]] dan mendukung data numerik maupun kategorikal.
# **CART (Classification and Regression Tree)**: menggunakan [[Gini index]] dan dapat digunakan untuk masalah klasifikasi maupun regresi.
# '''CART (Classification and Regression Tree)''': menggunakan [[Gini index]] dan dapat digunakan untuk masalah klasifikasi maupun regresi.


Setiap algoritme memiliki kelebihan dan kekurangan, sehingga pemilihan metode bergantung pada karakteristik data dan tujuan analisis.
Setiap algoritme memiliki kelebihan dan kekurangan, sehingga pemilihan metode bergantung pada karakteristik data dan tujuan analisis.