Sebuah pohon keputusan adalah keputusan dukungan
alat yang menggunakan grafik seperti pohon atau model keputusan dan konsekuensi
yang mungkin mereka, termasuk hasil kebetulan acara, biaya sumber daya, dan
utilitas. Ini adalah salah satu cara untuk menampilkan sebuah algoritma.
Pohon keputusan biasanya digunakan dalam riset
operasi, khususnya dalam analisis keputusan, untuk membantu mengidentifikasi
strategi yang paling mungkin untuk mencapai tujuan.
Beberapa keuntungan dari pohon keputusan adalah:
- · Sederhana untuk memahami dan menafsirkan. Pohon dapat divisualisasikan.
- · Membutuhkan sedikit persiapan data. Teknik lainnya sering membutuhkan normalisasi data, dummy variable perlu diciptakan dan nilai-nilai kosong untuk dihapus. Namun perlu dicatat bahwa modul ini tidak mendukung nilai-nilai yang hilang.
- · Biaya menggunakan pohon (yaitu, memprediksi data) adalah logaritmik dalam jumlah titik data yang digunakan untuk melatih pohon.
- · Mampu menangani baik data numerik dan kategorikal. Teknik lain biasanya khusus dalam menganalisis dataset yang hanya memiliki satu jenis variabel. Lihat algoritma untuk informasi lebih lanjut.
- · Mampu menangani masalah multi-output.
- · Menggunakan model kotak putih. Jika situasi tertentu yang diamati dalam model, penjelasan untuk kondisi ini mudah dijelaskan dengan logika boolean. Sebaliknya, dalam model kotak hitam (misalnya, dalam jaringan saraf tiruan), hasilnya mungkin lebih sulit untuk menafsirkan.
- · Kemungkinan untuk memvalidasi model menggunakan uji statistik. Yang memungkinkan untuk memperhitungkan keandalan model.
- · Berkinerja baik bahkan jika asumsi yang agak dilanggar oleh model benar dari mana data yang dihasilkan.
Kelemahan dari pohon keputusan meliputi:
- · Peserta didik Keputusan-pohon dapat membuat pohon over-kompleks yang tidak menggeneralisasi data dengan baik. Hal ini disebut overfitting. Mekanisme seperti pemangkasan (saat ini tidak didukung), pengaturan jumlah minimum sampel yang diperlukan pada simpul daun atau pengaturan kedalaman maksimum pohon diperlukan untuk menghindari masalah ini.
- · Pohon keputusan dapat menjadi tidak stabil karena variasi kecil dalam data mungkin mengakibatkan sebuah pohon yang sama sekali berbeda yang dihasilkan. Masalah ini diatasi dengan menggunakan pohon keputusan dalam sebuah ensemble.
- · Masalah pembelajaran pohon keputusan yang optimal dikenal sebagai NP-lengkap di bawah beberapa aspek optimal dan bahkan untuk konsep sederhana. Akibatnya, praktis algoritma pembelajaran pohon-keputusan didasarkan pada algoritma heuristik seperti algoritma serakah dimana keputusan optimal lokal yang dibuat di setiap node. Algoritma tersebut tidak dapat menjamin untuk mengembalikan pohon keputusan yang optimal secara global. Hal ini dapat diatasi dengan melatih beberapa pohon di pelajar ensemble, di mana fitur dan sampel secara acak sampel dengan penggantian.
- · Ada konsep yang sulit untuk belajar karena pohon keputusan tidak mengekspresikan mereka dengan mudah, seperti XOR, paritas atau multiplexer masalah.
- · Peserta didik pohon keputusan membuat pohon bias jika beberapa kelas mendominasi. Oleh karena itu dianjurkan untuk menyeimbangkan dataset sebelum pas dengan pohon keputusan.
- · Dalam permainan sekuensial, serangkaian keputusan yang dibuat, hasil dari masing-masing yang mempengaruhi kemungkinan berturut-turut. Dalam teori permainan, analisis permainan sekuensial sangat menarik karena mereka biasanya memodelkan realitas yang lebih baik daripada permainan simultan: produsen biasanya akan mengamati permintaan sebelum memutuskan berapa banyak output untuk menghasilkan, perusahaan duopoli akan mengamati keputusan masing-masing sebelum membuang barang lebih banyak di pasar, dll Sebagai contoh, mari kita memeriksa keputusan yang dihadapi perusahaan ketika mencoba untuk memecahkan pasar yang saat ini monopoli. Game Sequential direpresentasikan melalui pohon keputusan, dengan node berturut-turut pada setiap titik keputusan:
- · Permainan diwakili dalam pohon keputusan ini menunjukkan perusahaan 1 memilih apakah akan bersaing dalam pasar monopoli atau tidak. Karena tidak ada pesaing yang ada di pasar, jika mereka memilih untuk tidak masuk, hasil nya akan menjadi nol dan monopoli yang ada akan memiliki hasil dari dua. Namun, jika perusahaan memilih 1 untuk masuk kita mencapai simpul dua, di mana keputusan kedua harus dibuat oleh pemain ditantang (monopoli), apakah akan mengakomodasi pesaing baru atau melawan kembali untuk mencoba dan memblokir masuknya. Dalam contoh khusus ini, jika mereka memilih untuk melawan, kedua pemain akan memiliki hasil dari -1, sedangkan jika monopoli memutuskan untuk mengakomodasi pemain baru, monopoli kita menjadi duopoli dan drop sehingga harga menciptakan permintaan pasar yang lebih besar, yang berarti bahwa perusahaan yang ada masih akan menerima hasil dari satu dan pemain baru sebuah hasil dari dua.
Tidak ada komentar:
Posting Komentar