Tag Archives: Bayesian Network

Kritik Paper: Distributed Bayesian Network Structure Learning

5 Oct

Sumber: Yongchan Na Jihoon Yang, Sogang Univ Seoul, South Korea , “Distributed Bayesian Network Structure Learning”. Industrial Electronics (ISIE), 2010 IEEE International Symposium di Bari, Italia.

Bayesian Network merupakan model representasi grafik dari random variabel serta hubungan antar variabel tersebut dengan tanda panah. Di dalam Bayesian network juga terdapat CPD atau Conditional Probability Distribution yang merupakan nilai representasi probability antar variabel. Bayesian Network juga merupakan salah satu metoda dasar yang digunakan dalam prediksi untuk kategori klasifikasi. Proses klasifikasi itu sendiri terdiri dari 2 sub proses yakni proses pembelajaran(learning Process) dan proses pendugaan (inferences Process). Tujuan dari proses pembelajaran itu sendiri ialah untuk membentuk struktur dari Bayesian network sedangkan tujuan dari prosess pendugaan ialah sebagai klasifikasi instant.

Paper ini mencoba untuk memodifikasi metode algoritma K2 pada Scoring-based dalam menyelesaikan pembelajaran pada Bayesian network yang terdistribusi sehingga didapatkan waktu pembelajaran yang lebih efisien. Waktu pembelajaran juga dapat menjadi efisien karena proses pembelajaran tidak “Centralized” atau terpusat yakni proses pembelajaran dilakukan pada tiap site kemudian hasil pembelajaran ditiap site dikirim ke pusat untuk menentukan Bayesian network yang terbaik.

Tujuan dari paper ini ialah untuk memberikan solusi yang lebih efisien dalam pembelajaran dengan menggunakan  Struktur Bayesian Network terdistribusi secara optimal. Hasil percobaan menunjukkan hampir 7 kali lipat lebih baik waktu untuk pembelajarannya.

Secara umum disebutkan dalam paper bahwa ada 2 jenis algoritma pendekatan untuk pembelajaran struktur Bayesian network, Scoring-based dan Constraint-based dengan menggunakan algoritma K2. Tetapi pada paper ini tidak dibahas mengenai penggunaan algoritma K2 dengan pendekatan Constraint-based. Begitu juga tidak perbandingan algoritma K2 dengan algoritma lainnya dengan pendekatan Scoring-based dan Constraint-based. Hal ini menyebabkan tidak terlihat seberapa canggihnya algoritma K2 dibanding algoritma sejenisnya.

Disamping itu, di paper ini tidak dijelaskan juga mengenai hasil percobaan dari waktu pembelajaran, apakah hasil tersebut merupakan waktu pembelajaran di pusat atau kumulatif dari site-site dengan pusat. Dalam hal distribusi data melalui jaringan perlu adanya faktor faktor lain yang memiliki implikasi langsung terhadap hasil dari pembelajaran struktur Bayesian terdistribusi itu sendiri,  seperti kegagalan dalam pengiriman data, bandwith yang tidak konstan serta design awal dari system jaringan itu sendiri. Kesimpulannya sudah menjawab isu yang diangkat di awal, yaitu algoritma K2 dapat mengefisienkan waktu pembelajaran sehingga dapat meminimalkan biaya untuk komunikasi data serta mengurangi beban jaringan dalam hal data yang  besar.