Selasa, 12 Mei 2020

,

Perhitungan Metode Naive Bayes dengan Tipe Data Numerik (Contoh Ramalan Cuaca)

Selamat pagi para pejuang skripsi/mathematics seeker, pada kesempatan ini saya akan membagikan algoritma perhitungan metode naive bayes, contoh data yg saya gunakan adalah tipe data numerik, yang belakangan ini masih sulit dijumpai artikelnya. kasus yang akan saya pakai disini adalah mengenai ramalan cuaca, dengan 3 tipe parameter data yaitu suhu,kelembapan, dan kecepatan angin, tanpa beralama-lama lagi simak penjelasan berikut ini.

Algoritma Naive Bayes merupakan salah satu algoritma yang terdapat pada teknik klasifikasi. Naive Bayes merupakan pengklasifikasian dengan metode probabilitas dan statistik yang ditemukan oleh ilmuwan Inggris Thomas Bayes, yaitu memprediksi peluang di masa depan berdasarkan pengalaman dimasa sebelumnya sehingga dikenal sebagai Teorema Bayes. Teorema tersebut dikombinasikan dengan Naive dimana diasumsikan kondisi antar atribut saling bebas. Klasifikasi Naive Bayes diasumsikan bahwa ada atau tidak ciri tertentu dari sebuah kelas tidak ada hubungannya dengan ciri dari kelas lainnya. (1)


Tahapan Algoritma Naive Bayes dengan data numerik berbeda dengan data non numerik, bisa dilihat dibawah ini :
  • Menghitung Mean tiap fitur pada kasus ini fitur tersebut adalah suhu,kelembapan,dan kecepatan angin
  • Menghitung Standar Deviasi tiap fitur
  • Menghitung Distribusi Normal tiap fitur (Persamaan Densitas Gauss)
Kemudian dilanjutkan menghitung probabilitas akhir seperti algoritma Naive Bayes dengan data non numerik,


    1. Persamaan Algoritma Naive Bayes  

Keterangan : 
  • P(c|x) adalah data dengan class yang belum diketahui
  • P(x|c) adalah probabilitas x berdasarkan kondisi pada hipotesis c
  • P(c) adalah probabilitas hipotesis c
  • P(x) adalah probabilitas x

    2. Tahap Perhitungan Awal


Data probabilitas yang saya gunakan yaitu hujan dan cerah, sedangkan data latih yang akan saya gunakan berjumlah 30 dengan parameter suhu,kelembapan,kecepatan angin:




untuk tahapan pertama yang harus kita lakukan ialah menghitung rata rata dari setiap parameter, berdasarkan setiap probabilitas, hasil dan prosesnya dapat dilihat pada gambar dibawah ini: 

Rumus Mencari Rata-rata


Mengambil nilai rata-rata dari setiap parameter berdasarkan 2 probabilitas hujan dan cerah : 


Sehingga akan memberikan hasil sebagai berikut : 


Memasuki tahap berikutnya yaitu menghitung standar deviasi dari setiap parameter data berdasarkan probabilitas hujan dan cerah, dapat dilihat pada gambar berikut :

Persamaan Standar Deviasi


Hasil perhitungan standar deviasi

Gambar dibawah ini merupakan contoh perhitungan dari mencari nilai mean hingga ke standar deviasi untuk fitur data suhu.




Pada tahapan selanjutnya kita akan mencari hasil probabilitas hipotesis jika dalam persamaan di awal yaitu p(c) dengan cara menjumlah kelas propbablitas hujan dan membaginya dengan jumlah data yang ada, kebetulan saya disini memakai 15 data hujan dan 15 data cerah maka hasilnya 0.5 untuk setiap hipotesis. (Pro tips hasil dari P(c) jika dijumlah harus = 1 jika tidak maka peramalan Naive Bayes akan menghasilkan hasil yg rancu / mendapatkan banyak error). 





    3.Tahap Perhitungan Data Uji

Memasuki tahapan berikutnya saya akan memulai dengan menghitung menggunakan persamaan Densitas Gauss / (distrubusi normal), untuk data uji yang saya gunakan disini berjumlah sebanyak 10 set data, yang dapat dilihat pada gambar dibawah ini:


Data Uji


Persamaan Densitas Gauss


pada contoh perhitungannya saya akan memberikan di data no 1 yang dapat dilihat pada gambar dibawah ini.


Keterangan: 
  • σ = nilai standar deviasi untuk setiap parameter yang akan dihitung
  • x = Data pada parameter
  • μ = Nilai rata-rata
untuk hasil perhitungannya dapat dilihat pada gambar dibawah ini: 




Setelah perhitungan densitas gaus dilakukan tahap terakhir adalah menghitung probabilitas akhir dengan cara mengkalikan setiap hasil probabilitas yang ada, untuk lebih detailnya dapat dilihat pada gambar dibawah ini, saya memberikan contoh untuk data no 1 : 


sehingga dapat saya simpulkan hasil ramalannya melalui gambar dibawah ini :



Metode naive bayes ini cukup mudah bagi saya karena persamaan yang dipakai masih tergolong umum bagi saya. silahkan gunakan artikel ini dengan sebaik-baiknya jika ingin copas sertakan sumbernya. untuk yg bingung bisa langsung download hitungan excel yang saya buat di link berikut

LINK DOWNLOAD :KLIK DISINI

Sumber : (1)Bustami. (2010). Penerapan Algoritma Naive Bayes untuk Mengklasifikasi Data Nasabah. TECHSI: Jurnal Penelitian Teknik Informatika, 4, 127–146. https://doi.org/10.26555/JIFO.V8I1.A2086























1 komentar: