Implementasi Metode Random Forest Dalam Memprediksi Peristiwa Flare Di Siklus Ke-23 Dan 24 Menggunakan WEKA Data Mining
Abstract
Saat ini model operasional untuk peramalan aktivitas Matahari masih didasarkan pada hubungan statistik antara aktivitas Matahari dan evolusi medan magnet Matahari. Langkah-langkah konvensional didasarkan pada klasifikasi kelompok bintik Matahari (sunspot group) yang memberikan informasi terbatas dari bintik Matahari (individual sunspot). Oleh karena itu, penelitian ini menggunakan data bintik Matahari (individual sunspot) untuk memprediksi peristiwa flare menggunakan metode Random Forest dalam aplikasi WEKA Data Mining. Model prediksi flare diperoleh untuk memprediksi cuaca antariksa yang berdampak langsung pada lapisan ionosfer dan dapat mengakibatkan kegagalan komunikasi radio HF. Penulis menggunakan Supplied Test Set dengan pembagian data latihnya yaitu 10%, 30%, 50%, 70%, 90% dan Cross-validation Folds 10. Hasil dari model ini menunjukan model prediksi terbaik dengan metode Random Forest yaitu menggunakan opsi Supplied Test Set dengan nilai Correlation coefficient = 0.8, Mean absolute error = 0.1 dan Root mean squared error = 1.06, model ini tepat untuk memprediksi peristiwa flare menggunakan metode Random Forest.
Nowadays the operational model for predicting the sun activity is based on the statistical relation between the sun activity and the sun magnetic fields evolution. The conventional steps are based on the classification of sunspot group which give limited information from the individual sunspot. So, this study uses the data of individual sunspot to predict flare phenomenon using random forest method from WEKA Data Mining Application. The flare prediction model acquired to predict outer space weather which directly impact to ionosphere and might cause the failed of HF radio communication. The author used supplied test set with the training data distribution of 10%, 30%, 50%, 70%, 90%, dan cross-validation folds 10. The result of this model have led the best predictive model by the random forest method of using supplied test set option with correlation coefficient value of 0.8, Mean absolute error of 0.1, and root mean square error of 1.06. This model is suitable to predict the flare phenomenon using random forest method.