Success rates and performances of Gaussian Naive Bayes, Support Vector Machines, Linear Discriminant Analysis, Decision Tree and Random Forest classifier algorithms from machine learning methods were evaluated using the Heart Failure Prediction dataset. Label encoder method was used primarily in data preprocessing techniques on the data set. Catalog data (5 pieces) in the data set have been converted into numerical data. In addition, it was observed that there were negative values in the data in a field and this situation was converted to values in the range of 0 - 1 with min-max conversion methods. After the pre-processing, analyzes were made with classification algorithms. As a result of these analyzes, a success rate of 90.76% was achieved with the random forest algorithm, which is an ensemble classifier. In the study, 80% of the data was used for training and 20% for testing. Of the 184 data used for the test, 102 of them were patients with heart failure and 72 of them were from those without the disease. The success of the random forest algorithm in estimating those with heart failure disease was 93.1% (95 observations), and the success in predicting those without the disease was 87.8% (72 observations).
This study was carried out in Siirt University Engineering Faculty Human-Computer Interaction Laboratory. The authors of this article thank the Human-Computer Interaction Laboratory staff for their support.
Kalp Yetmezliği Tahmin veri seti kullanılarak makine öğrenmesi yöntemlerinden Gaussian Naive Bayes, Support Vector Machines, Linear Discriminant Analysis, Decision Tree ve Random Forest sınıflandırıcı algoritmalarının başarı oranları ve performansları değerlendirilmiştir. Data set üzerinde öncelikle veri ön işleme tekniklerinde label encoder yöntemi kullanılmıştır. Data setteki katalog veriler (5 adet) sayısal verilere dönüştürülmüştür. Ayrıca bir alandaki verilerde negatif değerlerin olduğu gözlemlenmiş ve bu durum min-max dönüşüm yöntemleri ile 0 - 1 aralığındaki değerlere dönüştürülmüştür. Yapılan ön işlemlerden sonra sınıflandırma algoritmaları ile analizler yapılmıştır. Bu analizler neticesinde bir ensemble (topluluk) sınıflandırıcı olan random forest algoritması ile %90,76 oranında bir başarı elde edilmiştir. Yapılan çalışmada verilerin %80’i eğitim, %20’si test için kullanılmıştır. Test için kullanılan 184 tane verinin 102 tanesi kalp yetmezliği hastalığı olanlar, 72 tanesi ise hastalığı olmayanlardan oluşmaktadır. Random forest algoritmasının kalp yetmezliği hastalığı olanları tahminlime başarısı %93,1 (95 gözlem), hastalığı olmayanları tahminlime başarısı ise %87,8 (72 gözlem) olarak gerçekleşmiştir.
Primary Language | English |
---|---|
Subjects | Computer Software |
Journal Section | Computer Engineering |
Authors | |
Publication Date | December 3, 2022 |
Submission Date | July 18, 2022 |
Published in Issue | Year 2022 |