TR
EN
AÇIKLANABİLİR YAPAY ZEKA VE BORUTA-SHAP YÖNTEMLERİYLE AKCİĞER KANSERİNİN ÖNGÖRÜLMESİ
Öz
Son yıllarda hastalık tahmini için popüler bir yaklaşım olan makine öğrenmesi algoritmaları, ölümcül etkileri olan akciğer kanserinin tahmininde de kullanılabilir. Bu çalışmada, akciğer kanserini tahmin etmek için makine öğrenmesi algoritmalarına dayalı bir tahmin modeli önerilmiştir. Sınıflandırıcı olarak beş karar ağacı tabanlı algoritma tercih edilmiştir. Deney, risk faktörlerini içeren kamuya açık bir veri seti üzerinde gerçekleştirilmiştir. Veri setindeki en belirgin özellikleri ortaya çıkarmak için Boruta-SHAP yaklaşımı kullanılmıştır. Öznitelik seçim yönteminin kullanılması sınıflandırıcılarının tahmin işleminde göstermiş oldukları performansları artırmıştır. Deneyler tüm özellikler ve indirgenmiş özellikler ayrı ayrı kullanılarak gerçekleştirilmiştir. Tüm sınıflandırıcıların performansları karşılaştırıldığında, 97.22% doğruluk ve 0.972 AUROC ile en iyi tahmin oranını üreten XGBoost algoritması olmuştur. Önerilen model, literatürdeki benzer çalışmalara kıyasla iyi bir sınıflandırma oranına sahiptir. Veri setindeki risk faktörlerinin model çıktısı üzerindeki etkisini araştırmak için SHAP (SHapley Additive exPlanation) yaklaşımını kullandık. Sonuç olarak, alerji bu hastalık için en önemli risk faktörü olarak bulunmuştur.
Anahtar Kelimeler
Ethical Statement
Bu çalışmada kamuya açık erişimi olan bir veri seti kullanıldı. Bu yüzden, etik kurul iznine ihtiyaç bulunmamaktadır.
References
- Sung, H., Ferlay, J., Siegel, R. L., Laversanne, M., Soerjomataram, I., Jemal, A., & Bray, F. (2021). Global cancer statistics 2020: GLOBOCAN estimates of incidence and mortality worldwide for 36 cancers in 185 countries. CA: a cancer journal for clinicians, 71(3), 209-249.
- Li, C., Lei, S., Ding, L., Xu, Y., Wu, X., Wang, H., Zhang, Z., Gao, T., Zhang, Y., Li, L. (2023). Global burden and trends of lung cancer incidence and mortality. Chin Med J (Engl), 136(13):1583-1590
- Latimer, K. M., & Mott, T. F. (2015). Lung cancer: diagnosis, treatment principles, and screening. American family physician, 91(4), 250-256.
- Kaplanoglu, E., & Nasab, A. (2023). Evaluation of artificial intelligence techniques in disease diagnosis and prediction. Discover Artificial Intelligence, 3(1). Turk, F. &. Kokver, Y. (2022). Application with deep learning models for COVID-19 diagnosis, SAUCIS, vol. 5, no. 2, pp. 169–180. Turk, F., Luy, M., Barıscı, N. & Yalcınkaya, F., (2022), Kidney tumour segmentation using two-stage bottleneck block architecture, Intelligent Automation and Soft Computing, 33(1).
- Cai, J., Luo, J., Wang, S., & Yang, S. (2018). Feature selection in machine learning: A new perspective. Neurocomputing, 300, 70-79.
- Theng, D., & Bhoyar, K. K. (2023). Feature selection techniques for machine learning: a survey of more than two decades of research. Knowledge and Information Systems, 1-63.
- Confalonieri, R., Coba, L., Wagner, B., & Besold, T. R. (2021). A historical perspective of explainable Artificial Intelligence. Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery, 11(1), e1391.
- Arrieta, A. B., Díaz-Rodríguez, N., Del Ser, J., Bennetot, A., Tabik, S., Barbado, A., ... & Herrera, F. (2020). Explainable Artificial Intelligence (XAI): Concepts, taxonomies, opportunities and challenges toward responsible AI. Information fusion, 58, 82-115.
Details
Primary Language
English
Subjects
Machine Learning (Other)
Journal Section
Research Article
Publication Date
September 3, 2024
Submission Date
January 25, 2024
Acceptance Date
March 4, 2024
Published in Issue
Year 1970 Volume: 27 Number: 3