Research Article

PREDICTING LUNG CANCER USING EXPLAINABLE ARTIFICIAL INTELLIGENCE AND BORUTA-SHAP METHODS

Volume: 27 Number: 3 September 3, 2024
TR EN

AÇIKLANABİLİR YAPAY ZEKA VE BORUTA-SHAP YÖNTEMLERİYLE AKCİĞER KANSERİNİN ÖNGÖRÜLMESİ

Öz

Son yıllarda hastalık tahmini için popüler bir yaklaşım olan makine öğrenmesi algoritmaları, ölümcül etkileri olan akciğer kanserinin tahmininde de kullanılabilir. Bu çalışmada, akciğer kanserini tahmin etmek için makine öğrenmesi algoritmalarına dayalı bir tahmin modeli önerilmiştir. Sınıflandırıcı olarak beş karar ağacı tabanlı algoritma tercih edilmiştir. Deney, risk faktörlerini içeren kamuya açık bir veri seti üzerinde gerçekleştirilmiştir. Veri setindeki en belirgin özellikleri ortaya çıkarmak için Boruta-SHAP yaklaşımı kullanılmıştır. Öznitelik seçim yönteminin kullanılması sınıflandırıcılarının tahmin işleminde göstermiş oldukları performansları artırmıştır. Deneyler tüm özellikler ve indirgenmiş özellikler ayrı ayrı kullanılarak gerçekleştirilmiştir. Tüm sınıflandırıcıların performansları karşılaştırıldığında, 97.22% doğruluk ve 0.972 AUROC ile en iyi tahmin oranını üreten XGBoost algoritması olmuştur. Önerilen model, literatürdeki benzer çalışmalara kıyasla iyi bir sınıflandırma oranına sahiptir. Veri setindeki risk faktörlerinin model çıktısı üzerindeki etkisini araştırmak için SHAP (SHapley Additive exPlanation) yaklaşımını kullandık. Sonuç olarak, alerji bu hastalık için en önemli risk faktörü olarak bulunmuştur.

Anahtar Kelimeler

Ethical Statement

Bu çalışmada kamuya açık erişimi olan bir veri seti kullanıldı. Bu yüzden, etik kurul iznine ihtiyaç bulunmamaktadır.

References

  1. Sung, H., Ferlay, J., Siegel, R. L., Laversanne, M., Soerjomataram, I., Jemal, A., & Bray, F. (2021). Global cancer statistics 2020: GLOBOCAN estimates of incidence and mortality worldwide for 36 cancers in 185 countries. CA: a cancer journal for clinicians, 71(3), 209-249.
  2. Li, C., Lei, S., Ding, L., Xu, Y., Wu, X., Wang, H., Zhang, Z., Gao, T., Zhang, Y., Li, L. (2023). Global burden and trends of lung cancer incidence and mortality. Chin Med J (Engl), 136(13):1583-1590
  3. Latimer, K. M., & Mott, T. F. (2015). Lung cancer: diagnosis, treatment principles, and screening. American family physician, 91(4), 250-256.
  4. Kaplanoglu, E., & Nasab, A. (2023). Evaluation of artificial intelligence techniques in disease diagnosis and prediction. Discover Artificial Intelligence, 3(1). Turk, F. &. Kokver, Y. (2022). Application with deep learning models for COVID-19 diagnosis, SAUCIS, vol. 5, no. 2, pp. 169–180. Turk, F., Luy, M., Barıscı, N. & Yalcınkaya, F., (2022), Kidney tumour segmentation using two-stage bottleneck block architecture, Intelligent Automation and Soft Computing, 33(1).
  5. Cai, J., Luo, J., Wang, S., & Yang, S. (2018). Feature selection in machine learning: A new perspective. Neurocomputing, 300, 70-79.
  6. Theng, D., & Bhoyar, K. K. (2023). Feature selection techniques for machine learning: a survey of more than two decades of research. Knowledge and Information Systems, 1-63.
  7. Confalonieri, R., Coba, L., Wagner, B., & Besold, T. R. (2021). A historical perspective of explainable Artificial Intelligence. Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery, 11(1), e1391.
  8. Arrieta, A. B., Díaz-Rodríguez, N., Del Ser, J., Bennetot, A., Tabik, S., Barbado, A., ... & Herrera, F. (2020). Explainable Artificial Intelligence (XAI): Concepts, taxonomies, opportunities and challenges toward responsible AI. Information fusion, 58, 82-115.

Details

Primary Language

English

Subjects

Machine Learning (Other)

Journal Section

Research Article

Publication Date

September 3, 2024

Submission Date

January 25, 2024

Acceptance Date

March 4, 2024

Published in Issue

Year 1970 Volume: 27 Number: 3

APA
Akkur, E., & Öztürk, A. C. (2024). PREDICTING LUNG CANCER USING EXPLAINABLE ARTIFICIAL INTELLIGENCE AND BORUTA-SHAP METHODS. Kahramanmaraş Sütçü İmam Üniversitesi Mühendislik Bilimleri Dergisi, 27(3), 792-803. https://doi.org/10.17780/ksujes.1425483