Sağlık istatistiklerinin veri madenciliği teknikleri ile analizi: Makine öğrenmesi algoritmaları kullanılarak genel sağlık durumunun sınıflandırılması
Künye
Gür, Y. E., Eşidir, K. A., & Şimşek, A. İ. (2024). Sağlık İstatistiklerinin Veri Madenciliği Teknikleri İle Analizi: Makine Öğrenmesi Algoritmaları Kullanılarak Genel Sağlık Durumunun Sınıflandırılması. Afyon Kocatepe Üniversitesi Fen Ve Mühendislik Bilimleri Dergisi, 24(6), 1364-1381. https://doi.org/10.35414/akufemubid.1491469Özet
Sağlık sektörü, günümüzde devasa veri yığınlarıyla başa çıkmak
zorundadır. Bu verilerin derinliklerindeki bilgileri çözümleyerek
hastalıkları daha iyi anlama ve sağlık hizmetlerini geliştirme gibi
birçok amaç doğrultusunda veri madenciliği metodolojileri
kullanılmaktadır. Bu çalışma, bir veri madenciliği sınıflandırma
tekniği olan Gradient Boosting’in, mikro sağlık verilerini nasıl
kategorize edebileceğini araştırmaktadır. Çalışmada, Türkiye
İstatistik Kurumu’ndan (TÜİK) elde edilen 2022 yılına ait mikro
veriler kullanılmıştır. Araştırmada kullanılan soru formundan
elde edilen 9 adet bağımsız değişken, analizlerde kullanılarak
sağlık durum tespiti tahmin edilmiştir. Ayrıca, çeşitli sosyodemografik faktörlerin (yaş, cinsiyet, medeni ve çalışma
durumu) ve yaşam tarzı alışkanlıklarının (tütün kullanımı) genel
sağlık üzerindeki etkileri analiz edilmiştir. Çalışmanın sonuçları,
makine öğrenmesi metotlarının sağlık sektöründe ne denli etkili
olabileceğini göstermektedir. Bu modeller arasında Gradient
Boosting modeli, sınıflandırma performansında, doğruluk,
hassasiyet, duyarlılık ve F1 skoru gibi metrikler dikkate alınarak
yapılan incelemede ön plana çıkarak, sağlık politikalarının ve
müdahalelerinin geliştirilmesine katkıda bulunacak önemli
bilgiler sunmuştur. Özellikle, tütün kullanımının sağlık üzerindeki
olumsuz etkilerinin belirlenmesi, bu faktörlerin insan sağlığına
etkisinin büyük olduğunu ortaya koymaktadır. Bu bulgular, sağlık
politikaları ve halk sağlığı programlarının geliştirilmesinde
makine öğrenmesinin önemli faydalar sağlayabileceğine işaret
etmektedir The healthcare industry today has to deal with huge piles of
data. Data mining methodologies are used for many purposes
such as better understanding diseases and improving health
services by analyzing the information in the depths of these
data. This study investigates how Gradient Boosting, a data
mining classification technique, can categorize micro health
data. In the study, micro data for 2022 obtained from the
Turkish Statistical Institute (TUIK) was used. Health status
determination was estimated by using 9 independent variables
obtained from the questionnaire used in the research in the
analyses. Additionally, the effects of various socio-demographic
factors (age, gender, marital and employment status) and
lifestyle habits (tobacco use) on general health were analyzed.
The results of the study show how effective machine learning
methods can be in the healthcare sector. Among these models,
the Gradient Boosting model came to the fore in the analysis of
classification performance, taking into account metrics such as
accuracy, sensitivity, sensitivity and F1 score, providing
important information that will contribute to the development
of health policies and interventions. In particular, determining
the negative effects of tobacco use on health reveals that these
factors have a great impact on human health. These findings
indicate that machine learning can provide significant benefits
in the development of health policies and public health
programs.
Cilt
24Sayı
6Koleksiyonlar
- Cilt 24 : Sayı 6 [25]



















