- Avrupa Bilim ve Teknoloji Dergisi
- Ejosat Special Issue: (ARACONF) Special Issue
- Veri Madenciliği İle Kalp Hastalığı Teşhisi
Veri Madenciliği İle Kalp Hastalığı Teşhisi
Authors : Merve Esra Taşçi, Rüya Şamli
Pages : 88-95
Doi:10.31590/ejosat.araconf12
View : 18 | Download : 3
Publication Date : 2020-04-01
Article Type : Research
Abstract :Gelişen ve değişen çevre koşulları, sınırların kalkması ile küreselleşen dünya, farklı pazarlama ve ar-ge (araştırma geliştirme) yöntemleri "veri”nin değil "bilgi”nin önemini her geçen gün daha da artacak şekilde ortaya koymaktadır. İnternetin yaygınlaşması ve kolaylaşması ar-ge ekiplerinin "bilgi”ye erişmelerini zorlaştırmaktadır. İnternette arama motorları kullanılarak yapılan araştırmalar çoğu zaman istenilenden farklı bir şekilde sonuçlanmaktadır. Büyük bir perakendecinin, fatura bilgilerinden müşteri eğilimlerini belirleyip ona göre pazarlama taktikleri üretebilmesi, rakiplerinin önüne geçmesini sağlayacaktır. Verilen örneklere dikkat edilirse, "veri”nin "bilgi”ye dönüşme işleminin vurgulandığı görülecektir. Veri madenciliği, büyük ölçekli veriler arasından bilgiye ulaşma, bilgiyi madenleme işidir. Ya da bir anlamda büyük veri yığınları içerisinden gelecek ile ilgili tahminde bulunabilmemizi sağlayabilecek bağıntıların bilgisayar programı kullanarak aranmasıdır. Veri madenciliği, eldeki verilerden üstü kapalı, çok net olmayan, önceden bilinmeyen ancak potansiyel olarak kullanışlı bilginin çıkarılmasıdır. Veri madenciliği sürecinin çeşitli aşamalarında; istatistiksel yöntemler, bellek tabanlı yöntemler, genetik algoritmalar, yapay sinir ağları ve karar ağaçları gibi algoritmalar kullanılabilmektedir. Kalp hastalıkları (kardiyovasküler hastalıklar) bugün dünyanın en yaygın hastalıklarından biridir. Küresel ölçekte kardiyovasküler hastalıkların uzun süre bir numaralı ölüm nedeni olmaya devam edeceği tahmin edilmektedir. Gelişmiş batı ülkelerindeki kardiyovasküler hastalık ölümleri gelişmekte olan ülkelere göre azalma eğilimi göstermektedir. Dünyadaki ölüm oranlarındaki pozitif faktör, kardiyovasküler hastalıklar açısından büyük ölçüde önlenebilir olmalarıdır. Bu nedenle, kalp hastalığı tanısı alan hastaların verilerine dayanarak, metin madenciliği ve algoritmalar kullanılarak kalp-öncesi hastalığı tahmin etmek için çalışma yapılmıştır. Bu çalışma veri madenciliğinin büyük veri setlerinin incelenmesi üzerinde ne kadar büyük bir öneme ve yere sahip olduğunu göstermek için yapılmıştır. Yüzlerce bilginin bulunduğu kalp veri setinden, WEKA programı kullanılarak, çeşitli algoritmalar uygulayarak kişilere kalp hastalığı teşhisi koyma çalışması yapılmıştır. Kalp hastalığının kesin tanısı ve hastalık şiddetinin saptanması için çeşitli uygulamalar ve yöntemler vardır. Bu çalışmada, daha ucuz ve daha etkili bir yaklaşım sağlayabilecek veri madenciliğinin kullanımı incelenmiştir. Bu çalışmada sınıflandırma yöntemleri ve doğru sınıflandırma oranları ile elde edilen sonuçlar karşılaştırılmıştır. Gerekli hesaplamaları ve modelleri elde etmek için ZeroR, OneR, Naive Bayes, J48 Karar Ağacı, Rastgele Orman, Çoklu Algılayıcılar, k-en yakın komşu (k-Nearest Neighbour - k-NN), Lojistik Regresyon, destek vektör makinesi (Support Vector Machine - SVM) gibi sınıflandırma algoritmaları, Weka programında uygulanmıştır. Uygulamanın sonucu olarak kalp hastalığı teşhisinde en iyi sonuçu veren algoritma tespit edilmeye çalışılmıştır. Veri madenciliği algoritmaları ile kalp hastalığını belirleyen birçok farklı çalışma vardır. Ancak yaptığımız incelemelerde, veri setine 9 farklı algoritma uygulayan bir çalışmaya rastlanmamıştır ve bu çerçevede bu çalışma ilk kez bu kadar çok algoritmanın kullanıldığı çalışma olacaktır.Keywords : Kalp Hastalığı, WEKA, Veri Madenciliği, ZeroR, OneR, Naive Bayes, J48 Karar Ağacı, Rastgele Orman, Multiplayer Perceptrons, k-en yakın komşuluk, Logistik Regresyon, Destek Vektör Makinesi