- Avrupa Bilim ve Teknoloji Dergisi
- Issue: 16
- Makine Öğrenmesi Algoritmaları ile Hava Kirliliği Tahmini Üzerine Karşılaştırmalı Bir Değerlendirme...
Makine Öğrenmesi Algoritmaları ile Hava Kirliliği Tahmini Üzerine Karşılaştırmalı Bir Değerlendirme
Authors : Yasemin Gültepe
Pages : 8-15
Doi:10.31590/ejosat.530347
View : 10 | Download : 3
Publication Date : 2019-08-31
Article Type : Research
Abstract :Hava kirliliği, günümüzün en büyük sorunlarından birini teşkil etmektedir. Hava kirliliği, nüfusun artması, kentsel gelişme ve büyüme, endüstrinin gelişmesiyle giderek artan bir önem arz etmektedir. Genellikle hava kirleticilerinin insanlara, canlılara ve çevreye zararlı etkileri zaman, mekan, etki süresi, konsantrasyon ve diğer karakteristiklerine bağlı olarak karmaşık dağılım şekilleri göstermektedir. Bu karmaşıklık, kirletici örnekleri ve eğilimleri modelleme veya ölçmede, ayrıca insanların maruz kaldığı seviyeleri tahmin etmenin zor olduğu anlamına gelmektedir. Hava kirliliğinin önlenmesi konusunda yapılacak çalışmalar içerisinde en önemli adımlardan biri kirlenme olayının bir model içerisinde değerlendirilmesidir. Bu çalışmada Kastamonu ili ele alınarak, meteoroloji ve çevre uygulamalarında oldukça yeni ve başarılı sonuçlar veren çeşitli makine öğrenmesi algoritmaları ile hava kirliliğinin tahmininde, bazı meteorolojik parametreler kullanılarak hava kirliliği modellenmesi amaçlanmıştır. Normalizasyon tekniklerinin sistem performansına etkisini gözlemleyebilmek için veri setindeki değerler Minimum-Maksimum (Min-Max) normalizasyon teknikleri ile normalize edilmiştir. Çalışmada elde edilen performans değerleri, literatürdeki benzer çalışmalarla kıyaslanarak problemin çözümüne ilişkin en uygun sınıflandırma algoritması tespit edilmiştir. Yapay Sinir Ağları (YSA), Rastgele Orman (Random Forest), K-En Yakın Komşu (K-Nearest Neighborhood), Lojistik Regresyon (Logistic Regression), Karar Ağacı (Decision Tree), Lineer Regresyon (Linear Regression) ve Basit Bayes (Naive Bayes) gibi yöntemler kullanılarak ayrı ayrı modeller tasarlanmış ve sonuçlar analiz edilmiştir. Veri setinin %70’i eğitim ve %30’si test verisi olarak ayrılmıştır. Çalışma sonucunda, yapay sinir ağları beklendiği gibi %91 oranında başarı göstererek en doğru tahmini yapan yöntem olarak belirlenirken, sınıflandırmalardan en başarısız sonuç Lineer Regresyon ile %30 elde edilirken, en başarılı sonuçlar Rastgele Orman ve Karar Ağacı ile %99 elde edilmiştir. KastamonuDataSet üzerinde kullanılan yöntemlerin performans değerlendirmelerinde kullanılan temel performans göstergeleri olarak Açıklayıcılık Katsayısı (R2), Ortalama Karesel Hata (Mean Squared Error-MSE), Ortalama Hata Kare Kökü (Root Mean Square Error-RMSE) ve Ortalama Mutlak Hata (Mean Absolute Error-MAE) metrikleri bakımından istatistiksel önemli farklılıkların bulunduğu tespit edilmiştir.Keywords : Yapay Sinir Ağları, Hava Kirliliği, Kastamonu