- Süleyman Demirel Üniversitesi Fen Bilimleri Enstitüsü Dergisi
- Vol: 25 Issue: 2
- In-Silico Mutajenisite Tahmininde İstatistiksel Öğrenme Modeli
In-Silico Mutajenisite Tahmininde İstatistiksel Öğrenme Modeli
Authors : Enis Gümüştaş, Ayça Çakmak Pehlivanli
Pages : 365-370
Doi:10.19113/sdufenbed.867067
View : 8 | Download : 4
Publication Date : 2021-08-20
Article Type : Research
Abstract :Toksisite testleri arasında, bir etken nedeniyle ortaya çıkabilecek genetik değişim (mutasyon) olarak tanımlanabilen mutajenisite önemli yer tutmaktadır. Bu çalışmada genel olarak mutajenisite belirleme sürecini iyileştirebilmek adına in-silico yaklaşım kapsamında istatistiksel öğrenme algoritmaları kullanılmıştır. Söz konusu yaklaşım deneyler ile elde edilen mutajenisite bilgisi içeren molekül setine uygulanmış ve dikkate değer sınıflama başarıları elde edilmiştir. Çalışmada kullanılmak üzere literatürde bulunan, moleküllerden oluşan Bursi ile Benchmark veri setleri birleştirilmiş ve Molecular Operating Environment (MOE) programı aracılığı ile moleküllerin özellikleri hesaplanmıştır. Hesaplama sonucunda 10835 gözleme ve 193 değişkene sahip veri seti üzerinde karar ağaçları algoritmaları uygulanarak grid arama yaklaşımı ile parametre seçimi gerçekleştirilmiştir. Elde edilen en iyi parametreler ile kurulan modeller sonucunda değişkenlerin seçimi mutajenisiteyi tahmin etmedeki önem düzeylerine göre yapılmış ve verinin boyutu en etkili 72 değişkene indirgenmiştir. Seçilen değişkenlerden oluşan yeni veriye farklı istatistiksel öğrenme algoritmaları uygulanmış ve içlerinden en iyi sonuç veren beş sınıflama algoritmasına karar verilmiştir. Parametre en iyilemesi ile model başarımları arttırılan bu algoritmalar kullanılarak yaklaşık %90 mutajenisiteyi doğru sınıflama oranları elde edilmiştir.Keywords : Sınıflama, Topluluk Öğrenmesi, XGBoost, LightGBM, Değişken Seçimi, Toksisite