Analysis of PDB Files and Calculating Similarity Between Two Proteins
Authors : Emre Yildirim, Volkan Altuntaş
Pages : 29-35
View : 24 | Download : 6
Publication Date : 2022-12-25
Article Type : Research
Abstract :Biyolojik yapıları incelemek protein mühendisliği, ilaç dizaynı ve üretimi gibi birçok geniş uygulama ağı için kritik bir işlemdir. PDB (Protein Veri Bankası) dosya formatı, proteinler gibi biyolojik moleküllerin tanımlandırılması, kimliklendirilmesi için kullanılmakta olan en elverişli ve popüler bir uzantıdır/formattır. Yazı tabanı yapısında olan bu formatta, satırlar belirli bir molekülü veya atomu belirtmektedir ve atomun ismi, kalıntısının ismi, bağlı olduğu zinciri ve koordinatları gibi teknik detaylarını içerir. Bu dosyalardan çeşitli detaylar ayıklayarak anlamlandırabilmek için çeşitli uygulamalar ve aracılar geliştirilmiştir. Geliştirilen bu araçlar, moleküler oluşumların incelenmesini ve dizaynını zor olmaktan çıkartır. Bu teknik uygulamalara örnek olarak ProDy ve BioJava gibi paketler gösterilebilir. Fakat bahsi geçen paketlerin yeni uygulamalara entegre olması kolay olmayabilir ve genellikle moleküler bazda simüle edilmelerinin incelenmesi hedefinde büyük kod tabanlarına entegredir. Ayrıca koordinatları güncelleştirme/değiştirme ve manipüle etme tekniklerinden yoksundurlar. PDB uzantılı dosyaları veritabanına çekebilen ve ayrıştırma işlemi, manipüle etme gibi kullanımları kolaylaştırarak sunan Python paketi pdb2sql kullanılmıştır. Farklı çözümler açısından bakılırsa, manuel olarak SQL kodu yazmak bir veritabanına sorgu çekmek için kullanılan en yaygın çözümlerdendir. Fakat SQL komut ve sorguları alanın dışında kalan çalışmacılar için zorlayıcı ve kafa karıştırıcı olup, SQL dilinin teknik olarak kullanılmasına engel teşkil etmektedir. Tam burada pdb2sql, son kullanıcılara basit Python tekniklerini kullanımı açısından aracı olarak SQL sorgularına kolaylık sağlar. Bununla birlikte makalede kullanılmış olan teknik ile SQL sorgularının olumlu ve etkili taraflarından yararlanılır ve SQL sorgu zorluklarına da çözüm olmuş olur. Buna ek olarak, biyolojik ve moleküler yapıları orijin ekseni etrafında döndürmek, arayüz ve teknik bilgilerine müdahale etmek ve iki protein arasındaki yapı benzeşmesini incelemek için pdb2sql içerisinde birkaç tipte güvenilir sınıflar da oluşturulmuş ve kullanılmaktadır. Sonuç olarak Python paketi olan pdb2sql; hafif ve çok yönlülüğüyle birlikte, modifiye ve dizayn edilmesi ve entegrasyon işlemleri kolay bir PDB uzantılı dosya işleme aracıdır.Keywords : pdb, proteinler, pdb2sql