Yüksek Lisans Adayı: Fatma Cankara
EABD: Biyoinformatik
Tarih: 30.01.2020 / 14:00
Yer: A-212
Özet: Tüm genom ve ekzom dizilemeleri göstermiştir ki, genom üzerindeki değişiklikler protein dizilimi, protein yapısı veya protein kararlılığı üzerinde sebep olduğu çeşitli değişikliklerle protein işlevi üzerinde zararlı etkilere sebep olabilir. Protein dizi, yapı ve işlevini değiştiren bu tekli nükleotid değişiklikleri, bir diğer deyişle sinonim olmayan tek nükleotid polimorfizmleri, insanlarda pek çok hastalık oluşumundan sorumludur. Ancak, bu mutasyonları anote etme hızı, yeni dizi verisi üretme hızının çok gerisinde kalmaktadır. Bu süreci hızlandırmak için, otomatize edilmiş bilgisayar tabanlı geliştirilmekte ve bilinmeyen veriler üzerinde uygulanmaktadır. Bu çalışmada biz, sinonim olmayan tekli nükleotid değişikliklerinin amino asit seviyesinde gösterdikleri etkiler hakkındaki bilgileri çeşitli veri tabanlarından toplamak ve organize etmek, bu bilgiyi sonuçları bilinmeyen tekli nükleotid değişikliklerinin proteine zarar verme potansiyellerini gözetimli makine öğrenmesi sistemi kullanarak tahmin etmek için bir metodoloji sunuyoruz. Bu amaçla, UniProt, ClinVar ve PMD gibi çeşitli veri tabanlarından anote edilmiş 109,069 mutasyon (68,831 zarar gösteren ve 50,238 zarar göstermeyen) toplandı. Her mutasyon veri noktası için, proteinlerin 3 boyutlu yapı bilgisi ve bölgesel UniProt dizi anotasyonları kullanılarak bir öznitelik vektörü oluşturuldu. Her mutasyonun bu bölgesel dizi anotasyonlarına olan uzaysal uzaklığı öznitelik vektörüne eklendi. Nihai amaç mutasyonları zarar gösteren ve zarar göstermeyen olarak sınıflandıracak bir model geliştirmek olmak üzere, bu öznitelikler ve bunların etiketleri kullanılarak bir gözetimli öğrenme sistemi eğitildi. Tahmin modeli çeşitli öznitelik alt gruplarının tahmin başarısına etkisini ölçmek üzere detaylı bir şekilde değerlendirildi. Nihai model bağımsız bir test seti üzerinde tatmin edici bir başarı gösterdi (AUROC:0.86, kesinlik: 0.77, duyarlılık 0:90, doğruluk: 0.78, F1-puanı: 0.83 ve MCC: 0.54) Gelecekte yapılacak çalışmalar olarak, ilk önce modelimizin performansını kalite testi ile mutasyon etkisi tahmini yapan yaygın metotların sonuçlarıyla karşılaştırmayı amaçlıyoruz. Daha sonra, bir vaka çalışması yürütüp, sonuçlarımızı literatür bazlı bilgi ile doğrulamayı planlıyoruz. Son olarak, geliştirdiğimiz aracı kullanıma hazır bir komut satırı aracı haline getirip, açık kaynaklı bir veri kaynağı vasıtasıyla araştırma topluluğuyla paylaşmayı planlıyoruz. Umuyoruz ki, geliştirdiğimiz metot literatürdeki iyi bilinen mutasyon etki tahmini araçlarına bir tamamlayıcı olacak ve gelecekte bileşik metotlara eklenerek gelişmiş metotların performansını artıracaktır.