Sana Basharat, Topluluk Öğrenmesi Kullanarak Kodlayıcı Olmayan Sürücü Mutasyonlarının Tahmini

Yüksek Lisans Adayı: Sana Basharat

EABD: Veri Bilişimi

Tarih: 07.06.2024 / 10:00

Yer: A-212

 

Özet: Sürücü kodlayan mutasyonları kapsamlı bir şekilde incelenmekte ve protein fonksiyonunu etkileyen zararlı amino asit değişiklikleri nedeniyle sıklıkla tespit edilmektedir. Ancak sürücü kodlamayan mutasyonların tespiti için daha fazla analize ve deneysel doğrulamaya ihtiyaç vardır. Burada, mevcut açıklama ve etki tahmin araçlarından gelen özelliklerle zenginleştirilmiş, yeni uzun menzilli etkileşim özelliklerine ve tasarlanmış transkripsiyon faktörü bağlama alanı özelliklerine dayalı olarak sürücü kodlamayan mutasyonları tahmin etmek için Güçlü Gradyan Arttırma (GGA) algoritmasını kullanıyoruz. Dizileri içeren yeni bir yöntem kullanarak uzun menzilli etkileşimli ilgi alanlarının sıklığını ve yayılmasını hesaplıyoruz. Transkripsiyon faktörü (TF) bağlama bölgelerindeki fonksiyonların kaybını ve kazanımını tahmin etmek için Rastgele Seçilmiş Gradyan İnişi (RGİ) algoritmasını kullanan transkripsiyon faktörü (TF) modellerini eğitiyoruz. Ayrıca mevcut açıklama ve etki tahmin araçlarından gelen özellikleri de dahil ediyoruz. Ortaya çıkan veri seti, metodik bir özellik seçimi ve özellik mühendisliği hattından geçirilir ve ardından sürücüye karşı yolcu kodlamayan mutasyonları tahmin etmek için gradyan artırma modelimizle eğitilir. Daha sonra diğer çalışmalarda bulunan kodlamayan sürücü mutasyonlarını kullanır, benzer şekilde açıklamalar ekler ve modelimizi test ederiz. Ayrıca mevcut literatürden bir sürücü keşif arttırılmış ağaçlar modeli uyguluyoruz ve bunu karşılaştırmalarımıza ekliyoruz. Daha sonra, açıklanabilir yapay zeka metodolojilerini kullanarak sonuçları detaylandırıyoruz. Sonuçlarımız, model eğitiminde kullanılmayan test verileri üzerinde ortalamanın üzerinde bir performans gösteriyor ve ek açıklamalarımızı kullanarak ve elde edilen verileri gradyan artırıcı ağaçlar kullanarak eğiterek, sürücü ile yolcu kodlamayan mutasyon arasındaki sınıflandırmanın nispeten yüksek doğruluk dereceleriyle mümkün olduğunu gösteriyor.