Onur Erdoğan, EnSCAN: “En”semble “S”coring for Prioritizing “CA”usative Varia“N”ts Across Multi-Platform GWAS for Late-Onset Alzheimer's Disease

Doktora Adayı: Onur Erdoğan

EABD: Tıp Bilişimi

Tarih: 06.09.2024 / 16:00

Yer: B-116

 

Özet: Alzheimer Hastalığı (LOAD), yaşlı bireyler arasında yaygın olarak görülen ilerleyici ve karmaşık bir nörodejeneratif hastalıktır. Hafıza bozukluğu ve azalmış entelektüel yetiler dahil olmak üzere bilişsel bozulma ile kendini gösterir. LOAD'un etiyolojisi sıklıkla travmatik beyin hasarlarıyla iç içe geçmiştir. Alzheimer Hastalığı'nın (AD) genetik temelleri belirsizliğini korumaktadır ve bu durum LOAD'un erken ve ayırt edici teşhisini engellemektedir. Genom boyutunda ilişkilendirme çalışmaları (GWAS), belirli lokuslarda bağımsız genetik varyantlar arasındaki istatistiksel etkileşimlerin incelenmesine olanak tanırken, geleneksel tek değişkenli analizler bu genetik varyantlar arasındaki doğrusal olmayan ve karmaşık ilişkileri gözden kaçırabilir. Buna karşın, makine öğrenimi (ML) algoritmaları, genetik varyantlar arasındaki doğrusal olmayan etkileşimleri dikkate alarak gizli, yenilikçi ve klinik olarak anlamlı örüntüleri ortaya çıkarmada önemli bir rol oynamaktadır. Böylece karmaşık hastalıklardaki genetik yatkınlığın anlaşılmasını artırmaktadır. Geleneksel sınıflandırma yöntemlerinden biri olan çoğunluk oy verme yöntemi, farklı genotipleme platformlarda farklı özellik yapılandırmaları nedeniyle uygulanabilir değildir. Bu nedenle, çoklu genotipleme platformları arasında anlamlı Tek Nükleotid Varyantlarını (SNV'ler) ayırt etmek için yenilikçi bir "post-ML ensemble" metodolojisi geliştirilmiştir. Bu çalışmada EnSCAN çerçevesini tanıtarak, farklı genotipleme platformlarında seçilen varyantları konsolide eden ve bu varyantları öncelikli aday lokus olarak sıralayarak her bir genotiplendirme platformundaki makine öğrenmesi sonuçlarından elde edilen önsel bilgiyi iyileştiren ve birleştiren yenilikçi bir algoritma önerilmektedir. Önerilen EnSCAN algoritması, varyatların kromozomal konumlarını sitogenetik bantlara göre haritalama ve çiftler arasındaki yakınlıkları ile çoklu model üzerinde Random Forest doğrulamalarını kullanarak SNV'leri ve Alzheimer Hastalığı için ayırt edici genleri önceliklendirmeyi sağlar. EnSCAN algoritmasındaki skorlama yöntemi ölçeklenebilir olup, herhangi bir çoklu platform genotipleme çalışmasına uygulanabilir durumdadır. Bu çalışmada EnSCAN skorlama algoritmasının, üç GWAS veri seti arasında LOAD ile ilişkili aday ayırt edici varyantlarını nasıl önceliklendirdiği sunulmaktadır.