Mustafa Erolcan Er, PDTB Tabanlı Çok Dilli Söylem Ayrıştırma İçin Modüler Bir Yapı
Bu tez, Penn Discourse TreeBank (PDTB) veri setleri için uygulanan çok dilli bir çerçeve geliştirerek, Doğal Dil İşleme (NLP) alanındaki söylem ayrıştırmasının doğasında var olan karmaşıklığı ele almaktadır. Büyük Dil Modelleri (LLM) ve transformer mimarilerindeki ilerlemelerden yararlanan tez; Söylem Bağlacı (DC) tespiti ve argüman aralığı etiketleme için ince ayar yapılmış BERT modellerini, Söylem İlişkisi Tanıma (DRR) aşaması için bağlam içi öğrenme stratejileriyle birleştiren hibrit bir metodoloji önermektedir. Çalışma; tespit, etiketleme ve tanıma aşamalarını birbirine bağlayan modüller tanımlayarak, yalıtılmış alt görevler ile uçtan uca işleme arasındaki boşluğu doldurmaktadır. İngilizce, Portekizce ve Türkçe dillerindeki yedi veri seti üzerinde değerlendirilen bu çerçeve, literatürdeki güncel modellerle eşdeğer bir performans sergilemektedir. Ek olarak tez, özgün ve hafif yapılı bir DC tespit modeli sunmakta ve makine çevirisi tekniklerini kullanarak örtük söylem ilişkisi tanımayı geliştirecek bir yöntem tanıtmaktadır. Böylece, bu yaklaşımların hem yüksek hem de düşük kaynaklı dil bağlamlarındaki etkinliğini ortaya koymaktadır.
Tarih: 23.12.2025 / 15:00 Yer: A-212

