Doktora Adayı: Mustafa Erolcan Er
EABD: Bilişsel Bilimler
Tarih: 23.12.2025 / 15:00
Yer: A-212
Özet: Söylem ayrıştırması, doğası gereği barındırdığı karmaşıklık sebebiyle doğal dil işleme (DDİ) alanındaki en zorlu görevlerden biridir. Büyük dil modeli tekniklerindeki gelişmeler, tüm DDİ alanlarında olduğu gibi söylem ayrıştırması üzerinde de dikkate değer bir etki göstermeye başlamıştır. Bu tezde, Penn Discourse TreeBank (PDTB) tabanlı veri kümeleri için tasarlanmış çok dilli bir söylem ayrıştırma çerçevesi sunmaktayız. PDTB’ye dayalı söylem ayrıştırma modelleri ideal olarak üç modül içerir: söylem bağlayıcılarının (SB) tespiti, üye uzunluğu etiketleme ve söylem bağıntısı tanıma. Öncelikle, SB tespit ve üye uzunluğu etiketleme görevlerini Açık ve Alternatif Sözcükleşitrme (AltSöz) ilişki tipleri için BERT modeli üzerinde ince ayar yöntemiyle gerçekleştiriyoruz. Ardından, söylem bağıntısı tanıma (Açık, Örtülü ve AltSöz ilişki tipleri için) aşamasını çeşitli bağlama dayalı öğrenme stratejileri ile yürütüyoruz. Son olarak, uçtan uca söylem ayrıştırmasına yönelik ilk adım olarak SB tespiti ile üye uzunluğu etiketleme modülünü birbirine bağlayan bir modül ve SB tespiti ile söylem bağıntısı tanıma sistemini birbirine bağlayan ikinci bir modül tanımlıyoruz. Söylem ayrıştırması sistemimiz, İngilizce, Portekizce ve Türkçe olmak üzere üç dilde yedi farklı veri kümesi üzerinde test edilmiş ve her aşamada, mevcut en iyi söylem ayrıştırma modelleri ile kıyaslanabilir sonuçlar elde etmiştir. Modüler söylem ayrıştırma sistemimize ek olarak iki katkı daha sunmaktayız: hafif yapılı bir SB tespiti modeli öneriyor ve makine çevirisi tekniklerinden yararlanarak örtük söylem bağıntısı tanıma görevinde bir iyileştirme gerçekleştiriyoruz.
