Barış Deniz Sağlam, Büyük Dil Modelleri Kullanılarak Bilgi Grafiği Destekli Çok Adımlı Soru Cevaplama
Bu tez, küçük ve orta boyutlu dil modellerinin (LLM’ler) çok aşamalı soru cevaplama süreçlerinde kullanımını inceleyerek, bu modellerin GPT-4 gibi daha büyük modellere kıyasla bilgi ve akıl yürütme konusundaki sınırlamalarını aşmayı amaçlıyor. Araştırma, bu modellerin performansını artırmak için bilgi grafikleri kullanmayı, özellikle de metinden çıkarılan varlık-ilişki üçlülerinin entegrasyonunu incelemektedir. Varlık-ilişki çıkarımını geliştirmek için gözetimli ince ayar ve pekiştirmeli öğrenme gibi teknikler değerlendirilmektedir. Ayrıca, daha düşük hesaplama maliyetleriyle soru yanıtlama performansını artırmak amacıyla “Bağlantı-Kur-Varlıklarla” (Connect-the-Entities - CTE) adlı yeni bir istem tekniği tanıtılmaktadır.
Tarih: 29.08.2024 / 10:00 Yer: A-212