Olca Orakcı, An LLM-Driven Framework for Automatic Curriculum Learning to Enhance Generalization in Open-Ended Reinforcement Learning

Yüksek Lisans Adayı: Olca Orakcı

EABD: Çokluortam Bilişimi

Tarih: 14.01.2026 / 13:00

Yer: A-212

Özet: Pekiştirmeli Öğrenme araştırmaları, uzun zamandır genelleştirmeyi elde etme arayışındadır. Kıyaslama ortamları, bu zorlu görevi başarmak adına yıllar içinde kademeli olarak evrimleşmiştir. Ortamların daha karmaşık ve genelleştirme odaklı hale gelmesi, Açık Uçlu Öğrenme (OEL) gibi yeni araştırma alanlarını ortaya çıkarmıştır. OEL, ortamda sunulan her bir durum için gerekli olabilecek ya da olmayabilecek geniş bir beceri setinin bulunduğu öğrenme kurgularının incelenmesidir. Bu karmaşık ortamlar, ortamı ezberlemek yerine genelleştirilmiş beceriler öğrenebilen politikaları zorunlu kılmıştır. Otomatik Müfredat Öğrenimi (ACL) gibi yöntemlerin geliştirilmesiyle birlikte, bu zorlu görev daha erişilebilir hale gelmiştir. Bu tezin odak noktası, Büyük Dil Modellerinin (LLM) bir ACL yöntemi olarak kullanımına dair Uyarlanabilir Akıl Yürütme Müfredatı (ARC) adında standartlaştırılmış bir yaklaşımı; özgün, yüksek performanslı, örneklem verimli ve tekrarlanabilir bir şekilde sunmak ve bu yöntemi en gelişmiş devasa çok-ajanlı OEL ortamı olan Neural MMO 2 üzerinde doğrulamaktır. Deney sonuçları; ARC çerçevesinin, hem ortalama getiri hem de örneklem verimliliği açısından, uzmanlar tarafından hazırlanan müfredatı ve çeşitli ACL yöntemlerini geride bıraktığını göstermektedir. Yardımcı araçlar, bir gösterge paneli ve bir doğrulama aracı, ile desteklenen ARC çerçevesi; açık kaynaklı, standartlaştırılmış ve paylaşılabilir adaptörler, orkestratörler ve deney dosyaları aracılığıyla, LLM destekli OEL araştırmalarını tüm araştırmacılar ve meraklılar için erişilebilir kılmayı amaçlamaktadır.