Bilişim Sistemleri EABD Yüksek Lisans Programı öğrencisi Yaser Yurtcan, "Mobil Cihazlarda Gerçek Zamanlı Gürültülü Konuşma Tanıma Performans Değerlendirilmesi" konulu tezini
Tarih: 12 Şubat 2019
Saat: 10:30 PM
Yer: A-212
Tez Özeti: İletişim insanlar için önemlidir. Birçok iletişim kurma yöntemi bulunmaktadır. Bunlar arasında en etkili olanı konuşmadır. Konuşma ile insanlar duygularını ve düşüncelerini rahat bir biçimde ifade edebilmektedir. Bununla birlikte, bazı insanların işitme problemi olabilir. Dahası, gürültülü bir ortamda konuşulan kelimeleri anlamak sağlıklı insanlar için bile zor olabilir. Konuşma tanıma sistemleri, metin dönüşümüne gerçek zamanlı konuşma sağlar. Konuşma tanıma sistemleri genellikle ses dalgalarının yakalanmasını ve anlamlı metinlere dönüştürülmesini içerir.
Mobil cihazlarda konuşma tanıma kullanımı, bulut sistemlerinin geliştirilmesi ile mümkün olmuştur. Ancak, gürültülü ortamlarda gürbüz ve düşük hata oranlı konuşma tanıma sistemi sağlamak hala önemli bir sorundur. Bu çalışmada, gürültülü ortamlarda kompakt bir mikrofon dizisi kullanılarak farklı konuşma örnekleri kaydedilmiş ve gerçek zamanlı bir gürültü engelleme algoritmasıyla işlenerek bir veri kümesi oluşturulmuştur. Konuşulanları anlamlı bir metne dönüştürmek için gürültü engelleme donanımı ve yazılımı olan taşınabilir bir mobil sistem önerilmiştir.
Farklı bulut sistemlerinin konuşma tanıma performansını, önerilen sistemin gürültüye dayanlıklılığını, konuşmacının cinsiyetinin konuşma tanıma performansına etkisini ve performans iyileştirmeyi ölçmek için temiz, gürültülü ve gürültüden temizlenmiş konuşma örnekleri üzerinde kapsamlı testler yapılmıştır. Deney sonuçları, önerilen sistemin gürültülü ortamlarda bile iyi performans sergilediğini göstermektedir. Sonuçlardan ayrıca anlaşılmıştır ki, mobil cihazlarda bulut tabanlı sistemleri kullanarak konuşma tanıma yapmak için gürültü seviyesi düşük olmalıdır veya gerçek zamanlı gürültü iptali algoritmalarına ihtiyaç duyulmaktadır. Önerilen sistem gürültülü ortamlarda konuşma tanıma doğruluğunu arttırmaktadır. Böylece, elde edilen performans ve taşınabilir tasarım, sistemin günlük hayatta kullanılmasına olanak sağlamaktadır.
Sinopsis: Bu çalışmanın amacı mobil cihazlarda gürültülü konuşma tanıma performansını iyileştirmektir. Bu çalışma, soruna bir sistem tasarımı sorunu olarak yaklaşmakta ve istenilen sonuçları elde etmek için uygun donanım ve yazılım bileşenlerini entegre etmektedir. Önerilen sistem ayrıntılı olarak anlatılmış, kullanılan gürültü iptal algoritmasının özellikleri, seçilen transfer ortamının nedenleri ve konuşma tanıma uygulaması açıklanmıştır. Detaylı sonuçlar belirtilmiştir ve sonuçlar değerlendirilmiştir. Bu nedenle, mevcut gürültü iptali veya konuşma tanıma algoritmalarının geliştirilmesi bu tezin kapsamı dışındadır.