Tezin Türü: Yüksek Lisans
Tezin Yürütüldüğü Kurum: TED Üniversitesi, Lisansüstü Programlar Enstitüsü, Bilgisayar Mühendisliği ABD, Türkiye
Tezin Onay Tarihi: 2023
Tezin Dili: İngilizce
Öğrenci: YAMAÇ TAN
Danışman: Gökçe Nur Yılmaz
Açık Arşiv Koleksiyonu: AVESİS Açık Erişim Koleksiyonu
Özet:
| Bilimsel araştırmaların ve akademik çalışmaların ivmelenerek arttığı Bilgisayarlı Görü alanında 3 Boyutlu (3B) videoların kullanımını temel alan uygulamaların popülaritesi her geçen gün yükselmektedir. Doğası itibariyla 3 boyutlu videoların kalitesini belirleyici rolde, iç-dış mekan farklılıkları ve çevresel faktörler gibi birçok değişken bulunmaktadır. Bu bağlamda, modern uygulamalarda kullanılacak 3B videoların kalite değerlendirmesi için yeni yöntemler geliştirmek, yüksek derinlik algısı memnuniyeti ve verimli iletim kanalı kullanımı sağlamak için elzemdir. Bu tezde, İnsan Görsel Sistemi (İGS) özelliklerini dikkate alarak izleyicilerde derinlik algısı memnuniyetini artırmayı amaçlayan dinamik, uyarlanabilir ve herhangi bir referans video gerektirmeyen bir 3B video kalite değerlendirme modeli sunulmuştur. Sunulan modelin temelleri, hem videoları oluşturan renkli görüntülerin, hem de derinlik haritalarının ilgili işlemlere dahil edildiği ölçüm metodlarına dayandırılmıştır. Derin öğrenme temelli yaklaşımlarının kullanılmasına azami önem gösterilen çalışmada Havadan Perspektif (AP) ölçüm metodu için Pix2Pix, Hareket Bilgisi (MI) ölçüm metodu için RAFT, Ağ Katmansal Görüntü Boyutu (RIS) ve Yakınsama (CONV) ölçüm metodları için ise YOLOv8 modelleri kullanılmıştır. Tüm yöntemler renkli videolar üzerinde gerçekleştirilmekle birlikte RIS ve CONV yöntemlerinde derinlik haritaları da hesaplamalara dahil edilmiştir. Yapılan çalışmalar sonucunda, önerilen yöntemlerin tüm çıktıları beklenen sonuçları karşılayacak şekilde elde edilmiş ve tez çalışması başarıyla tamamlanmıştır. | |||