Basit öğe kaydını göster

dc.contributor.authorYenilmez, Fulya
dc.date.accessioned2024-03-14T14:36:34Z
dc.date.available2024-03-14T14:36:34Z
dc.date.issued2023en_US
dc.date.submitted2023-07-21
dc.identifier.citationYenilmez, Fulya (2023). Explanatory comparative study of AI models in face expression recognition. Türk-Alman Üniversitesi, Fen Bilimleri Enstitüsü, İstanbul.en_US
dc.identifier.urihttps://hdl.handle.net/20.500.12846/797
dc.description.abstractThis thesis provides an analysis and comparison of five widely used CNN architec tures in face expression recognition task. The objective is to evaluate the performance of different CNN architectures available in the Keras library for this challenging com puter vision task. The chosen CNN architectures for comparison include VGG19, InceptionV3, ResNet152V2, MobileNetV2, and EfficientNetV2B1. Two different kinds of facial datasets are used in this research. The first dataset is Fer2013, a com monly used dataset in this domain known for its unbalanced structure. The second dataset is the FACES dataset from the Max-Planck Institute, comprising posed im ages of individuals with a balanced structure. Both of these datasets contain labeled face expression images. Pre-processing steps, such as rotation, shift, resizing, and rescaling, are applied to these images. Since this is a comparative analysis study, the same transfer learning steps are applied to all models. The results from this training are evaluated using test accuracy, which is necessary for analyzing every aspect of the study. To ensure a fair comparison, the same transfer learning steps are applied to all models. The models are trained by dividing the dataset into three sets; training data set, validation data set, and test data set. The comparative study reveals that each CNN architecture exhibits different levels of performance in facial expression recognition tasks. The study provides significant knowledge about the strengths and weaknesses of each CNN architecture in face ex pression recognition. Overall, this comparison study provides clarity on the effectiveness of VGG19, In ceptionV3, ResNet152V2, MobileNetv2, and EfficientNetV2B1 architectures in rec ognizing facial expressions. It serves as a valuable resource for researchers in the fields of computer vision and expression analysisen_US
dc.description.abstractBu tez, yüz ifadesi tanıma görevinde yaygın olarak kullanılan be¸s CNN mimarisinin analizini ve kar¸sıla¸stırmasını sunmaktadır. Amaç, bu zorlu bilgisayarla görme görevi için Keras kütüphanesinde bulunan farklı CNN mimarilerinin performansını deger- ˘ lendirmektir. Kar¸sıla¸stırma için seçilen CNN mimarileri arasında VGG19, Incepti onV3, ResNet152V2, MobileNetV2 ve EfficientNetV2B1 bulunmaktadır. Bu ara¸stırmada iki farklı türde yüz veri seti kullanılmı¸stır. ˙Ilk veri seti, dengesiz ya pısıyla bilinen ve bu alanda yaygın olarak kullanılan Fer2013 veri setidir. ˙Ikinci veri seti ise Max-Planck Enstitüsü’nün FACES veri setidir ve dengeli bir yapıya sahip bireylerin pozlanmı¸s görüntülerinden olu¸smaktadır. Bu veri setlerinin her ikisi de eti ketli yüz ifadesi içeren görüntülerdir. Bu görüntülere döndürme, kaydırma, yeniden boyutlandırma ve yeniden ölçeklendirme gibi ön i¸sleme adımları uygulanmı¸stır. Bu bir kar¸sıla¸stırmalı analiz çalı¸sması oldugu için tüm modellere aynı transfer ö ˘ grenme ˘ adımları uygulanır. Bu egitimden elde edilen sonuçlar, çalı¸smanın her yönünü ana- ˘ liz etmek için gerekli olan test dogrulu ˘ gu kullanılarak de ˘ gerlendirilir. Adil bir kar¸sı- ˘ la¸stırma saglamak için tüm modellere aynı transfer ö ˘ grenme adımları uygulanmı¸stır. ˘ Modeller, veri seti üç kümeye bölünerek egitilir; e ˘ gitim veri seti, do ˘ grulama veri seti ˘ ve test veri seti. Kar¸sıla¸stırmalı çalı¸sma, her CNN mimarisinin yüz ifadesi tanıma görevlerinde farklı performans seviyeleri sergiledigini ortaya koymaktadır. Çalı¸sma, yüz ifadesi tanımada her bir CNN mimarisinin güçlü ve zayıf yönleri hakkında önemli bilgiler sag-˘ lamaktadır. Genel olarak, bu kar¸sıla¸stırma çalı¸sması VGG19, InceptionV3, ResNet152V2, Mobi leNetv2 ve EfficientNetV2B1 mimarilerinin yüz ifadelerini tanımadaki etkinligi hak- ˘ kında netlik saglamaktadır. Bilgisayarla görme ve ifade analizi alanlarındaki ara¸stır- ˘ macılar için degerli bir kaynak niteli ˘ gindediren_US
dc.language.isoengen_US
dc.publisherTürk-Alman Üniversitesi Fen Bilimler Enstitüsüen_US
dc.rightsinfo:eu-repo/semantics/openAccessen_US
dc.subjectFace expression recognitionen_US
dc.subjectNeural networksen_US
dc.subjectCNN architecturesen_US
dc.subjectTransfer learningen_US
dc.subjectFine-tuningen_US
dc.subjectYüz ifadesi tanımaen_US
dc.subjectSinir ağlarıen_US
dc.subjectCNN mimarilerien_US
dc.subjectÖğrenme aktarımıen_US
dc.subjectİnce ayarlamaen_US
dc.titleExplanatory comparative study of AI models in face expression recognitionen_US
dc.title.alternativeYüz ifadesi tanıma alanında yapay zeka modellerinin karşılaştırılmalı açıklamalı çalışmasıen_US
dc.typemasterThesisen_US
dc.relation.publicationcategoryTezen_US
dc.contributor.departmentTAÜ, Fen Bilimleri Enstitüsü, Robotlar ve Akıllı Sistemler Ana Bilim Dalı Koleksiyonuen_US


Bu öğenin dosyaları:

Thumbnail

Bu öğe aşağıdaki koleksiyon(lar)da görünmektedir.

Basit öğe kaydını göster