Kadınların işgücüne katılım oranlarının tahmininde makine öğrenmesi metotlarının karşılaştırılması


Tezin Türü: Yüksek Lisans

Tezin Yürütüldüğü Kurum:

Tezin Onay Tarihi: 2024

Tezin Dili: İngilizce

Öğrenci: BİRSEN DAĞLI

Danışman: Seyit Mümin Cılasun

Özet:

Bu tezin amacı, kadınların işgücüne katılım oranlarının tahmininde makine öğrenmesi metotları içerisinde en iyi performans gösteren metodun hangi metot olduğunun belirlenmesi ve kadınların işgücüne katılımları üzerinde hangi faktörlerin en belirleyici olduğunun saptanmasıdır. Bu doğrultuda Dünya Değerler Araştırması'nın 1990-2022 dönemini kapsayan ikinci, üçüncü, dördüncü, beşinci, altıncı ve yedinci dalgaları incelenmiştir. Makine öğrenmesi algoritmaları olarak sırası ile Logistic Regression, Naïve Bayes, KNN (k-nearest neighbours), Karar Ağacı (Decision Trees), SVM (Destek Vektör Makineleri), Rastgele Orman (Random Forests), GBM ve XGBoost kullanılmıştır. Kullanılan yöntemler performans metrikleri olan Doğruluk (Accuracy), Kesinlik (Precision), Duyarlılık (Recall), F1-Score, AUC ve ROC değerlerine bakılarak karşılaştırılmıştır. Bulunan sonuçlar en iyi performans gösteren metotların XGBoost ve Rastgele Orman (Random Forest) olduğunu göstermektedir. Bu sonuçların yanında, makine öğrenmesi metotları, sırası ile bir kadının eğitim seviyesinin, yaşının, çocuk sayısının ve gelir düzeyinin işgücüne katılım kararında en önemli etkenler olduğunu göstermiş, bir kadının ataerkillik seviyesinin ve dindarlığının işgücüne katılım kararında etkisinin sınırlı olduğunu göstermiştir.