Decathlon Ürün Yorumlarında Duygu Analizi: Makine Öğrenmesi Algoritmaları ve SHAP Tabanlı Özellik Önemi
Selin Pir — Pamukkale Üniversitesi, Yönetim Bilişim Sistemleri
Danışman: Prof. Dr. Selçuk Burak Haşıloğlu
Araştırma Sorusu
Neden Bu Konu?
Motivasyon
E-ticaret platformlarında biriken binlerce müşteri yorumu, işletmeler için değerli içgörüler barındırır. Ancak bu yorumların manuel analizi pratik değildir. Literatür taraması kapsamında Decathlon Türkiye özelinde Türkçe müşteri yorumlarını ele alan sistematik bir duygu analizi çalışmasına ulaşılamamıştır.
Araştırma Sorusu & Hedefler
Decathlon Türkiye'deki 12.463 Türkçe müşteri yorumu üzerinde yapısal öznitelikler (yorum uzunluğu, yıldız, fiyat, marka, kullanım süresi) duygu sınıfını ne ölçüde belirler? Hangi makine öğrenmesi modeli en yüksek performansı sunar ve en güçlü belirleyici değişken hangisidir?
Metodoloji
Araştırma Pipeline
Veri toplama aşamasından açıklanabilir yapay zekâ analizine kadar 7 adımlı süreç.
Orange Data Mining
Analiz Akış Diyagramı
Düğümleri sürükleyerek akışı keşfedin. Her renk farklı bir widget kategorisini temsil eder.
Veri Seti
12.463 Türkçe Müşteri Yorumu
Decathlon Türkiye platformundan toplanan yorumların duygu dağılımı ve spor dalı analizi.
Duygu Dağılımı
En Fazla Yorum Alan Spor Dalları
Performans
Model Karşılaştırması
9 makine öğrenmesi algoritmasının 10-katlı stratified çapraz doğrulama sonuçları.
| Model | AUC | CA | F1 | Precision | Recall | |
|---|---|---|---|---|---|---|
| Gradient Boosting | 0,773 | 0,688 | 0,658 | 0,695 | 0,688 | |
| Neural Network | 0,769 | 0,686 | 0,655 | 0,691 | 0,686 | |
| Random Forest | 0,738 | 0,649 | 0,632 | 0,635 | 0,649 | |
| Naive Bayes | 0,736 | 0,651 | 0,635 | 0,636 | 0,651 | |
| Logistic Regression | 0,732 | 0,592 | 0,525 | 0,587 | 0,592 | |
| Decision Tree | 0,719 | 0,623 | 0,614 | 0,611 | 0,623 | |
| kNN | 0,700 | 0,592 | 0,583 | 0,579 | 0,592 | |
| AdaBoost | 0,681 | 0,599 | 0,591 | 0,587 | 0,599 | |
| Stochastic Gradient Descent | 0,569 | 0,563 | 0,463 | 0,618 | 0,563 |
Açıklanabilir Yapay Zekâ
SHAP Özellik Önem Analizi
Gradient Boosting modeli üzerinde permütasyon tabanlı özellik önem analizi sonuçları.
Negatif Sınıf
Yüksek kelime_sayisi → negatif olasılık artar. Uzun yorumlar memnuniyetsizlik sinyali taşır.
Pozitif Sınıf
Yüksek YORUM_YILDIZ + düşük kelime_sayisi → pozitif. Kısa ve yüksek puanlı = memnun müşteri.
Nötr Sınıf
Değişkenler dengeli etki gösterir. Kısa yorumlar nötre kayma eğilimindedir.
Özellik Önem Sıralaması
Sonuç
Temel Bulgular & Katkılar
En Başarılı Model
Gradient Boosting en yüksek AUC değerine (0,773) ulaşarak yapısal özniteliklerle duygu sınıflandırmasında öne çıkmıştır.
En Güçlü Belirleyici
Yorum uzunluğu (kelime_sayisi) — ∆AUC 0,19 ile en etkili değişkendir. Çıkarıldığında model performansı ciddi düşer.
Pratik Çıkarım
Uzun yorumlar öncelikli incelenmeli — memnuniyetsizlik göstergesidir. Bu bulgu, müşteri ilişkileri yönetiminde önceliklendirme stratejisi sunar.