SPSS'te Veri Temizleme ? Uç Değer (Outlier) Tespit ve Yönetim Rehberi
Veri Temizleme Neden İlk Adım?
Ham veri her zaman "kirli"dir ? veri giriş hataları, uç değerler, kayıp veriler, tutarsız yanıtlar. Kirli veriyle analiz = güvenilmez bulgular. Veri temizleme analizden ÖNCE yapılmalı ve tezde/makalede raporlanmalıdır.
Adım 1: Veri Giriş Hatalarını Bulma
Frekans tablosu: Analyze ? Descriptive ? Frequencies. Her değişkenin min-max değerini kontrol edin. 5'li Likert'te 6 veya 0 değeri varsa ? veri giriş hatası.
Betimsel istatistik: Ortalama ve standart sapma mantıklı mı? Yaş ortalaması 250 çıkıyorsa sorun var.
Adım 2: Uç Değer (Outlier) Tespiti
Yöntem 1 ? Z-skoru: Analyze ? Descriptives ? "Save standardized values" işaretleyin. |Z| > 3.29 olan gözlemler uç değer (p < .001). SPSS otomatik Z değişkeni oluşturur.
Yöntem 2 ? IQR (Çeyrekler Arası Genişlik): Q1 - 1.5×IQR altı ve Q3 + 1.5×IQR üstü = uç değer. Box plot ile görselleştirin: Graphs ? Legacy ? Boxplot. Kutu dışındaki noktalar = potansiyel uç değer.
Yöntem 3 ? Mahalanobis Uzaklığı (çok değişkenli): Regresyon analizi içinde hesaplanır. Analyze ? Regression ? Save ? Mahalanobis Distance. Ki-kare tablosundan kritik değer karşılaştırması yapılır (değişken sayısı = df, p < .001).
Adım 3: Uç Değerle Ne Yapmalı?
1. Doğrulama: Gerçekten hatalı mı yoksa gerçek bir gözlem mi? 500 TL maaş yazan akademisyen ? muhtemelen hata. 150.000 TL yayın alan profesör ? gerçek olabilir.
2. Veri giriş hatası ? Düzeltin (orijinal kaynak varsa) veya kayıp veri olarak işaretleyin.
3. Gerçek uç değer ? Seçenekler: a) Winsorizing: uç değeri en yakın normal değere çekin. b) Dönüşüm: log, karekök dönüşümü uygulayın. c) Çıkarma: son çare ? gerekçelendirin ve raporlayın. d) Bırakma: robust (dayanıklı) yöntemler kullanın.
Adım 4: Tutarsız Yanıt Tespiti
Aynı cevap kalıbı: Tüm sorulara 3-3-3-3 veren katılımcı ? dikkatsiz yanıt. Standart sapması 0 olan katılımcıları filtreleyin.
Ters kodlu madde tutarsızlığı: "Motivasyonum yüksek" (5) ve "İşimden memnun değilim" (5) ? tutarsız. Ters kodlu maddelerle korelasyonu düşük olan yanıtları kontrol edin.
Süre kontrolü (online anket): Ortalama tamamlama süresinin %10'u altında bitiren ? muhtemelen dikkatsiz.
APA'da Raporlama
"Veri temizleme aşamasında z-skoru |3.29|'u aşan 4 gözlem uç değer olarak tespit edilmiştir. Bu gözlemler Winsorizing yöntemiyle düzeltilmiştir. Ayrıca tüm sorulara aynı yanıtı veren 3 katılımcı (SD = 0) veri setinden çıkarılmıştır. Analizler temizlenmiş veri seti (N = 293) üzerinde gerçekleştirilmiştir."