Endüstri Mühendisliği (Industrial Engineering): SPSS Menü Kullanımı

BÖLÜM 1

HAZIR İSTATİSTİK YAZILIMLARI

1.1 HAZIR YAZILIMLAR

Günümüzde teorik ve uygulamalı bilim alanlarında bilimsel araştırmalara büyük önem verilmektedir. Araştırmalarda; araştırma planlama, araştırma alanlarının ve örneklerin seçilmesi, veri toplama, verilerin tablo ve grafiklerle özetlenmesi, hipotezlerin formulasyonu, hipotezlerin test edilmesi, sonuçların yorumlanması ve genellenmesi, bilimsel raporların hazırlanması ve veri sunum teknikleri gibi konularda ve bilimsel bilgi üretiminde tek tip yaklaşımlar kullanmak büyük önem taşımaktadır. Anılan konularda ortak ve etkin çalışmalar yapabilmek için istatistiksel yöntemlerden yararlanmak gerekir.

Araştırmalardan elde edilen yığınlarla verinin bilgisayar aracılığıyla kolayca analiz edilmesi isteği ve tüm dünyada bilgisayar kullanımının hızla yayılması, paket programlarının da hızla gelişmesine ve çeşitlenmesine yol açmıştır.

Tüm bilim ve uygulama alanlarında bilimsel araştırmaların yoğun bir uğraş olması, hazır istatistiksel veri analizi programlarının yaygın biçimde kullanılmasına yol açmıştır. Şu bir gerçektir ki; hazır yazılımlar; araştırmacıları ileri veri analizi tekniklerinin uygulanmasını gerektirecek tipte analitik araştırma planlamaya özendirmektedir. İleri analitik araştırmalar; ayrıntılı araştırma planlaması, çok sayıda birim ve değişken üzerinde veri toplamayı gerektirir. Gelişmiş özelliklere sahip hazır yazılımlar bu tür çok değişkenli veri yapılarını analizde kullanıcılara üstün destek sağlamaktadır.

Hazır yazılımları değerlendirirken;

• İçerdiği temel ve ileri istatistiksel tekniklerin çeşitliliği, grafik desteği sunması
• Programın sürekli geliştirilme, yeni versiyonlarının piyasaya sunulma garantisi
• Paketi hazırlayan merkezin kimliği
• Kullanım klavuzunun bulunması
• İçerdiği online yardım seçenekleri, yardımın açıklığı ve örneklerin çeşitliliği
• Veri girişi için çalışma sayfası içermesi ve matris formundaki veri girişlerini desteklemesi
• Lotus 123, Excel, Symphony, Database gibi yaygın kullanımı olan paket programlar ile veri alışverişinde bulunması
• Ekran dizaynı, menü yerleşimleri, mouse desteği, menüler arası geçişlerde vb. kullanımda kolaylık sağlaması
• Yaygın kullanımı olan yazıcı desteği sağlaması
• Tek ve çok kullanıcılı paketlerin fiyatının uygun olması, hız, fiyat ve performans bakımından üstün olması gibi kriterleri gözönüne almak gerekir.

Hazır yazılım değerlendirme kriterleri gözönüne alınarak piyasada bulunan ve yaygın olarak kullanılan hazır yazılımları; kullanım kolaylığına, temel ve ileri istatistiksel test yöntemlerini ve grafiksel teknikleri içerme özelliklerine göre INSTAT ve MYSTAT, SYSTAT, GENSTAT, OSIRIS, STATISTICA, SAS, BMDP, MINITAB, STATGRAPH, SPSS gibi seçmek ve sıralamak mümkündür. Yapılan değerlendirmelere göre BMDP,MINITAB, SAS, SPSS VE SYSTAT paket programları A kalite derecesine sahip olmuştur. Bu programlardan MINITAB, SPSS ve SYSTAT kullanım kolaylığı, bulunabilirlik ve fiyat etkinlik bakımından diğerlerinin önüne geçmiştir.

Yukarıdaki hazır yazılımların tümü aşağıdaki özellikleri taşımaktadır;

1. Worksheet aracılığı ile veri girişi
2. Başka paket programlardan veri aktarılması
3. Veri analizi modülleri aracılığı ile veri işleme
3.1 Frekans ve çapraz tabloların hazırlanması
3.2 Grafiklerin çizilmesi
3.3 Belirtici istatistiklerin hesaplanması
3.4 Kontenjans tablolarında kikare analizi
3.5 Parametrik ve parametrik olmayan testler
3.6 Regresyon ve korelasyon analizi (basit doğrusal, çoklu)
3.7 Çok değişkenli analiz
3.8 Zaman serileri analizi
3.9 Uyum analizi

MINITAB’de yukarıdaki özelliklere ek olarak teorik dağılımlara göre veri türetimi yer almaktadır.

SPSS’de ise yukarıdaki özelliklere ek olarak; Yaşam analizi, Güvenirlik ve soru analizi, Proses analizi, Homojenite Analizi, CHAID analizi yer almaktadır.

Hazırladığımız tezde yaygın şekilde kullanılan, kullanımı kolay olan etkin veri analizi yazılımlarından SPSS ve MINITAB paket programlarından sözedilecektir. Uygulamada bu programlar arasında farklılıklar varsa bu farklılıklara değinilecektir.

BÖLÜM 2

SPSS’E GİRİŞ

2.1 GİRİŞ

SPSS, veri analizi amacıyla geliştirilmiş temel ve ileri istatistiksel yöntemleri içeren bir pakettir. SPSS kelimesi, Statistical Package for Social Sciences sözcüklerinin baş harflerinden oluşmuş bir kelimedir. SPSS özellikle anket ve araştırma formlarından elde edilen verilerin analizinde yararlanılan ve yaygın kullanımı olan bir pakettir. Başlıca üç temel işlevi vardır.

• Verileri, kendi işleyeceği bir şekle çevirir.
• Verileri yeni şekillere sokar veya buradan yeni veriler hesaplar.
• Veriler üzerinde istatistiksel işlemler yapar ve grafikler hazırlar.

SPSS for WINDOWS, hem WINDOWS üzerinde çalışan ve WINDOWS’un ana özelliklerini kullanan bir menü yardımıyla hem de komut diliyle yazılmış dosyaların vasıtasıyla çalıştırılır.

SPSS çeşitli modüllerden oluşmuş bir pakettir. Bu modüller aşağıdaki gibi sayılabilir.

1. Base modülü: Veri girişi, veri işleme ve temel istatistiksel analizleri içeren bir modüldür.
2. Advanced Statistics modülü: Yaşam analizi, Lojistik Regresyon, Probit Regresyon, Cox Regresyon, MANOVA, Loglineer analiz gibi ileri istatistiksel yöntemleri kapsar.
3. Professional Statistics modülü: Kümeleme, Faktör, Diskriminant analizi gibi ileri istatistiksel yöntemleri kapsar.
4. Trends modülü: Zaman serilerinin analizini yapan ARIMA, Spectral analiz gibi yöntemleri içerir.
5. Statistical Quality Control modülü: Kalite kontrolünde yararlanılan prosedürleri içerir.
6. CHAID modülü: Aşamalı veri yapılarının Ki-kare analizi aracılığı ile analizini yapar.
7. LISREL modülü: Verilere doğrusal modeller uygular, parametre tahminleri ve testler yapar. İleri regresyon modelleri içerir.
8. Categories modülü: Kategorik verilerin analizini yapan yöntemler içerir.( Uyum, Türdeşlik analizi vb..)

2.2 SPSS MENÜLERİ

SPSS; File, Edit, View, Data, Transform, Analyze, Graphs, Utilities, Window, Help isimli on menüden oluşmaktadır.Temel menüler Ekran 2.1’de görülmektedir.

Ekran 2.1 SPSS’in ana menüleri

2.2.1 FİLE MENÜSÜ

Dosya işlemlerinin yürütüldüğü bir menüdür.Bu menü aracılğıyla;

• Yeni dosyalar açmak
• Disketteki kayıtlı dosyaları kullanıma açmak
• Yeni oluşturulan yada değişiklik yapılan dosya içeriklerini aynı isim yada farklı bir isimle diskete kaydetmek.
• Dosyalar hakkında bilgiler almak, dosya içeriklerini yazıcıdan dökmek vb işlemleri yapmak mümkündür

File menüsü alt seçenekleri Ekran 2.2’de görülmektedir ve işlevleri kısaca açıklanmıştır.

Ekran 2.2 File menüsü alt seçenekleri

New: Yeni veri (data), SPSS Syntax (komut dosyası) ve SPSS Output (çıktı) dosyalarından birini açmak için kullanılır.

• Data seçeneği tıklandığında veri giriş ekranı görüntüye gelir. Bu ekrana veri girişi yapılır.

Ekran 2.3 New seçeneği alt işlevler penceresi

Open : Diskette kayıtlı dosyaları kullanıma açmak için yararlanılır. Open seçeneği tıklandığında Data, SPSS Sytax, SPSS output dosya türlerinden birisi açılabilir.
• Data seçeneği tıklandığında *.sav uzantılı mevcut dosyalar görüntülenir ve bu listeden açılması istenen dosya seçilir.
• Open Syntax seçeneği SPSS komut satırını içeren ve ASCII formatta yazılmış dosya açar.
• Open output seçeneği SPSS çıktılarının ASCII formattaki bir dosyasını açar.

Open Database:.

Ekran 2.4 Open database seçeneği alt işlevler penceresi

Read Text Data: Herhangi bir editör progamı ile ASCII formatında yazılmış dosyalar SPSS tarafından okunup kendi formatına çevrilebilir.

Save : Aktif penceredeki dökümanı veya grafik penceresini bir dosyaya kaydeder

Save as: Aktif pencerede yer alan dökümanı yeni dosya ismi ile kaydeder.

Display Data Info: Disk üzerinde kayıtlı bulunan ve SPSS formatında kayıt edilmiş veri dosyaları hakkında bilgi verir.

Apply Data Dictionary: Daha önce SPSS formatında kayıtlı bir dosyadan halen kullanılan aktif bir veri dosyasına formatı ve isimleri uymak kaydı ile bilgi aktarmayı sağlar. Böylece daha önce aynı değişken isimlerine sahip bir dosyadan bu isimler yeni veri dosyasına aktarılabilir.

Cache Data

Print: Aktif pencerede yer alan bilgileri yazıcıdan döker.

Printer Preview: SPSS çıktılarını ve diğer pencere içeriklerinin yazıcıdan alınmasında yazıcı ayarları özelliklerini kullanarak yazıcı ayarlarının yapılmasını sağlar.

Switch Server

Stop Processor: Uygulanan bir yöntemin işlemlerini durdurmak veya kesmek için yararlanılır.

Recently Used Data

Recently Used Files

Exit: SPSS uygulamasından çıkılmasını ve SPSS’in kapatılmasını sağlar.

2.2.2 EDİT MENÜSÜ

SPSS’in metin, çıktı, veri dosyaları ve çalışma ekranları üzerinde standart işlemleri (kesme, yapıştırma, kopyalama, arama, ekleme, değiştirme vb. ) yerine getirir. Edit menüsü seçenekleri ve işlevleri Ekran 2.5’deki gibidir:

Ekran 2.5 Edit menüsü seçenekleri

Undo : Veri sayfasında son yapılan değişikliğin iptal edilerek işlevin bir önceki konuma getirilmesini sağlar.

Redo: Veri sayfasında iptal edilen son işleme tekrar ulaşılmasını sağlar.

Cut: Aktif pencerede işaretlenmiş olan bölümü pencereden keser, çıkarır ve kesilen ekran parçasını panoya alır. Eğer kesilen parça bir değişken ise veri sayfasında başka kolonlara bu değişkenin kopyalanmasını sağlar.

Copy: Aktif pencereden işaretli bölümü ya da veri ekranında işaretli verileri panoya kopyalar. Bu panoya alınan kesim bir metin ise diğer metin pencerelerine, veri ise veri ekranında başka kolonlara yapıştırılabilir.

Paste: Panoda yer alan daha önce kopyalanmış içeriği belirtilen alana işaret noktasından itibaren yapıştırır.

Clear: Seçilen bir metin alanını panoya almaksızın siler, belirlenen alanı temizler, boşaltır.

Find: Komut yazım penceresinde ve çıktı penceresinde yer alan metin içeriğinde herhangi bir karakter ifadeyi sağlar.

Options

2.2.3 VIEW MENÜSÜ

Ekran 2.6 View menüsü alt seçenekleri

2.2.4 DATA MENÜSÜ

Veri seti ile ilgili işlemler yapmaya yarar.
• Değişkenlerin belirlenmesi
• Tarih belirlenmesi
• Yeni değişkenler elde edilmesi
• Değişkenlerin başka cebirsel tabanlara dönüştürülmesi
• Verileri sıralama ve veri dosyalarını birleştirme işlevlerini de yerine getirmeye yarar.

Data menüsü seçenekleri ve işlevleri Ekran 2.7’deki gibidir.

Ekran 2.7 Data menüsü alt seçenekleri

Define Dates: Ay, gün, hafta ve saat gibi periyodik verilerin türetilmesini sağlar.

Insert Variable: Veri sayfasına seçilen kolonun soluna yeni bir değişken ekler.

Insert Case: Veri sayfasında seçilen bir satırın üstüne yeni bir birim ekler.

Go to Case: Veri sayfasında belirlenen bir birim no’suna imleci taşır ve o birimin değerlerini izleme fırsatı verir.

Sort Cases: Veri dosyasında kayıtlı birimlerin seçilen bir değişkene göre sıralanmasını sağlar. Sıralama küçükten büyüğe ya da büyükten küçüğe doğru yapılır.

Transpose: Veri dosyasında yer alan kolonları (değişkenleri) sıra, sıraları da kolona dönüştürür. Veri sayfasındaki verileri tranpoze eder. Bu seçenekle birimler değişken, değişkenler birim olarak döndürülmüş olur.

Merge Files: İki ya da daha fazla dosyanın verilerini bir dosyada toplamayı, birleştirmeyi sağlar. Bu seçenek kayıtlı iki ve daha fazla veri dosyasını değişkenler ya da birimler olarak birleştirmeyi sağlar. Birim birleştirilmesinde değişken isimlerinin aynı olması gerekir. Alt seçenekleri Ekran 2.8’deki gibidir:

Ekran 2.8 Merge Files seçeneği alt işlevler penceresi

Aggregate: Verilere, üzerinde gruplandırılarak işlemler yapılır ve bunlar ayrı ayrı dosyalar içinde saklanır. Bir sınıftaki kız ve erkeklerin grup ortalamalarını almak her ders için ayrı ayrı sınıf ortalamalarını almak, başarısız olanları saymak bu komut ile yapılır.

Split File: Değişik analizlerde kullanılmak üzere bir veri dosyasını alt gruplara böler, ayırır. Tablo içindeki değişkenleri belli değişkenlere göre gruplayıp her grubun ayrı ayrı istatistik değerlendirmesini yapabiliriz.

Select Cases: Belirli bir özelliğe uyan birimlerin seçilmesini sağlar. Belirli bir kritere göre aynı özelliklere sahip birimleri diğerlerinden ayırarak işlemlere almayı sağlayan bir seçenektir.

Weight Cases: Değişkenlere ağırlıklar vermek istediğimiz taktirde kullanılır. Örneğin erkeklerin sayısı kadınlara göre iki kat ise erkeklerin ağırlığını yarıya düşürmek için ;

a) Önce bir ağırlık sutunu açarak normal değerleri 1 olarak vermek.
b) Transform compute kısmından (örneğin cinsiyet 1 ise ağırlık 0,5 şeklinde hesaplanır.)
c) Sonra weıght cases kısmından o sütunu ayarlayıcı ölçü olarak seçmek.

2.2.5 TRANSFORM MENÜSÜ

Veri dosyasının ana yapısını değiştirmeden veri değerleri üzerinde ihtiyac duyulan bazı dönüştürmeleri yapar. Transform menüsü seçenekleri Ekran 2.9’daki gibidir.

Ekran 2.9 Transform menüsü alt seçenekleri

Compute: Veri setinde yeralan değişkenlerden belirli bir cebirsel (trigonometrik, aritmetik ve mantıksal fonksiyon ) kritere göre tüm birimler için yeni değişkenler belirlemeyi sağlar. Bu seçenek tıklandığında Ekran 2.10 görüntülenir ve ekrana girişler yapılır.

Ekran 2.10 Compute seçeneği ile değişken tanımlama

Random Number Seed ( Rastgele sayı üretici ): Ardışık olarak türetilecek sayıların türetimi için başlangıç belirlemeyi sağlar.

Count: Bir değişkende aynı değere sahip birimlerin belirlenmesini sağlar.

Recode: İki alt menüden oluşmaktadır:

• Into Same Variables: Kayıtlı değerlerin kodlanmasını sağlar. Bir değişkenin belirlenen aralıktaki değerlerini yeni kod değerleri ile aynı isim altında veri sayfasına yazmaya yarar.

• Into Different Variables: Kayıtlı değerlerin kodlanmasını sağlar. Bir değişkenin belirlenen aralıktaki değerlerini yeni kod değerleri ile farklı bir değişken ismi altında veri sayfasına yazmaya yarar.

Categorize Variables

Rank Cases: Sayısal değişkenleri sıralama değerlerine dönüştürerek yeni bir değişkene atanmasını sağlar. Blom, Tukey, Rankit ve Waerden gibi yöntemlere göre sıralama işlemleri yapılmaktadır.

Automatic Recode: Bir değişkenin değerlerini büyüklük sırasına göre dizerek yeni bir değişkene birden başlayarak yeni değerlerle kodlayarak yazar. Yeni değişken sınıflandırıldığında orjinal değerlerde tabloda görüntülenir.

Create Time Series: Bir veriyi referans alarak zaman serisi değişkeni türetir.

Replace Missing Values: Seride yer alan eksik değerler yerine bir değer atanmasını sağlar. Atanan değer serinin ortalaması yada herhangi bir zaman serisi fonksiyonlarından birisi olabilir.

2.2.6 ANALYZE MENÜSÜ

Veri analizinde yaralanılan istatistiksel analiz yöntemlerini içermektedir.

• Verilerin özet tablolarının çıkarılması
• Belirtici istatistiklerin hesaplanması
• Parametrik ve nonparametrik yöntemlerle hipotezlerin test edilmesi ve çok değişkenli hipotezlerin test edilmesine yönelik yöntemler yer almaktadır.

Analyze menüsü seçenekleri Ekran 2.11’deki gibidir. İşlevleri kısaca açıklanmıştır.

Ekran 2.11 Analyze menüsü seçenekleri

Report: Raporlama işlevlerini yerine getirir.

• OLAP Cubes
• Case Summaries: Veri sayfasında yer alan değişkenlerin değerlerinin listelenerek görüntülenmesini sağlar.
• Report Summarise in Rows: Sıralara ilişkin (birimler) özet istatistikler hesaplar.
• Report Summarise in Columns: Değişkenlerle ilgili özet istatistikler hesaplar.

Descriptive Statistics : Verilerin frekans ve çapraz tablolarının oluşturulması, belirtici istatistiklerin hesaplanması, grafiklerin çizilmesi ve raporlama işlevlerini yerine getiren seçenekler sunar.

• Frequinces: Verilerin frekans tablosunu hazırlar,aynı zamanda belirtici istatistikleri, dağılım ölçülerini hesaplar ve çubuk ya da histogram grafiklerini çizer.
• Descriptives: Verilerin belirtici istatistiklerini ve asimetrik dağılım istatistikleri olan çarpıklık (kurtosis, eğiklik) ve basıklık (skewnes) ölçülerini hesaplar.
• Explore: Tüm birimlerin ya da her bir gruptaki birimlerin belirtici istatistiklerini hesaplar, yayılım grafiklerini çizer. Bir değişkenin diğer bir anahtar değişkene göre istatistiklerini hesaplar.
• Crosstabs: İki ya da daha fazla değişkenin ikili çapraz tablolarını düzenler. Bu seçenekle hazırlanan tablolarda testler yapılır ve özet istatistikler hesaplanır. Sayısal değişkenler uygun kodlamalar ile az sayıda gruba bölünerek çapraz tablolar düzenlenebilir.

Compare Means: Gruplara göre verilerin belirtici istatistiklerini hesaplayan, bağımlı ve bağımsız örneklerde iki ya da daha fazla ortalama arasındaki farkları test eden yöntemleri içermektedir. Alt menüleri ve işlevleri aşağıdaki gibidir.

• Means: Değişkenlerin tek başına ya da diğer bağımsız değişkenlere göre alt grupların istatistiklerini hesaplar. Örneğin; X1 öğrencilerin boy uzunluğu, X2 cinsiyeti, X3 sınıflarını göstersin. Cins ve sınıflara göre boy uzunluğu ortalamalarını bulmak için Means seçeneği kullanılır.
 One sample T Test: Tek örneklem t testi yapar.
 Independent T Test: Bağımsız iki örneklem t testi yapar.
 Paired Samples T Test: Bağımlı iki örneklem t testi yapar.
 One –Way Anova : Bağımsız k- örneklem t testi yapar.

General Linear Model: Genel doğrusal modellerin (GLM) ve genel doğrusal etkileşimli modellerin (GLIM) analizlerini yapar. Verilere uyan tam ve kullanıcı tanımlı modellerin varyans analizlerini yapar, varyans bileşenlerini hesaplar. Polinomial karşılaştırmalar yapar. Ayrıca kareler ortalamasının hesaplanmasında Tek (Unique), Aşamalı (Hierarchique) ve Deneysel (Experimental) yöntemlerin uygulanmasını sağlar.

• Univariate
• Multivariate: Çok değişkenli veri setlerine varyans analizi (MANOVA) uygulamasını yapar. Modele ortak değişkenlerin katılması ile çok değişkenli kovaryans analizi (MANACOVA) uygular.
• Repeated Measures: Tekrarlı ölçümlü denemelerden elde edilen veri setlerine varyans analizi uygular. Deneme sonuçlarında bir birime ilişkin birden fazla gözlem bulunduğunda verilerin doğrudan girildiği veri setlerine varyans analizi uygular.
• Variance Components: Tek ve çok faktörlü deneme sonuçlarının varyans analizini yapar. Aynı zamanda ortak değişken modele katıldığında kovaryans analizi yapar.

Correlate: Aralıklı ya da oransal ölçekle değerleri saptanmış iki ve daha fazla değişken arasındaki ilişkinin, yönünü , büyüklüğünü ve önemliliğini belirlemeye yarar. Bu seçenek ile kısmi korelasyon analizi de yapılmaktadır. En az bir değişkene göre birimlerin birbirleriyle olan benzerlik uzaklıkları (similarity) ya da farklılıklarını gösteren uzaklıklar (dissimilarity) hesaplanır. Çeşitli uzaklık ve benzerlik ölçülerine göre birimlerin ya da değişkenlerin benzerlik /farklılık matrisleri hesaplanır.

Ekran 2.12 Correlate seçeneği alt işlevler penceresi

Regression: Değişik regresyon analizi yöntemlerinin (doğrusal, lojistik, probabilistik, doğrusal olmayan, ağırlıklı ve iki aşamalı en küçük kareler regresyon yöntemleri) verilere uygulanmasını sağlar.

Ekran 2.13 Regression seçeneği alt işlevler penceresi

Loglinear: Kategorik verilere genel ve aşamalı log-linear ve lojit analiz uygular.

Ekran 2.14 Loglinear seçeneği alt işlevler penceresi

Classify: Verilere kümeleme ve ayırma analizi uygular. Kümeleme analizi olguları ya da değişkenleri olabildiğince birbirleriyle homojen yapıda alt gruplara ayırmayı sağlar. Ayırma analizi ise grupları önceden belirli birimleri rasyonel biçimde birbirlerinden ayırmaya yarayan fonksiyonlar türetmeyi ve bu fonksiyon aracılığı ile verilerin sınıflandırılmasını sağlar. Bu seçenek ile k-means (McQuine ) yöntemine ve Aşamalı (hierarchical ) bağlantı yöntemlerine göre verilerin kümelenmesi yapılır. Ayırma analizinde ise doğrusal ve karesel yöntemlerle analiz yapılır.

• K-Means Cluster: Kümelenecek birim ya da değişkenlerin kaç kümeye ayrılacağı belirlenerek küme ortalamaları ve küme elemanları yaklaşımı kullanarak (Mac-Quine yöntemi) küme ortalamalarından yararlanarak gruplamalar yapılır.
• Hierarchical Cluster: Olgulara ya da değişkenlere aşamalı kümeleme analizi uygular. Birim ya da değişkenlerin benzerlik matrislerine göre birbirleriyle birleşme ve aynı kümeye ait üyelik uzaklıkları belirlenerek kümelerin ardışık oluşumları bir ağaç grafiği (dendrogram) biçiminde belirlenir. Kümelerin oluşturulmasında yararlanılan birçok yöntem vardır.
• Discriminat: Çoklu normal dağılım gösteren verilerin belirli bir grup değişkenine göre optimal düzeyde ayrılması için ayırma fonksiyonları hesaplamayı ve veri setine dahil edilen yeni birimlerin rasyonel biçimde bu fonksiyona göre sınıflara atanmasını sağlar. Ayırma analizi uygulanabilmesi için grup değişkeninin tam sayı değişken olarak girilmesi gerekir.

Data Reduction: Veri setine faktör analizi, uyum (correspondance) analizi ve optimal scalalara dönüştürme işlemini yapar. Factor isimli alt menüsü vardır.

Scale: İsimsel fakat kodlanmış, sıralı ya da aralıklı ölçekle elde edilmiş verilere güvenilirlik ve çok boyutlu analizi uygular. Alt menüleri aşağıdaki gibidir:

• Reliability Analysis: n birime uygulanan testlerin sorularına verilen cevapların ve soruların güvenilirlik analizini yapar. Kronbach, Guttman vb. yöntemlere göre güvenilirlik analizi yapar.
• Multidimensional Scaling

Nonparametric Tests: Tek örneklem, bağımlı/bağımsız iki ve k örneklem verilerine parametrik olmayan test yöntemlerinin uygulanmasını sağlar.

Ekran 2.15 Nonparametric seçeneği alt işlevler penceresi

Survival: Yaşamsal verilerin yaşam tablosu, Kaplan–Meier ve Cox orantısal riskler regresyon analizi modelleriyle analiz edilmesini sağlar.

• Life Tables: Verilerin yaşam ve ölüm fonksiyonlarının hesaplanmasında verileri sınıflara ayırarak analize alan Cutler-Ederer yaşam tablosu tekniğine göre hesaplanmasını ve ortalama yaşam sürelerinin tahminini sağlar.
• Kaplan –Meier: Verilerin yaşam ve ölüm fonksiyonlarını sadece ölüm sonuçlarına göre hesaplar ve ortanca yaşam sürelerini hesaplamayı sağlar. Ayrıca iki ve daha fazla faktöre göre yaşam eğrilerinin farklılıklarının analizini yapar.
• Cox Regression: Yaşam sürelerinin değişimi üzerine prognostik değişkenlerin etkilerini regresyon yöntemleriyle belirleme imkanı bulunmadığı durumlarda neden – sonuç ilişkilerini belirleme yöntemidir. Cox Regresyon yaklaşımı ile prognostik değişkenlerin yaşam süresi üzerine etkileri analiz edilir.
• Cox w/ Time-Dep Cov: Prognostik değişkenlerin etkilerini belirlerken zaman bağımlı değişkenlerin modele katılarak analiz edilmesi söz konusu olduğunda model kurma ve analiz yöntemlerini içerir.

Multiple Response: Çoklu cevap ya da çoklu ikili setlerin belirlenmesi ve analizi ile ilgili işlevler sunmaktadır.

Ekran 2.16 Multiple Response seçeneği alt işlevler penceresi

2.2.7 GRAPHS MENÜSÜ

Verilere değişik grafiklerin uygulanmasını sağlayan bir menüdür. Graphs menüsü seçenekleri Ekran 2.17’deki gibidir:

Ekran 2.17 Graphs seçeneği alt işlevler penceresi

Bar: Verilerin basit çubuk, kümelenmiş çubuk ve yığılımlı çubuk grafiklerini çizer.

Line: Verilerin basit ve çoklu çizgi grafiklerini çizer.

Area: Verilerin basit ve yığılımlı olan grafiklerini çizmeyi sağlar.

Pie: Verilerin basit daire grafiklerini yada birleşik çubuk grafiklerini çizmeyi sağlar.

High-Low : Verilerin ikili yada üçlü değerlerden yaralanarak yüksek ve düşük değerleri içeren grafiklerini çizmeyi sağlar.

Pareto: Pareto grafiği ve yığılımlı toplamları gösteren bir çizgi ile çubuk grafiği çizer.

Control: En yaygın kullanımı olan prosess kontrol kartları oluşturur.

Boxplot: Verilerin ortanca değerini, dörtte birlikler arası genişlik ve aşırı değer içeren birimleri ve sapan değerleri gösteren kutu grafikleri çizer.

Error Bar: Ortalama ve güven aralığını gösteren kutu grafiği çizer.

Scatter: Verilere uyan ilişki grafikleri, ilişki matrix grafiği yada üç boyutlu dağılım grafiği çizilmesini sağlar.

Histogram: Bir değişkenin dağılımı hakkında bilgi veren grafiği çizmeyi sağlar.

P-P: Bir değişkenin yığılımlı oranlarını normal dağılımın yığılımlı oranlarına karşı gösteren grafik çizer.

Q-Q: Bir değişkenin dağılımının dörtte birliklerini normal dağılımın dörtte birliklerine karşı gösteren grafik çizer.

Sequence: Veri setindeki değişkenlerin dosyada yer alış sırasına göre, zaman serileri yönünden irdelemek için çizgi grafikleri çizer.

ROC Curve

Time Series: Bir yada daha fazla zaman serisinin belirli bir gecikme sayısına göre otokorelasyonlarını hesaplar ve (ACF ) grafiğini çizer. Alt menülri aşağıdaki gibidir:

Ekran 2.18 Time Series seçeneği alt işlevler penceresi

2.2.8 UTILITIES MENÜSÜ

Bu komut grubu pratik olarak kullanılabilecek bir çok komut bulundurur.
• Yazı biçim ve büyüklüklerin seçimi.
• Veri dosyası hakkında bilgiler.
• Veri işleme pencerelerinin görünümü.
• Çıktı sayfalarında yer alması istenilen başlıklar girilebilir.
• Yer alan komutların işlevleri hakkında bilgi alınabilir.

Ekran 2.19 Utilities menüsü alt işlevler penceresi

2.2.9 WINDOW MENÜSÜ

SPSS ile çalışırken ekrandaki görüntülerin pencerelerde görünüş biçimlerini ayarlamaya yarayan seçenekleri içerir.

Ekran 2.20 Window menüsü alt işlevler penceresi

2.2.10 HELP MENÜSÜ

SPSS ile çalışırken SPSS komutları hakkında yardım almayı sağlayan seçenekler sunmaktadır. SPSS geniş bir yardım metnine sahiptir.

Ekran 2.21 Help menüsü alt işlevler penceresi

3.5 SPSS VE MINITAB MENÜLERİNİN KARŞILAŞTIRILMASI

• File menüsü, dosya işlemlerinin yürütüldüğü bir menüdür. Her iki paket programda da yeni dosya açmak, kayıtlı dosyaları kullanıma açmak, yeni oluşturulan ya da değişiklik yapılan dosya içeriklerini kaydetmek, yazıcıdan dökmek vb. işlevleri yerine getirir.

• Edit menüsü, her iki paket programda da yazım ve çıktı pencerelerinde metin, veriler üzerinde her türlü ekleme, çıkarma, kopyalama, yapıştırma, düzeltme, arama gibi işlemleri yapar. İki paket program arasında belirgin bir farklılık yoktur.

• SPSS’deki Data menüsü ile MINITAB’deki Manıp menüsü temelde aynı işlevleri yerine getirmekle beraber küçük farklılıklar göstermektedir. Data menüsü Manip menüsünden farklı olarak ay, gün, hafta gibi periyodik verilerin türetilmesini sağlayan Define dates, değişkenlere ağırlık verilmesini sağlayan Weight cases seçeneklerine sahiptir. Manip menüsü ise sütunları birleştirme , sütunu belirli kriterlere göre birden fazla sütuna ayırma işlevlerini gören Stack ve Unstack alt menüleri ve karakter verileri sayısal verilere, sayısal verileri karakter değerlere, tarih/zaman verilerini diğer tiplere dönüştüren Change data type seçeneğine sahiptir.

• MINITAB’deki Calc menüsü SPSS’de yer almamaktadır. Calc aracılığı ile yapılan ve en önemli ayırt edici özelliği olan belli teorik dağılımlara göre veri türetimi ve matris işlemleri SPSS’de yapılamamaktadır. Fakat bu menüde yer alan Calculator seçeneğinin işlevlerini SPSS’de Transform > Compute aracılığı ile yapabiliriz. SPSS’de seride yer alan eksik değerlerin yerine bir değer atanmasını sağlayan Transform > Replace Missing Value seçeneği varken MINITAB’de böyle bir işlem yapılamamaktadır.

• SPSS’deki Analyze ve MINITAB’deki Stat menüleri, veri analizinde yararlanılan istatistiksel veri analizi yöntemlerinden belirtici istatistiklerin hesaplanması, parametrik ve nonparametrik yöntemlerle hipotezlerin test edilmesi, çok değişkenli istatistiksel testlerin, regresyon ve korelasyon analizlerinin yapılmasını sağlarlar. Uygun deneme desenlerine ilişkin öneriler ve açıklamalar sunan DOE, verilere daha genel istatistiksel yöntemler uygulamadan önce veriler hakkında yapısal bilgiler elde etmek üzere açıklayıcı grafiksel yöntemler içeren EDA seçenekleri SPSS’de yer almamaktadır.

• Verilere değişik grafiklerin uygulanmasını sağlayan Graphs menüsü iki paket programda temelde benzerdir. Fakat MINITAB’de SPSS’den farklı olarak üç boyutlu grafik çizimini sağlayan seçenekler bulunmaktadır.

• MINITAB’deki Editor menüsü ile SPSS’deki Utilities menüsü genel olarak benzer işlevleri yürütmektedir. Fakat Editor menüsü ana işlem, veri ve grafik pencereleri olmak üzere üç farklı seçenekte yapılacak işlemleri ve düzenlemeleri kolaylaştırmaya yönelik seçenekleri daha ayrıntılı sunmaktadır

BÖLÜM 4

VERİ GİRİŞİ

4.1 GİRİŞ

Ele aldığımız programlarda veri sayfalarına veri girişleri için, ekrandaki veri sayfası penceresinin sütunlarına değişkenleri ve satırlarına ise herbir değişken için elde edilen değerlerin girilmesi gerekir. Bilgisayarda işlenecek veriler;

a) Ham veriler (veri seti, raw data matrix)
b) Tablolaştırılmış veriler (Frekans tablosu, Çapraz tablo)
c) Matris formunda veriler (Data matrix)
d) İşlenmiş veriler (Correlation matrix, Distance matrix) biçimlerinde düzenlenmiş olabilir.

Veri analizinde esas olan, doğru veri girişi ve bu verilerin uygun istatistiksel yöntemlerle analizidir. Bilgisayar programına veriler doğru girilmemiş ise en modern yöntem bile uygulanmış olsa sonuçlar anlamsızdır.

Bu veri yapılarının işlenmek üzere MINITAB ve SPSS’de veri sayfalarına girişlerinde çok küçük farklılıklar vardır. Herbir program için veri girişlerinin özellikleri aşağıda verilmiştir.

4.2 VERİ SETLERİNİN SPSS’E GİRİŞİ

4.4 METİN VE TABLOLARDAN KOLAY VERİ AKTARIMI

Daha önce WORD ve EXCEL programlarında hazırlanmış tablo ya da metin içinde yazılmış veri girişleri MINITAB ya da SPSS veri sayfalarına doğrudan aktarılabilir.

Verinin kayıtlı olduğu WORD/EXCEL ve verilerin aktarılacağı MINITAB/SPSS programları bellekte aynı anda çalışır hale getirilir. WORD/EXCEL programına geçilir (Alt+Tab) ve WORD’de tablo olarak girilen verilere ulaşılır. Değer içeren gözler işaretlenerek seçilir ve Ctrl+C ile ya da Edit menüsünden Copy komutu ile kopyalanarak panoya alınır. Daha sonra verinin aktarılacağı paket programına Alt+Tab tuş kalıbı ile geçilir. Görüntülenen veri sayfasının 1. sıra ve 1. sütun gözesine mouse yardımı ile konuşlanılır. Ctrl+V ya da Edit menüsünden Paste seçeneği kullanılarak panoda yer alan veriler veri sayfasına sıralar ve sütunlar halinde yapıştırılır.

NOT: Burada dikkat edilmesi gereken bir nokta vardır. Bilindiği gibi SPSS ve MINITAB, Windows altında çalışan programlardır. Ondalıklı sayıların girişinde kesirli sayının tam sayı ve ondalık bölümlerini ayırmak için nokta (.) ya da virgül (,) kullanılmaktadır. Eğer WORD’ de ondalık kısmın ayrımında nokta yada virgül kullanılmış ise bu ayrımların MINITAB ya da SPSS tarafından kabul edilir biçimde değişken tanımı yapılmış olması gerekir. MINITAB programı ondalık kısmın ayrılmasında nokta ile ayrımı kabul etmektedir. SPSS’de değişken tipi tanımlamasında kurulu (default) pozisyon virgül kullanımı biçimindedir. Bu nedenle SPSS’e aktarılacak ondalık kısım içeren sayıların ayrımında virgül kullanılmalı ya da değişken tipi tanımında aktarma işlemi yapılmadan önce SPSS seçeneklerinde CCC değişken gösterim tipi seçilerek bu sütuna yazılacak değişkenin ondalık sayı ayrımında nokta (.) işareti kullanılacağı programa hatırlatılır. Bu tür işlem gerektiren tüm sütunlarda gerekli tanımlamalar yapıldıktan sonra aktarma işlemine geçilir.

Panoya alınmış verileri MINITAB’e aktarmak için MINITAB sayfasına geçilir ve birinci sıra birinci sütunda yer alan veri alanına gelinir. CTRL+V tuş takımı yardımı ile veriler bu alana yapıştırılır.

Aynı verileri SPSS’e yapıştırmak için SPSS açılır. Veri sayfasının birinci sıra birinci sütunda yer alan veri alanına konuşlanılır. Ctrl+V tuşu ile veriler yapıştırılır.

ASCII ya da düz metin dosya biçiminde kaydedilmiş ve aralıklı olarak yazılmış değerleri içeren veri dosyaları MINITAB ve SPSS’de Import seçenekleri kullanılarak veri sayfalarına alınabilir.

4.5 DİĞER PROGRAMLARDAN VERİ AKTARIMI

ASCII ya da düz metin dosyaları oluşturan kelime işlemci programlarda yazılmış veri dosyalarını MINITAB ve SPSS’de açmak mümkündür. Ayrıca EXCEL, SYMPYHONY, QUATROPRO gibi veri tabanı ve veri bankası programlarından veri aktarımı mümkündür.

4.5.2 SPSS’de Farklı Program Veri Dosyalarının Açılması

SPSS’de ASCII veri dosyalarından veri aktarımı için Read ASCII data komutundan yararlanılır. Diğer programlarda (Excel, Lotus, Dbase vb.) hazırlanmış veri dosyalarını aktarmak için ise Open File komutundan yararlanılır. Ekrana gelen pencerede açılacak dosyanın hangi programın hangi tür dosyası olduğu Files of Type seçeneğinden belirlenerek tanımlanır. Dosya dizinden bulunur ve tıklanarak SPSS veri sayfasına açılır.

4.5.3 EXCEL-SPSS Veri Sayfalarından Veri Aktarımı

EXCEL, SPSS veri sayfalarında yer alan veriler işaretlendikten ve panoya alındıktan sonra ilgili programın veri sayfasına gelinerek Ctrl+V tuşu ile yapıştırılarak veri alış verişi yapılır.
Birbirleri arasında veri aktarımı yapılacak paket programlar aynı anda Window altında açılır ve birisinin veri sayfasına girilen değerler değişkenlerine göre birbirlerine aktarılarak paket programların herhangi birinde eksik olan bir analiz yönteminin, bu yöntemin bulunduğu başka bir paket programa verileri anında aktararak analiz yapmak mümkün olabilir. İki ve daha fazla program ortak ve etkileşimli olarak kullanılarak hızlı bir veri girişi ve veri analizi yapılması sağlanabilir.

Bu tür ortak kullanımlarda verilerin ondalıklı olması halinde programlar arasında ondalık sayı ayırımı için kullanılan nokta ya da virgül uyumunun sağlanması gerekir.

BÖLÜM 5

TABLOLARIN OLUŞTURULMASI

5.1 GİRİŞ

Veri setlerinde yer alan değişkenlerin frekans dağılım tablolarının ya da çapraz tablolarının hazırlanması, verilerin özetlenmesi bakımından önem taşımaktadır. Verilerin tablolarla gösterilmesi MINITAB ve SPSS’de ayrı ayrı ele alınmıştır.

5.2 ÇAPRAZ TABLOLARIN OLŞTURULMASI

Çapraz tablolar, iki değişkenin karşılıklı alt seçeneklerini birlikte gösteren tabloladır. r*c biçimindeki (r=sıra sayısı ve c=sütun sayısı) çapraz tabloların veri sayfasına girilmesinde tablonun sıra ve sütun sayısı dikkate alınarak giriş yapılır. İki değişkenin alt sçeneklerine aynı anda sahip olan birim sayıları, çapraz tablonun göze frekanslarını oluşturur. Çaparz tablolar daha çok az sayıda seçenek içeren kategorik değişkenler için ya da sınıflara bölünerek kodlanmış ve k sayıda sınıfa indirgenmiş aralıklı/orantılı ölçekli verilerin gösteriminde yararlanılır.

Paket programlar, çapraz tabloları oluşturduktan sonra birçok istatistik ve ölçü hesaplamaktadır. MINITAB ve SPSS bazıları benzer, bazıları farklı olan istatistikler hesaplamaktadır.

5.2.2 SPSS’de Çapraz Tablo Oluşturulması

• SPSS veri sayfasında sütunlara uygun girişler yapılır.
• Analyze > Discriptive statistics > Crosstabs seçenekleri tıklanır.
• Görüntülenen ekranda sıra ve sütunlar için seçimler yapılır. OK tıklanır.
• Elde edilen çıktıdaki tablo bilgileri yanında bazı katsayı ve ölçülerin görüntülenmesi isteiyorsa işlem penceresinde Statistics seçeneği tıklanır. Bu pencerede çıktıda yer alması istenilen istatistikler ve katsayılar işaretlenir. Continue tıklanır.

Örnek: KLM İşletmesinin verileri baz alınarak işlemler yapılmıştır. Bu örneğimizde toplam teknisyen sayısının toplam servis adedi üzerinde herhangi bir etkisinin olup olmadığı araştırılmaktadır. Toplam servis adedi üç gruba ayrılmıştır. Gruplar şöyle tanımlanmıştır.

1
14 Büyükada
Şişli 1026
4314 1
15
28 Sultanbeyli
Şirinevler 4347
6336 2
29
40 Haznedar
Basın Sitesi 6479
24243 3

Toplam teknisyen sayısı için de üç grup oluşturulmuştur.

2-5 1
6-8 2
9-12 3

Verilerin gruplandırılmasında Transform > Recode > Into different variables seçeneği tıklanmıştır. Çıkan ekranda kodlanacak orijinal değerleri içeren değişken ve kod değerlerinin yazılacağı değişken isimleri belirlenir. Old and New Values butonu tıklanarak hangi değerler arasındaki değerlerin hangi kodlarla ifade edileceği belirlenir. Bu kod değerlerini a adı altında açtığımız yeni sütunda görebiliriz.
İki değişkenin karşılıklı alt seçeneklerini birlikte görebilmek için çapraz tablo oluşturulmuştur. Çapraz tablo oluşturmaktaki amacımız birçok istatistik ve ölçünün hesaplanabilmesinin sağlamaktır. Çapraz tablolardan genellikle az sayıda seçenek içeren kategorik değişkenler için ya da sınıflara bölünerek kodlanmış ve n sayıda sınıfa indirgenmiş aralıklı /orantılı ölçekli verilerin gösteriminde yararlanılır.

SPSS veri sayfasına çapraz tablo oluşturmak için Analyze > Descriptive statistics > Crosstabs seçeneği tıklanır. Crosstabs menüsünde Row seçeneği için top.srvs (a) değişkeni seçilir. Column seçeneği içinse top.tek (b) değişkeni seçilir. Çapraz tablo hazırlanırken çıktılarda tablo bilgileri yanında bazı katsayı ve ölçülerin görüntülenmesi için Statistics seçeneği tıklanır. Bu pencerede çıktıda yer alması istenen Ki-kare , Kendall’s, seçenekleri tıklanır. Continue tıklanır.

α=0,05 anlamlılık düzeyi ve 4 sd’li kikare tablo değeri 9,49 bulunmuştur. Bu değer hesaplanan 12,186 kikare değerinden büyük olduğu için teknisyen sayısının servis adedi üzerinde etkisi olduğunu söyleyebiliriz.

5.3 FREKANS TABLOSU OLUŞTURMA

Veri setinde yer alan bir değişkenin kolay bilgi edinilebilir biçimde küçükten büyüğe doğru dizilerek tekrarlı ölçümlerin bir araya getirilmesi ve bu değerlere sahip birim sayılarının belirli bir düzende gösterilmesidir. Bu işleme frekans serisi adı da verilir.

Frekans tablosu iki biçimde düzenlenir:

 Sınıflandırılmış seri (tablo): Veri setindeki değerlerin küçükten büyüğe doğru dizilerek, tekrarlı ölçümlerden her değerin veri setinde kaç kez yer aldığı bulunur
 Gruplandırılmış seri (tablo): Veri setinde yer alan en küçük ve en büyük değer arasındaki değerler belirli aralıklara bölünerek sınıflar belirlenir ve her bir aralıktaki değerlerin veri setinde kaç kez tekrarlandığı bulunarak bir tablo hazırlanır.

Tablolaştırmada esas amaç n  30 birimden oluşan veri setini özetlemek ve kolay bilgi elde edilir biçimde düzenlemektir. Grupları sıralı biçimde dizmek ve verilerin genel dağılım ve yayılım eğilimini tablodan sezmek amaçlanır. Tablo yaparken bir sınıf aralığı seçilir ise bir frekans serileri (sınıflanmış= gruplanmış) birbirine eşit olur. Belirlenen gruptaki minimum değer (sınıf başlangıç değeri, SBD ) ve maksimum değer (sınıf üst sınıf değeri, SUD ) frekans tablosundaki grup, sınıf sayısını etkilemektedir. Bu nedenle seçilen sınıf (grup) sayısına göre frekans tabloları benzer ya da farklı olmaktadır. Burada frekans tablosu hazırlama terimi kullanılacaktır. Belirli sayıda sınıf seçerek, verileri kodlayarak bir frekans tablosu hazırlamak kolay bilgi elde etmek için uygun olacaktır. Nicel verilerde tablonun sınıf sayısını 5-16 arasında seçmek kolay bilgi edinilirliğini artırmaktadır. Nitel verilerde ise seçenek (kategori) sayı kadar sınıf belirlemek ya da en yakın seçenekleri birleştirerek sınıf sayısı 5-16 arasında değişecek tablolara indirgemek tercih edilmelidir. Ancak, birleştirme yapılırken bilgi kaybına izin verilmemelidir.

5.3.2 SPSS’de Frekans Tablosu Oluşturma
• Analyze > Descriptive Statistics > Frequencies seçenekleri sırasıyla tıklanır.
• Veriler veri sayfasına girilir, veri girilen sütuna değişken adı atanır.
• SPSS’ de kodlama işlemi Transforme > Recode > Into Different Variable seçeneği tıklanır.
• Bu ekranda kodlanacak orijinal değerleri içeren değişken ve kod değerlerin yazılacağı değişken isimleri (X2) belirlenir.
• Old and New Values butonu tıklanarak hangi değerler arasındaki değerlerin hangi kodlarla ifade edileceği ekran penceresi çıkar.

5.4 ÇOK BOYUTLU TABLOLAR (İç İçe Tablolar)
Üç veya daha fazla değişkenin birlikte çaprazlanması ile oluşan tablolara çokboyutlu tablolar adı verilmektedir. Bu tip tablolar faktörlerin her bir kademesinde iki veya daha fazla iç faktörün birlikte değişimlerini görmek için hazırlanırlar.

5.4.2 SPSS’de Çok Boyutlu Tabloların Oluşturulması
• Değişkenlere ait veriler sütunlara girildikten sonra Analyze > Descriptive Statistics > Crosstabs seçeneği seçilir.
• Görüntülenen ekranda aralarında temel ilişki olan değikenler Row(s) ve Column(s) alanına taşınır. Alt ana faktör olduğu düşünülen değişkenlerden biri Previous Layer 1 of 1 alanına diğeri Next seçeneği seçilerek Layer 2of 2 alanına taşınır. OK tıklanır.

BÖLÜM 6

BÖLÜM 7

GRAFİK ÇİZİMİ

7.1 GİRİŞ

Veri setlerinde yer alan değişkenler hakkında görsel bilgi edinmek amacıyla grafikler çizilir. Değişkenin dağılım biçimi, eğilimi hakkında ayrıntılı bilgi edinmeye yardımcı olan farklı grafik türleri bulunmaktadır.
Paket programlarda değişken tipi ve çizim amacına bağlı olarak değişik türde grafikler çizilebilmektedir. Bu bölümde grafik türleri ve çizim amaçları hakkında durulacak; SPSS’de çizilebilecek grafikler hakkında kısa bilgiler verilecektir.
Grafikleri; temel olarak, çizimlerinde yararlanılan tekniklere göre 6 ana gruba ayırmak mümkündür. Bunlar; Çizgi Grafikleri, Çubuk Grafikleri, Alan Grafikleri, Resimli Grafikler (Piktogram), Birikimli (Yığılımlı) Grafikler ve İlişki Grafikleri olarak sayılabilir.

7.2 HISTOGRAM GRAFİĞİ ÇİZİMİ

Histogram, gruplandırılmış değişkenin her sınıftaki frekanslarını diğer sınıfların frekanslarına göre orantılı büyüklükte dikdörtgenlerle (bar) ya da uygun geometrik şekillerle gösteren grafiktir. Histogram, eşit aralıklı ve sürekli k grupta sınıflanmış değişkenin grafik ile gösteriminde kullanılır.

7.2.2 SPSS’de Histogram Grafiği Çizimi

• SPSS’de Histogram grafiği çizmek için Graph > Histogram seçeneği tıklanır.

Ekran 7.4 SPSS Histogram seçenekleri penceresi

• Ekran 7.4’de variable alanına değişken taşınır.
• Grafik üzerinde verilere uyan normal eğri çizilmesi isteniyorsa Display normal curve seçeneği işaretlenir.
• Grafiğe başlıklar eklemek, eksen adları yazmak için Titles seçeneği tıklanır. Görüntülenen işlem penceresine uygun girişler yapılır. Continue tklanır.
• Grafik düzenlemesi için chart penceresinde iken Edit seçeneği tıklanır.

7.3 ÇİZGİ GRAFİĞİ ÇİZİMİ

7.3.2 SPSS’ de Çizgi Grafiği Çizimi

• Veri ekranına veriler girilir.
• SPSS’ de çizgi grafiği oluşturmak için verileri önce frekans dağılımı durumuna getirmek gerekir. Bu işlem görünümü küçük tutmak içindir. Bu amaçla isteğe bağlı olarak aşağıdaki işlemler yapılmalıdır.

1. X2 değişkenine veri değişkenimiz transforme edilir.
2. X2 değişkeni kod değerlere dönüştürülerek X3’ e yazılır.
3. X3 değişkeninin değerlerine etiketleme (labels) yaparak kod değerlerin adları girilir. Bu işlemler sırasıyla Transform/Define Variable seçeneğinden yapılır.
4. Çizgi grafiği çizimi için Graph/ Line seçeneği tıklanır.

Örneğin; Öğrencilerin matematik dersinden 1. vize sonuçları aşağıda görülmektedir.

55 , 20, 33, 45, 15, 60,10, 78, 75, 65, 89, 85, 20, 22, 51, 90, 47, 38, 25, 84, 95, 92, 24, 23, 13, 5, 15, 23, 56, 64, 78, 68, 49, 25, 75, 82, 95, 38, 44, 88

Görünümü küçük tutmak için aşğıdaki aralıklarda kodlamar yapılmıştır.

0 thru 15 1
16 thru 29 2
30 thru 40 3
41 thru 56 4
57 thru 63 5
64 thru 78 6
79 thru 85 7
86 thru 90 8
91 thru 95 9
96 thru highest 10

Şekil 7.1 Vize sonuçları çizgi grafiği

7.4 DAİRE (Pie) GRAFİĞİ ÇİZİMİ

Daire grafiği k sınıftaki frekansların dağılımını daire içinde açısal yoğunluk biçiminde gösteren grafiktir. Her sınıf veya kategori daire içinde temsil edilme derecelerine göre dilimlere ayrılarak gösterilir. Daire grafiği birçok yayında kullanılan bir grafik türüdür.

7.4.2 SPSS’de Daire Grafiği Çizimi

• SPSS’de daire grafiği çizmek için Graph > Pie Chart seçeneği tıklanır.
• Görüntülenen ekrandan Define seçeneği tıklanır. İşlem penceresine gerekli girişler yapıldıktan sonra OK tıklanır.

7.5 İLİŞKİ(Scatter, Cartesian, Dağılım) GRAFİĞİ ÇİZİMİ

• İlişki grafiği iki değişken arasındaki ilişkinin yönünü, tipini ve büyüklüğünü belirlemeye yardımcı olur.
• İlişki grafiği kartezyen grafik olarak da isimlendirilmektedir.
• N birimden elde edilen X, Y değerler çifti xy koordinat grafik alanında X değerleri x ekseninde Y değerleri y ekseninde gösterilecek şekilde ilişki grafiği çizilir.

7.5.2 SPSS’ de İlişki Grafiği çizimi

• İlişki grafiği çizmek için Graph > Scatter > Simple seçeneği tıklanır.
• X ve Y değişkenleri tanımlanır. OK tıklanır.
Örnek: Y ve X değişkenleri toplam teknisyen sayısı ve toplam servis adedi olarak tanımlanır. OK tıklanır.

Ekran 7.5 SPSS’de ilişki grafiği işlem penceresi

Şekil 7.3 Toplam teknisyen ile toplam servis adedi arasındaki ilişki grafiği

Şekil 7.3’den de anlaşılacağı gibi toplam servis adedi ve toplam teknisyen sayısı arasında doğrusal bir bağıntı vardır. İlişki pozitiftir. Bu noktaların birleştirilmesinden oluşan elipsin büyük ekseni ile küçük ekseni arasındaki oran 1’den daha büyük ve büyük eksen X eksenine paralel olmadığından iki değişken arasında doğrusal ilişki olduğu söylenebilir.

7.6 MATRİX GRAFİĞİ ÇİZİMİ

Matrix grafik, iki değişkenin hem X ekseninde hem de Y ekseninde birkez bağımlı değişken, birkez de bağımsız değişken olarak ele alınması sonucu iki değişken arasındaki karşılıklı ilişkileri belirlemeye yardımcı olan grafiktir. Matrix grafiği ikili çizilebileceği gibi veri setindeki değişkenlerin birbirine göre ilişkilerini aynı anda görme olanağı sağlamak için 3’lü, 4’lü, ... olarak da çizilebilir.

• tıklanır.

7.6.2 SPSS’de Matrix Grafiği Çizimi

• SPSS’de matrix grafiği çizmek için Graph > Scatter > Matrix seçeneği tıklanır.

Ekran 7.6 SPSS Matrix grafiği seçim ekranı

• Ekran 7.6’da Define tıklanır. Görüntülenen ekranda iki ve daha fazla değişken Matrix Variable alanına taşınır. Uygun seçimler yapıldıktan sonra OK tıklanır.

Örnek: KLM işletmesine ait verilere dayanarak toplam teknisyen sayısı, kış ve yaz dönemine ait servis adetlerinin birbirleriyle olan ilişkilerini aynı grafik üzerinde görelim.

Ekran 7.7 Matrix formunda ilşki grafikleri çizim ekranı

Şekil 7.4 SPSS’de üç değişkenin matrix grafiği

7.7 ZAMAN SERİSİ GRAFİĞİ ÇİZİMİ

Belirli iki zaman aralığında (günler, haftalar, aylar ya da yıllara göre elde edilen verilerin zaman değişkeni X ekseninde, Y değerleri Y ekseninde olmak üzere çizilen grafiktir.

7.8.2 SPSS’de Kutu Grafiği Çizimi

• Tek değişken incelendiğinde bunların değerleri veri sayfasında ilk sütuna girilir. İkinci sütuna ise ilk sütunda yer alan değerlerin tümünün tek gruba ait olduğunu belirtmek için o kadar 1 değeri girilir.
• SPSS’de kutu grafiği çizmek için Graphs > Boxplot > Simple > Define seçenekleri tıklanır.
• Görüntülenen ekranda Variable alanına değişkenimiz, Category Axis alanına ikinci sutun girilir. İşlem penceresine gerekli girişler yapıldıktan sonra OK tıklanır.

7.9 GÜVEN ARALIĞI (Confidence Interval Plot) GRAFİĞİ ÇİZİMİ

K grupta n birimden ölçülen X değişkeninin gruplara göre ortalama etrafında %95 olasılıkla değişimini incelemek amacıyla Güven Aralığı grafiği çizilir.

7.9.2 SPSS’ da Güven Aralığı Grafiği Çizimi

• Veriler veri sayfasına girilir.
• Graphs > Error Bar seçeneği tıklanır.
• Ekran 7.10’da uygun girişler yapılır. OK tıklanır.
• Artı eksi değerleri için 2 sayısı alınmıştır. Eğer belirli yüzde yerine bir çarpan seçerek güven aralığı grafiği çizilmek istenirse istenilen değer Multiplier (çarpan değer) alanına girilir. Uygun çarpan 1.96 y da 2.58 değerleridir.
• Ekran 7.10’da uygun girişler sonrası OK tıklanır ve sonuç grafik şekildeki gibi elde edilir.

Örnek: KLM işletmesine ait yaz ve kış toplam servis adedi değişkeninin kodlanmış gruplara göre ortalama etrafında %95 olasılıkla değişimini incelemek amacıyla güven aralığı grafiği çizilmiştir.

Ekran 7.10 SPSS Error Bar İşlem Penceresi

% 95 GÜVEN ARALIĞI GRAFİĞİ

Şekil 7.5 SPSS %95 Güven Aralığı Grafiği

Şekil 7.6 Üç boyutlu ilişki grafiği

BÖLÜM 8

BELİRTİCİ İSTATİSTİKLERİN HESAPLANMASI

8.1 GİRİŞ

Belirtici istatistikler, veri setinde yer alan değişkenleri özetleyen, tanıtan değerlerdir. n birime ait verinin genel eğilimi, yayılımı ve belirli değerler etrafında toplanma yığılmaları hakkında bilgi edinmek için belirtici istatistikler hesaplanır.

8.2 BELİRTİCİ İSTATİSTİKLER (Descriptive Statistics)

Belirtici istatistikler iki grupta incelenebilir.

1. Yer Ölçüleri (Measures of Location): Verilerin merkezi eğilimlerini ve verilerin belirli yüzdelerinin hangi değerlerde toplanma eğilimini gösteren tipik değerlerdir. Bu istatistikler toplum parametresini tahmine yardımcı olur. Yer ölçüleri ve açıklamaları aşağıda verilmiştir.

Aritmetik Ortalama (Mean, Average):

• n değerin toplamının n’e (birim sayısına) bölünmesiyle bulunur.
• Çan eğrisi biçiminde simetrik dağılım gösteren verileri en iyi temsil eden merkezi eğilim ölçüsüdür.
• Analitik araştırmalarda en sık kullanılan istatistiktir.

Geometrik Ortalama (Geometric Mean):

• n birimin değerleri çarpımlarının n kökünün alınması ile bulunan bir istatistiktir.
• n değerin logaritmaları toplamının n’e bölünmesi ile bulunan logaritmik ortalamanın antilogaritması alınarak da hesaplanabilir.
• Aritmetik ya da geometrik olarak düzenli artan ya da azalan dizilerin merkezi eğilimini belirtmekte kullanılır.

Harmonik Ortalama (Harmonic Mean):

• n birim sayısının, değerlerin tersleri toplamına bölünmesi ile hesaplanır.
• Genellikle T zaman periyodunda toplanmış ve zaman içinde düzenli ya da düzensiz dalgalanmalar gösteren veri dizilerinin merkezi eğilimini belirtmekte yararlanılır.

Düzeltilmiş Ortalama (Trimmed Mean):

• Dizide aşırı uçlarda yer alan değerlerin fazla olduğu durumlarda uçlardaki aşırı sapan değerleri en yakın değere yuvarlayarak (örneğin %5) hesaplanan merkezi eğilim ölçüsüdür.

Ortanca (Median):

• Değerleri küçükten büyüğe dizilmiş bir dizide dağılımı birim olarak iki eşit parçaya ayıran yer ölçüsüdür.
• n sayısı az olan, dizideki küçük ve büyük değerlerin aşırı uçlarda yer aldığı dağınık ve simetri özelliği göstermeyen dizilerin merkezi eğilimini belirtmekte yararlanılır.

Çeyrek Değerler (Quartil) (Q1 ve Q3):

• Değerleri küçükten büyüğe dizilmiş bir dizide dağılımı 4 eşit parçaya bölen değerlerdir. Bu değerler 1. Çeyrek (Q1), Ortanca (OD) ve 3. Çeyrek (Q3) olarak isimlendirilir.

Yüzdelik (Percentil) Değerler:

• Değerleri küçükten büyüğe dizilmiş bir dizide dağılımı yüz eşit parçaya ayıran yer ölçüleridir.
• Yüzdelikler içinde en sık kullanılanları 5. yüzdelik (P%5), 10. yüzdelik (P%10), 20. yüzdelik (P%20), 80. yüzdelik (P%80), 90. yüzdelik (P&90) ve 95. yüzdelik (P%95) değerleridir.
• P%25=1. çeyrek, P%50=Ortanca, P%75=3. çeyrek olduklarından yüzdelik olarak hesaplanamazlar.

2. Dağılım Ölçüleri: Verileri dağılım biçimini, ortalama etrafında değişimini, yayılmalarını ve serpilmelerini belirlemeye yarayan ölçülerdir. Değişim ölçüleri ve açıklamaları aşağıda verilmiştir.

Değişim Aralığı (Range, DA):

• Bir dizide en büyük değer (Xmax) ile en küçük değer (Xmin) arasındaki farktır.

Varyans (Variance):

• Bir dizideki değerlerin ortalamadan olan farkları kareleri toplamının (n-1) sayısına bölünmesiyle bulunan bir dağılım ölçüsüdür.
• Kare farklarının ortalaması diye de isimlendirilir.

Standart Sapma (Standart Deviation):

• Varyansın karekökü alınarak bulunan bir standart dağılım ölçüsüdür.
• Birimi değişkenin ölçü birimine eşittir.

Standart Hata (Standart Error of Mean):

• Standart sapmanın birim sayısının kare köküne bölünmesiyle bulunan bir dağılım ölçüsüdür.
• Ölçü birimi değişkenin ölçü birimi ile aynıdır.

Enbüyük Değer (Maximum, Xmax):

• Bir dizideki gözlenen en büyük değerli gözlemdir.
• Xmax biçiminde gösterilir.
• Değerleri küçükten büyüğe dizilmiş bir dizide n. gözlemdir (X(n)).

Enküçük Değer (Minimum, Xmin):

• Bir dizideki gözlenen en küçük değerli gözlemdir.
• Xmin biçiminde gösterilir.
• Değerleri küçükten büyüğe dizilmiş bir dizide 1. gözlemdir (X(n)).

Değişim Katsayısı (Coefficient of Variation):

• Bir dizinin standart sapmasının ortalamasına bölünmesi ve 100 ile çarpılması ile bulunan bir dağılım ölçüsüdür.
• Ölçü birimleri birbirinden farklı iki ya da daha fazla değişkenin dağılım yoğunluklarını karşılaştırmak amacıyla yararlanılan bir ölçüdür.
• Birimi yoktur.

Çarpıklık (Skewness):

• Bir dağılımın normal dağılıma göre simetrik ya da çarpık (asimetrik) olup olmadığını belirten bir ölçüdür. α3 gösterilir.
• Simetrik (normal) dağılımda α3 ‘ün değeri 0’dır.
• α3’ün önemliliği, dağılımın simetrik olup olmadığı, normal dağılım yaklaşımıyla test edilir.

Basıklık (Kortosis):

• Bir dağılımın normal dağılıma göre basık ya da sivri sivri (tepeleşmiş) olup olmadığını belirten bir ölçüdür.
• Basıklık ölçüsü normal dağılımda 3 değerini alır.
• Dağılımın basıklığının önemliliği, normal dağılıma göre basık olup olmadığı normal dağılım yaklaşımıyla test edilir.

8.2.2 SPSS’de Belirtici İstatistiklerin Hesaplanması

Verilerin belirtici istatistiklerinin hesaplanması için:

• Analyze > Descriptive Statistics > Descriptives seçenekleri tıklanır.
• Ekran 8.1’de belirtici istatistikleri hesaplanacak olan aralıklı ya da oransal ölçekli veriler Variables alnına taşınır.

Ekran 8.1 SPSS belirtici istatistikler işlem penceresi

• Hangi istatistiklerin hesaplanacağını belirlemek için Options butonu tıklanır. Ekran 8.2’de SPSS’de hesaplanabilecek belirtici istatistikler ve dağılım istatistikleri belirtilmiştir.

Ekran 8.2 SPSS’de hesaplanabilecek belirtici istatistikler

• Seçimler yapıldıktan sonra Continue tıklanır ve Ekran 8.1’e dönülür. OK tıklanır ve sonuçlar Output penceresinde görüntülenir. Bu çıktıda ortalama, standart sapma, standart hata, varyans, min, max, range istatistikleri, kurtosis, skewnees istatistikleri ile standart hata yer almaktadır.

SPSS’de belirtici istatistiklerin bir grup değişkeninin sınıflarına göre hesaplanması mümkündür. Bunun için:

• Analyze > Descriptive Statistics > Explore seçenekleri tıklanır.
• Explore seçeneği ile hesaplanacak istatistiklerin belirlenmesi için Statistics seçeneği tıklanır. Bu ekranda belirtici istatistiklerle birlikte yüzdelik değerler, dizideki sapan değerler ve güven aralıkları hesaplanmaktadır.
• Çıktıda yer alması istenen seçenekler işaretlendikten sonra Continue tıklanır. Bir önceki ekrana dönülür ve OK tıklanır.

Örnek: Aşağıdaki tablolarda KLM İşletmesinin betimsel istatistik değerlerini görmekteyiz.

BÖLÜM 9

PARAMETRİK TESTLER I
z ve t TESTLERİ

9.1 GİRİŞ

Toplum parametrelerine dayalı olarak kurulan hipotezlerin n birimli örneklerden elde edilen veriler aracılığı ile test edilmesi ve tutarlı kararlara ulaşılması istatistikte önemli bir uğraştır.
Toplum parametresi ele alınarak kurulan bir hipotezin test edilmesi hipotezin yapısına bağlı olarak değişmektedir. Bir toplumun parametrelerine dayalı kurulan hipotezler ile iki toplumun parametrelerine dayalı olarak kurulan hipotezlerin test edilmesinde z ve t testlerinden yararlanılmaktadır.

9.2 Z TESTİ

z testi, toplumda normal dağılım gösteren ve populasyon parametreleri bilinen X değişkeninin parametrelerine dayalı olarak kurulan Ho hipotezini, Hı karşıt hipotezine karşı α yanılma payına göre, n hacimli örnek verileri aracılığı ile test etmeyi amaçlar. z testi tek örnek ve iki örnek z testleri olarak uygulanır. Hipotezler, bir toplumun parametresi hedeflenerek kurulmuş ise bu hipotezleri test etmeye yardımcı testlere tek örnek testleri, iki toplum parametresi hedeflenerek kurulmuş ise iki örnek testleri olarak isimlendirilir.

z testinin uygulanabilmesi için aşağıdaki koşullar gereklidir:

• Değişken toplumda normal dağılım göstermelidir. (X~N (μ, σ))
• Değişkenlerin parametreleri bilinmelidir. (μ, σ)
• Toplumdan rasgele alınan örnek birim sayıları 30’dan büyük olmalıdır.
• Örneklerde X’in istatistikleri hesaplanmalıdır.

Kurulan hipotezler ele alınan değişkenin nitel ya da nicel olmalarına göre farklı biçimlerde formüle edilir. Nicel veriler aralıklı ve oransal ölçekli olarak elde edilirken nitel veriler isimsel ya da sıralı ölçekle elde edilirler.

a) X nicel değişken ise parametreleri μ, σ’dır.

• Tek örnek durumu: Toplumda X parametresinin μ’nün μo gibi bir teorik değere eşit olduğu varsayılıyorsa test edilen sıfır ve karşıt hipotezler aşağıdaki gibidir.
Ho: μ = μo
Hı : μ ≠ μo (Not equal)
Hı : μ > μo (Greater than)
Hı : μ < μo (Less than)

• İki örnek durumu: 1. toplumda μı parametresinin μo gibi bir teorik değere ve 2. toplumda parametresinin μo gibi bir teorik değere eşit olduğu varsayılıyorsa test edilen sıfır ve karşıt hipotezler aşağıdaki gibidir:

Ho: =
Hı : ≠ (Not equal)
Hı : > (Greater than)
Hı : < (Less than)

Bu hipotezleri test etmek için z testi kullanılır.

b) X nitel değişken ise parametreler toplum oranı P ve varyansı PQ/n’dir. Burada Q=1-P

Toplumda nitel değişkenlee ilişkin test edilen Ho ve ı hipotezleri aşağıdaki gibidir.

Ho: P = Po
Hı : P ≠ Po (Not equal)
Hı : P > Po (Greater than)
Hı : P < Po (Less than)

Bu hipotezleri test etmek için z testi kullanılır. z test istatistiğinin önemliliğinin belirlenmesi için IzI değerleri Zα değerleri ile karşılaştırılır. α=0,05 0,01 0,001 olmak üzere z değerleri sırasıyla 1.96, 2.58, 3.28 olarak alınır.
• Eğer IzI < Zα P > α Ho Kabul önemli farklılık yoktur
• Eğer IzI > Zα P ≤ α Ho Red farklılık önemlidir.

9.2.1 SPSS’de t Testi

SPSS programlarından sadece SPSS’de tek örnek ve iki örnek hipotezlerini n>30 olsa bile t testi ile test etmeyi tercih etmektedir.
MINITAB’de tek örnek z testi için:

• Veriler Ci sütununa girilir. Bu örneğin alındığı varsayılan ve parametreleri μ ve σ olan bir topluma dayalı kurulan Ho hipotezi Hı’e karşı test edilir.
• Stat > Basic Statistics > 1-Sample z seçeneği tıklanır.
• Ekran 9.1’de Variables alanına değişken taşınır. Test mean alanına örneğin alındığı varsayılan toplumun ortalaması, Sigma alanına örneğin alındığı varsayılan toplumun varyansı yazılır. Alternative alanında çift taraflı test için not equal seçeneği aktif hale getirilir. OK tıklanır.
• Eğer örnek verilerin alındığı toplumun parametresini tahmin etmek için güven aralığı hesaplanır. Bunun için Test mean seçeneği yerine Confidence Interval seçeneği tıklanır. Güven aralığı 95, 99 ya da 99,9 seçilir. Sigma değeri girilir.
• Sonuçlar tablo değerleri ile karşılaştırılır.

Örnek: İlköğretim mezunu öğrencilerin Türkçeyi kullanma başarı puanları X (60,10) parametreli normal dağılım göstermektedir. İlköğretim mezunu rasgele seçilen 35 öğrencinin Türkçeyi kullanma başarı puanları aşağıdaki gibi belirlenmiştir.

BAŞARI PUANLARI

23 45 65 47 65 48 56 78 90 87 65 67 65 45 67 66 88 73 52 44 83 23 43 54 44 66 74 81 88 32 43 61 74 70 75

Öğrencilerin başarı puanları (60,10) parametreli toplumdan alınmış rasgele örnek olabilir mi?

Ekran 9.1 MINITAB’de tek örnek z testi işlem penceresi

One-Sample Z: basarı puanları

Test of mu = 60 vs mu not = 60
The assumed sigma = 10

Variable N Mean StDev SE Mean
basarı puanl 35 61,34 18,05 1,69

Variable 95,0% CI Z P
basarı puanl ( 58,03; 64,66) 0,79 0,427

Çıktıya göre örneğin alındığı toplum parametresi μ=60’dan önemli düzeyde farklı değildir. Örnek toplumun rasgele örneğidir.

9.3 T TESTİ (Student’s t testi)

• Örneğin alındığı toplumun standart sapmasının () bilinmediği durumlarda tek örnek ve iki örnek hipotezlerinin test edilmesinde t testi kullanılır.
• Örnek hacminin 30’un altında (n<30) olduğu durumlarda tek örnek ve iki örnek hipotezlerinin test edilmesinde t testi kullanılır.
• Simetriktir.
• Ortalaması sıfırdır.
• Standart normal dağılımından daha değişken, daha basıktır.
• Büyük örneklemler için (büyük serbestlik dereceleri için) t ve z dağılımları hemen hemen eşdeğer olurlar.

İki örnek durumunda örneklemlerin bağımlı ve bağımsız olmaları test modelini etkiler.

Bağımlı iki örnek, iki veri dizisinin n birimlik tek bir grup üzerinden elde edilmiş olduğunu belirtir.

Bağımsız iki örnek, iki veri dizisinin farklı birimlerden oluşan iki ayrı gruptan elde edilmiş olduğunu belirtir.

T testi; tek örnek t (1-Sample t), bağımlı iki örnek t (paired t, 2-related samples t) ve bağımsız iki örnek t (2-Independent Samples t, Independent 2 samples t) testi olmak üzere 3 farklı tipte uygulanır. Örneklerden elde edilen verilerin nitel ve nicel olmasına göre de t testinin 5 farklı uygulama modeli bulunmaktadır.

Tek Örnek t Testi(1-Sample t test): Tek örnek t testi ile nicel veriler kullanılarak Ho:o, Hı:>o ve Hı:<o karşıt hipotezlerine karşı test edilebilir.

Tek örnek t testi modeli biçimindedir.

T test istatistiği sd=n-1 serbestlik dereceli t dağılımının kritik değerleri ile karşılaştırılarak önemlilik belirlenir ve olasılık düzeyine göre karar verilir.

Nitel verilerden hesaplanan oranlara dayalı varsayımları test etmek için de t testinden yararlanılır. Nitel verilerde t testinde, Ho:P=Po hipotezi, Hı:PPo, Hı:P>Po ve Hı:P<Po hipotezleri test edilir.

Test modeli; şeklindedir.

Bağımsız İki Örnek t Testi: Bağımsız İki Örnek t testi nicel verilerde; Ho: hipotezini, Hı: , Hı: ve Hı: karşıt hipotezlerine karşı test etmeyi amaçlar.

Bağımlı İki Örnek Testi (2-Related Samples t Test): Bir grupta yer alan n birimden farklı zamanlarda, farklı işlemlerden(treatments) elde edilmiş verilerin farklarının(F, Differance) 0 ortalamalı toplumun rasgele örnekleri olup olmadığını test etmeyi amaçlayan bir testtir.

N bireyin işlemden önce ve sonra verileri, farklı iki işlemden elde edilmiş verileri, rasgele iki gruba ayrılmış ikizlerin bir işlemden elde edilen verileri farklarını analize yarayan bir yöntemdir.

Test edilen hipotezler ; Ho: , Hı: , Hı: Hı: biçimindedir.

9.5 SPSS’DE BAĞIMSIZ İKİ ÖRNEK T TESTİ

Normal dağılım gösteren ve parametreli iki topluma dayalı hipotezleri test etmek için yararlanılan testtir. ve ortalamalı toplumlardan rasgele alındıkları varsayılan ve hacimli bağımsız iki örneğin verileri kullanılarak Ho: = yada Ho: - =0 ve Hı:  hipotezleri test edilir.

9.5.2 SPSS’de Bağımsız İki Örnek t Testi

SPSS’de bağımsız iki örnek t testi yapmak için değerler X sütununa, grup kodları (1,2) ise Grup sütununa girilir.

• Analyze > Compare Means > Independent Sample T Test seçeneği tıklanır.
• Görüntülenen ekranda Test variable(s) alanına X, Grouping variables alanına grup değişkenleri taşınır. Grup değişkeninin range’lerini belirlemek için Define groups seçeneği tıklanır. Bu ekranlarda gerekli belirlemeler yapıldıktan sonra Continue ve OK tıklanır.

9.6 SPSS’de BAĞIMLI İKİ ÖRNEK T TESTİ
(Eşleştirilmiş / Paired / Related Samples t Testi)

Bağımlı iki örnek t testi “n birimlik gruptan iki farklı uygulamaya bağlı olarak iki veri dizisi elde edilmiş ise bu diziler bağımlıdır ve iki dizi farkları, ortalaması sıfır olan bir toplumun rasgele örneğidir.” Öntest ve Sontest sonuçlarının değerlendirilmesi bu test modeli ile yapılmaktadır.

9.6.2 SPSS’de Bağımlı İki Örnek t Testi

• Önce ve sonra değişkenlerine ilişkin değerler farklı sütunlara girilir.
• Analyze > Compare means > Paired Samples T test seçeneği tıklanır.
• Görüntülenen ekranda Paired variables alanına önce ve sonra değişkenleri birlikte taşınır. OK tıklanır.
• Sonuçlar tablo değerleri ile karşılaştırılır.

BÖLÜM 10

PARAMETRİK TESTLER II

10.1 GİRİŞ

Varyans analizi (ANOVA, Analysis of Variance), k bağımsız ya da k bağımlı gruptan elde edilen verilerin grup ortalamalarının ya da işlem ortalamalarının farklılığını test etmek için yararlanılan bir yöntemdir.

Varyans analizi; bağımsız k grup, bağımlı k grup, faktöriyel etkiler içeren denemeler ve içiçe grupların etkilerini ortaya çıkarma yaklaşımlarına göre 5 ana grupta ele alınarak incelenir. Bunlar şu şekilde ele alınır:
• Tek Yönlü (Oneway) ANOVA
• İki Yönlü (Twoway) ANOVA
• İç İçe gruplarda ANOVA
• Faktöriyel ANOVA ve Çok faktörlü ANOVA
• Genel doğrusal modeller ANOVA

Bu ANOVA yöntemlerinden Tek Yönlü ANOVA ve İki Yönlü ANOVA uygulama modelleri bu bölümde ele alınacaktır.

10.2 TEK YÖNLÜ VARYANS ANALİZİ
(Bağımsız k grupta ortalamaların testi)

Normal dağılım gösteren k toplumdan alınan k bağımsız grup ortalamalarının birbirine eşitliğini test etmek için tek yönlü varyans analizi uygulanır. Tek Yönlü Varyans Analizi, iki ya da daha fazla grubun, normal dağılan benzer ortalamalı populasyonlardan alınıp alınmadığını ortak varyans kullanarak test etmeyi amaçlar.

Tek yönlü ANOVA’da, k toplumun ortalamalı ve ortak varyanslı normal dağılım gösterdiği varsayımı kabul edilir.

Tek yölü varyans analizi ile aşağıdaki hipoezler test edilir.
: Ortalamalar arasında fark yoktur.
: En azından bir ortalama diğerlerinden farklıdır.

F istatistiğinin önemiliğini belirlemek için F( ) dağılımının kritik değerlerinden ( ) yararlanılır. Bu kritik değerlere göre hipotezinin kabul ve red bölgesinde olup olmadığına karar verilir.

Tek yönlü varyans analizi sonuçlandıktan sonra F’in olasılığı önemli olarak nitelendiriliyor ise “grup ortalamalarından en az biri diğerinden farklıdır” karşıt hipotezinin kabul edilmesi gerekir. Bu durumda hangi grup ortalamasının diğerlerinden farklı olduklarının belirlenmesi gerekir. Bu amaçla yararlanılan ikinci aşama testlerine çoklu karşılaştırma tesleri adı verilir.

10.2.1 ÇOKLU KARŞILAŞTIRMA TESTLERİ

k bağımsız grubun ortalamasının birbirinden farklılığını test etmek için geliştirilen testlere çoklu karşılaştırma testleri adı verilir. Varyans analizi sonucunda F test istatistiği önemli ise, hangi grup ortalamasının diğerlerinden farklı olduğunu, farklılığın hangi gruptan kaynaklandığını ortaya koymak gerekir.

İki paket programın karşılaştırılmasında uyguladığımız örneklere, bağımsız k grup ortalamalarını ve t işlem ortalamalarını karşılaştırırken çoklu karşılaştırma testlerinden T_HSD testini, kontrol ile deneme grup ortalamaları arasındaki önemliliğini değerlendirirken Dunnet testini (k denemeden birinin kontrol olarak alındığı ve diğer deneme sonuçlarının kontrole göre etkinliğinin analizi için başvurulan bir test) uygulayacağız.

Örnek: Aşağıdaki tabloda 4 ayrı grupta ölçülen serum Total Protein değerleri (TP g/dI) verilmiştir. Total protein değerinin hastalık türlerine ve normal bireylere göre farklılık gösterip göstermediğini test edelim.

Birey no Normal
(TP) H hst.
(TP) L hst.
(TP) T hst.
(TP)
1
2
3
4
5 6,4
6,5
6,7
5,9
6,0 8,6
9,7
12,1
9,6
9,4 12,7
12,8
14,9
16,3
15,4 21,8
17,9
21,6
20,5
19,7
TOPL. 31,5 49,4 71,1 101,5

10.2.3 SPSS’de Tek Yönlü Varyans Analizi

• Her grubun verileri aynı sütuna sırası ile alt alta yazılır. Diğer bir sütuna bu verilerin hangi grubun verisi olduğunu belirten grup kodları girilir.
• Analyze > Compare Means > One-way Anova seçenekleri tıklanır.
• Görüntülenen ekranda Dependent List alanına verilerin girildiği değişken adı, Factor alanına grup kodlarının girildiği değişken adı girilir. Grup değişkeninin hangi kod değerleri içerdiği Define range seçeneği tıklanarak belirlenir. Grup ortalamalarını çoklu karşılaştıma testi ile test etmek için Post-hoc seçeneği tıklanır.

10.3 İKİ YÖNLÜ VARYANS ANALİZİ
( k bağımlı grupta ortalamaların testi)

k bağımlı gruptaki deneme sonuçlarının işlem (treatment) ortalamalarının benzer olup olmadıklarını belirlemek amacıyla iki yönlü ANOVA uygulanır. İki yönlü varyans analizi, deney birimlerini iki ölçüte göre sınıflayabildiğimizde veya etkileri farklı deneysel materyallere uyguladığımızda aklımıza gelmelidir.

Bu tür bir tasarımda sınıflama ölçütü ‘etki’ olurken, farklı deneysel materyaller ise blok adını alır. Bu tür bir tasarımda temel amaç etki ortalamalarının blok etkilerinden bağımsız olmasını sağlayarak, bloklar nedeniyle ortaya çıkan değişkenlikten hata değişkenliğini ayırmaktır. Söz konusu tasarımın başarısı, deney birimlerini homojen bloklarda toplayabilmeye dayanır ve bu da deneysel materyallerin iyi bilinmesiyle gerçekleştirilebilir.

Sanayi uygulamalarında farklı hammaddeler bloklama faktörü olarak kullanılırlar. Bir uygulamada boya formülleri etkiler, bunların uygulanacağı yüzeyler ise bloklar olarak alınabileceği gibi; başka bir uygulamada farklı metal işleme makineleri etkiler, bunlarda işlenen farklı metaller ise bloklar olarak değerlendirilebilir. İşte bu tür durumlarda uygulanabilecek varyans analizi iki yönlü varyans analizi ( two-way analysis of variance) tekniğidir.

Belirli bir deneydeki etki sayısını k ve blok sayısını n gösterdiğinde eğer her bir gözlemi etki ve blok olmak üzere iki ölçüte göre sınıflayabiliyorsak iki yönlü varyans analizi uygulayabiliriz.
İki yönlü varyans analizinde kullanacağımız rassallaştırılmış tam blok modeli şu şekilde ifade edilebilir:

= + + +

Burada 1  i  n ve   j  k arasında değişir.

Modelde ;
: Bilinmeyen bir sabit
: Deney birimi i bloğuna düştüğünde blok etkisi
: Deney birimi j.inci etkiyi aldıysa bunun sonucunda ortaya çıkacak etki
: Etki ve blok dışındaki tüm değişkenlik kaynaklarını gösteren artık bileşendir.

Varsayımlar, hipotez ve karar

İki yönlü varyans analizinin varsayımlarını şöyle özetleyebiliriz;
• Her gözlenen değeri, bir örneklem büyüklüğüne sahip bir bağımsız rassal örneklem oluşturur.
• tane ana kütlenin dağılımları ortalama ve aynı varyans ile normal dağılıma sahiptir.
• Etkilerle bloklar arasında etkileşim yoktur.

İki yönlü varyans analizinin hipotezleri şu şekildedir;

Ho:   ... 
Hı: Bütün ana kütle ortalamaları eşit değildir. En azından biri farklıdır.

İki yönlü varyans analizinde karar verilirken, eğer verilerden hesaplanan F değeri tablo değerinden büyükse Ho hipotezi reddedilir. Bunun tersine eğer verilerden hesaplanan F değeri tablo değerinden küçük veya ona eşitse Ho hipotezi reddedilemez.

İki yönlü varyans analizi örneği

k tane etki, n tane blok söz konusu olduğunda, farklı bileşenlere ilişkin serbestlik dereceleri şöyle olacaktır:

Toplam = Etkiler + Bloklar + Hata

Kn-1 = (k-1) + (n-1) + (n-1)(k-1)

Değişkenlik kaynağı

Kareler
Toplamı

(SS)

Serbestlik
Derecesi

Ortalama Kare

(MS)

F oranı

Etkiler
(Faktör)
SSTr

k-1

MSTr = SSTr/(k-1)
F=MSTr/MSE

Bloklar
SSB
n-1
MSB = SSB/(n-1)

Hata
SSE

(n-1)(k-1)
MSE=SSE/(n-1)(k-1)

Toplam

SST
Kn-1

10.3.2 SPSS’de İki Yönlü Varyans Analizi

• SPSS’de iki yönlü ANOVA uygulamak için veriler her birim ve işlem için sırası ile bir sütuna alt alta girilir. Birim kodları ile işlem kodları ayrı ayrı sütunlara girilir.
• Analyze > Anova > Simple Factorial seçenekleri tıklanır.
• Görüntülenen ekranda Dependent alanına verilerin girildiği sütun değişken adı, Factor(s) alanına ise birim ve işlemlerin yazıldığı değişken adları girilir. Faktörlerin minimum ve maksimum kodlarını belirlemek için her bir faktör için Define Ranges seçeneği tıklanır ve o faktörün en küçük ve en büyük kod değerleri belirlenir. Continue tıklanır.
• Önceki ekrana dönülür. Analizde birim ya da işlemlerin bir ardışık, ya da iç içe yapı içinde olup olmadığını belirtmek için varyans bileşenlerinin hesaplanma yöntemini belirlemek amacıyla Options seçeneği tıklanır.
• Görüntülenen akranda Method bölümünde Unique seçeneği, Maximum Interaction bölümünde None seçenekleri işaretlenir. Continue tıklanır.

BÖLÜM 11

PARAMETRİK TESTLER III

11.1 GİRİŞ

Varyans analizi, deney tasarımı sonucu elde edilen verileri analizinde yararlanılan bir yöntemdir. Bu yöntem ile k bağımsız ya da k bağımlı gruptan elde edilen verilerin analizi yanında f faktörlü denemelerin, içiçe gruplarda ana ve alt gruplardaki ortalamalar ile birinci, ikinci, ... dereceden etkileşimlerin önemliliği analiz edilir. Bu bölümde deney tasarımları içinde faktöriyel denemelerin, içiçe gruplu denemelerin ve genel doğrusal model tipinde ele alınabilecek denme sonuçlarının analizleri üzerinde genel hatları ile durulacaktır.

Kovaryans analizi, cevap değişkenin değişimini ortak değişkenlere göre düzelterek analizini amaçlayan bir yöntemdir. Kovaryans analizi ve varyans analizi içiçe konulardır. Ortak değişken içeren denemelerden elde edilen verilere ortak değişkenli varyans analizi ya da kovaryans analizi uygulanabilir.

Genel Doğrusal Modellerin (GLM) analizinde yararlanılan yöntemler ise eksik, dengesiz, etkileşimli etkileşimsiz tüm deneme sonuçlarını analizde kullanılır. GLM, kovaryans analizi sonuçlarını da içine alan çözümler sunmaktadır.

11.2 FAKTÖRİYEL DENEMELERİN VARYANS ANALİZİ

Labaratuvar, Saha ve Tarla denemelerinde cevap değişkenin değişimi üzerine etkide bulunan değişik sayıda ve seviyede faktörün (etken) etkisini ortaya koymak için geliştirilmiş çok sayıda deneme türü vardır. Bunlara genel olarak faktöriyel deney tasarımı denir. Bu tasarımlarda değişik faktörler değişik tasarımlarla birimlerde denenerek basit ve karmaşık deney sonuçları elde edilir.

Genelde iki ve daha fazla faktörün bağımlı değişken üzerindeki etkilerini ortaya koymak için tasarlanan denemelere faktöriyel denemeler adı verilir. Herbir faktör bağımsız ele alınabileceği gibi faktörlerin birbirleri ile etkileşimi de analize eklenebilir.
Her deney türüne özgü uygun analiz yöntemleri seçilmesi gerekir. Örneğin her gözde bir gözlemin bulunduğu ve her faktörün eşit sayıda birim üzerinde denendiği deney tasarımlarından elde edilen veriler dengeli varyans analizi (balanced ANOVA) ile analiz edilir. Bir ya da daha fazla faktörün içiçe ele alınarak denendiği deney sonuçları içiçe gruplarda varyans analizi yöntemi ile analiz edilir. Her gözde birden fazla verinin bulunduğu deneme sonuçlarına tekrarlı ölçümler varyans analizi uygulanır.

11.2.2 SPSS’de Faktöriyel Varyans Analizi

• Bağımlı değişken, A ve B etkeninin alt düzeylerinin kodları veri sayfasıda ayrı ayrı sütunlara girilir.
• Analyze > ANOVA Models > Simple factorial seçeneği tıklanır.
• Görüntülenen ekranda Dependent alanına bağımlı değişken, Factor(s) alanına etkenler taşınır. Faktörlerin maksimum ve minimum alt düzeyleri tanımlanır.
• Etkileşim düzeyini belirlemek için Options seçeneği tıklanır. Ekranda Method bölümünde Unique seçeneği, Interaction bölümünde ise 2-way seçeneği işaretlenir. Continue tıklanır.

MINITAB ve SPSS sonuçları benzerlik göstermektedir.

11.3 ORTAK DEĞİŞKENLİ FAKTÖRİYEL DENEMELERİN ANALİZİ

Bazı denemelerde bağımlı değişken (Y) yanında bağımlı değişkenle birlikte değişim gösteren ortak değişkenlerin (covariate, X1, X2 ) de verileri elde edilir. Ortak değişkenlerin Y ile bağımlılık gösterdiği durumlarda faktörlerin Y üzerindeki etkilerini doğru olarak belirlemek mümkün olmaz. Y’nin değişimini ortak değişkenlere göre düzeltilmesinden sonra faktörlere göre değişimin incelenmesi gerekir. Böylece Y’ nin faktörlerle seviyelerinden etkilenme biçimleri doğru olarak saptanabilir. Bu işleve ortak değişkenlere göre istatistiksel olarak düzeltilmiş Y değerlerinin varyans analizi denilmektedir.

11.3.2 SPSS’ de Ortak Değişkenli Faktöriyel Denemelerin Analizi

 Ortak değişken verileri X1 sütununa girilir.
 Analyze > ANOVA> Simple factorial işaretlenir.

SPSS çıktısında ana faktörlerin etkisi (main effects) faktörlere göre ayrıntılı biçimde verilmektedir. İki faktörün etkileşimi ve açıklanan varyans ile artık varyans değerleri ayrı satırlarda verilmektedir. SPSS’ de ortak değişkenli faktöriyel varyans analizi uygularken ortak değişkenin modelde analize alınış biçimi sonuçları etkilemektedir. Eğer cevap değişkeninin faktörlere göre değişimini ele alırken önce X1’ e göre düzeltip sonra varyans analizi uygulanmak isteniyor ise ortak değişkenin etkisini önce hesaplayıp düzeltmeyi yapmak ve daha sonra analize devam etmek gerekir. Bunun için Experimental ya da aşamalı metod ile çözüm yapmak ve Ortak değişkeni etkilerden önce dikkate almak (before effects) gerekir. Kovaryans analizi sonuçları ile benzerlik gösteren bu yaklaşım verilere ayrıca kovaryans analizi uygulanmasını da ortadan kaldırır.

İki programdan elde dilen sonuçlar aynıdır. Çıktılarda yer alan ayrıntılar bakımından SPSS, MINITAB’ a göre daha çok ayrıntılı bilgi vermektedir.

11.4 ÇOK FAKTÖRLÜ DENEME SONUÇLARININ ANALİZİ

Faktör sayıları ve her bir faktörün seçenekleri arttırılarak faktöriyel denemeleri çok faktörlü duruma getirmek, cevap değişkenin doğal dünyadaki değişimi hakkında gerçeğe yakın bilgiler elde etmeyi sağlar. Bu tür deneme sonucunda elde edilen verilere varyans analizi uygulandığında ikili, üçlü ve çok katlı (multiway) etkileşimler hesaplanarak bu etkileşimlerin önemlilikleri test edilir.

11.4.2 SPSS’de Çok Faktörlü Deneylerin Analizi

SPSS veri sayfasında veriler uygun biçimde girilir.

• Analyze >Anova Models > General Factorial seçeneği tıklanır.
• Görüntülenen akranda Dependent alanına seçilen bağımlı değişken, Factor(s) alanına ise faktörler taşınır. Her bir faktörün seviyeleri tanımlanır. Sonra bu ekranda Model seçeneği tıklanır. Ekrandaki Custom seçeneği seçilir ve MINITAB’de ele aldığımız model bu alana özgün model olarak yazılır. Bu işlem için her defasında tek faktör ya da iki faktör birlikte interaksiyon seçeneği ile birlikte sağ alana taşınır. Sum of Squares alanında Unique kareler toplamı seçilir. Continue tıklanır.

11.5 İÇİÇE FAKTÖRLÜ DENEMELERDE VARYANS ANALİZİ

Faktöriyel denemelerde bazı faktörler içinde alt faktörler (gruplar) halinde ele alınarak denemeler yapılabilir. Yine farklı türde ve farklı koşullarda düzenlenmiş denemelerin deneysel hatayı en aza indirmek için birleştirilerek analizi istenebilir. Değişik faktörlerin etkilerini daha fazla tekrarla incelemek için geliştirilmiş yöntemler sonucu elde edilmiş bulguları analiz etmek için içiçe denemelerde varyans analizi yaklaşımından yararlanılır. Çeşitli koşul ya da şartlarda yapılmış denemeler ana koşul altında birleştirilerek içiçe gruplar oluşturulur ve bulgular varyans analizi ile değerlendirilir.

İçiçe gruplarda varyans analizi modeli; bağımlı değişkenin değerini etkileyen faktörleri ve bu faktörlerin hangi ana faktör içinde yer aldığını belirlemek için yapılır.

11.5.2 SPSS’de İçiçe Gruplarda Varyans Analizi

SPSS’de içiçe faktörlü deneme sonuçlarına varyans analizi uygulamak için doğrudan bir menü seçeneği bulunmamaktadır. Yalnız veriler MINITAB’daki gibi SPSS veri sayfasına girilir. File > New > Syntax seçenekleri tıklanır. Komut kalıbı yazım editörü ekrana gelir. Bu editörün yazı alanına GLM Y by A B : /design A B(A) komutları iki satır halinde yazılır. Editörün menüsünden Run seçeneği tıklanır. Açılan seçenekler içinden all seçeneği tıklanır ve yazılan komut kalıbının tümü çalıştırılır ve analiz sonuçları elde edilir.

MINITAB ve SPSS sonuçları benzerdir. Ancak MINITAB’de uygulama daha basit yapılmaktadır.

BÖLÜM 12

PARAMETRİK OLMAYAN TESTLER

12.1 GİRİŞ

Toplum parametresinin hesaplanamadığı ya da belirli bir dağılım varsayımı yapılmadığı, ölçümlemenin isimsel, sıralı, skor ya da yaklaşık aralıklı bir yöntem ile yapılmış olduğu durumlarda verilerin analizinde parametrik olmayan testlerden ( nonparametric tests) yararlanılır.

Aralıklı ölçekle elde edilmiş verilerde normal dağılım varsayımı her zaman kurulamaz ya da belirli bir dağılım varsayımına göre kurulmuş hipotezler yerine serbest yaklaşımlar denenmek istenebilir. Bu gibi koşullarda da paremetrik olmayan testler uygulanır.

Örnek birim sayılarının az olduğu, verilerin türdeş olmayan bir yapıda olduğu, değerlerin doğrudan ölçme yerine hesaplama ile matematiksel olarak elde edildiği ve ölçümlerin aralıklı ölçekle ölçülmesine rağmen kullanılan ölçme aracının güvenirliğinin az olduğu durumlarda veri setindeki gerçek veriler yerine onların sıralama puanları (rank) kullanılarak analiz yapılmasının uygun görüldüğü durumlarda da parametrik olmayan testlerden yararlanılır.

Parametrik olmayan testlerde de bir sıfır hipotezi bir karşıt hipotez’e karşı test edilir. Fakat buradaki hipotezler bir parametrik değeri hedef almayan, belirli bir dağılımı varsaymayan hipotezlerdir.

Örnek olarak sıklıkla kullanılan parametrik olmayan testleri örnek durumuna göre aşağıdaki gibi sınıflamak mümkündür.

1. Tek örnek testleri (Binomial test, İşaret testi, Kikare Uygunluk testi)
2. İki Örnek testleri
2.1- Bağımlı iki örnek testleri (Wilcoxon T testi, McNemar testi)
2.2- Bağımsız iki örnek testleri (Mann-Whitney U testi)
3. k örnek testleri
3.1- Bağımlı k örnek testleri (Friedman Anova)
3.2- Bağımsız k örnek testleri (Kruskal-Wallis Anova, Mood Medyan testi, Cochran testi)
4. Korelasyon ve Uyumluluk testleri
4.1- Spearman korelasyon analizi
4.2- Kendall Tau analizi

12.2 KİKARE TESTİ

Kikare testi parametrik olmayan testler içinde en yaygın kullanmı olan testlerdendir.
R*1, 1*C, R*C, (R:sıra sayısı, C:sütun sayısı ) biçiminde sınıflanmış (tablolaştırılmış) verilerin analizinde yararlanılır.

12.2.1 Kikare Uygunluk Testi

R*1 ya da 1*C tipindeki bir frekans dağılımında her bir sınıfta gözlenen frekanslarının (Gi ya da Gj), bu frekans dağılımın uyduğu varsayılan belirli ya da herhangi bir dağılıma göre hesaplanan Teorik frekanslarından (Ti ya da Tj) olan farklarının önemliliğini test etmeyi amaçlar.
Uygunluk testinde test edilen hipotezler aşağıdaki gibi kurulur.

Ho: “uygunluk vardır.” Hı: “uygunluk yoktur.”

Ki-kare test istatistiğinin önemliliği sd=k-1 serbestlik dereceli teorik ki-kare dağılımının kritik değerlerine (α, sd) göre belirlenir. k tablo sınıf sayısıdır.

12.2.1.1 MINITAB’de Kikare Uygunluk Testi

• MINITAB’de doğrudan Kikare uygunluk testi uygulaması yoktur. Fakat bir dizi komut kalıbı aracılığı ile kikare uygunluk testi yapılabilir.

12.2.1.2 SPSS’de Kikare Uygunluk Testi

• Değişkenler veri ekranıda farklı sütunlara girilir. Ağırlik olarak belirlenecek değişken Data > Weight Cases seçeneği seçilerek belirlenir.
• Analyze > Nonparametric Tests > Chi-Square seçeneği seçilir.
• Görüntülenen ekranda değişken Test Variable List alanına taşınır. Values alanına teorik değerler girilir ve Add tıklanarak değerler Expected Values alanın taşınır. OK tıklanır.

12.2.2 Kikare Bağımsızlık Testi

2*2 ya da R*C tipindeki çapraz tablolarda gözlenen (Gij) frekansların, marjınal olasılıklar yaklaşımına göre hesaplanan teorik (Tij) frekanslardan olan farklarının önemliliğini test etmeyi amaçlar.

Bağımsızlık testinde test edilen hipotezler aşağıdaki gibi kurulur.

Ho: “Bağımsızlık vardır.” Hı: “Bağımsızlık yoktur.”

Sonuçlar ki-kare tablo değeri ile karşılaştırılarak karar verilir.

Bağımsızlık testleri tablonun sıra ve sütun sayısına göre iki farklı biçimde uygulanır.
a) 2*2 (dörtgözlü) tablolar
b) R*C (R>2, C>2) tablolar

2*2 tablolarında kikare testi; Pearson kikare testi, Yates kikare (düzeltilmiş kikare) testi, ve Fisher kikare (kesin kikare) testi, olmak üzere üç değişik tipte uygulanır.

• Pearson kikare testi, gözlerdeki teorik değerlerin tümü 25’ten büyük olduğunda uygulanır.
• Yates kikare testi, gözlerdeki teorik frekanslardan herhangi biri 5 ile 25 arasında ise uygulanır.
• Fisher kikare testi, gözlerdeki teorik frekanslardan herhangi biri 5’ten küçük ise uygulanır.

12.2.2.2 SPSS’de 2*2 Kikare Bağımsızlık Testi

• Kikare analizi için tablo değerleri tablonun sıra ve sütun sayıları dikkate alınarak veri sayfasına girilir. Bunun için üç değiken tanımlanır. Bunlar; sira: sıra no’ları değişkeni, sutun: sütun no’ları değişkeni ve frekans: göz frekansları değişkenidir.
• Verilerin kikare analizini yapmadan önce Data > Weight Cases seçeneği tıklanarak görüntülenen frekans değişkenin ağırlık (frequency variable) olarak tanıtılması gerekir.
• Kikare analizi uygulamak için Analyze > Descriptive Statistic > Crostabs seçeneği tıklanır.
• Görüntülenen ekranda Row(s) alanına sira değişkeni, Column(s) alanına sutun değişkeni taşınır. Statistics seçeneği tıklanır. Crosstabs statistics ekranına Chisquare seçeneği işaretlenir. Continue tıklanır. Bir önceki ekrana dönülür. OK tıklanır ve tablo verileri ile kikare analizi sonuçları görüntülenir.

12.2.2.3 R*C tablolarında kikare testi

R*C durumundaki çapraz tablo verilerinin bağımsızlık testinde Pearson kikare analizi uygulanır. R*C tablo verilerinin analizinde dikkat edilecek önemli nokta, tabloda 5’ten küçük teorik değerlerin sayısının toplam tablo göz sayısının (tg=R*C) %20’sini geçmemesidir. Eğer tablodaki 5’ten küçük teorik değere sahip göz sayısı toplam göz sayısının %20’sini aşar ise tablonun sıra ya da sütunlarında uygun birleştirme (boyut indirmesi) yapmak gerekir. Yeniden düzenlenen tablonun analizi için indirgenmiş tablo veri sayfasına yeniden girilir. Oluşturulan yeni tablonun tipi analizde yeniden değerlendirilir.

12.2.2.3.2 SPSS’de R*C Kikare Bağımsızlık Testi

• SPSS veri sayfasına veriler sıra, sütün ve frekans olarak üç sütuna girilir.
• Frekans değişkeni Data > Weight Cases seçilerek ağırlık değişkeni olarak tanımlanır.
• Analyze > Descriptive Statistics > Crosstabs > Statistics > Chisquare seçenekleri işaretlenir. Ekran sırasına göre Continue ve OK tıklanır.

12.3 İŞARET (SIGN) TESTİ

Verilen n birimlik bir dizinin, ortancası=K olan sürekli bir populasyonun rasgele örneği olup olmadığını test etmek için işaret testi uygulanır. İşaret testi, n birimlik bir veri dizisinde, ortanca değerin altında ve üstünde olan değerlerin gözlenme sıklığını Binom olasılığına göre test eder.
Dizideki n değerin her biri ortancadan küçük ise 0, ortancaya eşit ya da büyük ise 1 değeri ile kodlanır. 0 ve 1 değerli elemenler ayrı ayrı toplanır. Ortancadan küçük olan değerlerin sayısının ortancaya eşit ve daha büyük olanların eşit olduğu varsayımı (dizideki elemanların yarısı ortancadan küçük, diğerleri ise ortancaya eşit ya da daha büyüktür varsayımı, Ho: OD=K, Hı: ODK varsayımına karşı Binom olasılığı kullanılarak test edilir.

İşaret testinden eşleştirilmiş örneklerde eşler arası farkların ortancasının sıfır olduğu varsayımı da (Ho: OD=0) test edilebilir. İşaret testi ile birden fazla veri dizisi verildiğinde her bir dizinin verilen ortanca değere göre analizleri çoklu olarak aynı anda yapılabilir.

12.3.2 SPSS’de İşaret Testi
• SPSS’te tek örnek işaret testi uygulaması bulunmamaktadır. Eşleştirilmiş örneklerde işaret testi uygulanmaktadır.
• SPSS’de eş gözlemlere işaret testi uygulamak için; Analyze > Nonparametrics > 2- related samples seçeneği tıklanır.
• Görüntülenen ekranda Test List alanına değişkenler atanır. Test Type seçeneklerinden Sign seçeneği işaretlenir ve OK tıklanır.

12.4 WILCOXON T TESTİ
Wılcoxon T testi, bağımlı iki örnek testidir. Eşleştirilmiş (paired) t testinin parametrik olmayan alternatifidir. n birimlik örnekten elde edilen iki gözlem seti farkının ortancası sıfır olan toplumdan çekilmiş rasgele örnek olup olmadığını test eder (Ho: OD=0, Hı: OD0 ). Wilcoxon T testi, gözlemlerin sürekli dağılımdan çekilmiş aralıklı / yaklaşık aralıklı ölçekli veriler olduğunu varsayar.

12.4.2 SPSS’de Wilcoxon T Testi
• SPSS’de Wilcoxon T testi uygulamak için önce ne sonra değerleri iki ayrı sütuna girilir.
• Analyze > Nonparametrics > 2 Related Sample seçeneği tıklanır.
• Görüntülenen ekranda eş gözlemler seti Test pairs List alanına taşınır. Test Type seçenekleri içinden Wilcoxon test tipi işaretlenir ve OK tıklanır.

12.3 McNEMAR TESTİ

McNemar testi ikili biçimde sınıflandırılan ve birimlerin bir konudaki ilk görüşlerinin farklı bir zaman ya da uygulamadan sonra değişme gösterip göstermediğini, eğilimlerde / görüşlerde test öncesi ve sonrası değişimlerin önemliliği test edilir. McNemar testi, isimsel yada sıralı ölçekli eşleştirilmiş ikili verilerin analizinde kullanılır. McNemar testi, önceki durum ile sonraki durum arasında bir uyumluluk ya da değişme (farklılık) olup olmadığını test eder.

McNemar testi önce olumlu oldukları halde sonra olumsuz olan çiftler ile önce olumsuz oldukları halde sonra olumlu olan çiftlerin sayısını (önceki sonuçları sonraki uygulamada değişme gösterenler) dikkate alarak analiz yapar.

2*2 tablosunda;
A= Önce olumlu iken sonra olumsuz olan birim sayısı ya da
A= Önce (1) kodlu iken sonra (2) kodlu olan birim sayısı,

B= Önce olumsuz iken sonra olumlu olan birim sayısı ya da
B= Önce (2) kodlu iken sonra (1) kodlu olan birim sayısı olarak alınır.

McNemar test istatistiği; χ2 = (A-B)2

McNemar test istatistiği 2’nin önemliliği, sd=1 serbestlik dereceli kikare dağılımının kritik değerlerine (2) göre belirlenir.

12.5.2 SPSS’de McNemar Testi

• SPSS’de McNemar testi uygulamak için veriler 2*2 tablo biçiminde sütunlara girilir. Frekans sütunu Data > Weight Cases seçeneği ile ağırlık olarak tanımlanır.
• Analyze > Nonparamatrics Tests > 2-Related Samples... seçeneği tıklanır. Ekran 12.1’de Test Pair(s) List alanına önce ve sonra değişkenleri taşınır. Test Type seçeneklerinden McNemar işaretlenir ve OK tıklanır.

Örnek: 30 bireyin önteste vermiş oldukları olumlu ve olumsuz cevap dağılımının belirli bir eğitim aldıktan sonra değişimini incelemek istiyoruz. Veriler aşağıda verilen tablodadır. Öntest sonuçlarının sontestte değişmesi önemli midir?

Sontest Puanları
Öntest Puanları Olumlu (1) Olumsuz (2)
Olumlu (1) 13 8
Olumsuz (2) 6 3

Ekran 12.1 SPSS’de McNemar testi işlem penceresi
Düzeltme yapılmaksızın McNemar Test istatisiği, 2 = (8-6)2 / (8+6) =0,286 olarak, sd=1 için olasılığı P=0,7905 bulunur.

Düzeltme yapıldığında McNemar test istatistiği 2 = (I8-6I-1)2 / (8+6) =0,0714 olarak sd=1 için olasılığı ise P=0,861 bulunur.

Örneğimizde (A+B) < 30 olduğu için düzeltilmiş test sonuçları kullanılır. Öntest ve Sontest sonuçları arasında uyumluluk vardır. Öntest öncesi sonuçlar, ontestte önemli düzeyde değişme göstermiştir.

12.6 DİZİLER TESTİ (RUNS TEST)

Diziler testi n birimlik bir veri setinde, değerlerin gözlenme sıralarına göre rasgeleliğini test eder. n birimlik veri setinin K gibi bir değere göre (K=OD, K= ortalama, K=a) ard arda gelişlerindeki kümelenmenin rasgelelik koşullarına uygunluğunu test etmek için diziler testi uygulanır.

Bir veri setinde; değerlerin, gözlenme sıralarına göre ard arda gelişlerinde K’dan küçük ya da büyük olmalarına göre oluşturdukları kümelere dizi (run) adı verilir. n birimlik bir veri setinde değerlerin birbirine bağımlı olarak sıralanıp sıralanmadıklarını araştırmak için gözlenen küme sayısı (run) r ile beklene ortalama dizi sayısı arasındaki fark aşağıdaki test modeli ile test edilir.

Z= =

: Dizideki K’dan daha küçük değerlerin sayısı
: K’ya eşit ve daha büyük değerlerin sayısı
R : n birimlik veri setinde gözlenen küme sayısı
: Ortalama beklenen küme sayısı
: Standart hatadır.

Diziler testi uygulamak için dizideki elemanlar X<K için 0 ve X>K durumlarına göre 1 değerlerine dönüştürülerek 0,1 ikili dizi haline getirilir. Bu yeni ikili dizinin ard arda gelen elemanları 0 ise bir dizi, 1 ise başka bir dizide yer alacak şekilde gruplandırılır. Böylece yeni ikili dizinin rasgeleliği test edilir.

Diziler testi iki yönlü bir testtir. Verilen K değerine göre dizinin sağa ya da sola eğilim gösterip göstermediğini test etmeye yardım etmektedir.

12.6.2 SPSS’de Diziler Testi

• SPSS’de diziler testi uygulamak için veriler frekans sütununa girilir.
• Analyze > Nonparametrics Tests > Runs... seçeneği tıklanır.
• Çıkan ekranda Test Variable List alanına frekans değişkeni taşınır. Cut Point seçeneklerinde Mean seçeneği işaretlenir ve OK tıklanır.

12.7 MANN – WHITNEY U TESTİ

ve hacimli bağımsız iki örneğin aynı medyanlı populasyondan alınmış rasgele örnekler olup olmadığını test etmek için Mann-Whitney testi uygulanır. Bağımsız iki örneklem t testinin parametrik olmayan alternatifidir.

U testi, ETA parametresi ortalama yada ortanca değerden herhangi biri olmak üzere;

Ho: ETA1=ETA2 ( ve veri setleri aynı dağılıma sahiptir)
Hı: ETA1≠ETA2 ( veri setinin gözlemlerinin yarısından fazlası diğer setten farklıdır) hipotezlerini test etmeyi amaçlar.

12.7.2 SPSS’de Mann- Whitney U Testi

• Her iki gözlem seti verileri sırasıyla altalta C1 sütununa, grup kodlarıda C2 sütununa girilir.
• Testi uygulamak için Analyze > Nonparametric tests > 2 Independent Samples seçeneği tıklanır.
• Görüntülenen ekranda Test Variable List alanına C1, Grouping Variable alanına C2 taşınır.
• Test type seçeneğinden Mann-Whitney U seçeneği seçilir.
• Define Groups seçeneğinden örnek kodlarının min ve max değerleri tanımlanır.Continue ve OK tıklanır.

12.8 KRUSKAL – WALLIS (K-W) TESTİ

Kruskal Wallis Testi parametrik olmayan tekyönlü varyans analizi yöntemidir. K bağımsız örnekten elde edilen verilerin tek bir toplumun ana eğilimini gösteren veriler olup olmadığını analiz etmek için kullanılır.

Ho: K örnek aynı merkezli sürekli populasyondan alınmış örneklerdir
Hı: K örnekten en az birinin merkezi farklıdır hipotezlerini test etmeyi amaçlar.

K-W testi, herbir grup için sıralama puanları hesaplar. Bu sıralama puanları toplamından yaralanarak H test istatistiği hesaplar.

12.8.2 SPSS’de Kruskal-Wallis Testi

• Bu testi uygulamak için C1 sütununa puanlar grup sırasına göre altalta girilir. C2 sütununa değerlerin ait oldukları grupların grup kodları girilir.
• Analyze > Nonparametric tests > K Independent Samples seçeneği tıklanır.
• Ekran 12.2’de Test Variable List alanına C1, Grouping Variable alanına C2 taşınır.
• Test type seçeneğinden Kruskal-Wallis seçeneği seçilir.
• Define Groups seçeneğinden örnek kodlarının min ve max değerleri tanımlanır. Continue ve OK tıklanır.

Ekran 12.2 SPSS’de Kuruskal –Wallis testi işlem penceresi

12.9 MOOD MEDYAN TESTİ

Mood Medyan Testi, K bağımsız gruptaki ordinal ölçekle elde edilmiş verilerin aynı medyana sahip populasyondan alınmış örnekler olup olmadığını test etmeyi amaçlar. Bu test tek yönlü varyans analizinin parametrik olmayan alternatifidir. Kruskal-wallis testi ile aynı işlevi yerine getirir. Eğer veriler aralıklı ölçekle elde edilmiş ise Kruskal-wallis testi tercih edilir.

Ho: K grubun alındığı populasyonlar aynı medyana sahiptir
Hı: K grupta en azından bir grubun medyanı diğerlerinden farklıdır hipotezlerini test etmeyi amaçlar.

esi

12.9.2 SPSS’de Mood Medyan Testi

• Bu testi uygulamak için C1 sütununa puanlar grup sırasına göre altalta girilir. C2 sütununa değerlerin ait oldukları grupların grup kodları girilir.
• Analyze > Nonparametric tests > K Independent Samples seçeneği tıklanır.
• Görüntülenen ekranda Test Variable List alanına C1, Grouping Variable alanına C2 taşınır.
• Test type seçeneğinden Median seçeneği seçilir.
• Define Groups seçeneğinden örnek kodlarının min ve max değerleri tanımlanır. Continue ve OK tıklanır.

12.10 FRIEDMAN İKİ YÖNLÜ VARYANS TESTİ

Friedman testi iki yönlü varyans analizinin nonparametrik altenatifi olan bir testtir. Friedman testinde test edilen hipotezler aşağıdaki gibi kurulur.

Ho: İşlemlerin etkisi yoktur.
Hı: İşlemlerin farklı etkileri vardır.

Friedman testi yapmak için n birim (blok) ve k işlem için elde edilen veriler sırası ile aynı C1 sütununa girilir. Bu değerlerin hangi işlem ve birime ait oldukları C2 sütununda kod değerler olarak belirlenir. Herbir birimin k işlem için birim numaraları C3 sütununda sıralanır.

• 1

12.10.2 SPSS’de Friedman İki Yönlü Varyans Analizi

• SPSS’de Friedman testi yapmak için k işlem için verilen veriler sırasıyla sütunlara girilir.
• Analyze > Nonparametric tests > K Independent Samples seçeneği tıklanır
• Görüntülenen ekranda Test Variable List alanına değişkenler taşınır.
• Test type seçeneğinden Friedman seçeneği seçilir. OK tıklanır.

12.11 KENDALL W TESTİ

Kendall W testi, k-bağımlı örneğin aynı populasyondan alınmış rasgele örnekler olduğu varsayımını test eden parametrik olmayan bir testtir. W testi, n birimlik (b) bir grubun t değişken ya da işlem için puanları arasında uyumluluk (concordance) olup olmadığını test eder. W testi, n değerlendirici, gözlemci ya da teknisyenin t farklı fenomeni değerlendirmelerinde uyumluluğu da test etmek için kullanılır. W testi, değerlendiricilerin (rater, observer) kendi içlerinde uyumluluğunu (inter-rates reliability) ve test içi uyumluluğun güvenirliğini (inter-test reliability) değerlendirmede de yararlanılır.

12.11.2 SPSS’ de Kendall W Testi:

SPSS’ de Kendall W testi uygulamak için:

• Veriler sırasıyla sütunlara girilir.
• Analyze > Nonparametric Tests > K Related Samples seçeneği tıklanır.
• Görüntülenen ekranda Test Variables alanına C1, C2 ve C3 değişkenleri taşınır.
• Test Type bölümünde Kendall W seçeneği tıklanır.
• Belirtici istatistiklerin çıktıda yer alması isteniyorsa Statistics butonu tıklanır.
• Bu ekranda isteğe bağlı olarak Descriptive veya Quartiles seçenekleri işaretlenir. Continue tıklanır. Önceki ekrana dönülüp OK tıklanır.

12.12 COCHRAN Q TESTİ

Cochran Q testi, k-bağımlı ikili değerler alan (dichotomous) değişkenlerin aynı populasyondan geldikleri varsayımını test etmeye yarar. McNemar testinin iki ya da daha fazla bağımlı setin frekanslarının/oranlarının birbirlerinden önemli farklılık gösterip göstermediğini test etmek için genişletilmiş halidir. R sıra (birim) ve C sütunda (bağımlı grup, işlem) yer alan verilerin, Var-Yok, 0-1, Evet-Hayır gibi cevapların işlemlere göre farklılığını test etmek için Q testinden yararlanılır. Q testi uygulamak için her birimin skorları 0,1 biçiminde ikili (dichotomous) olmalıdır.

Q’ nun önemliliği sd=t-1 serbestlik dereceli kikare dağılımının kritik değerleri ile belirlenir.

12.12.1 MINITAB’ de Cochran Q Testi

• MINITAB programında Cochran Q testi uygulanmamaktadır.

12.12.2 SPSS’ de Cochran Q Testi

• Veriler sırasıyla sütunlara girilir.
• Analyze > Nonparametric Tests > K Related Samples seçeneği tıklanır.
• Görüntülenen ekranda Test Variables alanına C1, C2 ve C3 değişkenleri taşınır.
• Test Type bölümünde Cochran’s Q seçeneği tıklanır.
• Belirtici istatistiklerin çıktıda yer alması isteniyorsa Statistics butonu tıklanır.
• Bu ekranda isteğe bağlı olarak Descriptive veya Quartiles seçenekleri işaretlenir. Continue tıklanır. Önceki ekrana dönülüp OK tıklanır.

12.13 KOLMOGOROW – SİMİRNOV TESTİ

Kolmogorow uygunluk testi, örneklem büyüklüğü küçük olduğunda ki-kare uygunluk testlerine tercih edilir. Bir çok durumda Kolmogorow-Simirnov testinin ki-kare testine göre daha güçlü bir test olduğu çeşitli kaynaklarda belirtilmektedir. Kolmogorow-Simirnov testi, sıralayıcı ölçekle elde edilen verilere uygulanabilmesi özelliğiyle, sınıflayıcı ölçekle elde edilen verilerin analizinde kullandığımız ki-kare uygunluk testlerine bir alternatif oluşturur. Yine bu testler, ki-kare uygunluk testlerinde karşımıza çıkan verilerin biraz da rasgele bir şekilde gruplanması sorununu ortadan kaldırır. Kolmogorov-Simirnov testleri, sıfır hipotezinde öne sürülen dağılım fonksiyonunun tam anlamıyla belirli olduğu durumlarda uygundurlar ve ki-kare testleri gibi parametrik olmayan testler grubuna girerler.

Kolmogorov-Simirnov testi, teorik dağılım altında geçerli olan kümülatif frekans dağılımını, gözlenen verilerin kümülatif frekans dağılımı ile karşılaştırır. Bu karşılaştırma sırasında iki kümülatif dağılım arasındaki e büyük sapma, en büyük mutlak fark olarak belirlenir. Daha sonra ise örnekleme dağılımına göre bu ölçüdeki bir farkın şans eseri edilip edilemeyeceği araştırılır.

12.13.1 Tek Örnek Kolmogorov-Simirnov Testi

n hacimli örnekten elde edilen frekans dağılımlarının Ho varsayımı altında Fo(X) yığılımlı olasılık dağılımına sahip bir toplumdan alınmış rasgele örnekler olup olmadığını test etmek için kullanılır.

Tek Örnek KS Testi uygulamak için;

• Hipotez kurulur. ‘Ho: Uygunluk vardır.’ ‘Hı: Uygunluk yoktur.’
• Veriler frekans dağılımı durumuna getirilir. Bu frekans dağılımının yığılımlı olasılık dağılımı oluşturulur (So(X)).
• Ho varsayımı altında örneğin alındığı varsayılan herhangi bir teorik dağılımın Fo(X) yığılımlı olasılık dağılımı belirlenir.
• Teorik ve gözlenen yığılımlı olasılık dağılımlarının her sınıfta olasılıkları arasındaki mutlak farklar belirlenir. Bu farklardan en büyük farklılığın rasgelelik koşullarından ayrılıp ayrılmadığı test edilir.
• =maximum
• değerlerinin önemliliği, α=0,05, 0,01 ve 0,001 için hesaplanan kritik değerleri ile karşılaştırılarak belirlenir. Bu kritik değerler;

= 0,05 için =1,36/
=0,01 için =1,63/
=0,001 için =1,95 şeklinde hesaplanır.

• Karar verilir.

< P > Ho kabul edilir.
P < Ho reddedilir.

12.13.1.2 SPSS’de Tek Örnek Kolmogorov-Simirnov Testi

• SPSS’de tek Örnek Kolmogorov-Simirnov Testi uygulamak için veriler girilir.
• Analyze > Nonparametric Tests > 1-Sample K-S... seçeneği tıklanır.
• Görüntülenen ekranda Test Variable List alanına seçilen değişken taşınır. Test Distrubition seçeneklerinde Normal, Uniform ve Poison seçilebilir. OK tıklanır.

12.13.2 İki Örneklem Kolmogorov-Simirnov Testi

İki örnek KS Testi, dağılımlarının aynı olduğu varsayılan ve yığılımlı olasılık dağılımına sahip iki toplumdan alınan ve hacimli iki örneğin yığılımlı olasılık dağılımları (X) ve (X) in benzerliğini test eder.

İki Örnek KS Testi uygulamak için aşağıdaki aşamalar uygulanır;

• Hipotezler kurulur. ‘Ho: = ’ ‘Hı:  ’
• Veriler benzer sınıf başlangıç değerleri ve aralıkları içerecek şekilde frekans dağılımına dönüştürülür.
• Her frekans dağılımı (X) =k/n1 ve (X) =k/n2 biçiminde yığılımlı olasılık dağılımı durumuna getirilir.

• Sınıflara göre dağılımlar arasındaki mutlak farklar hesaplanır ve D farkları arasında en büyük fark belirlenir.

’ın gözlenme olasılığı ve önemliliği belirlenir. Eğer N= = olduğu ve <40 ve <40 olduğunda hazırlanmış tablolardan yararlanılır. K>6 ve + >20 olduğu durumlarda ise D( kritik değerlerinin D’nin asimtotik dağılımına yaklaştığı görüldüğünden D( kritik değerleri aşağıdaki gibi hesaplanır.

D( =0,05 için =1,36/
D( =0,01 için =1,62/
D( =0,001 için =1,95/
• Karar verilir.

< D( P >  Önemli fark yoktur.
 D( P >  Önemli fark vardır.

12.13.2.2 SPSS’de İki Örnek Kolmogorov-Simirnov Testi

• SPSS’de İki Örnek Kolmogorov-Simirnov testi uygulamak için Analyze > Nonparametric Tests > 2 Independent Samples... seçeneği tıklanır.
• Ekran 12.3’de test Variable List alanına seçilen değişken taşınır. Grouping Variable alanına grup taşınır ve Define Groups tıklanır.
• Çıkan pencerede Group 1’e 1 ve Group 2’ye 2 yazıldıktan sonra Continue tıklanır. Geri dönülür ve Test Type seçeneklerinden Kolmogorov-Simirnov Z işaretlenir. OK tıklanır.

Ekran 12.3 SPSS’de Two-Independent-Samples Tests işlem penceresi

BÖLÜM 13

BASİT DOĞRUSAL REGRESYON VE KORELASYON ANALİZİ

13.1 GİRİŞ

Y Bağımlı ve X Bağımsız değişken olmak üzere iki değişken arasındaki sebep sonuç ilişkisini matematiksel model olarak ortaya koyan yönteme regresyon analizi adı verilir.

İki değişken arasındaki ilişki düzeyini ve yönünü belirlemeye yardım eden yönteme korelasyon adı verilmektedir.

Regresyon analizinin uygulanması için değişkenlerin bağımlı ve bağımsız değişken olarak ayrılması ve regresyon modelinin kurulması gerekir.

Bağımlı değişken (Dependent variable): Değeri başka değişkenler tarafından etkilenen ve diğer değişkenlerin değeri değiştiğinde bu değişimden etkilenen değişkene, bağımlı değişken denir. Bağımlı değişken genelde Y harfi ile gösterilir.

Bağımsız değişken (Independent variable): Değeri rasgele koşullara göre belirlenen, bağımsız olarak değişim gösteren ve başka değişkenlerin değişimi üzerine etkide bulunan değişkenlere bağımsız değişken denir. Bağımsız değişken genelde X harfi ile gösterilir.

Regresyon analizi uygularken korelasyon analizi de ele alınacak daha sonra korelasyon analizi tek başına incelenecektir.

13.2 BASİT DĞRUSAL REGRESYON ANALİZİ

Basit doğrusal regresyonun amacı, Y ve X arasındaki bağıntıyı Y= a + bX biçiminde ifade eden modeli bulmak ve bu modelde yer alan katsayıların önemliliğini test etmektir.

Basit doğrusal regresyonda; toplumda iki değişken arasında Y= α + βX biçiminde bir bağıntı olduğu varsayılır. Bu bağıntının n birimlik örnek verileri aracılığı ile Y= a +bX biçiminde tahmin edilir. Bu modelde a ve b katsayıları; α ve β parametrelerinin tahminidir. a katsayısı sabit, b katsayısı ise regresyon doğrusunun eğimidir. b, X’de meydana gelen bir birimlik değişimin Y’de kaç birimlik değişime neden olacağını belirtir.

Bir gözlemin tahmin hatası, e = Y- (a + bX) biçiminde belirlenir. Eğer model tam olarak verilere uygun ise, bu farkların tüm birimler için kareleri toplamının sıfır olması beklenir. Fakat bu durum mümkün değildir. Bu yüzden farkların kareleri toplamının minimum olması gerekir.

Regresyonun tutarlılığı, tahminin varyansının minimum olması ile mümkündür. Verilere uyan doğrunun gerçekten tutarlı olup olmadığı regresyon analizi ile belirlenir. a ve b katsayıları, tahminin hatasını en küçük düzeyde tutacak biçimde belirlenmelidir.
b’nin önemliliği, regresyon doğrusu eğiminin sıfırdan farklılığının testidir. b=0 olması doğrunun x eksenine paralel olmasını yani X’in Y üzerinde bir etkisinin olmadığını belirtir. b önemli ise X’in Y üzerindeki belirleyiciliği önemlidir yorumu yapılır. Ho: β=0 , Hı: β≠0 hipotezleri t istatistiği ile test edilir.

a’nın öemliliği, regresyon doğrusunun merkezden geçip geçmediğinin test edilmesidir. a önemli ise X ile Y arasındaki regresyon denkleminde sabit mutlaka yer almalı, önemli değil ise modelde sabit değeri katmadan da modelin tahmin edilmesinin sakıncalı olmayacağı anlamı çıkarılır. Ho: α=0 , Hı: α≠0 hipotezleri t istatistiği ile test edilir.

Regresyon analizi, Y’nin varyanslarının bileşenlerine ayrılması ve bu varyans bileşenlerinin birbirlerine oranının önemliliğini belirleme işlemidir. F test istatistiği kritik değerlerine göre değerlendirilir.

İki değişken arasındaki ilişkinin düzeyi Pearson korelasyon katsayısı ile hesaplanır. Katsayının önemliliği t testi ile test edilir. t istatistiğinin önemliliği sd=n-2 serbestlik dereceli t dağılımının kritik değerlerine göre belirlenir. P>0,05 ise iki değişken arasında önemli ilişki olmadığı, P≤0,05 ise değişkenler arasında önemli düzeyde ilişki olduğu biçiminde değerlendirilir.

Örnek: KLM işletmesi verilerinden toplam servis adedi ile toplam teknisyen sayısı arasında bir bağıntı olup olmadığını araştırmak için regresyon analizi uygulayalım.

13.2.2 SPSS’de Basit Doğrusal Regresyon ve Korelasyon Analizi

• SPSS’de veri sayfasına bağımlı ve bağımsız değişkenler ayrı ayrı sütunlara girilir.
• Analyze > Regression > Linear seçenekleri tıklanır.
• Ekran 13.2 Dependent alanına bağımlı değişken, Independent alanına bağımsız değişken taşınır. OK tıklanır.
• Regresyon ve Korelasyon analizi sonuçları F, t, p istatistikleri kritik değerleriyle karşılaştırılarak doğrusal bağıntı denklemi yorumlanır.

Ekran 13.2 SPSS regresyon analizi işlem penceresi

MINITAB ve SPSS sonuçları benzerdir.

13.3 BASİT KORELASYON ANALİZİ

Basit korelasyon, iki değişken arasındaki ilişkinin büyüklüğünü, yönünü ve önemliliğini ortaya koyan yöntemdir. X ve Y arasında basit doğrusal bir regresyon modeli kurulabiliyorsa iki değişken arasında da basit korelasyon ilişkisi kurulabilir. Korelasyon analizi veri setinde yer alan X ve Y’nin bağımlı ya da bağımsız değişken olmaları dikkate alınmaz.

İki değişken arasındaki ilişkinin düzeyi korelasyon katsayısı ile hesaplanır. Korelasyon katsayısı önemliliği t istatistiğinin kritik değerlerine göre belirlenir. P>0,05 ise iki değişken arasında önemli ilişki olmadığı, P≤0,05 ise değişkenler arasında önemli düzeyde ilişki olduğu biçiminde değerlendirilir.

13.3.2 SPSS’de Basit Korelasyon Analizi

• Veriler her değişken farklı sütunda olmak üzere veri sayfasına girilir.
• Analyze > Correlate > Bivariate seçenekleri tıklanır.
• Görüntülenen ekranda Variables alanına iki değişken ismi taşınır.
• Test of Significance alanında Two-tailed olasılık düzeyi seçilir. Hesaplanacak katsayı için Correlation Coeffients alanında Pearson seçeneği işaretlenir. OK tıklanır.
• SPSS’de t testi sonuçları rutin çktıda yer almaktadır.

13.4 KOVARYANS ANALİZİ

Kovaryans, iki değişken arasındaki birlikte değişimi belirten bir kavramdır.

13.4.2 SPSS’de Kovaryans Analizi

• SPSS’de veri sayfasında yer alan değişkenkler için Kovaryans matrisi hesplamasına ilişkin bir alt menü ya da alt seçenek bulunmamaktadır. Regresyon modülü ile yapılan analizlerde çıktılar içinde varyans-kovaryans matrisinin hesaplanması ya da yalnızca kovaryans matrisinin hesaplanması mümkün olabilmektedir.

1

BÖLÜM 14

ÇOKLU DOĞRUSAL REGRESYON VE KORELASYON ANALİZİ

14.1 GİRİŞ

Y bağımlı değişken ve Xı, ..., Xp bağımsız değişkenler olmak üzere değişkenler arasındaki sebep-sonuç ilişkisini matematiksel bir model olarak ortaya koyan yönteme çoklu regresyon analizi adı verilir.

Bir bağımlı değişken ile bu değişkenin değişimi üzerinde etkide bulunan p sayıda bağımsız değişken arasındaki ilişkinin düzeyini belirleyen yönteme ise çoklu korelasyon analizi denilmektedir. Genellikle çoklu regresyon ve korelasyon analizi birlikte ele alınan ve hesaplamaları birlikte yapılan karma yöntemlerdir.

Çoklu Doğrusal Regresyon Analizi; Y= bo+bıXı+...+bpXp biçiminde ele alınan bir doğrusal modelde parametre tahmini yapmayı amaaçlar.

Verilere uyan modelin açıklayıcılık yüzdesi belirginlik katsayısı (R2 ) ile hesaplanır. Modelde yer alan herbir açıklayıcı değişkenin Y üzerindeki etkisinin önemliliği b’lerin önemliliğinin test edilmesi ile belirlenir. Bunun için herbir değişken için hesaplanan regresyon katsayısının önemliliği t testi ile test edilir.

Veri dizisinde değerler arasında otokorelasyon (ardışık bağmlılık) olup olmadığını test etmek amacıyla Durbin-Watson (DW) istatistiği kullanılır.

14.2 ÇOKLU REGRESYON VE KORELASYON ANALİZİ

14.2.1 MINITAB’de Çoklu Regresyon ve Korelasyon Analizi

• Veriler, veri sayfasına bağımlı değişken ve bağımsız değişkenler ayrı ayrı sütunlarda olmak üzere girilir.
• Stat > Regression > Regression seçeneği tıklanır.
• Görüntülenen ekranda Response alanına bağımlı değişken, Predictors alanına bağımsız değişkenler girilir. OK tıklanır.
• Modelin açıklayıcılık yüzdesi (belirginlik katsayısı) belirlenir, herbir değişken için hesaplanan regresyon katsayısının önemliliği t testi ile test edilir.

14.2.2 SPSS’de Çoklu Regresyon ve Korelasyon Analizi

• Veriler, veri sayfasına bağımlı değişken ve bağımsız değişkenler ayrı ayrı sütunlarda olmak üzere girilir.
• Analyze > Regression > Linear seçenekleri tıklanır.
• Görüntülenen ekranda Dependent alanına bağımlı değişken, Independent(s) alanına bağımsız değişkenler taşınır. OK tıklanır.
• Modelin açıklayıcılık yüzdesi (belirginlik katsayısı) belirlenir, herbir değişken için hesaplanan regresyon katsayısının önemliliği t testi ile test edilir.

14.3 POLINOMIYAL REGRESYON

Bağımlı ve bağımsız değişken arasındaki bağıntının belirlenmesinde bağımsız değişkenin 1., 2. vd. üslerinin modele katılması modelin belirlenme gücünü artırabilir.Bu yaklaşıma polinomiyal regresyon adı verilir.

Polinomiyal regresyonda model Y=b0+b1X+b2X2+b3X3+...+bkXk şeklindedir.

Bu modele X’ in dışında diğer değişkenlerin birinci ya da k’ ıncı üsleri katılarak model geliştirilebilir.

14.3.2 SPSS’ de Polinomiyal Regresyon:

• SPSS ‘de veriler hücreye girilir.
• Verilerin karesi ve küpü diğer hücrelere girilir.
• Analyze > Regression > Linear seçenği tıklanır.
• Uygun girişler yapılır.

İkinci bir yol olarak da:

• Statistics> Regression> Curve Estimation seçenekleri tıklanır.

14.4 AŞAMALI REGRESYON (STEPWİSE REGRESSİON)

Aşamalı regresyon, p sayıda belirleyici değişken içinden bağımlı değişkeni açıklama niteliğine sahip uygun belirleyici değişkenler alt setini seçmeyi sağlayan bir yöntemdir. Aşamalı regresyon ile k değişken setinden (p-k) < p değişkenden oluşan bir model oluşturulabilir.
Aşamalı regresyonda değişkenlerin, cevap değişkenini açıklamaktaki güçlerine göre modele alınması söz konusudur. Değişkenler önceden belirlenen (kurulu değer ya da kullanıcının kendi belirlediği değer olarak), modele giriş F değeri (FENTER, PIN) ile modele girebilir, modelden çıkış F değeri (FREMOVE, POUT) ile modelden çıkarılır. Bu değerler program türüne göre farklılık gösterir. Fakat FENTER değerinin FREMOVE değerinden küçük olması ya da eşit olması gerekir.
Aşamalı seçimde; 1. adımda veri matrisindeki her değişken için F istatistikleri hesaplanır. Bu adımda hesaplanan F değeri, FREMOVE ile verilen değerden küçük ise değişken modelden çıkarılır ve modele alınacak yeni bir değişken için diğer bir adıma geçilir. Yeni değişken için hesaplanan F değeri FREMOVE’den büyük ise değişken modele alınır ve bu işlemler tüm değişkenler için tekrarlanır. FENTER istatistiğini aşan en büyük F değerine sahip değişken modelde kalır. Veri setindeki tüm değişkenler bu yaklaşımla gözden geçirilinceye kadar işlemler devam eder.

Her defasında I. değişken için F(I) değeri;

F(I)=

biçiminde hesaplanır.Burada;

HKT: Hata (Artık, Residual) Kareler Toplamını, HKO ise Hata Kareler Ortalamasını belirtmektedir. F(I) istatistiğinin serbestlik derecesi (1, (N-p-1))dir.

STEPWİSE regresyonda değişkenlerin modele girmesi ya da modelden çıkarılması işlemleri değişik yaklaşımlarla yapılmaktadır. Bu yöntemler aşağıda kısaca açıklanmıştır.
İleriye Doğru Seçim (Forward Selection): Bu yöntemde her defasında bir değişken modele alınır ve modelde kısmi F değerleri hesaplanır. Eğer bu değer Fenter değerine eşit ya da daha büyük ise modele alınır. Daha sonraki tüm değişkenler bu yaklaşım ile sınanırlar. Bir değişken modele alınmış ise daha sonraki adımlarda modelden çıkarılmaz. F(I) değerleri büyük olan ve R2 değerinin en büyüklendiği konumdaki model regresyon modeli olarak kabul edilir.
Geriye Doğru Ayıklama (Backward Elimination): İlk adımda tüm değişkenler modele alınır. Küçük F(I) değerli değişken modelden çıkarılır. Yeniden F(I) değeri hesaplanır. F(I) değeri FREMOVE değerinden küçük olan değişken modelden çıkarılır. Bu işlem modelden çıkarılacak değişken kalmayıncaya kadar devam eder. Modelden çıkarılan değişkenin tekrar modele girme şansı kalmaz.
Tüm Olası Regresyon Yaklaşımı (All Possible Regression): Veri setindeki değişkenler ile tüm olası modeller denenerek modeller oluşturulur. Bu modeller içinden R2 değeri en yüksek olan model uygun regresyon modeli olarak kabul edilir.

14.4.2 SPSS’de Aşamalı Ragresyon Analizi
SPSS’de aşamalı regresyon analizi yapmak için:
• Analyze > Regression>Linear seçenekleri seçilir.
• Bağımlı ve bağımsız değişkenler seçilip Dependent ve Independent alanına taşınırlar. Method alanı tıklanır ve seçeneklerden Stepwise seçilir. Statistics seçeneği tıklanır. Çıkan pencerede Statistics seçenekleri içinden çıktıda yer alması istenilen tahminler, belirtici istatistikler ve test istatistikleri işaretlenir. Continue tıklanır.
• Options seçeneği seçilir. Options seçeneği aşamalı yöntemde değişkenlerin modele giriş ve çıkış olasılıklarını ya da FENTER ve FREMOVE değerlerini tanımlama olanağı sağlamaktadır. Uygun değerler ya da olasılıklar belirlendikten sonra Continue tıklanır ve ana ekrana geri dönülür. Hesaplanan yeni değişkenlerin (uyan değerler, artık değerler farklar v.b.) veri setine kaydetmek için Save seçeneği tıklanır ve görüntülenen ekranda uygun seçimler yapılır.
• Eğer regresyon modeli ile elde edilen değişkenler ile gözlem değerleri arasındaki uyumları, grafik üzerinde görülmek istenirse Plot seçeneği tıklanır. Görüntülenen ekranda uygun seçimler yapılır.

14.5 EN İYİ REGRESYON MODELİ BULMA
(BEST REGRESSION)

En büyük R2 kriteri kullanılarak tüm olası kombinasyonlara dayalı en iyi regresyon denklemini uydurmak amacıyla geliştirilmiş yöntemlerdir. Veri setinde yer alan bağımsız değişkenler ile bağımlı değişken arasında kurulabilecek tüm kombinasyonlara ilişkin regresyon denklemleri belirlenir. Bu denklemler içinden en yüksek belirginlik katsayısına sahip olan model uygun regresyon modeli olarak seçilir.

114.5.2 SPSS’de En İyi Regresyon Analizi

• SPSS’de en iyi regresyon modeli uygulaması yoktur.

14.6 ROBUST (SAĞLAM) REGRESYON MODELİ UYDURMA

Sıralama puanları kullanılarak kategorik verilere regresyon modeli uygulamak için ROBUST regresyon yaklaşımı kullanılır.

RREGRESS komutundan sonra bağımlı değişken , açıklayıcı değişken sayısı ve açıklayıcı değişkenlerin sıralama puanlarının yer aldığı sütun numaraları yazılır.

14.6.2 SPSS’ de Robust Regresyon Analizi:

• SPSS’ de Robust regresyon analizi bulunmamaktadır.
14.7 SPSS’DE MODEL TAHMİNİ (CURVE ESTIMATION)

SPSS’de veri setinden sadece iki değişken alınarak değişkenler arasındaki en uygun matematiksel bağıntının tipini ve matematiksel yapısını tahmin etmek için Curve Estimation seçeneğinden yararlanılır. Bu seçenek MINITAB programında yoktur.
• Analyze > Regression > Curve Estimation seçeneği tıklanır.
• Görüntülenen ekranda bağımlı ve bağımsız değişken seçilir. Bağımlı ve bağımsız değişken arasındaki bağıntıların matematiksel yapısı belirlenir. Ekranda doğrusal, logaritmik, karesel, kübik, invers, sigmodial vb. modeller yer almaktadır. Bu modellerden birisi seçilir ve OK tıklanır. Eğer veri setinde yer alan değişkenler ikili olarak ele alınıp bağıntılar araştırılacak ise her defasında bağımlı bağımsız değişken seçimlerini değiştirerek uygulama yapılmalıdır.

BÖLÜM 15

LOGLİNEAR ANALİZ

15.1 GİRİŞ

Loglinear analiz R*C biçiminde düzenlenmiş kategorik değişkenler arasındaki birlikteliğin ve etkileşimin yapısal özelliklerini ortaya koymaya çalışan bir yöntemdir.

Loglinear analiz (logaritmik doğrusal analiz), isimsel, sıralı ya da gruplanarak kategorik hale dönüştürülen aralıklı ve oransal ölçekli verilerin iki yönlü, çok yönlü ve içiçe çapraz tablolarında birlikte değişimleri ve değişkenlerin alt kategorileri arasındaki etkileşimlerini analiz etmeye yarayan bir yöntemdir.

Loglinear analiz, kikarenin uygulanabildiği ve yetersiz kaldığı durumlarda çok yönlü tabloların analizini modeller aracılığı ile analiz eden bir yöntemdir.

Loglinear analizde çözümlemeler yapılırken verilerin durumuna göre üç temel çözümleme yönteminden yararlanılır.

Bu yöntemler;
• Genel loglinear analiz
• Lojit loglinear analiz
• Aşamalı loglinear analiz olarak adlandırılır.

Genel Loglinear Analiz: r*c tipinde tablolaştırılabilen, X ve Y kategorik değişkenlerin tablo gözlerinde yer alan frekansları analiz etmekte kullanılır. Bu yöntemde ,R*C biçiminde çaprazlanan X ve Y kategorik değişkenleri birer faktör olarak alınır. Tablo gözelerindeki frekanslar ise bağımlı değişken olarak alınır. Çapraz tablodaki göze frekansları üzerine X ve Y’nin ana etkileri ve X ve Y’nin etkileşimi değerlendirilir.

Lojit Loglinear Analiz: Kategorik değişkenlerden birinin bağımlı değişken ve diğer değişken/değişkenlerin bağımsız değişken olarak tanımlandığı tabloların analizinde yararlanılan bir yöntemdir. Bu modeli uygulanabileceği veri yapılarında bağımsız değişken mutlaka kategorik olma koşulu ile bağımsız değişken kategorik, sürekli olabilir. Bu yöntemde modele ortak değişkenlerde katılarak analiz gerçekleştirilebilir.

Aşamalı Loglinear Analiz: Değişkenlerin içiçe gruplanarak 3 ve daha fazla değişkenin çok yönlü çapraz tablolar biçiminde gösterildiği veri yapılarının analizinde kullanılan bir yöntemdir. Bu yöntem, değişkenlerin en yüksek dereceden etkileşimlerini modele almadan önce aşamalı olarak ana etkileri modele alarak benzerlik kikare değeri hesaplamayı sonra ikili etkileşimleri modele katarak benzerlik kikare değeri hesaplamayı ve bu işlemi benzerlik kikare değeri önemlilik değerini kaybedinceye kadar yüksek dereceden etkileşimleri modele katarak sürdürmeyi amaçlayan bir yöntemdir.

Aşamalı loglinear analiz, ana etkilerden başlayarak sıra ile test ederek, etkileşimleri ikili, üçlü ve çoklu etkileşimler olarak modele alıp optimal model oluşturmayı ve bu modele göre verilerin analizini yapmayı amaçlar.

15.2 İKİ YÖNLÜ TABLOLARDA LOGLİNEAR ANALİZ

Kategorik verilerin analizinde sıklıkla kullanılan kriterlerden biri olasılıklar oranıdır. Olasılıklar oranı, değişkenler arasındaki etkileşimi ifade eden ve etken varken bir fenomenin gözlenme olasılığının etken yok iken gözlenme olasılığına göre kaç kat daha fazla gözlendiğini ifade etmekte kullanılan bir istatistiktir.

15.2.2 SPSS’de İki Yönlü Tablolarda Loglinear Analiz

• Öncelikle SPSS’de veriler tablo verilerinin girişi gibi girilir.
• SPSS’de genel loglinear analiz uygulamak için Analyze > Loglinear > General seçeneği seçilir.
• Ekranda Factor(s) alanına faktör değişkenleri taşınır. Bu faktörlerin değişim aralıları her defasında Define Range seçeneği tıklanarak görüntülenen ekranda minimum ve maksimum değerleri girilerek belirlenir. Define Range seçeneğinin altında göz sayısı (Number of cells) r*c biçiminde belirlenir. Constrasts seçeneği tıklanır.
• Görüntülenen ekranda parametre tahminlerinin görüntülenmesini ve artık değerlerin hesaplanmasında uygulanacak yaklaşımın seçilmesi için Contrasts seçeneği tıklanır.
• Yeni görüntülenen akranda faktörlerin parametre tahminlerinin görüntülenmesi için Display parameter estimates seçeneği, gözlenen ve teorik değerlerden sapmaların dikkate alınması için deviation seçeneği seçilir. Eğer Contrast değiştirilmek istenirse Change seçeneği tıklanır ve seçenekler penceresi açılır. Bu pencereden istenilen contrast seçeneği seçilir.
• Reference Category satırı iki seçenek içermektedir. Eğer sırada yer alan değişken X’in ilk kategorisine göre hesaplanacak ise First seçeneği, ikinci kategorisi referans alınacak ise Last seçeneği seçilir. Eğer tahminlerin korelasyonlarının görüntülenmesi isteniyor ise Display correlation of estimates seçeneği işaretlenir. OK tıklanır

Eğer tam (saturated) model yerine kullanıcı tanımlı bir model belirlenecek ise Model seçeneği tıklanır.
• Görüntülenen ekranda Saturated model kurulu seçenektir. Eğer kullanıcı tanımlı bir model yazılacak ise Custom seçeneği işaretlenir ve model alanına verilerle ilgili model yazılır. Continue tıklanır.
• Çıktıda yer alacak bilgileri belirlemek için Statistics seçeneği tıklanır. Uygun seçimler yapıldıktan sonra Continue tıklanır. OK tıklanarak çıktılar elde edilir.

15.3 R*C TABLOLARINDA LOGLİNEAR ANALİZ

R*C (R>2, C>2) tabloları, iki yönlü tabloların genişletilmiş biçimidir. R*C tablolarında R ve C faktör , gözelerdeki frekanslar ise bağımlı değişken olarak kabul edildiğinden genel loglinear model aracılığı ile test edilir. Bu modelde 8 parametre hesaplanmaktadır. Bunlar R tane X için ana etki, C tane Y için ana etki ve (R-1)*(C-1) tane etkileşim teriminden oluşur. Analizler sonucunda hangi parametrenin önemli olduğu belirlenerek tabloda alt gözlerdeki etkileşimlerin önemliliği araştırılabilir.

15.3.1 SPSS’de R*C Tablolarında Loglinear Analiz

• Veriler veri sayfasına uygun biçimde girilir.
• Gözelerdeki frekanslar ağırlık değişkeni olarak tanımlanır. Analyze > Loglinear > General seçeneği tıklanır.

• Loglinear analiz uygulanacak verilerin tablo biçimine getirilmesi gerekmez. Anket sonucu elde edilen ve kod değerleri olarak girilen ham verilere de loglinear analiz uygulanabilir.

15.1 SPSS’de genel loglinear analiz penceresi

15.4 ÜÇ YÖNLÜ TABLOLARDA LOGLİNEAR ANALİZ

En basit üç yönlü tablo düzeni her üç değişkenin de ikili gözlenme durumunun bulunduğu 2*2*2 durumudur.

Üç yönlü tabloların loglinear analizi, iki farklı yaklaşıma göre yapılabilir.

a) 1, yaklaşım, tablonun gözlerindeki frekansları bağımlı değişken olarak almak; diğer değişkenleri ise faktör olarak almaktır. Bu yaklaşıma göre analiz Genel Loglinear analiz yöntemi ile yapılır.
b) 2, yaklaşım, ise ana etkilerden sonra etkileşimleri sırası ile ikili etkileşimden başlayarak ele alıp aşamalı bir model kurmak ve onu analiz etmektir. Sonra benzerlik kikare değerini incelemektir. Eğer benzerlik kikare değerinde önemlilik devam edşiyor ise üçlü etkileşimi modele alarak analize devam etmektir. Bu yaklaşım ise aşamalı loglinear analiz ile çözülür.

15.5 ÇOK YÖNLÜ TABLOLARIN LOGLİNEAR ANALİZİ

Çok yönlü tabloların loglinear analiz yöntemi ile analizi üç yönlü yönlü tablolardaki yaklaşımın genişletilmiş biçimidir. Çok yönlü tablolarda tablonun boyutu arttıkça yüksek dereceden etkileşimlerin modele alınıp alınmamasına karar vermek için aşamalı loglinear yöntemin uygulanması önerilmektedir.

Loglinear analiz özellikle çok doyutlu tablolarda ana etkileri ve etkileşimleri analizde yararlı bir yöntemdir. Kikare analizi yerine kullanılmasında büyük yararlar vardır.

Çok sayıda değişkeni bağımlı –bağımsız ayrımı yapmaksızın ya da bağımlı-bağımsız ayrımı yaparak bir anda analiz yapma yeteneği bakımından loglinear güçlü bir yöntemdir.

BÖLÜM 16

LOJİSTİK REGRESYON ANALİZİ

16.1 GİRİŞ
Lojistik regresyon; cevap değişkenin kategorik, ikili (binary, dichotomous), üçlü ve çoklu kategorilerde gözlendiği durumlarda açıklayıcı değişkenlerle neden sonuç ilişkisini belirlemede yararlanılan bir yöntemdir. Açıklayıcı değişkenlere göre cevap değişkenin beklenen değerleri olasılık olarak elde edildiği bir regresyon yöntemidir.
Basit ve çoklu regresyon analizleri bağımlı değişken ile açıklayıcı değişken ya da değişkenler arasındaki matematiksel bağıntıyı analiz etmekte kullanılmaktadır. Bu yöntemlerin uygulanabilceği veri setlerinde bağımlı değişkenin normal dağılım göstermesi, bağımsız değişkenlerin normal dağılım gösteren toplum ya da toplumlardan çekilmiş olması ve hata varyansının   N(0, 2) parametreli normal dağılım göstermesi gerekmektedir. Bu ve benzeri koşulların yerine getirilemediği veri setlerine basit ya da çoklu regresyon analizleri uygulanamaz.
Lojistik regresyon analizi, sınıflama ve atama işlemi yapmaya yardımcı olan bir regresyon yöntemidir. Normal dağılım varsayımı, süreklilik varsayımı ön koşulu yoktur.
Bağımlı değişken üzerinde açıklayıcı değişkenlerin etkileri olasılık olarak elde edilerek risk faktörlerinin olasılık olarak belirlenmesi sağlanır.
Ayırma (Discriminant) analizi, verilerin sınıflandırılması ve belirli olasılıklara göre belirli sınıflara atanmasını sağlayan bir yöntemdir. Veri setindeki değişkenlerin sınıflamaya etkilerini Ayırma analizi ile belirlemek mümkündür. Fakat ayırma analizi çok değişkenli normal dağılım varsayımını ön koşul kabul etmektedir.
Lojistik regresyon, oluşturulan lojistik modellere göre parametre tahminleri yapmayı amaçlar. Lojistik regresyonda modellere ortak değişkenleri de katmak mümkündür. Böylece ortak değişkenlere göre düzeltilmiş Y değerlerinin tahminleri yapılabilir.
Lojistik regresyon bağımlı değişkenin tahmini değerlerini olasılık olarak hesaplayarak, olasılık kurallarına uygun sınıflama yapma imkanı veren bir istatistiksel yöntemdir. Lojistik regresyon tablolaştırılmış yada ham veri setlerini analiz eden bir yöntemdir.
Veri yapılarına göre kurulan lojistik modeller aşağıdaki gibi belirlenir. İki değişkenli regresyon modeli;
P(Y)=
Çok değişkenli lojistik regresyon modeli;
P(Y)= P(Y)= olarak yazılır.
Burada Z, bağımsız değişkenlerin doğrusal kombinasyonudur.

Z= şeklinde yazılır.
ve ,…, regresyon katsayılarıdır.
Regresyon katsayılarının hesaplanması aşağıdaki gibi yapılır.

ln

Burada Q(Y), Q(Y)=1-P(Y) olarak hesaplanır.

Odds Ration’nun OR= olarak hesaplandığını hatırlayacak olursak her bir parametrenin Exp( ) değerleri OR değerleri olarak ele alınır. Böylece Exp( ), Y değişkeninin değişkeninin etkisi ile kaç kat daha fazla ya da yüzde kaç oranda fazla gözlenme olasılığına sahip olduğunu belirti. katsayısınının önemliliği zamanda

=Exp( )’nın da önemliliği olarak değerlendirilir.
Lojistik regresyon analizinde üç temel yöntem vardır;
a) İkili Lojistik regresyon Binary Logistic Regression)
b) Ordinal Lojistik Regresyon ( OLOGREG, Ordinal Lojistik Regresyon)
c) İsimsel Lojistik Regresyon (NLOGREG, Nominal Lojistik Regression)

İkili Lojistik Regresyon (BLOGREG) Analizi: İkili cevap içeren bağımlı değişkenlerle yapılan lojistik regresyon analizidir. Bir ya da daha fazla açıklayıcı değişken ile ikili cevap değişken arasındaki bağıntıyı ortaya koyar. Açıklayıcı değişkenler ya faktör değişkenlerdir ya da ortak değişkendir (covariate). Faktör değişkenler kategorik isimsel ölçeklidirler, ortak değişkenler ise sürekli değişken olmalıdır. MINITAB ve SPSS programları tanımlanmadıkça veri setindeki açıklayıcı değişkenleri ortak değişken olarak almaktadır.
BLOGREG analizinde model tanımlama işlemleri kullanıcının doğrudan tanımlaması yöntemine (ENTER) göre yapılabileceği gibi Aşamalı regresyon yaklaşımı ile de yapılabilir. Aşamalı model seçiminde koşullu olasılık yaklaşımına göre ileriye doğru seçim, geriye doğru eleminasyon yöntemleri uygulanabilir.

Sıralı Lojistik Regresyon (OLEGREG) Analizi: Cevap değişkenin sıralı ölçekli olduğu durumlarda uygulanan bir yöntemdir. Sıralı ölçekli cevap değişken, en az üç kategoride gözlenen değerler içermelidir. Sıralı ölçekli veriler kodlanırken ya da isimsel olarak kategorileri belirlendiğinde cevapların doğal sıralama yapısında olması gerekir.
OLEGREG analizinde parametere tahminleri yinelemeli- ağarlıklı en küçük kareler yöntemine (iterative-reweighted least square method) göre en büyük benzerlik (MR) parametre tahminleri yapar. OLOGREG’ de kategoriler birbirine paraleldir varsayımı kullanılır. OLOGREG’de en uygun lojit modeller belirlenirken kategori sayısının ikili kombinasyonları kadar ((c-1)/2) model tanımlanarak bu alt modellerin birbirine paralellikleri analiz edilir ya da en büyük değere sahip cevap referans alınarak bu referansa göre lojit modeller türetilerek analiz yapılır.
Modelde açıklayıcı değişken olarak yer alan faktörler kategorik ya da sürekli değişken olabilir. Eğer modele ortak değişken katılacak ise ortak değişkenin sürekli değişken olması gerekir.

İsimsel Lojistik Regresyon (NLOGREG) Analizi: Cevap değişkenin isimsel olduğu durumlarda uygulanan bir yöntemdir. İsimsel ölçekli cevap değişken en az üç kategoride gözlenen değerler içermelidir. Gözlenen değerlerin kodlanması halinde bu kategorilerin bir sıra izlenmesi şart değildir.
NLOGREG’de parametre tahminleri yinelemeli-ağırlıklı en küçük kareler yöntemine göre yapılır. Tahminler en büyük benzerlik tahminleridir. NLOGREG’de enuygun lojit modeller belirleme varsayımına göre parametre tahminleri yapılır. Lojit modeller belirlenirken kategori sayısının ikili kombinasyonları kadar ((c-1)/2) model tanımlanarak analiz edilir ya da kategorilerden biri referans alınarak bu referansa göre ikili lojit modeller türetilerek analiz yapılır.

16.2 İKİLİ LOJİSTİK REGRESYON ANALİZİ
Veri setinde bağımlı değişken ikili cevaplar içeriyor, faktörler kategorik yapıda ve ortak değişkenler sürekli değişken tipinde iseler veri analizinde BLOGREG analizi uygulanır.
BLOGREG yöntemi tablo biçiminde düzenlenmiş verilerin analizinde de uygulanan bir yöntemdir.

16.2.2 SPSS’de İkili Lojistik Regresyon Analizi
• SPSS’de BLOGREG analizi uygulamak için Analyze > Regression>Logistic seçenekleri tıklanır.
• Dependent alanına bağımlı değişken girilir. Diğer açıklayıcı değişkenler Covariates alanına taşınır. Bu değişkenlerden hangilerinin faktör, hangilerinin ortak değişken olduğunu belirlemek için Categorial seçeneği tıklanır. SPSS faktörleri kategorik olarak değişken olarak modele alır. Değişkenler içinde kategorik olan Categorial Variables alanına alınır. Değişkenin Contrast tipi belirlenir. Kurulu seçenek Deviation’dur.

Ekran 16.1 SPSS logit loglinear seçeneği işlem penceresi
• Çıktıda yer alması istenilen bilgilerin belirlenmesi için Options seçeneği tıklanır. Ekran 16.1’de uygun seçimler yapılır.
• SPSS lojistik regresyon analizinde hesaplanan ve daha sonraki analizlerde kullanılmak üzere veri sayfasına kaydedilmesi istenen istatistikleri belirlemek için Save seçeneği tıklanır. Görüntülenen ekranda dosyaya kaydedilmesi istenen değerler belirlenir. Yardımcı seçeneklerle ilgili tüm tanımlamalar yapıldıktan sonra OK tıklanır. Özetlenmiş ve düzenlenmiş sonuçlar çıktıda ekde edilir.

• Verileri lojit loglinear analizi ile analiz etmek istenirse SPSS’ de Analyze > Loglinear > Logit seçenekleri tıklanır. Dependent alanına bağımlı değişken, Factor alanına ilgili faktörler, Cell covariates alanına ise ilgili değişkenler atanır. Değişkenler içinden kategorik olanların değişim aralıkları belirlenir. OK tıklanır.
• Lojit loglinear analiz yönteminde ortak değişkenler varsa tam doymuş model uygulanamaz. Bu nedenle Model seçeneği tıklanır. Görüntülenen ekranda Custom seçeneği tıklanır ve analiz edilecek olan, faktör ve ortak değişkenlerin ana etkilerini (main effects) ele alan bir model yazılır. Continue tıklanır.
Loglinear analizde bir model tanımlaması yapılamaz. Bir neden sonuç ilişkisi belirleme ve tahminler yapma olanağı yoktur. Değişkenlerin bir neden sonuç ilişkisi içinde değerlendirilmesi ve tahminlere yönelik matematiksel modeller elde edilmesi amaçlanıyor ise lojistik regresyon analizi uygun yöntemdir. Loglinear analiz değişkenler arasındaki çoklu birlikte değişim ve etkileşimleri değerlendirerek sonuca ulaşmayı amaçlarken lojistik regresyon bir modelleme yapmayı kısmi etkileri ele alarak her bir değişkenin cevap değişkeni açıklamaktaki etkinliğini ortaya koymayı amaçlamaktadır.
Örneğin elimizdeki verilerin ikili lojistik regresyon analizini SPSS aracılığı ile yapmak istersek ilk olarak veriler tablo düzeni içinde veri sayfasına girilir. Gözelerde yer alan birey sayısı ağırlık değişkeni olarak tanımlanır. Statistics>Regression>Logistic seçenekleri tıklanır. Bu ekranda bağımlı değişken seçilir. Diğer değişkenler ortak değişken olarak alınır ve değişkenler kategorik değerler taşıdıkları için tümü Categorical seçeneği aracılığıyla kategorik faktör olarak tanımlanır. Uygun seçimler yapıldıktan sonra OK tıklanır.

Endüstri Mühendisliği (Industrial Engineering)

30 Mayıs 2012 Çarşamba

SPSS Menü Kullanımı

Hiç yorum yok:

Yorum Gönder