Frekans, kontenjans tabloları ve dağılım grafikleri
Frekans tablosu bir değişkenin frekans dağılımını incelememize yardımcı olur. Frekans tablosu table()
fonksiyonuyla görüntülenebilir.
table(mtcars$vs)
##
## 0 1
## 18 14
table(mtcars$mpg)
##
## 10.4 13.3 14.3 14.7 15 15.2 15.5 15.8 16.4 17.3 17.8 18.1 18.7 19.2 19.7 21
## 2 1 1 1 1 2 1 1 1 1 1 1 1 2 1 2
## 21.4 21.5 22.8 24.4 26 27.3 30.4 32.4 33.9
## 2 1 2 1 1 1 2 1 1
Kontenjans tablosu iki veya (yorumlaması kolay olmasa da) daha fazla değişkenin değerlerinin karşılıklı olarak incelenmesine yarayan tablolardır. R’da yine table()
fonksiyonuyla kontenjans tabloları oluşturabiliriz:
table(mtcars$vs,mtcars$carb)
##
## 1 2 3 4 6 8
## 0 0 5 3 8 1 1
## 1 7 5 0 2 0 0
Bu örnekte araçların motor tipine göre karbüratör sayıları tablolanmıştır. Tabloyu daha okunur yapmak için vs değişkenini faktör olarak yeniden tanımlayarak tablo oluşturabiliriz:
mtcars1 <- mtcars
mtcars1$vsFac <- factor(mtcars1$vs, levels = c(0,1), labels = c("V-type","Straight"))
table(mtcars1$vsFac,mtcars1$carb)
##
## 1 2 3 4 6 8
## V-type 0 5 3 8 1 1
## Straight 7 5 0 2 0 0
Görüldğü gibi V tipi motorların karbüratör sayısı normal motorlardan daha fazla.
Üç boyutlu bir kontenjans tablosu da üretebiliriz:
mtcars1$amFac <- factor(mtcars1$am, levels = c(0,1), labels = c("Automatic","Manual"))
table(mtcars1$vsFac,mtcars1$carb,mtcars1$amFac)
## , , = Automatic
##
##
## 1 2 3 4 6 8
## V-type 0 4 3 5 0 0
## Straight 3 2 0 2 0 0
##
## , , = Manual
##
##
## 1 2 3 4 6 8
## V-type 0 1 0 3 1 1
## Straight 4 3 0 0 0 0
Bu örnekte önce vites türünü otomatik ve manual olmak üzere faktör haline çevirdik. Ardından üç boyutlu bir kontenjans tablosu ürettik.
Şayet sonuçları bir çalışmada kullanacaksak table()
fonksiyonunun bu çıktısı çok uygun değil. Daha güzel bir tabloyu ftable()
fonksiyonuyla elde edebiliriz. ftable()
fonksiyonu table()
fonksiyonuyla aynı işi yapmakla beraber, daha düz bir çıktı vermektedir.
ftable(mtcars1$vsFac,mtcars1$carb,mtcars1$amFac)
## Automatic Manual
##
## V-type 1 0 0
## 2 4 1
## 3 3 0
## 4 5 3
## 6 0 1
## 8 0 1
## Straight 1 3 4
## 2 2 3
## 3 0 0
## 4 2 0
## 6 0 0
## 8 0 0
Böylelikle biraz daha derli toplu bir tablo elde etmiş olduk.
Şimdi değişkenleri grafik şeklinde sunalım. plot()
fonksiyonuyla çizilebilen dağılım grafiği bu iş için uygundur:
plot(mtcars1$mpg, main="Dağılım Grafiği",ylab="Yakıt Performansı")
Grafikte yakıt performansı değişkeninin dağılımını görebiliyoruz.
Dağılım grafiğinin daha kullanışlı olduğu yer, kontenjans tablolarında olduğu gibi iki değişkenin birbirleriyle ilişkisini incelenmesidir.
plot(mtcars$wt,mtcars$mpg,main="Dağılım Grafiği",xlab="Aracın ağırlığı", ylab="Yakıt Performansı",pch=20,col=c("red","blue"))
plot()
komutuyla grafiği çizdik. main
parametresiyle grafik başlığı xlab
ve ylab
parametreleriyle x
ve y
eksen etiketlerini isimlendirdik.
Dağılım grafiğine değişkenler arasındaki ilişkiyi daha net görmemizi sağlayacak regresyon hattı da ekleyebiliriz:
plot(mtcars$wt,mtcars$mpg,main="Dağılım Grafiği",xlab="Aracın ağırlığı", ylab="Yakıt Performansı",pch=20,col=c("red","blue"))
abline(lm(mtcars$mpg~mtcars$wt), col="green")
lines(lowess(mtcars$wt,mtcars$mpg), col="purple")
Bu grafikte önce yeşil ile doğrusal modeli, ikinci olarak mor ile lowess modelini görmekteyiz. Doğrusal regresyon modelini grafik üzerine abline()
fonksiyonu ile yerleştirdik. abline()
fonksiyonu parametre olarak intercept yani doğrunun y
eksenini kestiği noktanın değerini ve doğrunun eğimini almaktadır. lm(mpg~wt)
fonksiyonu da birisi intercept diğeri eğim olmak üzere iki değer döndürmektedir.
Buna karşın lines()
fonksiyonu parametre olarak doğrunun oluşacağı x
,y
koordinat değerlerini almaktadır. Nitekim lowess(wt,mpg)
fonksiyonu da bu değerleri üretmekte ve böylelikle grafik üzerine lowess modelini yerleştirmekteyiz.
Son olarak dağılım grafiğinde kullandığımız pch
parametresiyle grafikteki değişkenlerin dağılımını gösterecek işaretin türünü seçtik. pch
parametresinin alabileceği değerler ve karşılıkları olan semboller aşağıda yer almaktadır. Tabloda bu işaretler renkli olarak gösterilmiş olsa da grafiği çizerken col
parametresiyle renklendirilmemesi halinde renksiz görüneceklerdir.

Semboller