İstatistik Programları ile İlgili Dersler

İstatistik Nedir?

Geçmişi ve şimdiki durumu, çeşitli sayısal tekniklerle analiz ederek gelecek hakkında karar vermeyi sağlayan bir bilim dalıdır. İstatistiğin konusu tahmin, karşılartırma, bilgi toplama, özet değerler elde etme, analiz, toplumu genelleme, olaylar ve olgular arasında ilişki kurma, grafiklerle gösterme...dir.

Kavramlar

Öncelikle ilerde kullanacağımız bazı kavramları tanıyalım.
Birim ; Canlı, cansız olay olgu demektir.
Anakütle; Tüm birimleri kapsayan kümeye Anakütle denir.
Değisken; Ölçmeden ölçmeye, kişiden kişiye, birimden birime... her gözlemde farklı değerler alabilen özelliktir. İki çeşit değişken vardır.

  • Nitel (Kalitatif); şıkları tamsayılarla ifade edilebilen değişkenler
  • Nicel (Kantitatif); şıkları kesirli sayılarla ifade edilebilen değişkenler

Gözlem ; Ölçme, tartma, sayma yoluyla veri toplama yöntemine gözlem denir.
Örneklem ; Bir anakütleden onu temsil etmek üzere daha az sayıda birim kapsayan alt kümeye örneklem denir.
Parametre ; Bir değişkenin anakütlede ki durumunu tek bir değerle özetleyen sayısal bilgidir.
İstatistik ; İlgilendiğimiz değişkenin bir örneklemde ki durumunu ortaya koyan özet değerledir.
Ölçme ; Bir değişkenin şıkları üzerinde gözlem yaparak onlara belli kurallar içinde simgeler atama işlemine ölçme denir.Ölçme yapmak için bir ölçek gereklidir.
Ölçek ; Standart bir değerdir. Şıklar bu değerle karşılaştırılarak nitelikleri yada nicelikleri tanımlanır. Dört çeşit ölçek vardır.

  1. Sınıflandırma
  2. Sıralama
  3. Eşit aralıklı
  4. Oranlı

Sınıflandırma ; Bir değişkenin şıklarına sözcükler, rakamlar, şekiller... atayarak onların birbirinden ayrılmasını sağlayan ölçekdir.
Sıralama ; Birimleri şıkkın durumuna göre büyüklük sırasına koymamızı sağlayan ölçekdir.
Eşit Aralıklı Ölçek ; İstenilen bir başlangıç noktasından başlayarak eşit aralıklarla devam eden ölçekdir.
Oranlı Ölçek ; Başlangıç noktası sıfır olan eşit aralıklarla düzenlenmiş ölçekdir.
Seri ; Verilerin belli bir düzene göre sıralanmasına seri denir.

Ortalamalar

Duyarlı Ortalamalar

Bir Seride ki tüm gözlem değerleri kullanılarak elde ettiğimiz ortalamalardır.

  1. Aritmetik Ortalama
  2. Geometrik Ortalama
  3. Harmonik Ortalama
  4. Kareli Ortalama

Aritmetik Ortalama : Bir serideki verilerin toplanarak, bu toplamın veri sayısına bölünmesiyle elde edilen değerdir. Genel formülü aşağıdaki gibidir.

  • Bir serinin tüm terimlerine aynı sayıyı ekler veya çıkarırsak aritmetik ortalama da o sayı kadar artar veya azalır.
  • Bir serinin tüm terimlerini aynı sayı ile çarpar veya bölersek, aritmetik ortalama da aynı şekilde değişir.
  • Bir seride ki aşırı büyük veya küçük değerler aritmetik ortalamayı etkiler. Bu durumda aritmetik ortalama seriyi temsil etme niteliğini kaybedeceğinden farklı ortalamalar seriyi daha iyi temsil edecektir.
  • Açık uçlu serilerde aritmetik ortalama hesaplanamaz.

Harmonik Ortalama: Hız, maliyet, verimlilik, fiyat gibi unsurların yer değiştirebildiği durumlarda hesaplanır.

Kareli Ortalama: Seride negatif veriler bulunması halinde hesaplanabilen bir ortalamadır.

Aynı Seriden hesaplanan duyarlı ortalamaların büyüklük sıralaması şu şekildedir.

Duyarlı Olmayan Ortalamalar

Bir serideki gözlem değerlerinin bazılarını kullanarak hesapladığımız ortalamalardır.

  1. Mod
  2. Medyan
  3. Kartiller

Mod: Bir seride ki en fazla tekrar eden veri o serinin modudur. Mod moda sözcüğünün eşanlamlısıdır.Mod seride ki uç değerlerden etkilenmez.

Medyan: Büyüklük sırasına göre dizilmiş bir seride tam ortaya düşen veri o serinin medyanıdır. Medyan açık uçlu serilerde de hesaplanabilir.

Kantil: Bir seriyi eşit parçalara bölen istatistiklerdir.

  • Kartil : 4'e bölenler
  • Desil : 10'a bölenler
  • Santil : 100'e bölenler

Değişkenlik Ölçüleri

Ortalama hesabı bize sadece serideki verilerin yığıldığı nokta hakkında bir fikir verebilir.Verilerin birbirine ne kadar yakın ya da uzak olduğu konusunda bir fikir edinemeyiz. Veriler birbirine yakın olduğu takdirde seri homejendir. Aksi takdirde seri heterojendir.İstatistikçi için homojen serilerle çalışmak daha faydalıdır. Serinin homojen olup olmadığını anlamak için değişkenlik ölçüleri kullanılır.

I) Seri Genişliği: Serideki en büyük değerden en küçük değerin çıkarılmasıyla elde edilen değerdir."R" ile gösterilir. Bu değer ne kadar küçük çıkarsa seri o kadar homojendir diyebiliriz.

II) Ortalama Sapma: Serideki gözlem değerlerinin aritmek ortalamadan ya da medyandan farklarının mutlak değerleri toplamının birim sayısına bölünmesiyle elde edilen değerdir.

III) Varyans ve Standart Sapma: En çok kullandığımız değişkenlik ölçülerinden biridir. Terimlerin aritmetik ortalamadan sapmalarının karelerinin toplamının terim sayınına bölünmesiyle elde edilen değere varyans denir. Varyansın kareköküne ise stantard sapma diyoruz. Örneklem için kullanılan formülleri aşağıdaki gibidir.

Asimetri ve Basıklık Ölçüsü

Asimetiri bir serinin grafiğinin sağa yatık, sola yatık veya simetrik olmasının ölçülmesidir. Asimetri ölçümü ortalama veya momentlere göre hesaplanabilir. Pearson'nın asimetri formülü en çok kullanılan asimetri ölçümlerinden biridir.

  • As = 0 ise simetri tam
  • As > 0 ise sağa eğik
  • As < 0 ise sola eğik

Momentler: İki türlü moment hesaplamasından bahsedeceğiz. Sıfıra göre momentler ve aritmetik ortalamaya göre momentler. Formüllerdeki r momentin derecesini ifade etmektedir.

Sıfıra göre moment
Aritmetik ortalamaya göre moment

Bu iki moment hesaplaması arasında bir ilişki vardır. Sıfıra göre hesapladığımız momentlerden, aritmetik ortalamaya göre hesaplanan momentleri aşağıda gördüğünüz Konig Teoremi yardımıyla bulmamız mümkündür.

Momentlere göre asimetri ölçümü aşağıdaki formüle dayanarak yapılır. Yine yukarda As değerine karşılık grafik şeklinin değerlendirilmesinin yapıldığı gibi bir değerlendirme söz konusudur.

Basıklık seri graiğinin yüksekliği ile ilgili bir kavramdır. Basıklığın ölçülmesi ise aşağıdaki formüle göre yapılır.

Normallik

Bir serinin normalliği asimetri ve basıklık ölçülerinden anlaşılabilir. Normallik çok önemli bir kavramdır. İstatistikte bir çok analiz yapılırken normallik şartı aranacaktır. Normalliği test etmek için çeşitli analizler söz konusudur. Bunları zamanla göreceğiz. Bir serinin normal olduğunu söyleyebilmemiz için aşağıdaki özellikleri sağlaması gerekir.

  • Tek modlu olmalı
  • Simetrik grafiğe sahip olmalı
  • Normal yükseklikte grafiğe sahip olmalı

Rassal Değişken

Her gözlemde farklı değerler alabilen özelliklere değişken denir. Fakat gözlem öncesi bu değişkenin hangi özelliği alacağını bilemeyiz. İşte bu yüzden bu değişkene RASSAL DEĞİŞKEN diyoruz. Rassal değişken ikiye ayrılır. Sürekli ve kesikli rassal değişken.

Kesikli Rassal Değişken : X rassal değişkeninin alabileceği değerler net olarak ifade edilebilirler. Yani X=a gibi kesin değerler alabilir.Örneğin bir para atma deneyinde iki sonuç vardır. Zar atma deneyinde 6 sonuç vardır. Bu gibi olaylarda kesikli rassal değişken kullanılır. Kesikli rassal değişkenlerde Olasılık fonksiyonu P(x) ile ifade edilir. P(X) aşağıdaki özellikleri sağladığı takdirde olasılık fonksiyonu olarak adlandırılır.

yani negatif olasılık yoktur ve tüm olasılıklar toplamı 1' eşittir.

Sürekli Rassal Değişken: X rassal değişkeni X=a gibi kesin değerler almayıp , bir sürekliliğe sahip değerler alıyorsa X'e sürekli rassal değişken denir. Kilo, uzunluk.... sürekli rassal değişkenlerdir. Sürekli rassal değişken için olasılık fonksiyonu f(x) ile gösterilerek olasılık yoğunluk fonksiyonu adını alır.