Bir aralık serisinin frekansları nasıl bulunur? Verileri gruplama ve bir dağıtım serisi oluşturma

Dağıtım serileri şeklinde sunulurlar ve şeklinde sunulurlar.

Dağıtım serisi gruplama türlerinden biridir.

Dağıtım aralığı- incelenen popülasyon birimlerinin belirli bir değişken özelliğe göre gruplar halinde düzenli bir dağılımını temsil eder.

Dağılım serilerinin oluşumunun altında yatan özelliğe bağlı olarak bunlar ayırt edilir. niteliksel ve varyasyonel dağıtım satırları:

  • Nitelikli- niteliksel özelliklere göre oluşturulan dağılım serilerine denir.
  • Niceliksel bir özelliğin değerlerinin artan veya azalan sırasına göre oluşturulan dağılım serisine denir varyasyonel.
Dağıtım varyasyon serisi iki sütundan oluşur:

İlk sütun, değişen karakteristiklerin niceliksel değerlerini sağlar. seçenekler ve belirlenir. Ayrık seçenek - tamsayı olarak ifade edilir. Aralık seçeneği ile ila arasında değişir. Seçeneklerin türüne bağlı olarak ayrık veya aralıklı bir varyasyon serisi oluşturabilirsiniz.
İkinci sütun şunları içerir: belirli seçenek sayısı, frekanslar veya frekanslar cinsinden ifade edilir:

Frekanslar- bunlar, bir özelliğin belirli bir değerinin toplamda kaç kez oluştuğunu gösteren mutlak sayılardır; bunlar . Tüm frekansların toplamı, tüm popülasyondaki birim sayısına eşit olmalıdır.

Frekanslar() toplamın yüzdesi olarak ifade edilen frekanslardır. Yüzde olarak ifade edilen tüm frekansların toplamı, birin kesirleri halinde %100'e eşit olmalıdır.

Dağıtım serisinin grafik gösterimi

Dağıtım serileri grafik görseller kullanılarak görsel olarak sunulmaktadır.

Dağıtım serisi şu şekilde gösterilmektedir:
  • Çokgen
  • Histogramlar
  • Kümülatif
  • Ogivler

Çokgen

Bir çokgen oluştururken, değişen karakteristiklerin değerleri yatay eksende (x ekseni), frekanslar veya frekanslar ise dikey eksende (y ekseni) çizilir.

Şekil 2'deki çokgen. 6.1, 1994 yılında Rusya nüfusunun mikro sayımından elde edilen verilere dayanmaktadır.

6.1. Hane büyüklüğü dağılımı

Durum: İşletmelerden birinin 25 çalışanının tarife kategorilerine göre dağılımına ilişkin veriler sağlanmaktadır:
4; 2; 4; 6; 5; 6; 4; 1; 3; 1; 2; 5; 2; 6; 3; 1; 2; 3; 4; 5; 4; 6; 2; 3; 4
Görev: Ayrı bir varyasyon serisi oluşturun ve bunu grafiksel olarak bir dağıtım poligonu olarak gösterin.
Çözüm:
Bu örnekte seçenekler çalışanın maaş notudur. Frekansları belirlemek için ilgili tarife kategorisine göre çalışan sayısını hesaplamak gerekir.

Çokgen, ayrık varyasyon serileri için kullanılır.

Bir dağıtım poligonu oluşturmak için (Şekil 1), değişen karakteristiklerin (seçeneklerin) niceliksel değerlerini apsis (X) eksenine ve frekansları veya frekansları ordinat eksenine çizeriz.

Bir özelliğin değerleri aralık şeklinde ifade edilirse böyle bir seriye aralık denir.
Aralık serisi dağılımlar grafiksel olarak histogram, kümülat veya ojiv şeklinde gösterilir.

İstatistik tablosu

Durum: 20 kişinin bir bankadaki mevduat büyüklüğüne ilişkin veriler (bin ruble) 60; 25; 12; 10; 68; 35; 2; 17; 51; 9; 3; 130; 24; 85; 100; 152; 6; 18; 7; 42.
Görev: Eşit aralıklarla bir aralık varyasyon serisi oluşturun.
Çözüm:

  1. Başlangıç ​​popülasyonu 20 birimden oluşur (N = 20).
  2. Sturgess formülünü kullanarak gerekli sayıda kullanılan grubu belirleriz: n=1+3.322*lg20=5
  3. Eşit aralığın değerini hesaplayalım: i=(152 - 2) /5 = 30 bin ruble
  4. Başlangıç ​​popülasyonunu 30 bin ruble arayla 5 gruba ayıralım.
  5. Gruplandırma sonuçlarını tabloda sunuyoruz:

Sürekli bir özelliğin bu şekilde kaydedilmesinde, aynı değer iki kez oluştuğunda (bir aralığın üst sınırı ve diğer aralığın alt sınırı olarak), bu değer, bu değerin üst sınır görevi gördüğü gruba aittir.

grafik çubuğu

Bir histogram oluşturmak için aralıkların sınırlarının değerleri apsis ekseninde gösterilir ve bunlara dayanarak yüksekliği frekanslarla (veya frekanslarla) orantılı olan dikdörtgenler oluşturulur.

İncirde. 6.2. 1997 yılında Rus nüfusunun yaş gruplarına göre dağılımının histogramını göstermektedir.

Pirinç. 6.2. Rusya nüfusunun yaş gruplarına göre dağılımı

Durum: Şirketin 30 çalışanının aylık maaşlarına göre dağılımı verilmiştir.

Görev: Aralık değişim serisini grafiksel olarak histogram biçiminde görüntüleyin ve toplayın.
Çözüm:

  1. Açık (birinci) aralığın bilinmeyen sınırı, ikinci aralığın değerine göre belirlenir: 7000 - 5000 = 2000 ruble. Aynı değerle ilk aralığın alt sınırını buluyoruz: 5000 - 2000 = 3000 ruble.
  2. Dikdörtgen bir koordinat sisteminde bir histogram oluşturmak için, değerleri varis serisinin aralıklarına karşılık gelen bölümleri apsis ekseni boyunca çizeriz.
    Bu bölümler alt taban görevi görür ve karşılık gelen frekans (frekans), oluşturulan dikdörtgenlerin yüksekliği görevi görür.
  3. Bir histogram oluşturalım:

Kümülatif oluşturmak için, birikmiş frekansları (frekansları) hesaplamak gerekir. Bunlar, önceki aralıkların frekanslarının (frekanslarının) sırayla toplanmasıyla belirlenir ve S olarak adlandırılır. Birikmiş frekanslar, popülasyonun kaç biriminin, söz konusu olandan daha büyük olmayan bir karakteristik değere sahip olduğunu gösterir.

Kümülatif

Bir varyasyon serisindeki bir özelliğin birikmiş frekanslar (frekanslar) üzerindeki dağılımı, bir kümülat kullanılarak gösterilir.

Kümülatif veya bir poligondan farklı olarak kümülatif bir eğri, birikmiş frekanslardan veya frekanslardan oluşturulur. Bu durumda, özelliğin değerleri apsis eksenine, biriken frekanslar veya frekanslar ise ordinat eksenine yerleştirilir (Şekil 6.3).

Pirinç. 6.3. Hane büyüklüğü dağılımı kümülatifleri

4. Birikmiş frekansları hesaplayalım:
İlk aralığın kümülatif frekansı şu şekilde hesaplanır: 0 + 4 = 4, ikincisi için: 4 + 12 = 16; üçüncüsü için: 4 + 12 + 8 = 24, vb.

Bir kümülasyon oluştururken, karşılık gelen aralığın birikmiş frekansı (frekansı) üst sınırına atanır:

Ogiva

Ogiva kümülata benzer şekilde inşa edilmiştir; tek fark, biriken frekansların apsis eksenine yerleştirilmesi ve karakteristik değerlerin ordinat eksenine yerleştirilmesidir.

Kümülatın bir türü konsantrasyon eğrisi veya Lorentz grafiğidir. Bir konsantrasyon eğrisi oluşturmak için, dikdörtgen koordinat sisteminin her iki eksenine 0'dan 100'e kadar yüzdelerde bir ölçek ölçeği çizilir, aynı zamanda apsis ekseninde biriken frekanslar ve payın birikmiş değerleri gösterilir. Karakteristiğin hacmine göre (yüzde olarak) ordinat ekseninde gösterilir.

Karakteristiğin düzgün dağılımı, grafikteki karenin köşegenine karşılık gelir (Şekil 6.4). Düzensiz bir dağılıma sahip olan grafik, özelliğin konsantrasyon düzeyine bağlı olarak içbükey bir eğriyi temsil eder.

6.4. Konsantrasyon eğrisi

İstatistiksel materyali özetlemenin en basit yolu seriler oluşturmaktır. İstatistiksel çalışma özetinin çıktısı dağıtım serisi olabilir. İstatistiklerdeki bir dağılım serisi, nüfus birimlerinin herhangi bir özelliğe göre (niteliksel veya niceliksel) gruplara düzenli bir şekilde dağıtılmasıdır. Bir seri niteliksel olarak oluşturulmuşsa buna atıfsal, niceliksel olarak oluşturulmuşsa varyasyonel denir.

Bir varyasyon serisi iki unsurla karakterize edilir: varyant (X) ve frekans (f). Bir varyant, bir popülasyonun bireysel bir biriminin veya grubunun bir özelliğinin ayrı bir değeridir. Bir özelliğin belirli bir değerinin kaç kez oluştuğunu gösteren sayıya frekans denir. Frekans göreceli bir sayı olarak ifade edilirse buna frekans denir. Bir varyasyon serisi, “başlangıç” ve “için” sınırları tanımlandığında aralıklı olabilir veya incelenen karakteristik belirli bir sayı ile karakterize edildiğinde ayrık olabilir.

Örnekleri kullanarak varyasyon serilerinin yapısına bakalım.

Örnek. ve tesisin atölyelerinden birinde 60 işçinin tarife kategorilerine ilişkin veriler var.

Çalışanları tarife kategorisine göre dağıtın, bir varyasyon serisi oluşturun.

Bunu yapmak için, özelliğin tüm değerlerini artan sırayla yazıyoruz ve her gruptaki işçi sayısını sayıyoruz.

Tablo 1.4

Çalışanların kategoriye göre dağılımı

İşçi Sıralaması (X)

Çalışan sayısı

kişi (f)

toplamın %'si olarak (özellikle)

İncelenen özelliğin (işçinin rütbesi) belirli bir sayı ile temsil edildiği değişken ayrık bir seri aldık. Açıklık sağlamak için varyasyon serileri grafiksel olarak gösterilmiştir. Bu dağıtım serisine dayanarak bir dağıtım yüzeyi oluşturuldu.

Pirinç. 1.1. İşçilerin tarife kategorisine göre dağılımı için poligon

Aşağıdaki örneği kullanarak eşit aralıklara sahip bir aralık serisinin oluşturulmasını ele alacağız.

Örnek. 50 şirketin sabit sermayesinin milyon ruble cinsinden değeri hakkında veriler biliniyor. Firmaların sabit sermaye maliyetine göre dağılımının gösterilmesi gerekmektedir.

Firmaların sabit sermaye maliyetine göre dağılımını göstermek için öncelikle vurgulamak istediğimiz grup sayısı sorununu çözüyoruz. Diyelim ki 5 işletme grubunu belirlemeye karar verdik. Daha sonra gruptaki aralığın boyutunu belirliyoruz. Bunu yapmak için formülü kullanıyoruz

Örneğimize göre.

Aralığın değerini özelliğin minimum değerine ekleyerek sabit sermaye maliyetine göre firma grupları elde ederiz.

Çift değeri olan bir birim, üst sınır olarak görev yaptığı gruba aittir (yani, 17 özelliğinin değeri birinci gruba, 24 ikinci gruba vb. gidecektir).

Her gruptaki fabrika sayısını sayalım.

Tablo 1.5

Firmaların sabit sermaye değerine göre dağılımı (milyon ruble)

Sabit sermaye maliyeti
milyon ruble olarak (X)

Firma sayısı
(frekans) (f)

Birikmiş frekanslar
(Kümülatif)

Bu dağılıma göre, 36 firmanın 10 ila 24 milyon ruble arasında sabit sermayeye sahip olduğu anlaşılan değişken bir aralık serisi elde edildi. vesaire.

Aralık dağılım serileri grafiksel olarak histogram şeklinde gösterilebilir.

Veri işlemenin sonuçları belgelenmiştir. istatistiksel tablolar. İstatistik tabloları kendi konu ve yüklemlerini içerir.

Özne, karakterize edilen bütünlüğün veya bütünlüğün bir parçasıdır.

Yüklemler konuyu karakterize eden göstergelerdir.

Tablolar ayırt edilir: yüklemin basit ve karmaşık gelişimi ile basit ve grup, kombinasyonel.

Konudaki basit bir tablo, bireysel birimlerin bir listesini içerir.

Konu bir birim gruplaması içeriyorsa, böyle bir tabloya grup tablosu denir. Örneğin, çalışan sayısına göre bir işletme grubu, cinsiyete göre nüfus grupları.

Kombinasyon tablosunun konusu iki veya daha fazla özelliğe göre gruplamayı içermektedir. Örneğin, nüfus cinsiyete göre eğitime, yaşa vb. göre gruplara ayrılır.

Kombinasyon tabloları, bir dizi göstergenin ilişkisini ve bunların hem mekan hem de zamandaki değişim modelini tanımlamaya ve karakterize etmeye olanak tanıyan bilgileri içerir. Konuyu geliştirirken tabloyu netleştirmek için kendinizi iki veya üç özellik ile sınırlandırın ve her biri için sınırlı sayıda grup oluşturun.

Tablolardaki yüklem farklı şekillerde geliştirilebilir. Yüklemin basit bir gelişimi ile tüm göstergeleri birbirinden bağımsız olarak konumlandırılmıştır.

Yüklemin karmaşık gelişimi ile göstergeler birbiriyle birleştirilir.

Herhangi bir tablo oluşturulurken çalışmanın amaçlarından ve işlenen materyalin içeriğinden yola çıkılmalıdır.

İstatistiklerde tabloların yanı sıra grafik ve diyagramlar da kullanılır. Diyagram – istatistiksel veriler geometrik şekiller kullanılarak gösterilir. Grafikler doğrusal ve çubuk grafiklere bölünmüştür, ancak figürlü grafikler (çizimler ve semboller), pasta grafikleri (bir daire tüm nüfusun büyüklüğü olarak alınır ve bireysel sektörlerin alanları nüfusun özgül ağırlığını veya oranını gösterir) olabilir. bileşenler), radyal grafikler (kutupsal koordinatlara dayalı olarak oluşturulmuştur). Kartogram, bir taslak haritanın veya site planının bir diyagramla birleşimidir.

İncelenen rastgele değişken sürekli ise, gözlemlenen değerlerin sıralanması ve gruplandırılması çoğu zaman değerlerindeki varyasyonun karakteristik özelliklerinin tanımlanmasına izin vermez. Bu, bir rastgele değişkenin bireysel değerlerinin birbirinden istenildiği kadar az farklı olabileceği ve bu nedenle, gözlemlenen verilerin toplamında, bir miktarın aynı değerlerinin nadiren oluşabileceği ve frekansların sıklıkları ile açıklanabilir. varyantlar birbirinden çok az farklılık gösterir.

Olası değerlerin sayısı büyük olan ayrı bir rastgele değişken için ayrı bir seri oluşturmak da pratik değildir. Bu gibi durumlarda, inşa etmelisiniz aralık varyasyon serisi dağıtımlar.

Böyle bir seri oluşturmak için, bir rastgele değişkenin gözlemlenen değerlerinin tüm değişim aralığı bir seriye bölünür kısmi aralıklar ve her kısmi aralıkta değer değerlerinin ortaya çıkma sıklığının sayılması.

Aralıklı varyasyon serisi rastgele bir değişkenin değişen değerlerinin, karşılık gelen frekansları veya her birine düşen değişkenin değerlerinin göreceli frekansları ile sıralı bir aralık kümesini çağırın.

Bir aralık serisi oluşturmak için ihtiyacınız olan:

  1. tanımlamak boyut kısmi aralıklar;
  2. tanımlamak Genişlik aralıklar;
  3. her aralık için ayarlayın tepe Ve alt sınır ;
  4. Gözlem sonuçlarını gruplandırın.

1 . Gruplandırma aralıklarının sayısını ve genişliğini seçme sorununa, her özel durumda aşağıdakilere dayalı olarak karar verilmelidir. hedefler araştırma, hacim örnekler ve varyasyon derecesi numunedeki karakteristik.

Yaklaşık aralık sayısı k yalnızca örneklem büyüklüğüne göre tahmin edilebilir N aşağıdaki yollardan biriyle:

  • formüle göre Sturges : k = 1 + 3,32 log n ;
  • Tablo 1'i kullanarak.

tablo 1

2 . Genellikle eşit genişlikte alanlar tercih edilir. Aralıkların genişliğini belirlemek için H hesaplamak:

  • varyasyon aralığı R - örnek değerler: R = x maks - x min ,

Nerede maksimum Ve xmin - maksimum ve minimum örnekleme seçenekleri;

  • her aralığın genişliği H aşağıdaki formülle belirlenir: sa = R/k .

3 . Sonuç olarak ilk aralık x h1 minimum örnek seçeneği olacak şekilde seçilir xmin yaklaşık olarak bu aralığın ortasına düştü: x sa1 = x dak - 0,5 sa .

Ara aralıklar kısmi aralığın uzunluğunun önceki aralığın sonuna eklenmesiyle elde edilir H :

x hi = x hi-1 +h.

Aralık sınırlarının hesaplanmasına dayalı bir aralık ölçeğinin oluşturulması, değere kadar devam eder. merhaba ilişkiyi karşılar:

merhaba< x max + 0,5·h .

4 . Aralık ölçeğine uygun olarak karakteristik değerler gruplandırılır - her kısmi aralık için frekansların toplamı hesaplanır n ben seçeneği dahil Ben aralık. Bu durumda aralık, rastgele değişkenin, aralığın alt sınırından büyük veya ona eşit, üst sınırından küçük değerlerini içerir.

Çokgen ve histogram

Açıklık sağlamak için çeşitli istatistiksel dağılım grafikleri oluşturulmuştur.

Ayrı bir varyasyon serisinin verilerine dayanarak, çokgen frekanslar veya göreceli frekanslar.

Frekans poligonu x 1 ; n 1 ), (x 2 ; n 2 ), ..., (x k ; nk ). Bir frekans poligonu oluşturmak için seçenekler apsis eksenine çizilir. x ben ve koordinatta - karşılık gelen frekanslar n ben . Puanlar ( x ben ; n ben ) düz parçalarla bağlanır ve bir frekans poligonu elde edilir (Şekil 1).

Göreceli frekansların çokgeni bölümleri noktaları birleştiren kesikli çizgiye denir ( x 1 ; W 1 ), (x 2 ; W 2 ), ..., (x k ; hafta ). Göreceli frekanslardan oluşan bir çokgen oluşturmak için seçenekler apsis ekseninde çizilir x ben ve koordinatta - karşılık gelen göreceli frekanslar ben . Puanlar ( x ben ; ben ) düz bölümlerle bağlanır ve bağıl frekansların bir çokgeni elde edilir.

Ne zaman sürekli işaret inşa edilmesi tavsiye edilir histogram .

Frekans histogramı tabanları kısmi uzunluk aralıkları olan dikdörtgenlerden oluşan basamaklı şekil olarak adlandırılır H ve yükseklikler orana eşittir NIH (frekans yoğunluğu).

Bir frekans histogramı oluşturmak için apsis ekseni üzerine kısmi aralıklar yerleştirilir ve apsis eksenine paralel bölümler bunların üzerine belli bir mesafede çizilir. NIH .

Toplanan istatistiksel verilerin gruplandırılmasının sonuçları genellikle dağılım serileri şeklinde sunulur. Bir dağılım serisi, üzerinde çalışılan özelliğe göre popülasyon birimlerinin gruplara düzenli bir şekilde dağıtılmasıdır.

Dağılım serileri, gruplandırmanın temelini oluşturan özelliğe bağlı olarak, niteleyici ve değişken olarak ikiye ayrılır. Nitelik niteliksel ise, o zaman dağılım serisine niteliksel denir. Nitelik serisine bir örnek, işletmelerin ve kuruluşların mülkiyet türüne göre dağılımıdır (bkz. Tablo 3.1).

Dağılım serisinin oluşturulduğu karakteristik niceliksel ise bu seriye varyasyonel seri denir.

Bir dağılımın varyasyon serisi her zaman iki bölümden oluşur: bir değişken ve karşılık gelen frekanslar (veya frekanslar). Değişken, bir özelliğin popülasyon birimlerinde alabileceği değerdir; frekans ise, özelliğin belirli bir değerine sahip olan gözlem birimlerinin sayısıdır. Frekansların toplamı her zaman popülasyonun hacmine eşittir. Bazen frekanslar yerine frekanslar hesaplanır; bunlar ya bir birimin kesirleri (bu durumda tüm frekansların toplamı 1'e eşit olur) veya nüfus hacminin yüzdesi (frekansların toplamı) olarak ifade edilen frekanslardır. %100'e eşit olacaktır.

Varyasyon serileri ayrık ve aralıklıdır. Ayrık seriler için (Tablo 3.7), seçenekler belirli sayılarla, çoğunlukla da tam sayılarla ifade edilir.

Tablo 3.8.
Sigorta şirketinde çalışanların çalışma sürelerine göre dağılımı Şirkette çalışılan süre, tam yıl (seçenekler)
Çalışan Sayısı Adam (frekanslar)
Toplamın yüzdesi olarak (frekans) 15 11,6
1 17 13,2
2 19 14,7
3 26 20,2
4 10 7,8
5 18 13,9
6 24 18,6
bir yıla kadar 129 100,0

Toplam

Aralık serilerinde (bkz. Tablo 3.2), gösterge değerleri aralıklar şeklinde belirtilir. Aralıkların iki sınırı vardır: alt ve üst. Aralıklar açık veya kapalı olabilir. Açık olanların kenarlıklarından biri yoktur, bu nedenle Tabloda. 3.2 İlk aralığın alt sınırı yoktur ve sonuncunun üst sınırı yoktur. Bir aralık serisi oluştururken, nitelik değerlerinin yayılmasının niteliğine bağlı olarak, hem eşit hem de eşit olmayan aralıklar kullanılır (Tablo 3.2, eşit aralıklara sahip bir varyasyon serisini göstermektedir).

Bir karakteristik, genellikle 10'dan fazla olmayan sınırlı sayıda değer alıyorsa, ayrık dağılım serileri oluşturulur. Seçenek daha büyükse ayrık seriler netliğini kaybeder; bu durumda varyasyon serisinin aralık formunun kullanılması tavsiye edilir. Bir özelliğin sürekli değişmesiyle, belirli sınırlar içindeki değerleri birbirinden keyfi olarak küçük bir miktarda farklı olduğunda, bir aralık dağılım serisi de oluşturulur.

3.3.1. Ayrık varyasyon serilerinin oluşturulması

Bir örnek kullanarak ayrık varyasyon serileri oluşturma metodolojisini ele alalım.

Örnek 3.2. 60 ailenin niceliksel bileşimine ilişkin aşağıdaki veriler mevcuttur:

Daha sonra aynı bileşime sahip ailelerin sayısını saymanız gerekir. Aile üyelerinin sayısı (değişen bir özelliğin değeri) değişkenlerdir (bunları x ile göstereceğiz), aynı bileşime sahip ailelerin sayısı ise frekanslardır (bunları f ile göstereceğiz). Gruplandırma sonuçlarını aşağıdaki ayrık varyasyonel dağılım serisi biçiminde sunuyoruz:

Tablo 3.11.
Aile üyesi sayısı (x) Aile sayısı (y)
1 8
2 14
3 20
4 9
5 5
6 4
bir yıla kadar 60

3.3.2. Aralık varyasyon serisinin oluşturulması

Aşağıdaki örneği kullanarak aralık varyasyon dağılım serilerini oluşturmaya yönelik metodolojiyi gösterelim.

Örnek 3.3. İstatistiksel gözlem sonucunda 50 ticari bankanın ortalama faiz oranına (%) ilişkin aşağıdaki veriler elde edildi:

Tablo 3.12.
14,7 19,0 24,5 20,8 12,3 24,6 17,0 14,2 19,7 18,8
18,1 20,5 21,0 20,7 20,4 14,7 25,1 22,7 19,0 19,6
19,0 18,9 17,4 20,0 13,8 25,6 13,0 19,0 18,7 21,1
13,3 20,7 15,2 19,9 21,9 16,0 16,9 15,3 21,4 20,4
12,8 20,8 14,3 18,0 15,1 23,8 18,5 14,4 14,4 21,0

Gördüğümüz gibi, bu tür bir veri dizisini görüntülemek son derece elverişsizdir; ayrıca göstergede hiçbir değişiklik modeli görülmez. Bir aralık dağılım serisi oluşturalım.

  1. Aralık sayısını belirleyelim.

    Uygulamadaki aralıkların sayısı genellikle her bir gözlemin hedeflerine göre araştırmacının kendisi tarafından belirlenir. Aynı zamanda Sturgess formülü kullanılarak matematiksel olarak da hesaplanabilmektedir.

    n = 1 + 3,322lgN,

    burada n, aralıkların sayısıdır;

    N, popülasyonun hacmidir (gözlem birimlerinin sayısı).

    Örneğimiz için şunu elde ederiz: n = 1 + 3,322lgN = 1 + 3,322lg50 = 6,6 "7.

  2. Formülü kullanarak aralıkların boyutunu (i) belirleyelim.

    burada x max, özelliğin maksimum değeridir;

    x min - özelliğin minimum değeri.

    Örneğimiz için

    Bir varyasyon serisinin aralıkları, sınırları "yuvarlak" değerlere sahipse açıktır; bu nedenle aralığın değerini 1,9'dan 2'ye ve karakteristik özelliğin minimum değerini 12,3'ten 12,0'a yuvarlayalım.

  3. Aralıkların sınırlarını belirleyelim.

    Aralıklar, kural olarak, bir aralığın üst sınırı aynı zamanda bir sonraki aralığın alt sınırı olacak şekilde yazılır. Örneğimiz için şunu elde ediyoruz: 12.0-14.0; 14.0-16.0; 16.0-18.0; 18.0-20.0; 20.0-22.0; 22.0-24.0; 24.0-26.0.

    Böyle bir giriş, niteliğin sürekli olduğu anlamına gelir. Bir özelliğin varyantları, örneğin yalnızca tamsayılar gibi kesin olarak tanımlanmış değerler alıyorsa, ancak sayıları ayrı bir seri oluşturmak için çok büyükse, aralığın alt sınırının üst sınırla çakışmayacağı bir aralık serisi oluşturabilirsiniz. bir sonraki aralığın sınırı (bu, karakteristiğin ayrık olduğu anlamına gelir). Örneğin kurumsal çalışanların yaşa göre dağılımında şu yıl aralık gruplarını oluşturabilirsiniz: 18-25, 26-33, 34-41, 42-49, 50-57, 58-65, 66 ve üzeri.

    Ek olarak örneğimizde ilk ve son aralıkları açık hale getirebiliriz vb. yazma: 14,0'a kadar; 24.0 ve üzeri.

  4. İlk verilere dayanarak sıralanmış bir seri oluşturacağız. Bunun için işaretin aldığı değerleri artan sırayla yazıyoruz. Sonuçları tabloda sunuyoruz: Tablo 3.13.
    Ticari bankaların sıralanmış faiz oranları serisi
    12,3 17,0 19,9 23,8
    12,8 17,4 20,0 24,5
    13,0 18,0 20,0 24,6
    13,3 18,1 20,4 25,1
    13,8 18,5 20,4 25,6
    14,2 18,7 20,5
    14,3 18,8 20,7
    14,4 18,9 20,7
    14,7 19,0 20,8
    14,7 19,0 21,0
    15,1 19,0 21,0
    15,2 19,0 21,1
    15,3 19,0 21,4
    16,0 19,6 21,9
    16,9 19,7 22,7
  5. Banka oranı % (seçenekler)

    Frekansları sayalım.

Frekansları sayarken, bir özelliğin değerinin belirli bir aralığın sınırına düştüğü bir durum ortaya çıkabilir. Bu durumda, kurala göre yönlendirilebilirsiniz: belirli bir birim, değerinin üst sınır olduğu aralığa atanır. Yani örneğimizdeki 16,0 değeri ikinci aralığı ifade edecektir.

Örneğimizde elde edilen gruplama sonuçları bir tabloda sunulacaktır.
Tablo 3.14. Ticari bankaların kredi faiz oranlarına göre dağılımı Kısa oran, %
12,0-14,0 5 5
14,0-16,0 9 14
16,0-18,0 4 18
18,0-20,0 15 33
20,0-22,0 11 44
22,0-24,0 2 46
24,0-26,0 4 50
bir yıla kadar 50 -

Banka sayısı, birim (frekanslar)

Birikmiş frekanslar

Çoğu durumda, istatistiksel bir popülasyon büyük veya daha da önemlisi sonsuz sayıda varyant içerdiğinde, ki bu çoğunlukla sürekli varyasyonla ortaya çıkar, her varyant için bir birim grubu oluşturmak pratik olarak imkansız ve pratik değildir. Bu gibi durumlarda istatistiksel birimlerin gruplar halinde birleştirilmesi yalnızca bir aralık temelinde mümkündür; değişen bir özelliğin değerleri için belirli sınırları olan bir grup. Bu limitler her grubun üst ve alt limitlerini gösteren iki rakamla gösterilmektedir. Aralıkların kullanılması bir aralık dağılım serisinin oluşmasına yol açar.

Aralık aralığı varyantları aralıklar şeklinde sunulan bir varyasyon serisidir.

Eşit ve eşit olmayan aralıklarla bir aralık serisi oluşturulabilirken, bu seriyi oluşturma ilkesinin seçimi esas olarak istatistiksel popülasyonun temsil edilebilirlik derecesine ve uygunluğuna bağlıdır. Popülasyon birim sayısı bakımından yeterince büyükse (temsili) ve bileşimi tamamen homojense, o zaman aralık serisinin oluşumunu aralıkların eşitliğine dayandırmak tavsiye edilir. Genellikle bu prensibi kullanarak, varyasyon aralığının nispeten küçük olduğu popülasyonlar için bir aralık serisi oluşturulur; maksimum ve minimum seçenekler genellikle birbirinden birkaç kez farklılık gösterir. Bu durumda, eşit aralıkların değeri, bir özelliğin değişim aralığının belirli sayıda oluşturulmuş aralığa oranıyla hesaplanır. Eşitliği belirlemek için Ve aralıkta Sturgess formülü kullanılabilir (genellikle aralık özelliklerinde küçük bir değişiklik ve istatistiksel popülasyonda çok sayıda birim ile):

nerede x ben - eşit aralık değeri; X max, X min - istatistiksel bir toplamdaki maksimum ve minimum seçenekler; N . - toplamdaki birim sayısı.

Örnek. İlk (minimum) seçeneğin I km / km 2, son ( maksimum) - 65 ki/km 2. Formül 5.1'i kullanma. şunu elde ederiz:

Sonuç olarak, Krasnopolsky bölgesindeki 137 yerleşim yeri sezyum kirliliğinin yoğunluğu açısından eşit aralıklarla bir aralık serisi oluşturmak için eşit aralığın boyutu 8 ki/km 2 olabilir.

Eşit olmayan dağıtım koşulları altında, yani. Maksimum ve minimum seçenekler yüzlerce kez olduğunda, bir aralık serisi oluştururken prensibi uygulayabilirsiniz. eşit olmayan aralıklar. Karakteristiğin daha büyük değerlerine doğru ilerledikçe eşit olmayan aralıklar genellikle artar.

Aralıkların şekli kapalı veya açık olabilir. Kapalı Hem alt hem de üst sınırları olan aralıkları çağırmak gelenekseldir. Açık aralıkların yalnızca bir sınırı vardır: ilk aralıkta bir üst sınır vardır, sonuncuda ise bir alt sınır vardır.

Özellikle eşit olmayan aralıklarla aralık serilerinin değerlendirilmesi tavsiye edilir. dağıtım yoğunluğu, Yerel frekansın (veya frekansın) aralığın boyutuna oranının hangisi olduğunu hesaplamanın en basit yolu.

Pratik olarak bir aralık serisi oluşturmak için tablo düzenini kullanabilirsiniz. 5.3.

Tablo 5.3. Sezyum –137 ile radyoaktif kirlenmenin yoğunluğuna göre Krasnopolsky bölgesinde bir dizi yerleşim yeri oluşturma prosedürü

Aralık serilerinin temel avantajı maksimumdur. kompaktlık. aynı zamanda aralık dağılım serisinde, özelliğin bireysel değişkenleri karşılık gelen aralıklarda gizlenir

Dikdörtgen koordinat sisteminde bir aralık serisini grafiksel olarak gösterirken, aralıkların üst sınırları apsis ekseninde, serinin yerel frekansları ise ordinat ekseninde çizilir. Bir aralık serisinin grafiksel yapısı, her aralığın alt ve üst sınırlarına sahip olması ve iki apsisin bir ordinat değerine karşılık gelmesi bakımından bir dağıtım poligonunun yapısından farklıdır. Bu nedenle, bir aralık serisinin grafiğinde, çokgende olduğu gibi bir nokta değil, iki noktayı birleştiren bir çizgi işaretlenir. Bu yatay çizgiler birbirine dikey çizgilerle bağlanarak halk arasında basamaklı çokgen adı verilen basamaklı çokgen şekli elde edilir. histogram dağıtım (Şekil 5.3).

Yeterince büyük bir istatistiksel popülasyon için bir aralık serisini grafiksel olarak oluştururken, histogram şuna yaklaşır: simetrik dağıtım şekli. İstatistiksel popülasyonun küçük olduğu durumlarda, kural olarak, asimetrik grafik çubuğu.

Bazı durumlarda, bir dizi birikmiş frekansın oluşturulması tavsiye edilir; Kümülatif sıra. Kümülatif bir seri, kesikli veya aralıklı bir dağılım serisi temelinde oluşturulabilir. Dikdörtgen koordinat sisteminde kümülatif bir seriyi grafiksel olarak gösterirken, değişkenler apsis ekseninde, birikmiş frekanslar (frekanslar) ordinat ekseninde çizilir. Ortaya çıkan eğri çizgiye genellikle denir Kümülatif dağıtım (Şekil 5.4).

Çeşitli varyasyon serilerinin oluşumu ve grafiksel gösterimi, konu 6'da ayrıntılı olarak tartışılan ana istatistiksel özelliklerin basitleştirilmiş bir şekilde hesaplanmasına katkıda bulunur ve istatistiksel popülasyonun dağılım yasalarının özünün daha iyi anlaşılmasına yardımcı olur. Bir varyasyon serisinin analizi, seçenekler ve frekanslar (frekanslar) arasındaki ilişkinin tanımlanması ve izlenmesinin gerekli olduğu durumlarda özellikle önem kazanır. Bu bağımlılık, seçenek başına vaka sayısının belirli bir şekilde bu seçeneğin büyüklüğüyle ilişkili olmasıyla ortaya çıkar; değişen karakteristik değerlerinin artmasıyla birlikte, bu değerlerin frekansları (frekansları) belirli, sistematik değişiklikler yaşar. Bu, frekans (frekans) sütunundaki sayıların düzensiz bir şekilde dalgalanmadığı, belirli bir yönde, belirli bir düzen ve sırayla değiştiği anlamına gelir.

Eğer frekanslar değişimlerinde belli bir sistematiklik gösteriyorsa bu bir kalıp belirleme yolunda olduğumuz anlamına gelir. Frekanslardaki değişimlerin sistemi, düzeni, sırası, genel nedenlerin, tüm popülasyonun karakteristik genel koşullarının bir yansımasıdır.

Dağıtım modelinin her zaman hazır biçimde verildiği varsayılmamalıdır. Frekansların çılgınca sıçradığı, bazen arttığı, bazen azaldığı oldukça fazla varyasyon serisi var. Bu gibi durumlarda, araştırmacının ne tür bir dağılımla uğraştığını bulmak tavsiye edilir: ya bu dağılımın kendine özgü bir modeli yoktur ya da doğası henüz açıklanmamıştır: İlk durum nadirdir, ancak ikincisi vaka oldukça yaygın ve çok yaygın bir olgudur.

Dolayısıyla bir aralık serisi oluştururken istatistiksel birimlerin toplam sayısı küçük olabilir ve her aralık az sayıda değişken içerir (örneğin 1-3 birim). Bu gibi durumlarda herhangi bir modelin tezahürüne güvenilemez. Rastgele gözlemlere dayalı olarak doğal bir sonuç elde edilebilmesi için büyük sayılar kanununun yürürlüğe girmesi gerekmektedir. böylece her aralık için birkaç değil, onlarca ve yüzlerce istatistiksel birim olacaktır. Bunun için mümkün olduğu kadar gözlem sayısını artırmaya çalışmalıyız. Bu, kitlesel süreçlerdeki kalıpları tespit etmenin en kesin yoludur. Gözlem sayısını artırmak için gerçek bir fırsat yoksa, dağılım serisindeki aralıkların sayısı azaltılarak bir modelin belirlenmesi sağlanabilir. Bir varyasyon serisindeki aralıkların sayısı azaltıldığında her aralıktaki frekansların sayısı artar. Bu, her istatistiksel birimin rastgele dalgalanmalarının üst üste bindirildiği, "düzeltildiği" ve bir modele dönüştüğü anlamına gelir.

Varyasyon serilerinin oluşumu ve inşası, istatistiksel popülasyonun dağılımının yalnızca genel, yaklaşık bir resmini elde etmemizi sağlar. Örneğin, yalnızca kaba formdaki bir histogram, bir özelliğin değerleri ile frekansları (frekanslar) arasındaki ilişkiyi ifade eder. Bu nedenle, varyasyon serileri esasen statiğin iç düzenliliğinin daha derinlemesine incelenmesi için temel oluşturur. dağıtım.

KONU 5 İÇİN TEST SORULARI

1. Varyasyon nedir? İstatistiksel bir popülasyonda bir özellikteki varyasyona ne sebep olur?

2. İstatistiklerde ne tür değişken özellikler ortaya çıkabilir?

3. Varyasyon serisi nedir? Ne tür varyasyon serileri olabilir?

4. Sıralı seri nedir? Avantajları ve dezavantajları nelerdir?

5. Ayrık seri nedir, avantajları ve dezavantajları nelerdir?

6. Aralık serisi oluşturma prosedürü nedir, avantajları ve dezavantajları nelerdir?

7. Sıralanmış, ayrık, aralıklı dağılım serisinin grafiksel gösterimi nedir?

8. Dağıtım kümülasyonu nedir ve neyi karakterize eder?



Makaleyi beğendin mi? Arkadaşlarınla ​​paylaş!