Deret variasi jenis deret variasi interval deret. Seri distribusi variasi dan statistik

Seri variasi - ini adalah rangkaian statistik yang menunjukkan sebaran fenomena yang diteliti menurut nilai suatu karakteristik kuantitatif. Misalnya pasien berdasarkan usia, lama pengobatan, bayi baru lahir berdasarkan berat badan, dll.

Pilihan - nilai-nilai individu dari karakteristik yang digunakan untuk melakukan pengelompokan (dilambangkan V ) .

Frekuensi- angka yang menunjukkan seberapa sering suatu pilihan tertentu muncul (dilambangkan P ) . Jumlah semua frekuensi ditampilkan jumlah total pengamatan dan ditunjuk N . Selisih varian terbesar dan terkecil suatu deret variasi disebut rentang atau amplitudo .

Ada seri variasi:

1. Terputus-putus (diskrit) dan kontinyu.

Suatu rangkaian dianggap kontinu jika sifat pengelompokannya dapat dinyatakan dalam besaran pecahan (berat badan, tinggi badan, dan lain-lain), terputus-putus jika sifat pengelompokannya hanya dinyatakan dalam bilangan bulat (hari cacat, jumlah denyut nadi, dan lain-lain).

2.Sederhana dan seimbang.

Deret variasi sederhana adalah deret yang nilai kuantitatif suatu sifat yang bervariasi muncul satu kali. Dalam rangkaian variasi tertimbang, nilai kuantitatif suatu karakteristik yang bervariasi diulangi dengan frekuensi tertentu.

3. Dikelompokkan (interval) dan tidak dikelompokkan.

Seri yang dikelompokkan memiliki opsi yang digabungkan ke dalam kelompok yang menyatukannya berdasarkan ukuran dalam interval tertentu. Dalam rangkaian yang tidak dikelompokkan, setiap opsi individu berhubungan dengan frekuensi tertentu.

4. Genap dan ganjil.

Dalam deret variasi genap, jumlah frekuensi atau jumlah observasi dinyatakan dengan bilangan genap, dalam deret ganjil - dengan bilangan ganjil.

5. Simetris dan asimetris.

Dalam deret variasi simetris, semua jenis nilai rata-rata bertepatan atau sangat dekat (mode, median, mean aritmatika).

Tergantung pada sifat fenomena yang dipelajari, pada tugas dan tujuan khusus penelitian statistik, serta pada isi bahan sumber, dalam statistik sanitasi Jenis rata-rata berikut digunakan:

sarana struktural (mode, median);

rata-rata aritmatika;

rata-rata harmonik;

rata-rata geometrik;

rata-rata progresif.

Mode (M HAI ) - nilai suatu sifat yang bervariasi, yang lebih sering dijumpai pada populasi yang diteliti, yaitu. pilihan yang sesuai dengan frekuensi tertinggi. Mereka menemukannya langsung dari struktur deret variasi, tanpa menggunakan perhitungan apa pun. Biasanya nilainya sangat dekat dengan mean aritmatika dan sangat mudah digunakan dalam praktik.

Median (M e ) - membagi rangkaian variasi (diurutkan, yaitu nilai opsi disusun dalam urutan menaik atau menurun) menjadi dua bagian yang sama. Median dihitung menggunakan apa yang disebut deret ganjil, yang diperoleh dengan menjumlahkan frekuensi secara berurutan. Jika jumlah frekuensinya sesuai dengan bilangan genap, maka rata-rata aritmatika dari dua nilai rata-rata secara konvensional diambil sebagai median.

Modus dan median digunakan dalam kasus populasi terbuka, yaitu. ketika opsi terbesar atau terkecil tidak memiliki karakteristik kuantitatif yang pasti (misalnya, hingga 15 tahun, 50 tahun ke atas, dll.). Dalam hal ini, mean aritmatika (karakteristik parametrik) tidak dapat dihitung.

Rata-rata Saya berhitung - nilai paling umum. Rata-rata aritmatika sering dilambangkan dengan M.

Ada rata-rata aritmatika sederhana dan tertimbang.

Rata-rata aritmatika sederhana dihitung:

- dalam kasus di mana populasi diwakili oleh daftar pengetahuan sederhana tentang suatu karakteristik untuk setiap unit;

- jika jumlah pengulangan setiap pilihan tidak dapat ditentukan;

- jika jumlah pengulangan setiap pilihan berdekatan.

Rata-rata aritmatika sederhana dihitung menggunakan rumus:

dimana V - nilai individu dari karakteristik; n - jumlah nilai individu;
- tanda penjumlahan.

Jadi, rata-rata sederhana adalah perbandingan jumlah varian dengan jumlah observasi.

Contoh: tentukan rata-rata lama rawat inap di tempat tidur untuk 10 pasien pneumonia:

16 hari - 1 pasien; 17–1; 18–1; 19–1; 20–1; 21–1; 22–1; 23–1; 26–1; 31–1.

hari tidur

Rata-rata aritmatika tertimbang dihitung dalam kasus di mana nilai individual dari suatu karakteristik diulang. Itu dapat dihitung dengan dua cara:

1. Langsung (rata-rata aritmatika atau metode langsung) menurut rumus:

,

dimana P adalah frekuensi (jumlah kasus) pengamatan setiap pilihan.

Jadi, mean aritmatika tertimbang adalah rasio jumlah hasil kali varian dan frekuensi dengan jumlah observasi.

2. Dengan menghitung simpangan dari rata-rata bersyarat (menggunakan metode momen).

Dasar penghitungan rata-rata aritmatika tertimbang adalah:

― mengelompokkan materi menurut varian karakteristik kuantitatif;

— semua opsi harus disusun dalam urutan nilai atribut (baris peringkat) menaik atau menurun.

Untuk menghitung menggunakan metode momen, prasyaratnya adalah ukuran semua interval sama.

Dengan menggunakan metode momen, mean aritmatika dihitung dengan menggunakan rumus:

,

di mana M o adalah rata-rata bersyarat, yang sering dianggap sebagai nilai karakteristik yang sesuai dengan frekuensi tertinggi, yaitu. yang lebih sering diulang (Fashion).

saya adalah nilai intervalnya.

a adalah simpangan bersyarat dari kondisi rata-rata, yaitu deretan angka berurutan (1, 2, dst) dengan tanda + untuk varian rata-rata bersyarat besar dan dengan tanda – (–1, –2, dst) .) untuk varian yang berada di bawah rata-rata konvensional. Deviasi bersyarat dari varian yang diambil sebagai rata-rata bersyarat adalah 0.

P - frekuensi.

- jumlah observasi atau n.

Contoh: menentukan secara langsung rata-rata tinggi badan anak laki-laki umur 8 tahun (Tabel 1).

Tabel 1

Tinggi dalam cm

anak laki-laki P

Pusat

pilihan V

Opsi tengah - tengah interval - didefinisikan sebagai setengah jumlah nilai awal dari dua kelompok yang bertetangga:

;
dll.

VP produk diperoleh dengan mengalikan varian pusat dengan frekuensi
;
dll. Kemudian produk yang dihasilkan ditambahkan dan diperoleh
, yang dibagi dengan jumlah observasi (100) dan diperoleh mean aritmatika tertimbang.

cm.

Kami akan menyelesaikan masalah yang sama menggunakan metode momen, yang disusun tabel 2 berikut:

Tabel 2

Tinggi dalam cm (V)

anak laki-laki P

n=100

Kita ambil 122 sebagai M o, karena dari 100 pengamatan, 33 orang memiliki tinggi badan 122 cm. Kami menemukan penyimpangan bersyarat (a) dari rata-rata bersyarat sesuai dengan hal di atas. Kemudian kita memperoleh produk deviasi bersyarat dengan frekuensi (aP) dan menjumlahkan nilai yang diperoleh (
). Hasilnya 17. Terakhir, kita substitusikan data tersebut ke dalam rumus:

Ketika mempelajari suatu karakteristik yang bervariasi, seseorang tidak dapat membatasi diri hanya pada menghitung nilai rata-rata. Perlu juga dihitung indikator-indikator yang mencirikan derajat keragaman sifat-sifat yang diteliti. Nilai suatu karakteristik kuantitatif tertentu tidak sama untuk semua unit populasi statistik.

Ciri-ciri deret variasi adalah simpangan baku ( ), yang menunjukkan sebaran (dispersi) sifat-sifat yang dipelajari relatif terhadap mean aritmatika, yaitu. mencirikan variabilitas deret variasi. Dapat ditentukan secara langsung dengan menggunakan rumus:

Simpangan baku sama dengan akar kuadrat dari jumlah hasil kali simpangan kuadrat setiap pilihan dari rata-rata aritmatika (V–M) 2 dengan frekuensinya dibagi dengan jumlah frekuensi (
).

Contoh perhitungan: menentukan rata-rata jumlah cuti sakit yang dikeluarkan di klinik per hari (Tabel 3).

Tabel 3

Jumlah hari sakit

lembar yang diterbitkan

dokter per hari (V)

Jumlah dokter (P)

;

Pada penyebut, bila jumlah pengamatan kurang dari 30, maka diperlukan dari
kurangi satu.

Jika deret tersebut dikelompokkan dalam interval yang sama, maka simpangan baku dapat ditentukan dengan menggunakan metode momen:

,

dimana i adalah nilai interval;

- penyimpangan bersyarat dari rata-rata bersyarat;

P - varian frekuensi dari interval yang sesuai;

- jumlah total observasi.

Contoh perhitungan : Tentukan rata-rata lama rawat pasien di tempat tidur terapeutik (menggunakan metode momen) (Tabel 4):

Tabel 4

Jumlah hari

tetap di tempat tidur (V)

sakit (P)

;

Ahli statistik Belgia A. Quetelet menemukan bahwa variasi fenomena massa mematuhi hukum distribusi kesalahan, yang ditemukan hampir bersamaan oleh K. Gauss dan P. Laplace. Kurva yang mewakili distribusi ini berbentuk lonceng. Menurut hukum distribusi normal, variabilitas nilai individu suatu karakteristik berada dalam batasnya
, yang mencakup 99,73% dari seluruh unit populasi.

Telah dihitung jika Anda menjumlahkan dan mengurangi 2 ke mean aritmatika , maka 95,45% dari seluruh anggota deret variasi berada dalam nilai yang diperoleh dan, terakhir, jika kita menjumlahkan dan mengurangi 1 ke mean aritmatika , maka 68,27% dari seluruh anggota rangkaian variasi ini akan berada dalam nilai yang diperoleh. Dalam pengobatan dengan besarnya
1terkait dengan konsep norma. Penyimpangan dari mean aritmatika lebih dari 1 , tetapi kurang dari 2 di bawah normal, dan deviasinya lebih dari 2 tidak normal (di atas atau di bawah normal).

Dalam statistik kesehatan, aturan tiga sigma digunakan ketika mempelajari pembangunan fisik, menilai kinerja institusi pelayanan kesehatan, dan menilai kesehatan penduduk. Aturan yang sama banyak digunakan dalam perekonomian nasional ketika menentukan standar.

Jadi, simpangan baku berfungsi untuk:

— pengukuran dispersi deret variasi;

— ciri-ciri derajat keanekaragaman ciri, yang ditentukan oleh koefisien variasi:

Jika koefisien variasi lebih dari 20% - keragaman kuat, dari 20 hingga 10% - rata-rata, kurang dari 10% - keragaman sifat lemah. Koefisien variasi sampai batas tertentu merupakan kriteria reliabilitas mean aritmatika.

Metode pengelompokan juga memungkinkan Anda melakukan pengukuran variasi(variabilitas, fluktuasi) tanda. Ketika jumlah unit dalam suatu populasi relatif kecil, variasi diukur berdasarkan peringkat jumlah unit yang membentuk populasi. Serial ini disebut peringkat, jika satuan-satuan tersebut disusun menurut urutan sifat menaik (menurun).

Namun, rangkaian peringkat cukup indikatif ketika diperlukan karakteristik komparatif dari variasi. Selain itu, dalam banyak kasus kita harus berhadapan dengan populasi statistik yang terdiri dari sejumlah besar unit, yang secara praktis sulit untuk direpresentasikan dalam bentuk rangkaian tertentu. Sehubungan dengan itu, untuk pengenalan umum awal terhadap data statistik dan khususnya untuk memudahkan kajian variasi karakteristik, fenomena dan proses yang diteliti biasanya digabungkan ke dalam kelompok-kelompok, dan hasil pengelompokannya disajikan dalam bentuk tabel kelompok.

Jika tabel grup hanya memiliki dua kolom - grup berdasarkan karakteristik yang dipilih (opsi) dan jumlah grup (frekuensi atau frekuensi), itu disebut dekat distribusi.

Rentang distribusi - jenis pengelompokan struktural yang paling sederhana berdasarkan satu karakteristik, ditampilkan dalam tabel grup dengan dua kolom yang berisi varian dan frekuensi karakteristik. Dalam banyak kasus, dengan pengelompokan struktural seperti itu, mis. Dengan disusunnya rangkaian distribusi, pembelajaran materi statistik awal dimulai.

Pengelompokan struktural yang berupa rangkaian distribusi dapat diubah menjadi pengelompokan struktural asli jika kelompok yang dipilih tidak hanya dicirikan oleh frekuensi, tetapi juga oleh indikator statistik lainnya. Tujuan utama deret distribusi adalah untuk mempelajari variasi karakteristik. Teori deret distribusi dikembangkan secara rinci oleh statistik matematika.

Seri distribusi dibagi menjadi atributif(pengelompokan menurut ciri-ciri atributif, misalnya membagi penduduk berdasarkan jenis kelamin, kebangsaan, status perkawinan, dll) dan variasional(pengelompokan berdasarkan karakteristik kuantitatif).

Seri variasi adalah tabel kelompok yang berisi dua kolom: pengelompokan unit menurut satu karakteristik kuantitatif dan jumlah unit dalam setiap kelompok. Interval pada deret variasi biasanya dibentuk sama dan tertutup. Rangkaian variasinya adalah pengelompokan penduduk Rusia berdasarkan pendapatan moneter rata-rata per kapita (Tabel 3.10).

Tabel 3.10

Distribusi penduduk Rusia menurut pendapatan per kapita rata-rata tahun 2004-2009.

Kelompok penduduk menurut pendapatan tunai rata-rata per kapita, gosok/bulan

Populasi dalam kelompok, % dari total

8 000,1-10 000,0

10 000,1-15 000,0

15 000,1-25 000,0

Lebih dari 25.000,0

Seluruh populasi

Deret variasi, pada gilirannya, dibagi menjadi diskrit dan interval. Diskrit seri variasi menggabungkan varian karakteristik diskrit yang bervariasi dalam batas sempit. Contoh rangkaian variasi diskrit adalah distribusi keluarga Rusia berdasarkan jumlah anak yang mereka miliki.

Selang seri variasi menggabungkan varian karakteristik kontinu atau karakteristik diskrit yang bervariasi dalam rentang yang luas. Interval adalah rangkaian variasi distribusi penduduk Rusia menurut pendapatan moneter per kapita rata-rata.

Deret variasi diskrit tidak terlalu sering digunakan dalam praktik. Sedangkan penyusunannya tidaklah sulit, karena komposisi kelompok ditentukan oleh varian-varian spesifik yang sebenarnya dimiliki oleh ciri-ciri pengelompokan yang diteliti.

Rangkaian variasi interval lebih luas. Saat menyusunnya, muncul pertanyaan sulit mengenai jumlah kelompok, serta ukuran interval yang harus ditetapkan.

Prinsip-prinsip untuk mengatasi masalah ini diuraikan dalam bab tentang metodologi pembuatan pengelompokan statistik (lihat paragraf 3.3).

Deret variasi merupakan sarana untuk meruntuhkan atau mengompresi berbagai informasi menjadi suatu bentuk yang kompak; dari deret tersebut seseorang dapat membuat penilaian yang cukup jelas tentang sifat variasi, dan mempelajari perbedaan karakteristik fenomena yang termasuk dalam himpunan yang diteliti. Tetapi arti terpenting dari rangkaian variasi adalah bahwa atas dasar rangkaian tersebut, karakteristik generalisasi khusus dari variasi dihitung (lihat Bab 7).

Sebut saja nilai sampel yang berbeda pilihan rangkaian nilai dan menunjukkan: X 1 , X 2,…. Pertama-tama kami akan memproduksi mulai pilihan, yaitu susunannya dalam urutan menaik atau menurun. Untuk setiap opsi, bobotnya ditunjukkan, mis. angka yang mencirikan kontribusi suatu pilihan tertentu terhadap total populasi. Frekuensi atau frekuensi berperan sebagai bobot.

Frekuensi dan saya pilihan x saya adalah angka yang menunjukkan berapa kali suatu pilihan tertentu muncul dalam populasi sampel yang dipertimbangkan.

Frekuensi atau frekuensi relatif dengan saya pilihan x saya adalah bilangan yang sama dengan rasio frekuensi suatu varian dengan jumlah frekuensi semua varian. Frekuensi menunjukkan berapa proporsi unit dalam populasi sampel yang mempunyai varian tertentu.

Urutan opsi dengan bobot (frekuensi atau frekuensi) yang sesuai, ditulis dalam urutan menaik (atau menurun), disebut seri variasi.

Deret variasi bersifat diskrit dan interval.

Untuk deret variasi diskrit ditentukan nilai titik suatu karakteristik, untuk deret interval nilai karakteristik ditentukan dalam bentuk interval. Rangkaian variasi dapat menunjukkan sebaran frekuensi atau frekuensi relatif (frekuensi), bergantung pada nilai apa yang ditunjukkan untuk setiap pilihan – frekuensi atau frekuensi.

Rangkaian variasi distribusi frekuensi yang diskrit memiliki bentuk:

Frekuensi dicari dengan rumus, i = 1, 2, …, M.

w 1 +w 2 + … + w m = 1.

Contoh 4.1. Untuk sekumpulan angka tertentu

4, 6, 6, 3, 4, 9, 6, 4, 6, 6

membangun rangkaian variasi diskrit dari frekuensi dan distribusi frekuensi.

Larutan . Volume populasi sama dengan N= 10. Deret distribusi frekuensi diskrit berbentuk

Deret interval mempunyai bentuk pencatatan yang serupa.

Rangkaian variasi interval distribusi frekuensi ditulis sebagai:

Jumlah semua frekuensi sama dengan jumlah total observasi, yaitu. volume keseluruhan: N = N 1 +N 2 + … + N M.

Rangkaian variasi interval distribusi frekuensi relatif (frekuensi) memiliki bentuk:

Frekuensi dicari dengan rumus i = 1, 2, …, M.

Jumlah semua frekuensi sama dengan satu: w 1 +w 2 + … + w m = 1.

Seri interval paling sering digunakan dalam praktik. Jika terdapat banyak data sampel statistik dan nilainya berbeda satu sama lain dalam jumlah yang sangat kecil, maka rangkaian diskrit untuk data ini akan sangat rumit dan merepotkan untuk penelitian lebih lanjut. Dalam hal ini digunakan pengelompokan data, yaitu. Interval yang berisi semua nilai atribut dibagi menjadi beberapa interval parsial dan, dengan menghitung frekuensi untuk setiap interval, diperoleh deret interval. Mari kita tuliskan lebih detail skema pembuatan deret interval, dengan asumsi panjang interval parsial akan sama.

2.2 Konstruksi deret interval

Untuk membuat deret interval, Anda memerlukan:

Tentukan jumlah interval;

Tentukan panjang interval;

Tentukan letak interval pada sumbu.

Untuk menentukan jumlah interval k Ada rumus Sturges yang menurutnya

,

Di mana N- volume seluruh agregat.

Misalnya, jika terdapat 100 nilai suatu karakteristik (varian), maka disarankan untuk mengambil jumlah interval yang sama dengan interval untuk membuat deret interval.

Namun seringkali dalam prakteknya jumlah interval dipilih oleh peneliti sendiri, dengan pertimbangan bahwa bilangan tersebut tidak boleh terlalu besar agar deretnya tidak rumit, tetapi juga tidak terlalu kecil agar tidak kehilangan beberapa sifat dari interval tersebut. distribusi.

Panjang interval H ditentukan dengan rumus berikut:

,

Di mana X maks dan X min masing-masing adalah nilai opsi terbesar dan terkecil.

Ukuran ditelepon cakupan baris.

Untuk membangun interval itu sendiri, mereka melanjutkan dengan cara yang berbeda. Salah satu cara paling sederhana adalah sebagai berikut. Awal interval pertama dianggap sebagai
. Kemudian sisa batas interval dicari dengan rumus. Jelas, akhir dari interval terakhir A m+1 harus memenuhi kondisi

Setelah semua batas interval ditemukan, frekuensi (atau frekuensi) interval tersebut ditentukan. Untuk mengatasi masalah ini, lihat semua opsi dan tentukan jumlah opsi yang termasuk dalam interval tertentu. Mari kita lihat konstruksi lengkap deret interval menggunakan sebuah contoh.

Contoh 4.2. Untuk data statistik berikut, yang dicatat dalam urutan menaik, buatlah deret interval dengan jumlah interval sama dengan 5:

11, 12, 12, 14, 14, 15, 21, 21, 22, 23, 25, 38, 38, 39, 42, 42, 44, 45, 50, 50, 55, 56, 58, 60, 62, 63, 65, 68, 68, 68, 70, 75, 78, 78, 78, 78, 80, 80, 86, 88, 90, 91, 91, 91, 91, 91, 93, 93, 95, 96.

Larutan. Total N=50 nilai varian.

Jumlah interval ditentukan dalam rumusan masalah, yaitu. k=5.

Panjang intervalnya adalah
.

Mari kita tentukan batas intervalnya:

A 1 = 11 − 8,5 = 2,5; A 2 = 2,5 + 17 = 19,5; A 3 = 19,5 + 17 = 36,5;

A 4 = 36,5 + 17 = 53,5; A 5 = 53,5 + 17 = 70,5; A 6 = 70,5 + 17 = 87,5;

A 7 = 87,5 +17 = 104,5.

Untuk menentukan frekuensi interval, kita menghitung jumlah opsi yang termasuk dalam interval tertentu. Misalnya, interval pertama dari 2,5 hingga 19,5 mencakup opsi 11, 12, 12, 14, 14, 15. Jumlahnya adalah 6, oleh karena itu, frekuensi interval pertama adalah N 1 =6. Frekuensi interval pertama adalah . Interval kedua dari 19,5 hingga 36,5 meliputi pilihan 21, 21, 22, 23, 25 yang banyaknya 5. Oleh karena itu, frekuensi interval kedua adalah N 2 =5, dan frekuensi . Setelah mencari frekuensi dan frekuensi untuk semua interval dengan cara yang sama, kita memperoleh deret interval berikut.

Deret interval distribusi frekuensi berbentuk:

Jumlah frekuensinya adalah 6+5+9+11+8+11=50.

Deret interval distribusi frekuensi berbentuk:

Jumlah frekuensinya adalah 0,12+0,1+0,18+0,22+0,16+0,22=1. ■

Saat membangun deret interval, tergantung pada kondisi spesifik dari masalah yang sedang dipertimbangkan, aturan lain dapat diterapkan, yaitu

1. Deret variasi interval dapat terdiri dari interval parsial yang panjangnya berbeda-beda. Panjang interval yang tidak sama memungkinkan untuk menyoroti sifat-sifat populasi statistik dengan distribusi karakteristik yang tidak merata. Misalnya, jika batas interval menentukan jumlah penduduk di kota, maka dalam soal ini disarankan untuk menggunakan interval yang panjangnya tidak sama. Tentu saja, untuk kota-kota kecil, perbedaan kecil dalam jumlah penduduk adalah hal yang penting, namun untuk kota-kota besar perbedaan puluhan atau ratusan penduduk tidaklah signifikan. Deret interval dengan panjang interval parsial yang tidak sama dipelajari terutama dalam teori umum statistik dan pertimbangannya berada di luar cakupan manual ini.

2. Dalam statistik matematika, deret interval kadang-kadang dipertimbangkan, yang batas kiri interval pertama diasumsikan sama dengan –∞, dan batas kanan interval terakhir +∞. Hal ini dilakukan untuk mendekatkan sebaran statistik dengan sebaran teoritis.

3. Saat membuat deret interval, mungkin saja nilai suatu opsi bertepatan persis dengan batas interval. Hal terbaik untuk dilakukan dalam hal ini adalah sebagai berikut. Jika hanya ada satu kebetulan seperti itu, maka pertimbangkan bahwa opsi yang dipertimbangkan dengan frekuensinya jatuh ke dalam interval yang terletak lebih dekat ke tengah rangkaian interval, jika ada beberapa opsi seperti itu, maka semuanya dimasukkan ke dalam interval ke di sebelah kanan opsi ini, atau semuanya ditetapkan di sebelah kiri.

4. Setelah menentukan banyaknya interval dan panjangnya, penyusunan interval dapat dilakukan dengan cara lain. Temukan mean aritmatika dari semua nilai opsi yang dipertimbangkan X Menikahi dan bangun interval pertama sedemikian rupa sehingga rata-rata sampel ini berada dalam interval tertentu. Jadi, kita mendapatkan interval dari X Menikahi – 0,5 H ke X rata-rata.. + 0,5 H. Kemudian ke kiri dan ke kanan, menjumlahkan panjang interval, kita membangun interval yang tersisa hingga X menit dan X max tidak akan jatuh ke dalam interval pertama dan terakhir.

5. Deret interval dengan jumlah interval yang banyak sebaiknya ditulis secara vertikal, yaitu. tulis intervalnya bukan pada baris pertama, tetapi pada kolom pertama, dan frekuensi (atau frekuensi) pada kolom kedua.

Data sampel dapat dianggap sebagai nilai dari beberapa variabel acak X. Variabel acak mempunyai hukum distribusinya sendiri. Dari teori probabilitas diketahui bahwa hukum distribusi suatu variabel acak diskrit dapat ditentukan dalam bentuk deret distribusi, dan untuk deret kontinu dapat ditentukan dengan menggunakan fungsi kepadatan distribusi. Namun, terdapat hukum distribusi universal yang berlaku untuk variabel acak diskrit dan kontinu. Hukum distribusi ini diberikan sebagai fungsi distribusi F(X) = P(X<X). Untuk data sampel, Anda dapat menentukan analog dari fungsi distribusi - fungsi distribusi empiris.


Informasi terkait.


Seri variasi: definisi, jenis, ciri-ciri utama. Metode perhitungan
mode, median, mean aritmatika dalam penelitian medis dan statistik
(tunjukkan dengan contoh bersyarat).

Deret variasi adalah serangkaian nilai numerik dari sifat yang dipelajari, yang besarnya berbeda satu sama lain dan disusun dalam urutan tertentu (urutan menaik atau menurun). Setiap nilai numerik suatu rangkaian disebut varian (V), dan bilangan yang menunjukkan seberapa sering suatu varian tertentu muncul dalam suatu rangkaian tertentu disebut frekuensi (p).

Banyaknya kasus pengamatan yang termasuk dalam deret variasi dilambangkan dengan huruf n. Perbedaan makna dari ciri-ciri yang diteliti disebut variasi. Jika suatu karakteristik yang bervariasi tidak mempunyai ukuran kuantitatif, maka variasi tersebut disebut kualitatif, dan rangkaian distribusinya disebut atributif (misalnya distribusi berdasarkan hasil penyakit, status kesehatan, dll.).

Jika suatu sifat yang bervariasi mempunyai ekspresi kuantitatif, maka variasi tersebut disebut kuantitatif, dan deret distribusinya disebut variasional.

Deret variasi dibedakan menjadi diskontinyu dan kontinyu - berdasarkan sifat karakteristik kuantitatifnya; sederhana dan tertimbang - berdasarkan frekuensi kemunculan varian.

Pada rangkaian variasi sederhana, setiap opsi hanya muncul satu kali (p=1), pada rangkaian berbobot, opsi yang sama muncul beberapa kali (p>1). Contoh seri tersebut akan dibahas lebih lanjut dalam teks. Jika sifat kuantitatifnya kontinu, mis. Di antara besaran bilangan bulat terdapat besaran pecahan perantara; deret variasinya disebut kontinu.

Misalnya: 10.0 – 11.9

14.0 – 15.9, dst.

Jika karakteristik kuantitatifnya terputus-putus, mis. nilai individualnya (varian) berbeda satu sama lain dalam bilangan bulat dan tidak memiliki nilai pecahan antara; deret variasi disebut diskontinu atau diskrit.

Menggunakan data detak jantung dari contoh sebelumnya

untuk 21 siswa, kita akan membuat deret variasi (Tabel 1).

Tabel 1

Distribusi mahasiswa kedokteran berdasarkan detak jantung (bpm)

Jadi, menyusun deret variasi berarti mensistematisasikan dan mengatur nilai-nilai numerik (varian) yang tersedia, yaitu. disusun dalam urutan tertentu (dalam urutan menaik atau menurun) dengan frekuensi yang sesuai. Dalam contoh yang sedang dipertimbangkan, opsi-opsi disusun dalam urutan menaik dan dinyatakan sebagai bilangan bulat terputus-putus (diskrit), setiap opsi muncul beberapa kali, yaitu. kita berhadapan dengan rangkaian variasi berbobot, terputus-putus, atau diskrit.

Biasanya, jika jumlah observasi dalam populasi statistik yang kita pelajari tidak melebihi 30, maka cukup dengan menyusun semua nilai karakteristik yang dipelajari dalam deret variasi menaik, seperti pada Tabel. 1, atau urutan menurun.

Dengan jumlah observasi yang banyak (n>30), jumlah varian yang muncul bisa sangat besar; dalam hal ini disusun rangkaian variasi interval atau berkelompok, yang di dalamnya untuk menyederhanakan pemrosesan selanjutnya dan memperjelas sifat sebarannya, varian digabungkan menjadi beberapa kelompok.

Biasanya jumlah opsi grup berkisar antara 8 hingga 15.

Setidaknya harus ada 5 dari mereka, karena... jika tidak maka akan menjadi terlalu kasar, pembesaran berlebihan, yang mendistorsi gambaran variasi secara keseluruhan dan sangat mempengaruhi keakuratan nilai rata-rata. Ketika jumlah varian kelompok lebih dari 20-25, keakuratan penghitungan nilai rata-rata meningkat, tetapi karakteristik variasi karakteristik terdistorsi secara signifikan dan pemrosesan matematis menjadi lebih rumit.

Saat menyusun seri yang dikelompokkan, hal ini perlu diperhitungkan

− kelompok pilihan harus disusun dalam urutan tertentu (naik atau turun);

− interval dalam kelompok pilihan harus sama;

− nilai batas interval tidak boleh bertepatan, karena tidak jelas kelompok mana yang mengklasifikasikan varian individu;

− perlu mempertimbangkan fitur kualitatif dari bahan yang dikumpulkan ketika menetapkan batas interval (misalnya, ketika mempelajari berat badan orang dewasa, interval 3-4 kg dapat diterima, dan untuk anak-anak di bulan-bulan pertama kehidupannya) tidak boleh melebihi 100 g)

Mari kita buat rangkaian kelompok (interval) yang mengkarakterisasi data denyut nadi (denyut per menit) dari 55 mahasiswa kedokteran sebelum ujian: 64, 66, 60, 62,

64, 68, 70, 66, 70, 68, 62, 68, 70, 72, 60, 70, 74, 62, 70, 72, 72,

64, 70, 72, 76, 76, 68, 70, 58, 76, 74, 76, 76, 82, 76, 72, 76, 74,

79, 78, 74, 78, 74, 78, 74, 74, 78, 76, 78, 76, 80, 80, 80, 78, 78.

Untuk membuat seri yang dikelompokkan, Anda memerlukan:

1. Tentukan besarnya interval;

2. Tentukan bagian tengah, awal dan akhir kelompok deret variasi.

● Besar kecilnya interval (i) ditentukan oleh banyaknya kelompok yang diduga (r), yang banyaknya ditentukan berdasarkan banyaknya observasi (n) menurut tabel khusus

Jumlah kelompok tergantung pada jumlah observasi:

Dalam kasus kami, untuk 55 siswa, Anda dapat membuat 8 hingga 10 grup.

Nilai interval (i) ditentukan dengan rumus berikut -

i = V maks-V menit/r

Dalam contoh kita, nilai intervalnya adalah 82-58/8= 3.

Jika nilai intervalnya berupa pecahan, maka hasilnya harus dibulatkan ke bilangan bulat terdekat.

Ada beberapa jenis rata-rata:

● mean aritmatika,

● rata-rata geometri,

● rata-rata harmonik,

● akar berarti kuadrat,

● rata-rata progresif,

● median

Dalam statistik medis, rata-rata aritmatika paling sering digunakan.

Rata-rata aritmatika (M) adalah nilai generalisasi yang menentukan karakteristik seluruh populasi. Metode utama untuk menghitung M adalah: metode mean aritmatika dan metode momen (penyimpangan bersyarat).

Metode mean aritmatika digunakan untuk menghitung mean aritmatika sederhana dan mean aritmatika tertimbang. Pilihan metode untuk menghitung mean aritmatika bergantung pada jenis deret variasi. Dalam kasus deret variasi sederhana, di mana setiap opsi hanya muncul satu kali, mean aritmatika ditentukan dengan menggunakan rumus:

dimana: M – nilai rata-rata aritmatika;

V – nilai karakteristik yang bervariasi (varian);

Σ – menunjukkan tindakan – penjumlahan;

n – jumlah total observasi.

Contoh penghitungan rata-rata aritmatika sederhana. Laju pernafasan (jumlah gerakan nafas per menit) pada 9 orang laki-laki umur 35 tahun : 20, 22, 19, 15, 16, 21, 17, 23, 18.

Untuk mengetahui rata-rata tingkat pernafasan pada pria umur 35 tahun, perlu:

1. Buatlah deret variasi dengan menyusun semua pilihan dalam urutan menaik atau menurun. Kita memperoleh deret variasi sederhana, karena nilai opsi hanya muncul sekali.

M = ∑V/n = 171/9 = 19 napas per menit

Kesimpulan. Frekuensi pernapasan pada pria usia 35 tahun rata-rata 19 gerakan pernapasan per menit.

Jika nilai individual suatu varian diulang, tidak perlu menuliskan setiap varian dalam satu baris; cukup dengan mencantumkan ukuran varian yang muncul (V) dan di sebelahnya menunjukkan jumlah pengulangannya (hal ). Deret variasi seperti itu, yang opsi-opsinya seolah-olah ditimbang oleh jumlah frekuensi yang bersesuaian dengannya, disebut deret variasi tertimbang, dan nilai rata-rata yang dihitung adalah rata-rata aritmatika tertimbang.

Rata-rata aritmatika tertimbang ditentukan dengan rumus: M= ∑Vp/n

dimana n adalah jumlah observasi yang sama dengan jumlah frekuensi – Σр.

Contoh penghitungan rata-rata tertimbang aritmatika.

Durasi kecacatan (dalam hari) pada 35 penderita penyakit pernafasan akut (ISPA) yang dirawat oleh dokter setempat selama triwulan pertama tahun berjalan adalah: 6, 7, 5, 3, 9, 8, 7, 5, 6 , 4, 9, 8, 7, 6, 6, 9, 6, 5, 10, 8, 7, 11, 13, 5, 6, 7, 12, 4, 3, 5, 2, 5, 6, 6 , 7 hari.

Cara menentukan rata-rata durasi kecacatan pada penderita ISPA adalah sebagai berikut:

1. Mari kita buat deret variasi berbobot, karena Nilai individual dari opsi diulang beberapa kali. Untuk melakukan ini, Anda dapat mengatur semua opsi dalam urutan menaik atau menurun dengan frekuensi yang sesuai.

Dalam kasus kami, opsi disusun dalam urutan menaik

2. Hitung rata-rata tertimbang aritmatika dengan rumus: M = ∑Vp/n = 233/35 = 6,7 hari

Distribusi penderita infeksi saluran pernafasan akut berdasarkan lama kecacatannya:

Durasi kecacatan (V) Jumlah pasien (p) Wakil
∑p = n = 35 ∑Vp = 233

Kesimpulan. Durasi kecacatan pada penderita penyakit pernafasan akut rata-rata 6,7 ​​hari.

Mode (Mo) adalah pilihan paling umum dalam rangkaian variasi. Untuk distribusi yang disajikan dalam tabel, modusnya sesuai dengan varian yang sama dengan 10; ini terjadi lebih sering daripada yang lain - 6 kali.

Distribusi pasien berdasarkan lama rawat inap di rumah sakit (dalam hari)

V
P

Terkadang sulit untuk menentukan besaran pasti suatu mode karena mungkin terdapat beberapa observasi “paling umum” dalam data yang sedang dipelajari.

Median (Me) adalah indikator nonparametrik yang membagi rangkaian variasi menjadi dua bagian yang sama besar: jumlah varian yang sama terletak di kedua sisi median.

Misalnya untuk distribusi yang ditunjukkan pada tabel, mediannya adalah 10, karena di kedua sisi nilai ini ada opsi 14, yaitu. angka 10 menempati posisi sentral dalam deret ini dan merupakan mediannya.

Mengingat banyaknya observasi pada contoh ini genap (n=34), maka mediannya dapat ditentukan sebagai berikut:

Saya = 2+3+4+5+6+5+4+3+2/2 = 34/2 = 17

Artinya bagian tengah deret tersebut berada pada pilihan ketujuh belas, yang memiliki median sama dengan 10. Untuk distribusi yang disajikan dalam tabel, mean aritmatikanya sama dengan:

M = ∑Vp/n = 334/34 = 10,1

Jadi, untuk 34 observasi dari tabel. 8, kita mendapatkan: Mo=10, Me=10, mean aritmatika (M) adalah 10,1. Dalam contoh kita, ketiga indikator tersebut ternyata sama atau mendekati satu sama lain, meskipun keduanya sangat berbeda.

Rata-rata aritmatika adalah jumlah efektif dari semua pengaruh; semua pilihan tanpa kecuali, termasuk pilihan ekstrim, yang seringkali tidak lazim untuk suatu fenomena atau populasi tertentu, mengambil bagian dalam pembentukannya.

Modus dan median, tidak seperti mean aritmatika, tidak bergantung pada nilai semua nilai individual dari karakteristik yang bervariasi (nilai varian ekstrem dan derajat dispersi deret). Rata-rata aritmatika mencirikan seluruh massa pengamatan, modus dan median mencirikan sebagian besar pengamatan

Konsep deret variasi. Langkah pertama dalam mensistematisasikan bahan observasi statistik adalah menghitung jumlah satuan yang mempunyai karakteristik tertentu. Dengan menyusun satuan-satuan dalam urutan sifat kuantitatifnya menaik atau menurun dan menghitung jumlah satuan dengan nilai karakteristik tertentu, kita memperoleh deret variasi. Deret variasi mencirikan distribusi unit-unit populasi statistik tertentu menurut beberapa karakteristik kuantitatif.

Deret variasi terdiri dari dua kolom, kolom kiri berisi nilai-nilai sifat yang bervariasi, disebut varian dan dilambangkan (x), dan kolom kanan berisi bilangan absolut yang menunjukkan berapa kali setiap varian muncul. Indikator pada kolom ini disebut frekuensi dan diberi tanda (f).

Rangkaian variasi tersebut secara skematis dapat disajikan dalam bentuk Tabel 5.1:

Tabel 5.1

Jenis seri variasi

Pilihan (x)

Frekuensi (f)

Di kolom kanan, indikator relatif juga dapat digunakan, yang mengkarakterisasi bagian frekuensi opsi individu dalam jumlah total frekuensi. Indikator relatif ini disebut frekuensi dan secara konvensional dilambangkan dengan , yaitu. . Jumlah semua frekuensi sama dengan satu. Frekuensi juga dapat dinyatakan sebagai persentase, dan jumlahnya akan sama dengan 100%.

Tanda-tanda yang berbeda mungkin memiliki sifat yang berbeda. Varian dari beberapa karakteristik dinyatakan dalam bilangan bulat, misalnya jumlah kamar dalam suatu apartemen, jumlah buku yang diterbitkan, dll. Tanda-tanda ini disebut terputus-putus atau diskrit. Varian karakteristik lain dapat mengambil nilai apa pun dalam batas tertentu, seperti pemenuhan tugas yang direncanakan, upah, dll. Karakteristik tersebut disebut kontinu.

Seri variasi diskrit. Jika varian suatu deret variasi dinyatakan dalam bentuk besaran diskrit, maka deret variasi tersebut disebut diskrit, penampakannya disajikan dalam tabel. 5.2:

Tabel 5.2

Pembagian siswa menurut nilai ujian

Peringkat (x)

Jumlah siswa (f)

Dalam % dari total ()

Sifat sebaran deret diskrit digambarkan secara grafis dalam bentuk poligon sebaran, Gambar 5.1.

Beras. 5.1. Pembagian siswa menurut nilai yang diperoleh dalam ujian.

Seri variasi interval. Untuk karakteristik kontinu, deret variasi dikonstruksikan sebagai deret interval, yaitu. nilai-nilai sifat di dalamnya dinyatakan dalam bentuk interval “dari dan ke”. Dalam hal ini, nilai minimum suatu karakteristik pada suatu interval disebut batas bawah interval, dan maksimum disebut batas atas interval.

Deret variasi interval dibuat untuk karakteristik terputus-putus (diskrit) dan untuk karakteristik yang bervariasi dalam rentang yang luas. Baris interval bisa dengan interval yang sama atau tidak sama. Dalam praktik ekonomi, sebagian besar interval yang tidak sama digunakan, yang semakin meningkat atau menurun. Kebutuhan ini muncul terutama dalam kasus dimana fluktuasi suatu karakteristik terjadi secara tidak merata dan dalam batas yang besar.

Mari kita perhatikan jenis deret interval dengan interval yang sama, tabel. 5.3:

Tabel 5.3

Distribusi pekerja berdasarkan produksi

Keluaran, t.r. (X)

Jumlah pekerja (f)

Frekuensi kumulatif (f´)

Deret distribusi interval digambarkan secara grafis dalam bentuk histogram, Gambar 5.2.

Gambar.5.2. Distribusi pekerja berdasarkan produksi

Frekuensi akumulasi (kumulatif). Dalam praktiknya, ada kebutuhan untuk mengubah rangkaian distribusi menjadi seri kumulatif, dibangun berdasarkan frekuensi yang terakumulasi. Dengan bantuan mereka, Anda dapat menentukan rata-rata struktural yang memfasilitasi analisis data deret distribusi.

Frekuensi kumulatif ditentukan dengan menambahkan secara berurutan ke frekuensi (atau frekuensi) kelompok pertama indikator-indikator kelompok berikutnya dari rangkaian distribusi. Kumulat dan ogif digunakan untuk mengilustrasikan rangkaian distribusi. Untuk membangunnya, nilai karakteristik diskrit (atau ujung interval) ditandai pada sumbu absis, dan total kumulatif frekuensi (berakumulasi) ditandai pada sumbu ordinat, Gambar 5.3.

Beras. 5.3. Distribusi kumulatif pekerja berdasarkan produksi

Jika skala frekuensi dan pilihan dibalik, mis. sumbu absis mencerminkan akumulasi frekuensi, dan sumbu ordinat menunjukkan nilai varian, maka kurva yang mencirikan perubahan frekuensi dari kelompok ke kelompok disebut distribusi ogive, Gambar 5.4.

Beras. 5.4. Ogiva distribusi pekerja berdasarkan produksi

Rangkaian variasi dengan interval yang sama memberikan salah satu persyaratan terpenting untuk rangkaian distribusi statistik, memastikan perbandingannya dalam ruang dan waktu.

Kepadatan distribusi. Namun, frekuensi interval individu yang tidak sama dalam deret yang disebutkan tidak dapat dibandingkan secara langsung. Dalam kasus seperti itu, untuk memastikan perbandingan yang diperlukan, kepadatan distribusi dihitung, yaitu. tentukan berapa banyak satuan dalam setiap kelompok per satuan nilai interval.

Saat membuat grafik sebaran deret variasi dengan interval yang tidak sama, tinggi persegi panjang ditentukan bukan secara proporsional dengan frekuensi, tetapi dengan indikator kepadatan sebaran nilai-nilai karakteristik yang dipelajari dalam persamaan yang sesuai. interval.

Menyusun deret variasi dan representasi grafisnya merupakan langkah awal dalam pengolahan data awal dan tahap pertama dalam analisis populasi yang diteliti. Langkah selanjutnya dalam analisis deret variasi adalah menentukan indikator umum utama yang disebut ciri-ciri deret tersebut. Ciri-ciri tersebut hendaknya memberikan gambaran tentang nilai rata-rata ciri tersebut antar unit populasi.

Nilai rata-rata. Nilai rata-rata adalah suatu sifat yang digeneralisasikan dari sifat-sifat yang diteliti pada populasi yang diteliti, yang mencerminkan tingkat khasnya per satuan populasi dalam kondisi tempat dan waktu tertentu.

Nilai rata-rata selalu diberi nama dan mempunyai dimensi yang sama dengan ciri-ciri unit individu dalam populasi.

Sebelum menghitung nilai rata-rata, perlu dilakukan pengelompokan unit-unit populasi yang diteliti, mengidentifikasi kelompok-kelompok yang secara kualitatif homogen.

Rata-rata yang dihitung untuk penduduk secara keseluruhan disebut rata-rata keseluruhan, dan untuk setiap kelompok – rata-rata kelompok.

Ada dua jenis rata-rata: pangkat (rata-rata aritmatika, rata-rata harmonik, rata-rata geometri, rata-rata kuadrat); struktural (modus, median, kuartil, desil).

Pilihan rata-rata untuk perhitungan tergantung pada tujuannya.

Jenis rata-rata daya dan metode perhitungannya. Dalam praktek pengolahan statistik bahan yang dikumpulkan, muncul berbagai masalah yang penyelesaiannya memerlukan rata-rata yang berbeda-beda.

Statistik matematika memperoleh berbagai rata-rata dari rumus rata-rata daya:

dimana nilai rata-ratanya; x – opsi individual (nilai fitur); z – eksponen (dengan z = 1 – mean aritmatika, z = 0 mean geometri, z = - 1 – mean harmonik, z = 2 – mean kuadrat).

Namun, pertanyaan tentang jenis rata-rata apa yang harus diterapkan dalam setiap kasus diselesaikan melalui analisis spesifik terhadap populasi yang diteliti.

Jenis rata-rata yang paling umum dalam statistik adalah rata-rata aritmatika. Ini dihitung dalam kasus di mana volume karakteristik rata-rata dibentuk sebagai jumlah nilainya untuk masing-masing unit populasi statistik yang diteliti.

Bergantung pada sifat data awal, mean aritmatika ditentukan dengan berbagai cara:

Jika datanya tidak dikelompokkan, maka perhitungannya dilakukan dengan menggunakan rumus rata-rata sederhana

Perhitungan mean aritmatika dalam deret diskrit terjadi menurut rumus 3.4.

Perhitungan mean aritmatika dalam deret interval. Dalam deret variasi interval, di mana nilai suatu karakteristik pada setiap kelompok secara konvensional dianggap berada di tengah interval, rata-rata aritmatika mungkin berbeda dari rata-rata yang dihitung dari data yang tidak dikelompokkan. Selain itu, semakin besar interval dalam kelompok, semakin besar kemungkinan penyimpangan rata-rata yang dihitung dari data yang dikelompokkan dari rata-rata yang dihitung dari data yang tidak dikelompokkan.

Saat menghitung rata-rata pada rangkaian variasi interval, untuk melakukan penghitungan yang diperlukan, seseorang berpindah dari interval ke titik tengahnya. Kemudian rata-ratanya dihitung menggunakan rumus rata-rata aritmatika tertimbang.

Sifat-sifat mean aritmatika. Rata-rata aritmatika memiliki beberapa sifat yang memungkinkan untuk menyederhanakan perhitungan; mari kita pertimbangkannya.

1. Rata-rata aritmatika dari bilangan konstan sama dengan bilangan konstan tersebut.

Jika x = a. Kemudian .

2. Jika bobot semua pilihan diubah secara proporsional, mis. bertambah atau berkurang dengan jumlah yang sama, maka rata-rata aritmatika deret baru tersebut tidak akan berubah.

Jika semua bobot f dikurangi sebanyak k kali, maka .

3. Jumlah deviasi positif dan negatif masing-masing opsi dari rata-rata, dikalikan dengan bobot, sama dengan nol, yaitu.

Jika, maka. Dari sini.

Jika semua pilihan dikurangi atau ditambah dengan angka berapa pun, maka rata-rata aritmatika dari deret baru tersebut akan berkurang atau bertambah dengan jumlah yang sama.

Mari kita kurangi semua pilihan X pada A, yaitu X´ = XA.

Kemudian

Rata-rata aritmatika dari deret asli dapat diperoleh dengan menambahkan ke rata-rata tereduksi bilangan yang sebelumnya dikurangkan dari pilihan A, yaitu .

5. Jika semua pilihan dikurangi atau ditambah k kali, maka rata-rata aritmatika deret baru tersebut akan berkurang atau bertambah dengan jumlah yang sama, yaitu. V k sekali.

Biarkan saja .

Oleh karena itu, yaitu. untuk mendapatkan rata-rata deret aslinya, rata-rata aritmatika deret baru (dengan varian tereduksi) harus ditambah sebesar k sekali.

Arti harmonik. Rata-rata harmonik adalah kebalikan dari rata-rata aritmatika. Ini digunakan ketika informasi statistik tidak memuat frekuensi untuk masing-masing varian populasi, tetapi disajikan sebagai produknya (M = xf). Rata-rata harmonik akan dihitung menggunakan rumus 3.5

Penerapan praktis dari mean harmonik adalah untuk menghitung beberapa indeks, khususnya indeks harga.

Rata-rata geometris. Saat menggunakan mean geometrik, nilai individual dari suatu karakteristik, sebagai suatu peraturan, adalah nilai relatif dari dinamika, yang dikonstruksi dalam bentuk nilai rantai, sebagai rasio terhadap level sebelumnya dari setiap level dalam rangkaian dinamika. Dengan demikian, rata-rata mencirikan tingkat pertumbuhan rata-rata.

Nilai rata-rata geometrik juga digunakan untuk menentukan nilai jarak yang sama dari nilai maksimum dan minimum suatu karakteristik. Misalnya, sebuah perusahaan asuransi mengadakan kontrak untuk penyediaan layanan asuransi mobil. Tergantung pada peristiwa tertentu yang diasuransikan, pembayaran asuransi dapat berkisar antara 10.000 hingga 100.000 dolar per tahun. Jumlah rata-rata pembayaran asuransi adalah USD.

Rata-rata geometrik adalah besaran yang digunakan sebagai rata-rata perbandingan atau deret distribusi yang disajikan dalam bentuk barisan geometri jika z = 0. Rata-rata ini mudah digunakan jika perhatian tidak diberikan pada perbedaan mutlak, tetapi pada perbandingan dua. angka.

Rumus perhitungannya adalah sebagai berikut

dimana varian karakteristik dirata-ratakan; – produk pilihan; F– frekuensi pilihan.

Rata-rata geometrik digunakan dalam perhitungan tingkat pertumbuhan tahunan rata-rata.

Berarti persegi. Rumus mean square digunakan untuk mengukur derajat fluktuasi nilai individu suatu karakteristik di sekitar mean aritmatika dalam deret distribusi. Jadi, ketika menghitung indikator variasi, rata-rata dihitung dari kuadrat deviasi nilai individu suatu karakteristik dari mean aritmatika.

Nilai akar rata-rata kuadrat dihitung menggunakan rumus

Dalam penelitian ekonomi, mean square yang dimodifikasi banyak digunakan dalam menghitung indikator variasi suatu karakteristik, seperti dispersi dan standar deviasi.

Aturan mayoritas. Terdapat hubungan antara rata-rata pangkat sebagai berikut - semakin besar eksponennya, semakin besar pula nilai rata-ratanya, Tabel 5.4:

Tabel 5.4

Hubungan antar rata-rata

nilai z

Hubungan antar rata-rata

Hubungan ini disebut aturan mayoritas.

Rata-rata struktural. Untuk mengkarakterisasi struktur penduduk digunakan indikator khusus, yang dapat disebut rata-rata struktural. Indikator tersebut meliputi modus, median, kuartil, dan desil.

Mode. Modus (Mo) adalah nilai suatu karakteristik yang paling sering muncul di antara unit-unit populasi. Modus adalah nilai atribut yang sesuai dengan titik maksimum kurva distribusi teoritis.

Fashion banyak digunakan dalam praktik komersial ketika mempelajari permintaan konsumen (saat menentukan ukuran pakaian dan sepatu yang banyak diminati), dan mencatat harga. Mungkin ada beberapa mod secara total.

Perhitungan modus dalam rangkaian diskrit. Dalam rangkaian diskrit, modus adalah varian dengan frekuensi tertinggi. Mari kita pertimbangkan untuk mencari modus dalam deret diskrit.

Perhitungan modus dalam deret interval. Dalam rangkaian variasi interval, modus kira-kira dianggap sebagai varian sentral dari interval modal, yaitu. interval yang mempunyai frekuensi (frekuensi) tertinggi. Dalam interval tersebut, Anda perlu menemukan nilai atribut yang merupakan mode. Untuk deret interval, modusnya ditentukan oleh rumus

dimana adalah batas bawah interval modal; – nilai interval modal; – frekuensi yang sesuai dengan interval modal; – frekuensi sebelum interval modal; – frekuensi interval setelah modal.

median. Median () adalah nilai atribut unit tengah dari rangkaian rangking. Seri yang diperingkat adalah seri yang nilai atributnya ditulis dalam urutan menaik atau menurun. Atau median adalah nilai yang membagi banyaknya deret variasi terurut menjadi dua bagian yang sama besar: bagian yang satu mempunyai nilai karakteristik bervariasi yang lebih kecil dari pilihan rata-rata, dan bagian yang lain mempunyai nilai yang lebih besar.

Untuk mencari median, tentukan dulu bilangan urutnya. Caranya, jika jumlah satuan ganjil, satu ditambahkan ke jumlah semua frekuensi dan semuanya dibagi dua. Dengan jumlah satuan genap, median ditemukan sebagai nilai atribut suatu satuan, yang nomor urutnya ditentukan oleh jumlah total frekuensi dibagi dua. Mengetahui nomor urut median, mudah untuk menemukan nilainya menggunakan frekuensi akumulasi.

Perhitungan median dalam deret diskrit. Berdasarkan survei sampel diperoleh data sebaran keluarga menurut jumlah anak, tabel. 5.5. Untuk menentukan mediannya, kita tentukan terlebih dahulu bilangan urutnya

Dalam keluarga tersebut jumlah anak sama dengan 2, maka = 2. Jadi, pada 50% keluarga jumlah anak tidak melebihi 2.

– akumulasi frekuensi sebelum interval median;

Di satu sisi, ini adalah properti yang sangat positif karena dalam hal ini, pengaruh semua penyebab yang mempengaruhi semua unit populasi yang diteliti diperhitungkan. Di sisi lain, bahkan satu pengamatan yang dimasukkan secara kebetulan ke dalam sumber data dapat secara signifikan mendistorsi gagasan tentang tingkat perkembangan sifat yang dipelajari dalam populasi yang dipertimbangkan (terutama dalam seri pendek).

Kuartil dan desil. Dengan analogi mencari median dalam deret variasi, Anda dapat mencari nilai suatu karakteristik untuk setiap unit deret berperingkat. Jadi, khususnya, Anda dapat menemukan nilai atribut untuk satuan yang membagi suatu deret menjadi 4 bagian yang sama, menjadi 10, dan seterusnya.

Kuartil. Opsi yang membagi deret rangking menjadi empat bagian yang sama disebut kuartil.

Dalam hal ini, mereka membedakan: kuartil bawah (atau pertama) (Q1) - nilai atribut untuk unit rangkaian peringkat, membagi populasi dengan rasio hingga ¾ dan kuartil atas (atau ketiga) ( Q3) - nilai atribut untuk unit rangkaian peringkat yang membagi populasi dengan rasio ¾ hingga ¼.

– frekuensi interval kuartil (bawah dan atas)

Interval yang mengandung Q1 dan Q3 ditentukan oleh akumulasi frekuensi (atau frekuensi).

Desil. Selain kuartil, desil dihitung - opsi yang membagi rangkaian peringkat menjadi 10 bagian yang sama.

Mereka ditandai dengan D, desil pertama D1 membagi seri dengan perbandingan 1/10 dan 9/10, D2 kedua - 2/10 dan 8/10, dst. Mereka dihitung menurut skema yang sama seperti median dan kuartil.

Baik median, kuartil, dan desil termasuk dalam apa yang disebut statistik ordinal, yang dipahami sebagai opsi yang menempati tempat ordinal tertentu dalam rangkaian peringkat.



Apakah Anda menyukai artikelnya? Bagikan dengan teman Anda!