શ્રેણી અંતરાલ વિવિધતા શ્રેણીના વિવિધતા શ્રેણીના પ્રકારો. વિવિધતા અને આંકડાકીય વિતરણ શ્રેણી

વિવિધતા શ્રેણી - આ એક આંકડાકીય શ્રેણી છે જે કોઈપણ માત્રાત્મક લાક્ષણિકતાના મૂલ્ય અનુસાર અભ્યાસ હેઠળની ઘટનાનું વિતરણ દર્શાવે છે. ઉદાહરણ તરીકે, વય દ્વારા દર્દીઓ, સારવારની અવધિ, વજન દ્વારા નવજાત શિશુ વગેરે.

વિકલ્પ - લાક્ષણિકતાના વ્યક્તિગત મૂલ્યો કે જેના દ્વારા જૂથીકરણ હાથ ધરવામાં આવે છે (નિર્ધારિત વી ) .

આવર્તન- ચોક્કસ વિકલ્પ કેટલી વાર થાય છે તે દર્શાવતી સંખ્યા (નિર્ધારિત પી ) . તમામ ફ્રીક્વન્સીઝનો સરવાળો દર્શાવે છે કુલ સંખ્યા અવલોકનો અને નિયુક્ત કરવામાં આવે છે n . વિવિધતા શ્રેણીના સૌથી મોટા અને નાના ચલ વચ્ચેના તફાવતને કહેવામાં આવે છે ગાળો અથવા કંપનવિસ્તાર .

વિવિધ શ્રેણીઓ છે:

1. અવ્યવસ્થિત (અલગ) અને સતત.

શ્રેણીને સતત ગણવામાં આવે છે જો જૂથની લાક્ષણિકતાને અપૂર્ણાંક જથ્થામાં (વજન, ઊંચાઈ, વગેરે) વ્યક્ત કરી શકાય છે, જો જૂથની લાક્ષણિકતા માત્ર પૂર્ણાંક (અપંગતાના દિવસો, પલ્સ બીટ્સની સંખ્યા, વગેરે) તરીકે દર્શાવવામાં આવે તો તે અસંતુલિત માનવામાં આવે છે.

2.સરળ અને સંતુલિત.

એક સરળ ભિન્નતા શ્રેણી એ એક શ્રેણી છે જેમાં વિવિધ લાક્ષણિકતાનું માત્રાત્મક મૂલ્ય એકવાર થાય છે. ભારિત વિવિધતા શ્રેણીમાં, વિવિધ લાક્ષણિકતાના જથ્થાત્મક મૂલ્યો ચોક્કસ આવર્તન સાથે પુનરાવર્તિત થાય છે.

3. જૂથબદ્ધ (અંતરાલ) અને જૂથ વિનાનું.

જૂથબદ્ધ શ્રેણીમાં જૂથોમાં સંયુક્ત વિકલ્પો હોય છે જે તેમને ચોક્કસ અંતરાલમાં કદ દ્વારા એક કરે છે. જૂથ વિનાની શ્રેણીમાં, દરેક વ્યક્તિગત વિકલ્પ ચોક્કસ આવર્તનને અનુરૂપ હોય છે.

4. સમ અને વિષમ.

સમ ભિન્નતા શ્રેણીમાં, ફ્રીક્વન્સીઝનો સરવાળો અથવા અવલોકનોની કુલ સંખ્યા એક બેકી સંખ્યા દ્વારા, બેકી સંખ્યામાં - એક વિષમ સંખ્યા દ્વારા દર્શાવવામાં આવે છે.

5. સપ્રમાણ અને અસમપ્રમાણ.

સપ્રમાણ વિવિધતા શ્રેણીમાં, તમામ પ્રકારના સરેરાશ મૂલ્યો એકરૂપ થાય છે અથવા ખૂબ નજીક છે (મોડ, મધ્ય, અંકગણિત સરેરાશ).

સેનિટરી આંકડાઓમાં, આંકડાકીય સંશોધનના વિશિષ્ટ કાર્યો અને લક્ષ્યો તેમજ સ્ત્રોત સામગ્રીની સામગ્રી પર, અભ્યાસ કરવામાં આવતી ઘટનાની પ્રકૃતિના આધારે. નીચેના પ્રકારના સરેરાશનો ઉપયોગ થાય છે:

માળખાકીય અર્થ (મોડ, મધ્ય);

અંકગણિત સરેરાશ;

હાર્મોનિક સરેરાશ;

ભૌમિતિક સરેરાશ;

સરેરાશ પ્રગતિશીલ.

ફેશન (એમ ) - વિવિધ લાક્ષણિકતાનું મૂલ્ય, જેનો અભ્યાસ કરવામાં આવતી વસ્તીમાં વધુ વખત જોવા મળે છે, એટલે કે. સૌથી વધુ આવર્તનને અનુરૂપ વિકલ્પ. તેઓ તેને કોઈપણ ગણતરીઓનો આશરો લીધા વિના, વિવિધતા શ્રેણીના બંધારણમાંથી સીધા જ શોધે છે. તે સામાન્ય રીતે અંકગણિત સરેરાશની ખૂબ નજીકનું મૂલ્ય છે અને વ્યવહારમાં ખૂબ અનુકૂળ છે.

મધ્યક (એમ ) - વિવિધતા શ્રેણી (ક્રમાંકિત, એટલે કે વિકલ્પના મૂલ્યો ચડતા અથવા ઉતરતા ક્રમમાં ગોઠવાયેલા છે) ને બે સમાન ભાગોમાં વિભાજિત કરવું. મધ્યકની ગણતરી કહેવાતી વિષમ શ્રેણીનો ઉપયોગ કરીને કરવામાં આવે છે, જે ફ્રીક્વન્સીઝના ક્રમિક સમીકરણ દ્વારા મેળવવામાં આવે છે. જો ફ્રીક્વન્સીઝનો સરવાળો એક સમાન સંખ્યાને અનુરૂપ હોય, તો બે સરેરાશ મૂલ્યોના અંકગણિત સરેરાશને પરંપરાગત રીતે મધ્યક તરીકે લેવામાં આવે છે.

ખુલ્લી વસ્તીના કિસ્સામાં મોડ અને મધ્યનો ઉપયોગ થાય છે, એટલે કે. જ્યારે સૌથી મોટા અથવા નાના વિકલ્પોમાં ચોક્કસ જથ્થાત્મક લાક્ષણિકતા હોતી નથી (ઉદાહરણ તરીકે, 15 વર્ષ સુધી, 50 અને તેથી વધુ ઉંમરના, વગેરે). આ કિસ્સામાં, અંકગણિત સરેરાશ (પેરામેટ્રિક લાક્ષણિકતાઓ) ની ગણતરી કરી શકાતી નથી.

સરેરાશ હું અંકગણિત છું - સૌથી સામાન્ય મૂલ્ય. અંકગણિત સરેરાશ ઘણીવાર દ્વારા સૂચવવામાં આવે છે એમ.

ત્યાં સરળ અને ભારિત અંકગણિત સરેરાશ છે.

સરળ અંકગણિત સરેરાશ ગણતરી કરેલ:

- એવા કિસ્સાઓમાં જ્યાં વસ્તી દરેક એકમ માટે લાક્ષણિકતાના જ્ઞાનની સરળ સૂચિ દ્વારા રજૂ થાય છે;

- જો દરેક વિકલ્પની પુનરાવર્તનની સંખ્યા નક્કી કરી શકાતી નથી;

- જો દરેક વિકલ્પની પુનરાવર્તનોની સંખ્યા એકબીજાની નજીક હોય.

સરળ અંકગણિત સરેરાશની ગણતરી સૂત્રનો ઉપયોગ કરીને કરવામાં આવે છે:

જ્યાં વી - લાક્ષણિકતાના વ્યક્તિગત મૂલ્યો; n - વ્યક્તિગત મૂલ્યોની સંખ્યા;
- સમીકરણ ચિહ્ન.

આમ, સરળ સરેરાશ એ અવલોકનોની સંખ્યા અને ચલોના સરવાળાનો ગુણોત્તર છે.

ઉદાહરણ: ન્યુમોનિયાવાળા 10 દર્દીઓ માટે પથારીમાં રહેવાની સરેરાશ લંબાઈ નક્કી કરો:

16 દિવસ - 1 દર્દી; 17-1; 18-1; 19-1; 20-1; 21-1; 22-1; 23-1; 26-1; 31-1.

પથારીનો દિવસ

અંકગણિત સરેરાશ ભારાંકિત એવા કિસ્સાઓમાં ગણવામાં આવે છે જ્યાં લાક્ષણિકતાના વ્યક્તિગત મૂલ્યોનું પુનરાવર્તન થાય છે. તેની ગણતરી બે રીતે કરી શકાય છે:

1. સૂત્ર અનુસાર સીધી રીતે (અંકગણિત સરેરાશ અથવા સીધી પદ્ધતિ):

,

જ્યાં P એ દરેક વિકલ્પના અવલોકનોની આવર્તન (કેસોની સંખ્યા) છે.

આમ, ભારાંકિત અંકગણિત સરેરાશ એ અવલોકનોની સંખ્યા અને આવર્તનનાં ઉત્પાદનોના સરવાળાનો ગુણોત્તર છે.

2. શરતી સરેરાશ (ક્ષણોની પદ્ધતિનો ઉપયોગ કરીને) માંથી વિચલનોની ગણતરી કરીને.

ભારિત અંકગણિત સરેરાશની ગણતરી માટેનો આધાર છે:

- માત્રાત્મક લાક્ષણિકતાના પ્રકારો અનુસાર જૂથબદ્ધ સામગ્રી;

— બધા વિકલ્પો એટ્રિબ્યુટ (ક્રમાંકિત શ્રેણી) ના મૂલ્યના ચડતા અથવા ઉતરતા ક્રમમાં ગોઠવાયેલા હોવા જોઈએ.

ક્ષણ પદ્ધતિનો ઉપયોગ કરીને ગણતરી કરવા માટે, પૂર્વશરત એ તમામ અંતરાલોનું સમાન કદ છે.

ક્ષણોની પદ્ધતિનો ઉપયોગ કરીને, અંકગણિત સરેરાશની ગણતરી સૂત્રનો ઉપયોગ કરીને કરવામાં આવે છે:

,

જ્યાં M o એ શરતી સરેરાશ છે, જે ઘણીવાર ઉચ્ચતમ આવર્તનને અનુરૂપ લાક્ષણિકતાના મૂલ્ય તરીકે લેવામાં આવે છે, એટલે કે. જે વધુ વખત પુનરાવર્તિત થાય છે (ફેશન).

i એ અંતરાલનું મૂલ્ય છે.

a એ એવરેજની શરતોમાંથી એક શરતી વિચલન છે, જે મોટી શરતી સરેરાશના ચલો માટે + ચિહ્ન સાથે અને – ચિહ્ન (–1, –2, વગેરે) સાથે સંખ્યાઓની ક્રમિક શ્રેણી (1, 2, વગેરે) છે. .) વેરિઅન્ટ્સ માટે, જે પરંપરાગત સરેરાશથી નીચે છે. શરતી સરેરાશ તરીકે લેવામાં આવેલ વેરિઅન્ટમાંથી શરતી વિચલન 0 છે.

પી - ફ્રીક્વન્સીઝ.

- અવલોકનોની કુલ સંખ્યા અથવા n.

ઉદાહરણ: 8 વર્ષના છોકરાઓની સરેરાશ ઊંચાઈ સીધી નક્કી કરો (કોષ્ટક 1).

કોષ્ટક 1

cm માં ઊંચાઈ

છોકરાઓ પી

સેન્ટ્રલ

વિકલ્પ વી

કેન્દ્રિય વિકલ્પ - અંતરાલની મધ્યમાં - બે પડોશી જૂથોના પ્રારંભિક મૂલ્યોના અર્ધ-સરવાળા તરીકે વ્યાખ્યાયિત કરવામાં આવે છે:

;
વગેરે

ઉત્પાદન VP એ કેન્દ્રીય ચલોને ફ્રીક્વન્સીઝ દ્વારા ગુણાકાર કરીને મેળવવામાં આવે છે
;
વગેરે પછી પરિણામી ઉત્પાદનો ઉમેરવામાં આવે છે અને મેળવવામાં આવે છે
, જેને અવલોકનોની સંખ્યા (100) વડે ભાગવામાં આવે છે અને ભારિત અંકગણિત સરેરાશ પ્રાપ્ત થાય છે.

સેમી

અમે ક્ષણોની પદ્ધતિનો ઉપયોગ કરીને સમાન સમસ્યાને હલ કરીશું, જેના માટે નીચેનું કોષ્ટક 2 સંકલિત કરવામાં આવ્યું છે:

કોષ્ટક 2

સેમી (V) માં ઊંચાઈ

છોકરાઓ પી

n=100

આપણે 122 ને M o તરીકે લઈએ છીએ, કારણ કે 100 અવલોકનોમાંથી, 33 લોકોની ઊંચાઈ 122 સેમી હતી. અમે ઉપરોક્ત અનુસાર શરતી સરેરાશમાંથી શરતી વિચલનો (a) શોધીએ છીએ. પછી આપણે ફ્રીક્વન્સીઝ (aP) દ્વારા શરતી વિચલનોનું ઉત્પાદન મેળવીએ છીએ અને પ્રાપ્ત મૂલ્યોનો સરવાળો કરીએ છીએ (
). પરિણામ 17 છે. અંતે, અમે ડેટાને ફોર્મ્યુલામાં બદલીએ છીએ:

વિવિધ લાક્ષણિકતાનો અભ્યાસ કરતી વખતે, વ્યક્તિ ફક્ત સરેરાશ મૂલ્યોની ગણતરી કરવા માટે પોતાને મર્યાદિત કરી શકતો નથી. અભ્યાસ કરવામાં આવતી લાક્ષણિકતાઓની વિવિધતાની ડિગ્રી દર્શાવતા સૂચકોની ગણતરી કરવી પણ જરૂરી છે. આંકડાકીય વસ્તીના તમામ એકમો માટે એક અથવા બીજી માત્રાત્મક લાક્ષણિકતાનું મૂલ્ય સમાન નથી.

વિવિધતા શ્રેણીની લાક્ષણિકતા પ્રમાણભૂત વિચલન છે ( ), જે અંકગણિત સરેરાશને સંબંધિત અભ્યાસ કરેલ લાક્ષણિકતાઓનો ફેલાવો (વિખેરવું) દર્શાવે છે, એટલે કે. વિવિધતા શ્રેણીની પરિવર્તનક્ષમતા દર્શાવે છે. તે સૂત્રનો ઉપયોગ કરીને સીધા જ નક્કી કરી શકાય છે:

પ્રમાણભૂત વિચલન એ અંકગણિત સરેરાશ (V–M) 2 માંથી દરેક વિકલ્પના વર્ગ વિચલનોના ઉત્પાદનના સરવાળાના વર્ગમૂળની બરાબર છે તેની આવર્તનો દ્વારા વિભાજિત ફ્રીક્વન્સીઝ (
).

ગણતરી ઉદાહરણ: દરરોજ ક્લિનિકમાં જારી કરાયેલ બીમાર પાંદડાઓની સરેરાશ સંખ્યા નક્કી કરો (કોષ્ટક 3).

કોષ્ટક 3

માંદા દિવસોની સંખ્યા

શીટ્સ જારી

દિવસ દીઠ ડૉક્ટર (V)

ડોકટરોની સંખ્યા (P)

;

છેદમાં, જ્યારે અવલોકનોની સંખ્યા 30 કરતા ઓછી હોય, ત્યારે તે જરૂરી છે
એક બાદબાકી કરો.

જો શ્રેણી સમાન અંતરાલો પર જૂથબદ્ધ કરવામાં આવે છે, તો ક્ષણોની પદ્ધતિનો ઉપયોગ કરીને પ્રમાણભૂત વિચલન નક્કી કરી શકાય છે:

,

જ્યાં હું અંતરાલનું મૂલ્ય છે;

- શરતી સરેરાશથી શરતી વિચલન;

પી - અનુરૂપ અંતરાલોનું આવર્તન વેરિઅન્ટ;

- અવલોકનોની કુલ સંખ્યા.

ઉદાહરણ ગણતરી : રોગનિવારક પથારી પર દર્દીઓના રોકાણની સરેરાશ લંબાઈ નક્કી કરો (ક્ષણોની પદ્ધતિનો ઉપયોગ કરીને) (કોષ્ટક 4):

કોષ્ટક 4

દિવસોની સંખ્યા

પથારી પર રહો (V)

બીમાર (પી)

;

બેલ્જિયન આંકડાશાસ્ત્રી એ. ક્વેટલેટે શોધ્યું કે સામૂહિક ઘટનાઓમાં ભિન્નતા ભૂલ વિતરણના નિયમનું પાલન કરે છે, કે. ગૌસ અને પી. લેપ્લેસ દ્વારા લગભગ એકસાથે શોધાયું હતું. આ વિતરણનું પ્રતિનિધિત્વ કરતી વળાંક ઘંટડીનો આકાર ધરાવે છે. સામાન્ય વિતરણ કાયદા અનુસાર, લાક્ષણિકતાના વ્યક્તિગત મૂલ્યોની પરિવર્તનશીલતા મર્યાદાની અંદર છે
, જે વસ્તીના તમામ એકમોના 99.73%ને આવરી લે છે.

તે ગણતરી કરવામાં આવી છે કે જો તમે અંકગણિત સરેરાશમાં 2 ઉમેરો અને બાદ કરો , તો ભિન્નતા શ્રેણીના તમામ સભ્યોમાંથી 95.45% પ્રાપ્ત મૂલ્યોની અંદર છે અને અંતે, જો આપણે અંકગણિત સરેરાશમાં 1 ઉમેરી અને બાદ કરીએ , તો આ વિવિધતા શ્રેણીના તમામ સભ્યોમાંથી 68.27% પ્રાપ્ત મૂલ્યોની અંદર હશે. તીવ્રતા સાથે દવામાં
1ધોરણની વિભાવના સાથે સંકળાયેલ. અંકગણિત સરેરાશમાંથી વિચલન 1 કરતાં વધુ છે , પરંતુ 2 કરતા ઓછા અસાધારણ છે, અને વિચલન 2 કરતાં વધુ છે અસામાન્ય (સામાન્ય ઉપર અથવા નીચે).

આરોગ્યના આંકડાઓમાં, શારીરિક વિકાસનો અભ્યાસ કરતી વખતે, આરોગ્યસંભાળ સંસ્થાઓની કામગીરીનું મૂલ્યાંકન કરતી વખતે અને વસ્તીના સ્વાસ્થ્યનું મૂલ્યાંકન કરતી વખતે થ્રી-સિગ્મા નિયમનો ઉપયોગ થાય છે. ધોરણો નક્કી કરતી વખતે રાષ્ટ્રીય અર્થતંત્રમાં સમાન નિયમનો વ્યાપકપણે ઉપયોગ થાય છે.

આમ, પ્રમાણભૂત વિચલન આ માટે સેવા આપે છે:

- વિવિધતા શ્રેણીના વિક્ષેપનું માપ;

- લાક્ષણિકતાઓની વિવિધતાની ડિગ્રીની લાક્ષણિકતાઓ, જે વિવિધતાના ગુણાંક દ્વારા નક્કી કરવામાં આવે છે:

જો વિવિધતાનો ગુણાંક 20% થી વધુ હોય - મજબૂત વિવિધતા, 20 થી 10% - સરેરાશ, 10% થી ઓછી - લક્ષણોની નબળી વિવિધતા. ભિન્નતાના ગુણાંક એ અંકગણિત સરેરાશની વિશ્વસનીયતા માટે ચોક્કસ અંશે માપદંડ છે.

જૂથ પદ્ધતિ તમને માપવાની પણ મંજૂરી આપે છે વિવિધતા(પરિવર્તનશીલતા, વધઘટ) ચિહ્નોની. જ્યારે વસ્તીમાં એકમોની સંખ્યા પ્રમાણમાં ઓછી હોય છે, ત્યારે વસ્તી બનાવે છે તેવા એકમોની ક્રમાંકિત સંખ્યાના આધારે વિવિધતા માપવામાં આવે છે. શ્રેણી કહેવામાં આવે છે ક્રમાંકિત,જો એકમો લાક્ષણિકતાના ચડતા (ઉતરતા) ક્રમમાં ગોઠવાયેલા હોય.

જો કે, જ્યારે ભિન્નતાની તુલનાત્મક લાક્ષણિકતાની જરૂર હોય ત્યારે ક્રમાંકિત શ્રેણી તદ્દન સૂચક હોય છે. વધુમાં, ઘણા કિસ્સાઓમાં અમારે સંખ્યાબંધ એકમોનો સમાવેશ કરતી આંકડાકીય વસ્તી સાથે વ્યવહાર કરવો પડે છે, જે ચોક્કસ શ્રેણીના સ્વરૂપમાં રજૂ કરવું વ્યવહારીક રીતે મુશ્કેલ છે. આ સંદર્ભે, આંકડાકીય માહિતી સાથે પ્રારંભિક સામાન્ય પરિચય માટે અને ખાસ કરીને લાક્ષણિકતાઓમાં ભિન્નતાના અભ્યાસની સુવિધા માટે, અભ્યાસ હેઠળની ઘટનાઓ અને પ્રક્રિયાઓને સામાન્ય રીતે જૂથોમાં જોડવામાં આવે છે, અને જૂથના પરિણામો જૂથ કોષ્ટકોના સ્વરૂપમાં રજૂ કરવામાં આવે છે.

જો જૂથ કોષ્ટકમાં ફક્ત બે કૉલમ હોય - પસંદ કરેલ લાક્ષણિકતા (વિકલ્પો) અને જૂથોની સંખ્યા (આવર્તન અથવા આવર્તન) અનુસાર જૂથો, તેને કહેવામાં આવે છે. વિતરણની નજીક.

વિતરણ શ્રેણી -એક લાક્ષણિકતા પર આધારિત માળખાકીય જૂથીકરણનો સૌથી સરળ પ્રકાર, લાક્ષણિકતાના પ્રકારો અને ફ્રીક્વન્સીઝ ધરાવતા બે કૉલમ સાથે જૂથ કોષ્ટકમાં પ્રદર્શિત થાય છે. ઘણા કિસ્સાઓમાં, આવા માળખાકીય જૂથ સાથે, એટલે કે. વિતરણ શ્રેણીના સંકલન સાથે, પ્રારંભિક આંકડાકીય સામગ્રીનો અભ્યાસ શરૂ થાય છે.

વિતરણ શ્રેણીના સ્વરૂપમાં માળખાકીય જૂથને વાસ્તવિક માળખાકીય જૂથમાં ફેરવી શકાય છે જો પસંદ કરેલા જૂથોને માત્ર ફ્રીક્વન્સીઝ દ્વારા જ નહીં, પરંતુ અન્ય આંકડાકીય સૂચકાંકો દ્વારા પણ દર્શાવવામાં આવે છે. વિતરણ શ્રેણીનો મુખ્ય હેતુ લાક્ષણિકતાઓની વિવિધતાનો અભ્યાસ કરવાનો છે. વિતરણ શ્રેણીનો સિદ્ધાંત ગાણિતિક આંકડાઓ દ્વારા વિગતવાર વિકસાવવામાં આવ્યો છે.

વિતરણ શ્રેણી વિભાજિત કરવામાં આવે છે વિશેષતા(લાક્ષણિક લાક્ષણિકતાઓ અનુસાર જૂથ બનાવવું, ઉદાહરણ તરીકે, જાતિ, રાષ્ટ્રીયતા, વૈવાહિક સ્થિતિ, વગેરે દ્વારા વસ્તીને વિભાજીત કરવી) અને વિવિધતાલક્ષી(માત્રાત્મક લાક્ષણિકતાઓ દ્વારા જૂથબદ્ધ કરવું).

વિવિધતા શ્રેણીએક જૂથ કોષ્ટક છે જેમાં બે કૉલમ છે: એક માત્રાત્મક લાક્ષણિકતા અનુસાર એકમોનું જૂથ અને દરેક જૂથમાં એકમોની સંખ્યા. વિવિધતા શ્રેણીમાં અંતરાલો સામાન્ય રીતે સમાન અને બંધ હોય છે. ભિન્નતા શ્રેણી એ માથાદીઠ સરેરાશ નાણાકીય આવક (કોષ્ટક 3.10) દ્વારા રશિયન વસ્તીનું નીચેનું જૂથ છે.

કોષ્ટક 3.10

2004-2009માં સરેરાશ માથાદીઠ આવક દ્વારા રશિયન વસ્તીનું વિતરણ.

સરેરાશ માથાદીઠ રોકડ આવક દ્વારા વસ્તી જૂથો, rub./month

જૂથમાં વસ્તી, કુલનો %

8 000,1-10 000,0

10 000,1-15 000,0

15 000,1-25 000,0

25,000.0 થી વધુ

સમગ્ર વસ્તી

ભિન્નતા શ્રેણી, બદલામાં, સ્વતંત્ર અને અંતરાલમાં વિભાજિત થાય છે. અલગભિન્નતા શ્રેણી સાંકડી મર્યાદામાં બદલાતી અલગ લાક્ષણિકતાઓના પ્રકારોને જોડે છે. એક અલગ ભિન્નતા શ્રેણીનું ઉદાહરણ એ છે કે તેમના બાળકોની સંખ્યા દ્વારા રશિયન પરિવારોનું વિતરણ.

અંતરાલભિન્નતા શ્રેણી કાં તો સતત લાક્ષણિકતાઓ અથવા વિશાળ શ્રેણીમાં અલગ અલગ લાક્ષણિકતાઓના પ્રકારોને જોડે છે. અંતરાલ એ સરેરાશ માથાદીઠ નાણાકીય આવક દ્વારા રશિયન વસ્તીના વિતરણની વિવિધતા શ્રેણી છે.

અલગ અલગ શ્રેણીનો વ્યવહારમાં વારંવાર ઉપયોગ થતો નથી. દરમિયાન, તેમને સંકલન કરવું મુશ્કેલ નથી, કારણ કે જૂથોની રચના ચોક્કસ પ્રકારો દ્વારા નક્કી કરવામાં આવે છે જે અભ્યાસ કરેલ જૂથ લાક્ષણિકતાઓ ખરેખર ધરાવે છે.

અંતરાલ વિવિધતા શ્રેણી વધુ વ્યાપક છે. તેમને સંકલન કરતી વખતે, જૂથોની સંખ્યા, તેમજ અંતરાલોના કદ વિશે મુશ્કેલ પ્રશ્ન ઊભો થાય છે જે સ્થાપિત થવો જોઈએ.

આ મુદ્દાને ઉકેલવા માટેના સિદ્ધાંતો આંકડાકીય જૂથો બનાવવાની પદ્ધતિના પ્રકરણમાં દર્શાવવામાં આવ્યા છે (ફકરો 3.3 જુઓ).

ભિન્નતા શ્રેણી એ વિવિધ માહિતીને કોમ્પેક્ટ સ્વરૂપમાં સંકુચિત કરવા માટેનું એક માધ્યમ છે; પરંતુ ભિન્નતા શ્રેણીનું સૌથી મહત્વપૂર્ણ મહત્વ એ છે કે તેના આધારે વિવિધતાની વિશિષ્ટ સામાન્ય લાક્ષણિકતાઓની ગણતરી કરવામાં આવે છે (જુઓ પ્રકરણ 7).

ચાલો વિવિધ નમૂના મૂલ્યોને કૉલ કરીએ વિકલ્પોમૂલ્યોની શ્રેણી અને સૂચિત કરો: એક્સ 1 , એક્સ 2,…. સૌ પ્રથમ આપણે ઉત્પાદન કરીશું રેન્જિંગવિકલ્પો, એટલે કે ચડતા અથવા ઉતરતા ક્રમમાં તેમની ગોઠવણી. દરેક વિકલ્પ માટે, તેનું પોતાનું વજન સૂચવવામાં આવે છે, એટલે કે. કુલ વસ્તીમાં આપેલ વિકલ્પના યોગદાનને દર્શાવતી સંખ્યા. આવર્તન અથવા આવર્તન વજન તરીકે કાર્ય કરે છે.

આવર્તન n i વિકલ્પ x iવિચારણા હેઠળના નમૂનાની વસ્તીમાં આપેલ વિકલ્પ કેટલી વાર જોવા મળે છે તે દર્શાવતી સંખ્યા છે.

આવર્તન અથવા સંબંધિત આવર્તન w i વિકલ્પ x iચલની આવર્તનના ગુણોત્તર અને તમામ ચલોની ફ્રીક્વન્સીના સરવાળા સમાન સંખ્યા છે. આવર્તન દર્શાવે છે કે નમૂનાની વસ્તીમાં એકમોના કેટલા પ્રમાણમાં આપેલ પ્રકાર છે.

ચડતા (અથવા ઉતરતા) ક્રમમાં લખેલા તેમના અનુરૂપ વજન (ફ્રીક્વન્સી અથવા ફ્રીક્વન્સીઝ) સાથેના વિકલ્પોનો ક્રમ કહેવાય છે. વિવિધતા શ્રેણી.

વિવિધતા શ્રેણી અલગ અને અંતરાલ છે.

એક અલગ ભિન્નતા શ્રેણી માટે, લાક્ષણિકતાના બિંદુ મૂલ્યો નિર્દિષ્ટ કરવામાં આવે છે, અંતરાલ શ્રેણી માટે, લાક્ષણિકતા મૂલ્યો અંતરાલોના સ્વરૂપમાં નિર્દિષ્ટ કરવામાં આવે છે. દરેક વિકલ્પ - આવર્તન અથવા આવર્તન માટે શું મૂલ્ય સૂચવવામાં આવે છે તેના આધારે વિવિધતા શ્રેણી ફ્રીક્વન્સીઝ અથવા સંબંધિત ફ્રીક્વન્સીઝ (આવર્તન) નું વિતરણ બતાવી શકે છે.

ફ્રીક્વન્સી ડિસ્ટ્રિબ્યુશનની અલગ ભિન્નતા શ્રેણીફોર્મ ધરાવે છે:

આવર્તન સૂત્ર દ્વારા જોવા મળે છે, i = 1, 2, …, m.

ડબલ્યુ 1 +ડબલ્યુ 2 + … + ડબલ્યુ m = 1.

ઉદાહરણ 4.1. આપેલ સંખ્યાઓના સમૂહ માટે

4, 6, 6, 3, 4, 9, 6, 4, 6, 6

ફ્રીક્વન્સી અને ફ્રીક્વન્સી ડિસ્ટ્રિબ્યુશનની અલગ ભિન્નતા શ્રેણી બનાવો.

ઉકેલ . વસ્તીનું પ્રમાણ બરાબર છે n= 10. સ્વતંત્ર આવર્તન વિતરણ શ્રેણીનું સ્વરૂપ છે

અંતરાલ શ્રેણીમાં રેકોર્ડિંગનું સમાન સ્વરૂપ છે.

આવર્તન વિતરણની અંતરાલ વિવિધતા શ્રેણીઆ રીતે લખાયેલ છે:

તમામ ફ્રીક્વન્સીઝનો સરવાળો અવલોકનોની કુલ સંખ્યા જેટલો છે, એટલે કે. કુલ વોલ્યુમ: n = n 1 +n 2 + … + n m

સંબંધિત ફ્રીક્વન્સીઝ (આવર્તન) ના વિતરણની અંતરાલ વિવિધતા શ્રેણીફોર્મ ધરાવે છે:

આવર્તન સૂત્ર દ્વારા જોવા મળે છે, i = 1, 2, …, m.

તમામ ફ્રીક્વન્સીઝનો સરવાળો એક સમાન છે: ડબલ્યુ 1 +ડબલ્યુ 2 + … + ડબલ્યુ m = 1.

ઇન્ટરવલ શ્રેણીનો વ્યવહારમાં મોટાભાગે ઉપયોગ થાય છે. જો ત્યાં ઘણા બધા આંકડાકીય નમૂનાના ડેટા છે અને તેમના મૂલ્યો એક બીજાથી મનસ્વી રીતે નાની રકમથી અલગ છે, તો પછી આ ડેટા માટે એક અલગ શ્રેણી વધુ સંશોધન માટે ખૂબ બોજારૂપ અને અસુવિધાજનક હશે. આ કિસ્સામાં, ડેટા જૂથનો ઉપયોગ થાય છે, એટલે કે. એટ્રિબ્યુટના તમામ મૂલ્યો ધરાવતા અંતરાલને કેટલાક આંશિક અંતરાલોમાં વિભાજિત કરવામાં આવે છે અને, દરેક અંતરાલ માટે આવર્તનની ગણતરી કરીને, એક અંતરાલ શ્રેણી મેળવવામાં આવે છે. ચાલો આંશિક અંતરાલોની લંબાઈ સમાન હશે એમ ધારીને, અંતરાલ શ્રેણી બનાવવા માટેની યોજના વધુ વિગતવાર લખીએ.

2.2 અંતરાલ શ્રેણીનું નિર્માણ

અંતરાલ શ્રેણી બનાવવા માટે તમારે આની જરૂર છે:

અંતરાલોની સંખ્યા નક્કી કરો;

અંતરાલોની લંબાઈ નક્કી કરો;

ધરી પર અંતરાલોનું સ્થાન નક્કી કરો.

નક્કી કરવા માટે અંતરાલોની સંખ્યા k સ્ટર્જિસનું સૂત્ર છે, જે મુજબ

,

જ્યાં n- સમગ્ર એકંદર વોલ્યુમ.

ઉદાહરણ તરીકે, જો કોઈ લાક્ષણિકતા (ચલ) ના 100 મૂલ્યો હોય, તો પછી અંતરાલ શ્રેણી બનાવવા માટે અંતરાલોની સંખ્યાને અંતરાલની સમાન લેવાની ભલામણ કરવામાં આવે છે.

જો કે, ઘણી વાર વ્યવહારમાં, અંતરાલોની સંખ્યા સંશોધક પોતે જ પસંદ કરે છે, ધ્યાનમાં લેતા કે આ સંખ્યા ખૂબ મોટી ન હોવી જોઈએ જેથી શ્રેણી બોજારૂપ ન હોય, પણ ખૂબ નાની પણ ન હોય જેથી અમુક વિતરણ ગુણધર્મો ન ગુમાવે. .

અંતરાલ લંબાઈ h નીચેના સૂત્ર દ્વારા નિર્ધારિત:

,

જ્યાં xમહત્તમ અને x min એ અનુક્રમે વિકલ્પોનું સૌથી મોટું અને સૌથી નાનું મૂલ્ય છે.

કદ કહેવાય છે અવકાશપંક્તિ

અંતરાલો પોતાને બનાવવા માટે, તેઓ જુદી જુદી રીતે આગળ વધે છે. એક સરળ રીત નીચે મુજબ છે. પ્રથમ અંતરાલની શરૂઆત તરીકે લેવામાં આવે છે
. પછી અંતરાલોની બાકીની સીમાઓ સૂત્ર દ્વારા જોવા મળે છે. દેખીતી રીતે, છેલ્લા અંતરાલનો અંત a m+1 એ શરત સંતોષવી આવશ્યક છે

અંતરાલોની તમામ સીમાઓ મળી ગયા પછી, આ અંતરાલોની ફ્રીક્વન્સીઝ (અથવા ફ્રીક્વન્સીઝ) નક્કી કરવામાં આવે છે. આ સમસ્યાને ઉકેલવા માટે, બધા વિકલ્પો જુઓ અને ચોક્કસ અંતરાલમાં આવતા વિકલ્પોની સંખ્યા નક્કી કરો. ચાલો ઉદાહરણનો ઉપયોગ કરીને અંતરાલ શ્રેણીના સંપૂર્ણ બાંધકામને જોઈએ.

ઉદાહરણ 4.2. ચડતા ક્રમમાં નોંધાયેલ નીચેના આંકડાકીય ડેટા માટે, 5 ની બરાબર અંતરાલોની સંખ્યા સાથે અંતરાલ શ્રેણી બનાવો:

11, 12, 12, 14, 14, 15, 21, 21, 22, 23, 25, 38, 38, 39, 42, 42, 44, 45, 50, 50, 55, 56, 58, 60, 62, 63, 65, 68, 68, 68, 70, 75, 78, 78, 78, 78, 80, 80, 86, 88, 90, 91, 91, 91, 91, 91, 93, 93, 95, 96.

ઉકેલ. કુલ n=50 વેરિઅન્ટ મૂલ્યો.

અંતરાલોની સંખ્યા સમસ્યા નિવેદનમાં ઉલ્લેખિત છે, એટલે કે. k=5.

અંતરાલોની લંબાઈ છે
.

ચાલો અંતરાલોની સીમાઓ વ્યાખ્યાયિત કરીએ:

a 1 = 11 − 8,5 = 2,5; a 2 = 2,5 + 17 = 19,5; a 3 = 19,5 + 17 = 36,5;

a 4 = 36,5 + 17 = 53,5; a 5 = 53,5 + 17 = 70,5; a 6 = 70,5 + 17 = 87,5;

a 7 = 87,5 +17 = 104,5.

અંતરાલોની આવર્તન નક્કી કરવા માટે, અમે આપેલ અંતરાલમાં આવતા વિકલ્પોની સંખ્યા ગણીએ છીએ. ઉદાહરણ તરીકે, 2.5 થી 19.5 સુધીના પ્રથમ અંતરાલમાં વિકલ્પો 11, 12, 12, 14, 14, 15 નો સમાવેશ થાય છે. તેમની સંખ્યા 6 છે, તેથી, પ્રથમ અંતરાલની આવૃત્તિ n 1 = 6. પ્રથમ અંતરાલની આવર્તન છે . 19.5 થી 36.5 સુધીના બીજા અંતરાલમાં 21, 21, 22, 23, 25 વિકલ્પોનો સમાવેશ થાય છે, જેની સંખ્યા 5 છે. તેથી, બીજા અંતરાલની આવૃત્તિ n 2 =5, અને આવર્તન . સમાન રીતે તમામ અંતરાલો માટે ફ્રીક્વન્સીઝ અને ફ્રીક્વન્સીઝ મળ્યા પછી, અમે નીચેની અંતરાલ શ્રેણી મેળવીએ છીએ.

આવર્તન વિતરણની અંતરાલ શ્રેણીનું સ્વરૂપ છે:

ફ્રીક્વન્સીઝનો સરવાળો 6+5+9+11+8+11=50 છે.

આવર્તન વિતરણની અંતરાલ શ્રેણીનું સ્વરૂપ છે:

ફ્રીક્વન્સીઝનો સરવાળો 0.12+0.1+0.18+0.22+0.16+0.22=1 છે. ■

અંતરાલ શ્રેણી બનાવતી વખતે, વિચારણા હેઠળની સમસ્યાની ચોક્કસ પરિસ્થિતિઓના આધારે, અન્ય નિયમો લાગુ કરી શકાય છે, એટલે કે

1. અંતરાલ વિવિધતા શ્રેણીમાં વિવિધ લંબાઈના આંશિક અંતરાલો હોઈ શકે છે. અંતરાલોની અસમાન લંબાઈ લાક્ષણિકતાના અસમાન વિતરણ સાથે આંકડાકીય વસ્તીના ગુણધર્મોને પ્રકાશિત કરવાનું શક્ય બનાવે છે. ઉદાહરણ તરીકે, જો અંતરાલોની સીમાઓ શહેરોમાં રહેવાસીઓની સંખ્યા નક્કી કરે છે, તો આ સમસ્યામાં અસમાન લંબાઈના અંતરાલોનો ઉપયોગ કરવાની સલાહ આપવામાં આવે છે. દેખીતી રીતે, નાના શહેરો માટે રહેવાસીઓની સંખ્યામાં નાનો તફાવત મહત્વપૂર્ણ છે, પરંતુ મોટા શહેરો માટે દસ અથવા સેંકડો રહેવાસીઓનો તફાવત નોંધપાત્ર નથી. આંશિક અંતરાલોની અસમાન લંબાઈવાળી અંતરાલ શ્રેણીનો અભ્યાસ મુખ્યત્વે આંકડાશાસ્ત્રના સામાન્ય સિદ્ધાંતમાં કરવામાં આવે છે અને તેમની વિચારણા આ માર્ગદર્શિકાના અવકાશની બહાર છે.

2. ગાણિતિક આંકડાઓમાં, અંતરાલ શ્રેણીને કેટલીકવાર ગણવામાં આવે છે, જેના માટે પ્રથમ અંતરાલની ડાબી સીમા –∞ સમાન માનવામાં આવે છે, અને છેલ્લા અંતરાલની જમણી સીમા +∞. આ આંકડાકીય વિતરણને સૈદ્ધાંતિકની નજીક લાવવા માટે કરવામાં આવે છે.

3. અંતરાલ શ્રેણી બનાવતી વખતે, તે બહાર આવી શકે છે કે અમુક વિકલ્પનું મૂલ્ય અંતરાલની સીમા સાથે બરાબર એકરુપ છે. આ કિસ્સામાં કરવા માટે શ્રેષ્ઠ વસ્તુ નીચે મુજબ છે. જો ત્યાં ફક્ત એક જ સંયોગ છે, તો પછી ધ્યાનમાં લો કે તેની આવર્તન સાથે વિચારણા હેઠળનો વિકલ્પ અંતરાલ શ્રેણીની મધ્યમાં સ્થિત અંતરાલમાં પડ્યો છે, જો ત્યાં આવા ઘણા વિકલ્પો છે, તો પછી તે બધાને અંતરાલો માટે સોંપેલ છે; આ વિકલ્પોની જમણી બાજુએ, અથવા તે બધા ડાબી બાજુએ સોંપેલ છે.

4. અંતરાલોની સંખ્યા અને તેમની લંબાઈ નક્કી કર્યા પછી, અંતરાલોની ગોઠવણી બીજી રીતે કરી શકાય છે. વિકલ્પોના તમામ ગણવામાં આવતા મૂલ્યોનો અંકગણિત સરેરાશ શોધો એક્સબુધ અને પ્રથમ અંતરાલ એવી રીતે બનાવો કે આ નમૂનાની સરેરાશ અમુક અંતરાલની અંદર હશે. આમ, આપણને અંતરાલ મળે છે એક્સબુધ - 0.5 hથી એક્સસરેરાશ.. + 0.5 h. પછી ડાબી અને જમણી બાજુએ, અંતરાલની લંબાઈ ઉમેરીને, અમે બાકીના અંતરાલો ત્યાં સુધી બનાવીએ છીએ xમિનિટ અને xમહત્તમ અનુક્રમે પ્રથમ અને છેલ્લા અંતરાલોમાં આવશે નહીં.

5. મોટી સંખ્યામાં અંતરાલો સાથે અંતરાલ શ્રેણી અનુકૂળ રીતે ઊભી રીતે લખવામાં આવે છે, એટલે કે. અંતરાલો પ્રથમ પંક્તિમાં નહીં, પરંતુ પ્રથમ કૉલમમાં અને બીજી કૉલમમાં ફ્રીક્વન્સીઝ (અથવા ફ્રીક્વન્સીઝ) લખો.

નમૂના ડેટાને કેટલાક રેન્ડમ ચલના મૂલ્યો તરીકે ગણી શકાય એક્સ. રેન્ડમ ચલનો પોતાનો વિતરણ કાયદો હોય છે. સંભાવના સિદ્ધાંત પરથી તે જાણીતું છે કે એક અલગ રેન્ડમ ચલનો વિતરણ કાયદો વિતરણ શ્રેણીના સ્વરૂપમાં સ્પષ્ટ કરી શકાય છે, અને સતત એક માટે - વિતરણ ઘનતા કાર્યનો ઉપયોગ કરીને. જો કે, ત્યાં એક સાર્વત્રિક વિતરણ કાયદો છે જે સ્વતંત્ર અને સતત રેન્ડમ ચલ બંને માટે ધરાવે છે. આ વિતરણ કાયદો વિતરણ કાર્ય તરીકે આપવામાં આવે છે એફ(x) = પી(એક્સ<x). નમૂના ડેટા માટે, તમે વિતરણ કાર્યના એનાલોગનો ઉલ્લેખ કરી શકો છો - પ્રયોગમૂલક વિતરણ કાર્ય.


સંબંધિત માહિતી.


વિવિધતા શ્રેણી: વ્યાખ્યા, પ્રકારો, મુખ્ય લાક્ષણિકતાઓ. ગણતરી પદ્ધતિ
તબીબી અને આંકડાકીય સંશોધનમાં મોડ, મધ્ય, અંકગણિત સરેરાશ
(શરતી ઉદાહરણ સાથે બતાવો).

વૈવિધ્ય શ્રેણી એ અભ્યાસ કરવામાં આવતી લાક્ષણિકતાના સંખ્યાત્મક મૂલ્યોની શ્રેણી છે, જે એક બીજાથી તીવ્રતામાં અલગ છે અને ચોક્કસ ક્રમમાં (ચડતા અથવા ઉતરતા ક્રમમાં) ગોઠવાય છે. શ્રેણીના દરેક આંકડાકીય મૂલ્યને ચલ (V) કહેવામાં આવે છે, અને આપેલ શ્રેણીમાં ચોક્કસ પ્રકાર કેટલી વાર થાય છે તે દર્શાવે છે તે સંખ્યાઓને આવર્તન (p) કહેવામાં આવે છે.

અવલોકન કેસોની કુલ સંખ્યા જે વિવિધતા શ્રેણી બનાવે છે તે અક્ષર n દ્વારા સૂચવવામાં આવે છે. અભ્યાસ કરવામાં આવતી લાક્ષણિકતાઓના અર્થમાં તફાવતને ભિન્નતા કહેવામાં આવે છે. જો વિવિધ લાક્ષણિકતામાં માત્રાત્મક માપ ન હોય, તો ભિન્નતાને ગુણાત્મક કહેવામાં આવે છે, અને વિતરણ શ્રેણીને વિશેષતા કહેવામાં આવે છે (ઉદાહરણ તરીકે, રોગના પરિણામ દ્વારા વિતરણ, આરોગ્યની સ્થિતિ, વગેરે).

જો કોઈ અલગ-અલગ લાક્ષણિકતામાં માત્રાત્મક અભિવ્યક્તિ હોય, તો આવી ભિન્નતાને જથ્થાત્મક કહેવામાં આવે છે, અને વિતરણ શ્રેણીને ભિન્નતા કહેવાય છે.

ભિન્નતા શ્રેણીઓ વિભાજિત કરવામાં આવે છે અખંડ અને સતત - માત્રાત્મક લાક્ષણિકતાની પ્રકૃતિના આધારે સરળ અને ભારિત - વેરિઅન્ટની ઘટનાની આવર્તન પર આધારિત;

સરળ ભિન્નતા શ્રેણીમાં, દરેક વિકલ્પ માત્ર એક જ વાર થાય છે (p=1), ભારિત શ્રેણીમાં, સમાન વિકલ્પ ઘણી વખત થાય છે (p>1). આવી શ્રેણીના ઉદાહરણોની ટેક્સ્ટમાં વધુ ચર્ચા કરવામાં આવશે. જો માત્રાત્મક લાક્ષણિકતા સતત છે, એટલે કે. પૂર્ણાંક જથ્થાઓ વચ્ચે મધ્યવર્તી અપૂર્ણાંક માત્રા હોય છે;

ઉદાહરણ તરીકે: 10.0 - 11.9

14.0 - 15.9, વગેરે.

જો માત્રાત્મક લાક્ષણિકતા અસંતુલિત છે, એટલે કે. તેના વ્યક્તિગત મૂલ્યો (ચલો) પૂર્ણાંક દ્વારા એકબીજાથી ભિન્ન હોય છે અને તેમાં મધ્યવર્તી અપૂર્ણાંક મૂલ્યો હોતા નથી તેને અસંતુલિત અથવા અલગ કહેવામાં આવે છે;

પાછલા ઉદાહરણમાંથી હાર્ટ રેટ ડેટાનો ઉપયોગ કરીને

21 વિદ્યાર્થીઓ માટે, અમે વિવિધતા શ્રેણી (કોષ્ટક 1) બનાવીશું.

કોષ્ટક 1

હૃદય દર (bpm) દ્વારા તબીબી વિદ્યાર્થીઓનું વિતરણ

આમ, ભિન્નતા શ્રેણી બનાવવાનો અર્થ છે ઉપલબ્ધ સંખ્યાત્મક મૂલ્યો (ચલો) ને વ્યવસ્થિત અને વ્યવસ્થિત કરવું, એટલે કે. તેમની અનુરૂપ ફ્રીક્વન્સીઝ સાથે ચોક્કસ ક્રમમાં (ચડતા અથવા ઉતરતા ક્રમમાં) ગોઠવો. વિચારણા હેઠળના ઉદાહરણમાં, વિકલ્પોને ચડતા ક્રમમાં ગોઠવવામાં આવે છે અને પૂર્ણાંક અસંતુલિત (અલગ) સંખ્યાઓ તરીકે વ્યક્ત કરવામાં આવે છે, દરેક વિકલ્પ ઘણી વખત થાય છે, એટલે કે. અમે ભારિત, અવ્યવસ્થિત અથવા અલગ વિવિધતા શ્રેણી સાથે કામ કરી રહ્યા છીએ.

એક નિયમ તરીકે, જો આપણે અભ્યાસ કરી રહ્યા છીએ તે આંકડાકીય વસ્તીમાં અવલોકનોની સંખ્યા 30 થી વધુ ન હોય, તો તે કોષ્ટકની જેમ, ચડતા વિવિધતા શ્રેણીમાં અભ્યાસ કરવામાં આવતી લાક્ષણિકતાઓના તમામ મૂલ્યોને ગોઠવવા માટે પૂરતું છે. 1, અથવા ઉતરતા ક્રમમાં.

મોટી સંખ્યામાં અવલોકનો (n>30) સાથે, આ કિસ્સામાં, એક અંતરાલ અથવા જૂથ ભિન્નતા શ્રેણી સંકલિત કરવામાં આવે છે, જેમાં અનુગામી પ્રક્રિયાને સરળ બનાવવા અને વિતરણની પ્રકૃતિને સ્પષ્ટ કરવા માટે, ચલોને જૂથોમાં જોડવામાં આવે છે.

સામાન્ય રીતે જૂથ વિકલ્પોની સંખ્યા 8 થી 15 સુધીની હોય છે.

તેમાંના ઓછામાં ઓછા 5 હોવા જોઈએ, કારણ કે... અન્યથા તે ખૂબ રફ, અતિશય વિસ્તરણ હશે, જે વિવિધતાના એકંદર ચિત્રને વિકૃત કરે છે અને સરેરાશ મૂલ્યોની ચોકસાઈને મોટા પ્રમાણમાં અસર કરે છે. જ્યારે જૂથ ચલોની સંખ્યા 20-25 થી વધુ હોય છે, ત્યારે સરેરાશ મૂલ્યોની ગણતરીની ચોકસાઈ વધે છે, પરંતુ લાક્ષણિકતાના વિવિધતાની લાક્ષણિકતાઓ નોંધપાત્ર રીતે વિકૃત થાય છે અને ગાણિતિક પ્રક્રિયા વધુ જટિલ બને છે.

જૂથબદ્ધ શ્રેણીનું સંકલન કરતી વખતે, તે ધ્યાનમાં લેવું જરૂરી છે

- વિકલ્પ જૂથો ચોક્કસ ક્રમમાં ગોઠવાયેલા હોવા જોઈએ (ચડતા અથવા ઉતરતા);

- વિકલ્પ જૂથોમાં અંતરાલ સમાન હોવા જોઈએ;

- અંતરાલ સીમાઓના મૂલ્યો એકરૂપ ન હોવા જોઈએ, કારણ કે વ્યક્તિગત ચલોને કયા જૂથોમાં વર્ગીકૃત કરવા તે અસ્પષ્ટ રહેશે;

- અંતરાલ મર્યાદા નક્કી કરતી વખતે એકત્રિત સામગ્રીની ગુણાત્મક લાક્ષણિકતાઓ ધ્યાનમાં લેવી જરૂરી છે (ઉદાહરણ તરીકે, પુખ્ત વયના લોકોના વજનનો અભ્યાસ કરતી વખતે, 3-4 કિગ્રાનો અંતરાલ સ્વીકાર્ય છે, અને જીવનના પ્રથમ મહિનામાં બાળકો માટે તે 100 ગ્રામથી વધુ ન હોવો જોઈએ)

ચાલો પરીક્ષા પહેલાં 55 તબીબી વિદ્યાર્થીઓના પલ્સ રેટ (મિનિટ દીઠ ધબકારા) પર ડેટા દર્શાવતી જૂથબદ્ધ (અંતરાલ) શ્રેણી બનાવીએ: 64, 66, 60, 62,

64, 68, 70, 66, 70, 68, 62, 68, 70, 72, 60, 70, 74, 62, 70, 72, 72,

64, 70, 72, 76, 76, 68, 70, 58, 76, 74, 76, 76, 82, 76, 72, 76, 74,

79, 78, 74, 78, 74, 78, 74, 74, 78, 76, 78, 76, 80, 80, 80, 78, 78.

જૂથબદ્ધ શ્રેણી બનાવવા માટે તમારે આની જરૂર છે:

1. અંતરાલનું કદ નક્કી કરો;

2. વિવિધતા શ્રેણીના જૂથોની મધ્ય, શરૂઆત અને અંત નક્કી કરો.

● અંતરાલ (i) નું કદ માનવામાં આવતા જૂથો (r) ની સંખ્યા દ્વારા નક્કી કરવામાં આવે છે, જેની સંખ્યા વિશિષ્ટ કોષ્ટક અનુસાર અવલોકનો (n) ની સંખ્યાના આધારે સેટ કરવામાં આવે છે.

અવલોકનોની સંખ્યાના આધારે જૂથોની સંખ્યા:

અમારા કિસ્સામાં, 55 વિદ્યાર્થીઓ માટે, તમે 8 થી 10 જૂથો બનાવી શકો છો.

અંતરાલ (i) નું મૂલ્ય નીચેના સૂત્ર દ્વારા નક્કી કરવામાં આવે છે -

i = V મહત્તમ-V મિનિટ/r

અમારા ઉદાહરણમાં, અંતરાલનું મૂલ્ય 82-58/8= 3 છે.

જો અંતરાલ મૂલ્ય અપૂર્ણાંક છે, તો પરિણામ નજીકની પૂર્ણ સંખ્યા પર ગોળાકાર હોવું જોઈએ.

સરેરાશના ઘણા પ્રકારો છે:

● અંકગણિત સરેરાશ,

● ભૌમિતિક સરેરાશ,

● હાર્મોનિક સરેરાશ,

● મૂળ સરેરાશ ચોરસ,

● સરેરાશ પ્રગતિશીલ,

● મધ્યક

તબીબી આંકડાઓમાં, અંકગણિત સરેરાશનો મોટાભાગે ઉપયોગ થાય છે.

અંકગણિત સરેરાશ (M) એ એક સામાન્યીકરણ મૂલ્ય છે જે નિર્ધારિત કરે છે કે સમગ્ર વસ્તી માટે શું લાક્ષણિક છે. M ની ગણતરી કરવા માટેની મુખ્ય પદ્ધતિઓ છે: અંકગણિત સરેરાશ પદ્ધતિ અને ક્ષણોની પદ્ધતિ (શરતી વિચલનો).

અંકગણિત સરેરાશ પદ્ધતિનો ઉપયોગ સરળ અંકગણિત સરેરાશ અને ભારિત અંકગણિત સરેરાશની ગણતરી કરવા માટે થાય છે. અંકગણિત સરેરાશની ગણતરી કરવા માટેની પદ્ધતિની પસંદગી વિવિધતા શ્રેણીના પ્રકાર પર આધારિત છે. સરળ ભિન્નતા શ્રેણીના કિસ્સામાં, જેમાં દરેક વિકલ્પ માત્ર એક જ વાર આવે છે, અંકગણિત સરેરાશ સરળ સૂત્ર દ્વારા નક્કી કરવામાં આવે છે:

જ્યાં: M - અંકગણિત સરેરાશ મૂલ્ય;

V - વિવિધ લાક્ષણિકતાનું મૂલ્ય (ચલો);

Σ – ક્રિયા સૂચવે છે – સમીકરણ;

n – અવલોકનોની કુલ સંખ્યા.

સરળ અંકગણિત સરેરાશની ગણતરીનું ઉદાહરણ. 35 વર્ષની વયના 9 પુરુષોમાં શ્વસન દર (મિનિટ દીઠ શ્વાસની હિલચાલની સંખ્યા): 20, 22, 19, 15, 16, 21, 17, 23, 18.

35 વર્ષની વયના પુરુષોમાં શ્વસન દરનું સરેરાશ સ્તર નક્કી કરવા માટે, તે જરૂરી છે:

1. બધા વિકલ્પોને ચડતા અથવા ઉતરતા ક્રમમાં ગોઠવીને વિવિધતા શ્રેણી બનાવો, કારણ કે અમે એક સરળ વિવિધતા શ્રેણી મેળવી છે વિકલ્પ મૂલ્યો માત્ર એક જ વાર થાય છે.

M = ∑V/n = 171/9 = 19 શ્વાસ પ્રતિ મિનિટ

નિષ્કર્ષ. 35 વર્ષની વયના પુરુષોમાં શ્વસન દર પ્રતિ મિનિટ સરેરાશ 19 શ્વસન ચળવળ છે.

જો વેરિઅન્ટના વ્યક્તિગત મૂલ્યો પુનરાવર્તિત થાય છે, તો દરેક વેરિઅન્ટને લાઇનમાં લખવાની જરૂર નથી (V) અને તેની બાજુમાં તેમના પુનરાવર્તનોની સંખ્યા સૂચવવા માટે તે પૂરતું છે; ). આવી વિવિધતા શ્રેણી, જેમાં વિકલ્પો, જેમ કે તે હતા, તેમને અનુરૂપ ફ્રીક્વન્સીઝની સંખ્યા દ્વારા તોલવામાં આવે છે, તેને ભારિત વિવિધતા શ્રેણી કહેવામાં આવે છે, અને ગણતરી કરેલ સરેરાશ મૂલ્ય એ ભારિત અંકગણિત સરેરાશ છે.

ભારિત અંકગણિત સરેરાશ સૂત્ર દ્વારા નક્કી કરવામાં આવે છે: M= ∑Vp/n

જ્યાં n એ ફ્રીક્વન્સીઝના સરવાળા સમાન અવલોકનોની સંખ્યા છે – Σр.

અંકગણિત ભારાંકિત સરેરાશની ગણતરીનું ઉદાહરણ.

ચાલુ વર્ષના પ્રથમ ત્રિમાસિક ગાળા દરમિયાન સ્થાનિક ડૉક્ટર દ્વારા સારવાર કરાયેલ તીવ્ર શ્વસન રોગો (ARI) ધરાવતા 35 દર્દીઓમાં અપંગતાનો સમયગાળો (દિવસોમાં) હતો: 6, 7, 5, 3, 9, 8, 7, 5, 6 , 4, 9, 8, 7, 6, 6, 9, 6, 5, 10, 8, 7, 11, 13, 5, 6, 7, 12, 4, 3, 5, 2, 5, 6, 6 , 7 દિવસ.

તીવ્ર શ્વસન ચેપ ધરાવતા દર્દીઓમાં અપંગતાની સરેરાશ અવધિ નક્કી કરવા માટેની પદ્ધતિ નીચે મુજબ છે:

1. ચાલો ભારિત વિવિધતા શ્રેણી બનાવીએ, કારણ કે વિકલ્પના વ્યક્તિગત મૂલ્યો ઘણી વખત પુનરાવર્તિત થાય છે. આ કરવા માટે, તમે બધા વિકલ્પોને તેમની અનુરૂપ ફ્રીક્વન્સીઝ સાથે ચડતા અથવા ઉતરતા ક્રમમાં ગોઠવી શકો છો.

અમારા કિસ્સામાં, વિકલ્પો ચડતા ક્રમમાં ગોઠવાયેલા છે

2. સૂત્રનો ઉપયોગ કરીને અંકગણિત ભારાંકિત સરેરાશની ગણતરી કરો: M = ∑Vp/n = 233/35 = 6.7 દિવસ

અપંગતાના સમયગાળા દ્વારા તીવ્ર શ્વસન ચેપ ધરાવતા દર્દીઓનું વિતરણ:

અપંગતાનો સમયગાળો (V) દર્દીઓની સંખ્યા (p) વી.પી
∑p = n = 35 ∑Vp = 233

નિષ્કર્ષ. તીવ્ર શ્વસન રોગોવાળા દર્દીઓમાં અપંગતાની અવધિ સરેરાશ 6.7 દિવસ છે.

મોડ (Mo) એ વિવિધતા શ્રેણીમાં સૌથી સામાન્ય વિકલ્પ છે. કોષ્ટકમાં પ્રસ્તુત વિતરણ માટે, મોડ 10 ની સમાન વિકલ્પને અનુરૂપ છે તે અન્ય કરતા વધુ વખત થાય છે - 6 વખત.

હોસ્પિટલના પલંગમાં રોકાણની લંબાઈ દ્વારા દર્દીઓનું વિતરણ (દિવસોમાં)

વી
પી

કેટલીકવાર મોડની ચોક્કસ તીવ્રતા નક્કી કરવી મુશ્કેલ હોય છે કારણ કે અભ્યાસ કરવામાં આવતા ડેટામાં ઘણા "સૌથી સામાન્ય" અવલોકનો હોઈ શકે છે.

મધ્યક (Me) એ બિન-પેરામેટ્રિક સૂચક છે જે વિવિધતા શ્રેણીને બે સમાન ભાગોમાં વિભાજિત કરે છે: સમાન સંખ્યાના ચલ મધ્યની બંને બાજુએ સ્થિત છે.

ઉદાહરણ તરીકે, કોષ્ટકમાં બતાવેલ વિતરણ માટે, મધ્ય 10 છે, કારણ કે આ મૂલ્યની બંને બાજુએ 14 વિકલ્પો છે, એટલે કે. સંખ્યા 10 આ શ્રેણીમાં કેન્દ્રિય સ્થાન ધરાવે છે અને તેનો મધ્યક છે.

આપેલ છે કે આ ઉદાહરણમાં અવલોકનોની સંખ્યા સમ છે (n=34), મધ્ય નીચે પ્રમાણે નક્કી કરી શકાય છે:

હું = 2+3+4+5+6+5+4+3+2/2 = 34/2 = 17

આનો અર્થ એ છે કે શ્રેણીની મધ્ય સત્તરમા વિકલ્પ પર આવે છે, જે 10 ની સમાન મધ્યને અનુરૂપ છે. કોષ્ટકમાં પ્રસ્તુત વિતરણ માટે, અંકગણિત સરેરાશ સમાન છે:

M = ∑Vp/n = 334/34 = 10.1

તેથી, કોષ્ટકમાંથી 34 અવલોકનો માટે. 8, અમને મળ્યું: Mo=10, Me=10, અંકગણિત સરેરાશ (M) 10.1 છે. અમારા ઉદાહરણમાં, ત્રણેય સૂચકાંકો એકબીજાની સમાન અથવા નજીક હોવાનું બહાર આવ્યું છે, જો કે તે સંપૂર્ણપણે અલગ છે.

અંકગણિત સરેરાશ એ તમામ પ્રભાવોનો અસરકારક સરવાળો છે; અપવાદ વિનાના તમામ વિકલ્પો, આત્યંતિક વિકલ્પો સહિત, જે ઘણી વખત આપેલ ઘટના અથવા વસ્તી માટે અસામાન્ય હોય છે, તેની રચનામાં ભાગ લે છે.

મોડ અને મધ્ય, અંકગણિત સરેરાશથી વિપરીત, વિવિધ લાક્ષણિકતાના તમામ વ્યક્તિગત મૂલ્યોના મૂલ્ય પર આધાર રાખતા નથી (આત્યંતિક ચલોના મૂલ્યો અને શ્રેણીના વિખેરવાની ડિગ્રી). અંકગણિત સરેરાશ અવલોકનોના સમગ્ર સમૂહને દર્શાવે છે, મોડ અને મધ્ય બલ્કને લાક્ષણિકતા આપે છે

વિવિધતા શ્રેણીનો ખ્યાલ.આંકડાકીય અવલોકન સામગ્રીને વ્યવસ્થિત કરવા માટેનું પ્રથમ પગલું એ ચોક્કસ લાક્ષણિકતા ધરાવતા એકમોની સંખ્યાની ગણતરી છે. એકમોને તેમની જથ્થાત્મક લાક્ષણિકતાના ચડતા અથવા ઉતરતા ક્રમમાં ગોઠવીને અને લાક્ષણિકતાના ચોક્કસ મૂલ્ય સાથે એકમોની સંખ્યાની ગણતરી કરીને, અમે વિવિધતા શ્રેણી મેળવીએ છીએ. વિવિધતા શ્રેણી અમુક માત્રાત્મક લાક્ષણિકતા અનુસાર ચોક્કસ આંકડાકીય વસ્તીના એકમોના વિતરણને દર્શાવે છે.

ભિન્નતા શ્રેણીમાં બે કૉલમનો સમાવેશ થાય છે, ડાબા કૉલમમાં વિવિધ લાક્ષણિકતાઓના મૂલ્યો હોય છે, જેને વેરિઅન્ટ કહેવાય છે અને સૂચિત (x) અને જમણી કૉલમમાં ચોક્કસ સંખ્યાઓ હોય છે જે દર્શાવે છે કે દરેક પ્રકાર કેટલી વાર થાય છે. આ સ્તંભમાંના સૂચકોને ફ્રીક્વન્સી કહેવામાં આવે છે અને તેને નિયુક્ત કરવામાં આવે છે (f).

વિવિધતા શ્રેણીને યોજનાકીય રીતે કોષ્ટક 5.1 ના સ્વરૂપમાં રજૂ કરી શકાય છે:

કોષ્ટક 5.1

વિવિધતા શ્રેણીનો પ્રકાર

વિકલ્પો (x)

ફ્રીક્વન્સીઝ (f)

જમણી સ્તંભમાં, સંબંધિત સૂચકાંકોનો પણ ઉપયોગ કરી શકાય છે, જે ફ્રીક્વન્સીના કુલ સરવાળામાં વ્યક્તિગત વિકલ્પોની આવર્તનના હિસ્સાને લાક્ષણિકતા આપે છે. આ સંબંધિત સૂચકાંકોને ફ્રીક્વન્સીઝ કહેવામાં આવે છે અને પરંપરાગત રીતે તે દ્વારા સૂચિત કરવામાં આવે છે, એટલે કે. . તમામ ફ્રીક્વન્સીઝનો સરવાળો એક સમાન છે. ફ્રીક્વન્સીઝને ટકાવારી તરીકે પણ વ્યક્ત કરી શકાય છે, અને પછી તેમનો સરવાળો 100% જેટલો હશે.

વિવિધ ચિહ્નો વિવિધ પ્રકૃતિના હોઈ શકે છે. કેટલીક લાક્ષણિકતાઓના પ્રકારો પૂર્ણાંકોમાં દર્શાવવામાં આવે છે, ઉદાહરણ તરીકે, એપાર્ટમેન્ટમાં રૂમની સંખ્યા, પ્રકાશિત પુસ્તકોની સંખ્યા, વગેરે. આ ચિહ્નોને અવ્યવસ્થિત અથવા અલગ કહેવામાં આવે છે. અન્ય લાક્ષણિકતાઓના પ્રકારો ચોક્કસ મર્યાદામાં કોઈપણ મૂલ્યો લઈ શકે છે, જેમ કે આયોજિત કાર્યોની પરિપૂર્ણતા, વેતન, વગેરે. આ લાક્ષણિકતાઓને સતત કહેવામાં આવે છે.

સ્વતંત્ર વિવિધતા શ્રેણી.જો ભિન્નતા શ્રેણીના પ્રકારોને અલગ જથ્થાના સ્વરૂપમાં દર્શાવવામાં આવે છે, તો આવી વિવિધતા શ્રેણીને અલગ કહેવામાં આવે છે, તેનો દેખાવ કોષ્ટકમાં રજૂ કરવામાં આવે છે. 5.2:

કોષ્ટક 5.2

પરીક્ષાના ગ્રેડ અનુસાર વિદ્યાર્થીઓનું વિતરણ

રેટિંગ્સ (x)

વિદ્યાર્થીઓની સંખ્યા (f)

કુલ () ના % માં

અલગ શ્રેણીમાં વિતરણની પ્રકૃતિ વિતરણ બહુકોણના સ્વરૂપમાં ગ્રાફિકલી રીતે દર્શાવવામાં આવી છે, ફિગ. 5.1.

ચોખા. 5.1. પરીક્ષામાં મેળવેલ ગ્રેડ અનુસાર વિદ્યાર્થીઓનું વિતરણ.

અંતરાલ વિવિધતા શ્રેણી.સતત લાક્ષણિકતાઓ માટે, ભિન્નતા શ્રેણીઓ અંતરાલ રાશિઓ તરીકે બનાવવામાં આવે છે, એટલે કે. તેમાંની લાક્ષણિકતાના મૂલ્યો "થી અને સુધી" અંતરાલોના રૂપમાં વ્યક્ત થાય છે. આ કિસ્સામાં, આવા અંતરાલમાં લાક્ષણિકતાના લઘુત્તમ મૂલ્યને અંતરાલની નીચલી મર્યાદા કહેવામાં આવે છે, અને મહત્તમને અંતરાલની ઉપલી મર્યાદા કહેવામાં આવે છે.

અંતરાલ ભિન્નતા શ્રેણીનું નિર્માણ અસંતુલિત લાક્ષણિકતાઓ (સ્વચ્છ) અને વિશાળ શ્રેણીમાં બદલાતી હોય તે માટે બંને માટે કરવામાં આવે છે. અંતરાલ પંક્તિઓ સમાન અથવા અસમાન અંતરાલો સાથે હોઈ શકે છે. આર્થિક વ્યવહારમાં, મોટા ભાગના અસમાન અંતરાલોનો ઉપયોગ થાય છે, ક્રમશઃ વધતા અથવા ઘટતા. આ જરૂરિયાત ખાસ કરીને એવા કિસ્સાઓમાં ઊભી થાય છે જ્યાં લાક્ષણિકતાની વધઘટ અસમાન રીતે અને મોટી મર્યાદામાં થાય છે.

ચાલો સમાન અંતરાલ, કોષ્ટક સાથે અંતરાલ શ્રેણીના પ્રકારને ધ્યાનમાં લઈએ. 5.3:

કોષ્ટક 5.3

ઉત્પાદન દ્વારા કામદારોનું વિતરણ

આઉટપુટ, t.r. (X)

કામદારોની સંખ્યા (f)

સંચિત આવર્તન (f´)

અંતરાલ વિતરણ શ્રેણી ગ્રાફિકલી હિસ્ટોગ્રામના સ્વરૂપમાં દર્શાવવામાં આવી છે, ફિગ. 5.2.

ફિગ.5.2. ઉત્પાદન દ્વારા કામદારોનું વિતરણ

સંચિત (સંચિત) આવર્તન.વ્યવહારમાં, વિતરણ શ્રેણીમાં પરિવર્તન કરવાની જરૂર છે સંચિત શ્રેણી,સંચિત ફ્રીક્વન્સીઝ અનુસાર બાંધવામાં આવે છે. તેમની સહાયથી, તમે માળખાકીય સરેરાશ નક્કી કરી શકો છો જે વિતરણ શ્રેણીના ડેટાના વિશ્લેષણની સુવિધા આપે છે.

વિતરણ શ્રેણીના અનુગામી જૂથોના આ સૂચકાંકો પ્રથમ જૂથની ફ્રીક્વન્સીઝ (અથવા ફ્રીક્વન્સીઝ) માં ક્રમિક રીતે ઉમેરીને સંચિત ફ્રીક્વન્સીઝ નક્કી કરવામાં આવે છે. ક્યુમ્યુલેટ્સ અને ઓગિવ્સનો ઉપયોગ વિતરણ શ્રેણીને દર્શાવવા માટે થાય છે. તેમને બાંધવા માટે, અલગ લાક્ષણિકતાના મૂલ્યો (અથવા અંતરાલોનો છેડો) એબ્સિસા અક્ષ પર ચિહ્નિત થયેલ છે, અને ફ્રીક્વન્સીઝના સંચિત સરવાળો (ક્યુમ્યુલેટ્સ) ઓર્ડિનેટ અક્ષ પર ચિહ્નિત થયેલ છે, ફિગ. 5.3.

ચોખા. 5.3. ઉત્પાદન દ્વારા કામદારોનું સંચિત વિતરણ

જો ફ્રીક્વન્સીઝ અને વિકલ્પોના ભીંગડા ઉલટાવી દેવામાં આવે છે, એટલે કે. એબ્સીસા અક્ષ સંચિત ફ્રીક્વન્સીઝને પ્રતિબિંબિત કરે છે, અને ઓર્ડિનેટ અક્ષ વેરિઅન્ટના મૂલ્યો દર્શાવે છે, પછી જૂથથી જૂથમાં ફ્રીક્વન્સીઝમાં ફેરફારને દર્શાવતા વળાંકને વિતરણ ઓગિવ કહેવાશે, ફિગ. 5.4.

ચોખા. 5.4. ઉત્પાદન દ્વારા કામદારોના વિતરણનું ઓગીવા

સમાન અંતરાલ સાથે ભિન્નતા શ્રેણી આંકડાકીય વિતરણ શ્રેણી માટે સૌથી મહત્વપૂર્ણ આવશ્યકતાઓમાંની એક પૂરી પાડે છે, સમય અને અવકાશમાં તેમની તુલનાત્મકતા સુનિશ્ચિત કરે છે.

વિતરણ ઘનતા.જો કે, નામવાળી શ્રેણીમાં વ્યક્તિગત અસમાન અંતરાલોની ફ્રીક્વન્સી સીધી તુલનાત્મક નથી. આવા કિસ્સાઓમાં, જરૂરી તુલનાત્મકતાની ખાતરી કરવા માટે, વિતરણ ઘનતાની ગણતરી કરવામાં આવે છે, એટલે કે. અંતરાલ મૂલ્યના એકમ દીઠ દરેક જૂથમાં કેટલા એકમો છે તે નક્કી કરો.

અસમાન અંતરાલો સાથે વિવિધતા શ્રેણીના વિતરણનો ગ્રાફ બનાવતી વખતે, લંબચોરસની ઊંચાઈ ફ્રીક્વન્સીઝના પ્રમાણમાં નહીં, પરંતુ અનુરૂપમાં અભ્યાસ કરવામાં આવતી લાક્ષણિકતાના મૂલ્યોના વિતરણના ઘનતા સૂચકાંકોના પ્રમાણમાં નક્કી કરવામાં આવે છે. અંતરાલો

વિવિધતા શ્રેણી અને તેનું ગ્રાફિકલ રજૂઆત એ પ્રારંભિક ડેટાની પ્રક્રિયામાં પ્રથમ પગલું છે અને અભ્યાસ કરવામાં આવી રહેલી વસ્તીના વિશ્લેષણમાં પ્રથમ તબક્કો છે. વિવિધતા શ્રેણીના વિશ્લેષણમાં આગળનું પગલું મુખ્ય સામાન્ય સૂચકાંકો નક્કી કરવાનું છે, જેને શ્રેણીની લાક્ષણિકતાઓ કહેવાય છે. આ લાક્ષણિકતાઓએ વસ્તીના એકમોમાં લાક્ષણિકતાના સરેરાશ મૂલ્યનો ખ્યાલ આપવો જોઈએ.

સરેરાશ મૂલ્ય. સરેરાશ મૂલ્ય એ અભ્યાસ હેઠળની વસ્તીમાં અભ્યાસ કરવામાં આવતી લાક્ષણિકતાની સામાન્ય લાક્ષણિકતા છે, જે સ્થળ અને સમયની ચોક્કસ પરિસ્થિતિઓ હેઠળ વસ્તીના એકમ દીઠ તેના લાક્ષણિક સ્તરને પ્રતિબિંબિત કરે છે.

સરેરાશ મૂલ્યને હંમેશા નામ આપવામાં આવે છે અને તે વસ્તીના વ્યક્તિગત એકમોની લાક્ષણિકતા તરીકે સમાન પરિમાણ ધરાવે છે.

સરેરાશ મૂલ્યોની ગણતરી કરતા પહેલા, અભ્યાસ હેઠળની વસ્તીના એકમોનું જૂથ બનાવવું જરૂરી છે, ગુણાત્મક રીતે સમાન જૂથોની ઓળખ કરવી.

સમગ્ર વસ્તી માટે ગણતરી કરેલ સરેરાશને એકંદર સરેરાશ કહેવામાં આવે છે, અને દરેક જૂથ માટે - જૂથ સરેરાશ.

સરેરાશ બે પ્રકારના હોય છે: શક્તિ (અંકગણિત સરેરાશ, હાર્મોનિક સરેરાશ, ભૌમિતિક સરેરાશ, ચતુર્ભુજ સરેરાશ); માળખાકીય (મોડ, મધ્ય, ચતુર્થાંશ, ડેસિલ્સ).

ગણતરી માટે સરેરાશની પસંદગી હેતુ પર આધારિત છે.

પાવર સરેરાશના પ્રકારો અને તેમની ગણતરી માટેની પદ્ધતિઓ.એકત્રિત સામગ્રીની આંકડાકીય પ્રક્રિયાની પ્રેક્ટિસમાં, વિવિધ સમસ્યાઓ ઊભી થાય છે, જેના ઉકેલ માટે વિવિધ સરેરાશની જરૂર પડે છે.

ગાણિતિક આંકડા પાવર એવરેજ સૂત્રોમાંથી વિવિધ સરેરાશ મેળવે છે:

સરેરાશ મૂલ્ય ક્યાં છે; x - વ્યક્તિગત વિકલ્પો (સુવિધા મૂલ્યો); z – ઘાતાંક (z = 1 – અંકગણિત સરેરાશ સાથે, z = 0 ભૌમિતિક સરેરાશ, z = - 1 – હાર્મોનિક સરેરાશ, z = 2 – ચોરસ સરેરાશ સાથે).

જો કે, દરેક વ્યક્તિગત કેસમાં કયા પ્રકારની સરેરાશ લાગુ કરવી જોઈએ તે પ્રશ્નનો અભ્યાસ કરવામાં આવતી વસ્તીના ચોક્કસ વિશ્લેષણ દ્વારા ઉકેલવામાં આવે છે.

આંકડાઓમાં સરેરાશનો સૌથી સામાન્ય પ્રકાર છે અંકગણિત સરેરાશ. તે એવા કિસ્સાઓમાં ગણવામાં આવે છે કે જ્યાં અભ્યાસ કરવામાં આવતી આંકડાકીય વસ્તીના વ્યક્તિગત એકમો માટે સરેરાશ લાક્ષણિકતાનું પ્રમાણ તેના મૂલ્યોના સરવાળા તરીકે રચાય છે.

સ્ત્રોત ડેટાની પ્રકૃતિના આધારે, અંકગણિત સરેરાશ વિવિધ રીતે નક્કી કરવામાં આવે છે:

જો ડેટા અનગ્રુપ કરેલ હોય, તો ગણતરી સરળ સરેરાશ સૂત્રનો ઉપયોગ કરીને હાથ ધરવામાં આવે છે

એક અલગ શ્રેણીમાં અંકગણિત સરેરાશની ગણતરીફોર્મ્યુલા 3.4 અનુસાર થાય છે.

અંતરાલ શ્રેણીમાં અંકગણિત સરેરાશની ગણતરી.અંતરાલ ભિન્નતા શ્રેણીમાં, જ્યાં દરેક જૂથમાં લાક્ષણિકતાના મૂલ્યને પરંપરાગત રીતે અંતરાલના મધ્યમાં ગણવામાં આવે છે, અંકગણિતનો સરેરાશ જૂથ વગરના ડેટામાંથી ગણવામાં આવતા સરેરાશથી અલગ હોઈ શકે છે. તદુપરાંત, જૂથોમાં અંતરાલ જેટલું મોટું છે, જૂથબદ્ધ ડેટામાંથી ગણતરી કરાયેલ સરેરાશના સંભવિત વિચલનો અસંગઠિત ડેટામાંથી ગણતરી કરાયેલ સરેરાશમાંથી વધારે છે.

અંતરાલ વિવિધતા શ્રેણીમાં સરેરાશની ગણતરી કરતી વખતે, જરૂરી ગણતરીઓ કરવા માટે, વ્યક્તિ અંતરાલથી તેમના મધ્યબિંદુઓ તરફ આગળ વધે છે. અને પછી ભારાંકિત અંકગણિત સરેરાશ સૂત્રનો ઉપયોગ કરીને સરેરાશની ગણતરી કરવામાં આવે છે.

અંકગણિતના ગુણધર્મ.અંકગણિત સરેરાશમાં કેટલાક ગુણધર્મો છે જે ગણતરીઓને સરળ બનાવવાનું શક્ય બનાવે છે;

1. અચળ સંખ્યાઓનો અંકગણિત સરેરાશ આ અચળ સંખ્યાની બરાબર છે.

જો x = a. પછી .

2. જો બધા વિકલ્પોનું વજન પ્રમાણસર બદલાય છે, એટલે કે. સમાન સંખ્યામાં વખત વધારો અથવા ઘટાડો, પછી નવી શ્રેણીનો અંકગણિત સરેરાશ બદલાશે નહીં.

જો બધા વજન f ને k ગણાથી ઘટાડવામાં આવે, તો .

3. સરેરાશમાંથી વ્યક્તિગત વિકલ્પોના હકારાત્મક અને નકારાત્મક વિચલનોનો સરવાળો, વજન દ્વારા ગુણાકાર, શૂન્ય બરાબર છે, એટલે કે.

જો, તો. અહીંથી.

જો બધા વિકલ્પો કોઈપણ સંખ્યા દ્વારા ઘટાડવા અથવા વધારવામાં આવે છે, તો નવી શ્રેણીનો અંકગણિત સરેરાશ સમાન રકમથી ઘટશે અથવા વધશે.

ચાલો બધા વિકલ્પો ઓછા કરીએ xપર a, એટલે કે x´ = xa

પછી

મૂળ શ્રેણીનો અંકગણિત સરેરાશ, અગાઉ વિકલ્પોમાંથી બાદ કરવામાં આવેલી સંખ્યાના ઘટાડેલા સરેરાશમાં ઉમેરીને મેળવી શકાય છે. a, એટલે કે .

5. જો બધા વિકલ્પોમાં ઘટાડો અથવા વધારો થયો છે kવખત, તો નવી શ્રેણીનો અંકગણિત સરેરાશ એ જ રકમથી ઘટશે અથવા વધશે, એટલે કે. વી kએકવાર

તે પછી રહેવા દો .

આથી, એટલે કે. મૂળ શ્રેણીની સરેરાશ મેળવવા માટે, નવી શ્રેણીની અંકગણિત સરેરાશ (ઘટાડા વિકલ્પો સાથે) વધારવી આવશ્યક છે kએકવાર

હાર્મોનિક સરેરાશ.હાર્મોનિક સરેરાશ એ અંકગણિત સરેરાશનો પરસ્પર છે. તેનો ઉપયોગ ત્યારે થાય છે જ્યારે આંકડાકીય માહિતીમાં વસ્તીના વ્યક્તિગત પ્રકારો માટે ફ્રીક્વન્સી ન હોય, પરંતુ તેના ઉત્પાદન (M = xf) તરીકે રજૂ કરવામાં આવે છે. ફોર્મ્યુલા 3.5 નો ઉપયોગ કરીને હાર્મોનિક સરેરાશની ગણતરી કરવામાં આવશે

હાર્મોનિક સરેરાશનો વ્યવહારુ ઉપયોગ એ કેટલાક સૂચકાંકોની ગણતરી કરવાનો છે, ખાસ કરીને, ભાવ સૂચકાંક.

ભૌમિતિક સરેરાશ.ભૌમિતિક સરેરાશનો ઉપયોગ કરતી વખતે, લાક્ષણિકતાના વ્યક્તિગત મૂલ્યો, એક નિયમ તરીકે, ગતિશાસ્ત્રના સંબંધિત મૂલ્યો છે, જે સાંકળ મૂલ્યોના સ્વરૂપમાં બનાવવામાં આવે છે, ગતિશાસ્ત્રની શ્રેણીમાં દરેક સ્તરના અગાઉના સ્તરના ગુણોત્તર તરીકે. સરેરાશ આમ સરેરાશ વૃદ્ધિ દર દર્શાવે છે.

ભૌમિતિક સરેરાશ મૂલ્યનો ઉપયોગ લાક્ષણિકતાના મહત્તમ અને લઘુત્તમ મૂલ્યોમાંથી સમાન મૂલ્ય નક્કી કરવા માટે પણ થાય છે. ઉદાહરણ તરીકે, વીમા કંપની ઓટો વીમા સેવાઓની જોગવાઈ માટે કરાર કરે છે. ચોક્કસ વીમાની ઘટનાના આધારે, વીમા ચુકવણી દર વર્ષે 10,000 થી 100,000 ડૉલર સુધીની હોઈ શકે છે. વીમા ચૂકવણીની સરેરાશ રકમ USD હશે.

ભૌમિતિક સરેરાશ એ ગુણોત્તરની સરેરાશ તરીકે અથવા z = 0 હોય ત્યારે ભૌમિતિક પ્રગતિના સ્વરૂપમાં પ્રસ્તુત વિતરણ શ્રેણીમાં વપરાતો જથ્થો છે. જ્યારે સંપૂર્ણ તફાવતો પર નહીં, પરંતુ બેના ગુણોત્તર પર ધ્યાન આપવામાં આવે ત્યારે આ સરેરાશ વાપરવા માટે અનુકૂળ છે. સંખ્યાઓ

ગણતરી માટેના સૂત્રો નીચે મુજબ છે

લાક્ષણિકતાના પ્રકારો ક્યાં સરેરાશ કરવામાં આવે છે; - વિકલ્પોનું ઉત્પાદન; f- વિકલ્પોની આવર્તન.

ભૌમિતિક સરેરાશનો ઉપયોગ સરેરાશ વાર્ષિક વૃદ્ધિ દરની ગણતરીમાં થાય છે.

મીન ચોરસ.સરેરાશ ચોરસ સૂત્રનો ઉપયોગ વિતરણ શ્રેણીમાં અંકગણિત સરેરાશની આસપાસ લાક્ષણિકતાના વ્યક્તિગત મૂલ્યોની વધઘટની ડિગ્રીને માપવા માટે થાય છે. આમ, વિવિધતા સૂચકાંકોની ગણતરી કરતી વખતે, સરેરાશની ગણતરી અંકગણિત સરેરાશમાંથી લાક્ષણિકતાના વ્યક્તિગત મૂલ્યોના વર્ગ વિચલનમાંથી કરવામાં આવે છે.

સૂત્રનો ઉપયોગ કરીને મૂળ સરેરાશ ચોરસ મૂલ્યની ગણતરી કરવામાં આવે છે

આર્થિક સંશોધનમાં, વિક્ષેપ અને પ્રમાણભૂત વિચલન જેવા લાક્ષણિકતાના ભિન્નતાના સૂચકાંકોની ગણતરીમાં સંશોધિત સરેરાશ ચોરસનો વ્યાપકપણે ઉપયોગ થાય છે.

બહુમતી શાસન.પાવર એવરેજ વચ્ચે નીચેનો સંબંધ છે - ઘાતાંક જેટલું મોટું, એવરેજનું મૂલ્ય જેટલું વધારે, કોષ્ટક 5.4:

કોષ્ટક 5.4

સરેરાશ વચ્ચેનો સંબંધ

z મૂલ્ય

સરેરાશ વચ્ચેનો સંબંધ

આ સંબંધને મેજરન્સી નિયમ કહેવામાં આવે છે.

માળખાકીય સરેરાશ.વસ્તીના બંધારણને દર્શાવવા માટે, ખાસ સૂચકાંકોનો ઉપયોગ કરવામાં આવે છે, જેને માળખાકીય સરેરાશ કહી શકાય. આ સૂચકાંકોમાં મોડ, મધ્ય, ચતુર્થાંશ અને ડેસીલ્સનો સમાવેશ થાય છે.

ફેશન.મોડ (Mo) એ વસ્તીના એકમોમાં લાક્ષણિકતાનું સૌથી વધુ વારંવાર બનતું મૂલ્ય છે. મોડ એ એટ્રિબ્યુટનું મૂલ્ય છે જે સૈદ્ધાંતિક વિતરણ વળાંકના મહત્તમ બિંદુને અનુરૂપ છે.

ગ્રાહકની માંગનો અભ્યાસ કરતી વખતે (જ્યારે કપડા અને પગરખાંના કદને બહોળી માંગમાં છે તે નક્કી કરતી વખતે) અને કિંમતો રેકોર્ડ કરતી વખતે વ્યાપારી વ્યવહારમાં ફેશનનો વ્યાપક ઉપયોગ થાય છે. કુલમાં ઘણા મોડ્સ હોઈ શકે છે.

એક અલગ શ્રેણીમાં મોડની ગણતરી.એક અલગ શ્રેણીમાં, મોડ એ સૌથી વધુ આવર્તન સાથેનો પ્રકાર છે. ચાલો એક અલગ શ્રેણીમાં મોડ શોધવાનો વિચાર કરીએ.

અંતરાલ શ્રેણીમાં મોડની ગણતરી.અંતરાલ વિવિધતા શ્રેણીમાં, મોડને લગભગ મોડલ અંતરાલનું કેન્દ્રિય સંસ્કરણ માનવામાં આવે છે, એટલે કે. અંતરાલ કે જે સૌથી વધુ આવર્તન (આવર્તન) ધરાવે છે. અંતરાલની અંદર, તમારે એટ્રિબ્યુટનું મૂલ્ય શોધવાની જરૂર છે જે મોડ છે. અંતરાલ શ્રેણી માટે, મોડ ફોર્મ્યુલા દ્વારા નક્કી કરવામાં આવશે

મોડલ અંતરાલની નીચી મર્યાદા ક્યાં છે; - મોડલ અંતરાલનું મૂલ્ય; - મોડલ અંતરાલને અનુરૂપ આવર્તન; - મોડલ અંતરાલ પહેલાની આવર્તન; - મોડલ એક પછી અંતરાલની આવર્તન.

મધ્યક.મધ્યક () એ ક્રમાંકિત શ્રેણીના મધ્ય એકમના લક્ષણનું મૂલ્ય છે. ક્રમાંકિત શ્રેણી એ એક શ્રેણી છે જેમાં લાક્ષણિક મૂલ્યો ચડતા અથવા ઉતરતા ક્રમમાં લખવામાં આવે છે. અથવા મધ્યક એ એક મૂલ્ય છે જે ક્રમાંકિત વિવિધતા શ્રેણીની સંખ્યાને બે સમાન ભાગોમાં વિભાજિત કરે છે: એક ભાગમાં વિવિધ લાક્ષણિકતાનું મૂલ્ય હોય છે જે સરેરાશ વિકલ્પ કરતાં ઓછું હોય છે, અને બીજામાં મૂલ્ય વધારે હોય છે.

મધ્યક શોધવા માટે, પ્રથમ તેની ક્રમાંકિત સંખ્યા નક્કી કરો. આ કરવા માટે, જો એકમોની સંખ્યા વિષમ હોય, તો તમામ ફ્રીક્વન્સીના સરવાળામાં એક ઉમેરવામાં આવે છે અને દરેક વસ્તુને બે વડે વિભાજિત કરવામાં આવે છે. એકમોની સમાન સંખ્યા સાથે, મધ્યક એકમના લક્ષણના મૂલ્ય તરીકે જોવા મળે છે, જેનો સીરીયલ નંબર બે વડે વિભાજિત ફ્રીક્વન્સીના કુલ સરવાળા દ્વારા નક્કી કરવામાં આવે છે. મધ્યકનો સીરીયલ નંબર જાણીને, સંચિત ફ્રીક્વન્સીઝનો ઉપયોગ કરીને તેનું મૂલ્ય શોધવાનું સરળ છે.

એક અલગ શ્રેણીમાં મધ્યકની ગણતરી.નમૂના સર્વેક્ષણ મુજબ, બાળકોની સંખ્યા દ્વારા પરિવારોના વિતરણ અંગેનો ડેટા મેળવ્યો હતો, ટેબલ. 5.5. મધ્યકને નિર્ધારિત કરવા માટે, આપણે સૌ પ્રથમ તેની ક્રમાંકિત સંખ્યા નક્કી કરીએ છીએ

આ પરિવારોમાં બાળકોની સંખ્યા 2 જેટલી છે, તેથી = 2. આમ, 50% પરિવારોમાં બાળકોની સંખ્યા 2 કરતાં વધી નથી.

- મધ્ય અંતરાલ પહેલાની સંચિત આવર્તન;

એક તરફ, આ એક ખૂબ જ હકારાત્મક મિલકત છે કારણ કે આ કિસ્સામાં, અભ્યાસ હેઠળની વસ્તીના તમામ એકમોને અસર કરતા તમામ કારણોની અસરને ધ્યાનમાં લેવામાં આવે છે. બીજી બાજુ, સંજોગ દ્વારા સ્ત્રોત ડેટામાં સમાવિષ્ટ એક અવલોકન પણ વિચારણા હેઠળની વસ્તીમાં (ખાસ કરીને ટૂંકી શ્રેણીમાં) અભ્યાસ કરવામાં આવતા લક્ષણના વિકાસના સ્તરના વિચારને નોંધપાત્ર રીતે વિકૃત કરી શકે છે.

ચતુર્થાંશ અને ડેસિલ્સ.વિવિધતા શ્રેણીમાં મધ્ય શોધવા સાથે સામ્યતા દ્વારા, તમે ક્રમાંકિત શ્રેણીના કોઈપણ એકમ માટે લાક્ષણિકતાનું મૂલ્ય શોધી શકો છો. તેથી, ખાસ કરીને, તમે શ્રેણીને 4 સમાન ભાગોમાં, 10, વગેરેમાં વિભાજીત કરતા એકમો માટે વિશેષતાનું મૂલ્ય શોધી શકો છો.

ચતુર્થાંશ.વિકલ્પો કે જે ક્રમાંકિત શ્રેણીને ચાર સમાન ભાગોમાં વિભાજીત કરે છે તેને ચતુર્થાંશ કહેવામાં આવે છે.

આ કિસ્સામાં, તેઓ અલગ પાડે છે: નીચલા (અથવા પ્રથમ) ચતુર્થાંશ (Q1) - ક્રમાંકિત શ્રેણીના એકમ માટે વિશેષતાનું મૂલ્ય, વસ્તીને ¼ થી ¾ ના ગુણોત્તરમાં વિભાજીત કરીને અને ઉપલા (અથવા ત્રીજા) ચતુર્થાંશ ( Q3) - ક્રમાંકિત શ્રેણીના એકમ માટે વિશેષતાનું મૂલ્ય, વસ્તીને ¾ થી ¼ ના ગુણોત્તરમાં વિભાજીત કરીને.

- ચતુર્થાંશ અંતરાલોની આવર્તન (નીચલા અને ઉપલા)

Q1 અને Q3 ધરાવતા અંતરાલો સંચિત ફ્રીક્વન્સીઝ (અથવા ફ્રીક્વન્સીઝ) દ્વારા નક્કી કરવામાં આવે છે.

ડેસીલ્સ.ક્વાર્ટાઇલ્સ ઉપરાંત, ડેસિલ્સની ગણતરી કરવામાં આવે છે - વિકલ્પો કે જે ક્રમાંકિત શ્રેણીને 10 સમાન ભાગોમાં વિભાજિત કરે છે.

તેઓ ડી દ્વારા નિયુક્ત કરવામાં આવે છે, પ્રથમ ડેસિલ ડી 1 શ્રેણીને 1/10 અને 9/10 ના ગુણોત્તરમાં વિભાજિત કરે છે, બીજો D2 - 2/10 અને 8/10, વગેરે. તેઓ મધ્યક અને ચતુર્થાંશની સમાન યોજના અનુસાર ગણવામાં આવે છે.

મધ્યક, ક્વાર્ટાઈલ્સ અને ડેસીલ બંને કહેવાતા ઓર્ડિનલ સ્ટેટિસ્ટિક્સના છે, જેને એક વિકલ્પ તરીકે સમજવામાં આવે છે જે ક્રમાંકિત શ્રેણીમાં ચોક્કસ ઓર્ડિનલ સ્થાન ધરાવે છે.



શું તમને લેખ ગમ્યો? તમારા મિત્રો સાથે શેર કરો!