આંકડામાં વિવિધતા શ્રેણી શું છે. વિવિધતા શ્રેણીની વ્યાખ્યા

આ પ્રકરણમાં નિપુણતા મેળવવાના પરિણામે, વિદ્યાર્થીએ આવશ્યક: ખબર

  • વિવિધતાના સૂચકાંકો અને તેમના સંબંધો;
  • લાક્ષણિકતાઓના વિતરણના મૂળભૂત નિયમો;
  • સંમતિ માપદંડનો સાર; માટે સમર્થ થાઓ
  • વિવિધતાના સૂચકાંકોની ગણતરી કરો અને યોગ્યતાના માપદંડો;
  • વિતરણ લાક્ષણિકતાઓ નક્કી કરો;
  • આંકડાકીય વિતરણ શ્રેણીની મૂળભૂત સંખ્યાત્મક લાક્ષણિકતાઓનું મૂલ્યાંકન કરો;

પોતાના

  • વિતરણ શ્રેણીના આંકડાકીય વિશ્લેષણની પદ્ધતિઓ;
  • વિભિન્નતાના વિશ્લેષણની મૂળભૂત બાબતો;
  • વિતરણના મૂળભૂત કાયદાઓનું પાલન કરવા માટે આંકડાકીય વિતરણ શ્રેણી તપાસવા માટેની તકનીકો.

વિવિધતા સૂચકાંકો

વિવિધ આંકડાકીય વસ્તીની લાક્ષણિકતાઓના આંકડાકીય અભ્યાસમાં, વસ્તીના વ્યક્તિગત આંકડાકીય એકમોની લાક્ષણિકતાની વિવિધતા તેમજ આ લાક્ષણિકતા અનુસાર એકમોના વિતરણની પ્રકૃતિનો અભ્યાસ કરવો ખૂબ જ રસપ્રદ છે. ભિન્નતા -આ અભ્યાસ કરવામાં આવી રહેલા વસ્તીના એકમોમાં લાક્ષણિકતાના વ્યક્તિગત મૂલ્યોમાં તફાવત છે. વિવિધતાનો અભ્યાસ ખૂબ જ વ્યવહારુ મહત્વ ધરાવે છે. વિવિધતાની ડિગ્રી દ્વારા, વ્યક્તિ લાક્ષણિકતાની વિવિધતાની મર્યાદા, આપેલ લાક્ષણિકતા માટે વસ્તીની એકરૂપતા, સરેરાશની લાક્ષણિકતા અને વિવિધતાને નિર્ધારિત કરતા પરિબળોના સંબંધને નક્કી કરી શકે છે. ભિન્નતા સૂચકાંકોનો ઉપયોગ આંકડાકીય વસ્તીને દર્શાવવા અને ગોઠવવા માટે થાય છે.

આંકડાકીય અવલોકન સામગ્રીના સારાંશ અને જૂથીકરણના પરિણામો, આંકડાકીય વિતરણ શ્રેણીના સ્વરૂપમાં રજૂ કરવામાં આવે છે, અભ્યાસ હેઠળની વસ્તીના એકમોના જૂથીકરણ (વિવિધ) માપદંડો અનુસાર જૂથોમાં ક્રમબદ્ધ વિતરણનું પ્રતિનિધિત્વ કરે છે. જો કોઈ ગુણાત્મક લાક્ષણિકતાને જૂથીકરણના આધાર તરીકે લેવામાં આવે છે, તો આવી વિતરણ શ્રેણી કહેવામાં આવે છે વિશેષતા(વ્યવસાય, લિંગ, રંગ, વગેરે દ્વારા વિતરણ). જો વિતરણ શ્રેણી માત્રાત્મક ધોરણે બાંધવામાં આવે છે, તો આવી શ્રેણી કહેવામાં આવે છે વિવિધતાલક્ષી(ઊંચાઈ, વજન, પગાર, વગેરે દ્વારા વિતરણ). વિવિધતા શ્રેણી બનાવવાનો અર્થ છે લાક્ષણિક મૂલ્યો દ્વારા વસ્તી એકમોના જથ્થાત્મક વિતરણને ગોઠવવા, આ મૂલ્યો (આવર્તન) સાથે વસ્તી એકમોની સંખ્યાની ગણતરી કરો અને પરિણામોને કોષ્ટકમાં ગોઠવો.

વેરિઅન્ટની આવર્તનને બદલે, અવલોકનોના કુલ જથ્થામાં તેના ગુણોત્તરનો ઉપયોગ કરવો શક્ય છે, જેને આવર્તન (રિલેટિવ ફ્રીક્વન્સી) કહેવામાં આવે છે.

વિવિધતા શ્રેણીના બે પ્રકાર છે: અલગ અને અંતરાલ. અલગ શ્રેણી- આ એક ભિન્નતા શ્રેણી છે, જેનું નિર્માણ અસંતુલિત ફેરફારો (અલગ લાક્ષણિકતાઓ) સાથેની લાક્ષણિકતાઓ પર આધારિત છે. બાદમાં એન્ટરપ્રાઇઝમાં કર્મચારીઓની સંખ્યા, ટેરિફ કેટેગરી, પરિવારમાં બાળકોની સંખ્યા વગેરેનો સમાવેશ થાય છે. એક અલગ ભિન્નતા શ્રેણી કોષ્ટકનું પ્રતિનિધિત્વ કરે છે જેમાં બે કૉલમ હોય છે. પ્રથમ કૉલમ એટ્રિબ્યુટનું ચોક્કસ મૂલ્ય સૂચવે છે, અને બીજી કૉલમ વિશેષતાના ચોક્કસ મૂલ્ય સાથે વસ્તીમાં એકમોની સંખ્યા સૂચવે છે. જો કોઈ લાક્ષણિકતામાં સતત ફેરફાર થાય છે (આવકની રકમ, સેવાની લંબાઈ, એન્ટરપ્રાઇઝની નિશ્ચિત સંપત્તિની કિંમત, વગેરે, જે ચોક્કસ મર્યાદામાં કોઈપણ મૂલ્યો લઈ શકે છે), તો આ લાક્ષણિકતા માટે બાંધકામ શક્ય છે. અંતરાલ વિવિધતા શ્રેણી.અંતરાલ વિવિધતા શ્રેણી બનાવતી વખતે, કોષ્ટકમાં બે કૉલમ પણ હોય છે. પ્રથમ "થી - થી" (વિકલ્પો) અંતરાલમાં લક્ષણનું મૂલ્ય સૂચવે છે, બીજું અંતરાલ (આવર્તન) માં સમાવિષ્ટ એકમોની સંખ્યા સૂચવે છે. આવર્તન (પુનરાવર્તન આવર્તન) - વિશેષતા મૂલ્યોના ચોક્કસ પ્રકારના પુનરાવર્તનોની સંખ્યા. અંતરાલો બંધ અથવા ખુલ્લા હોઈ શકે છે. બંધ અંતરાલો બંને બાજુઓ પર મર્યાદિત છે, એટલે કે. નીચલી ("થી") અને ઉપલી ("થી") સીમા બંને હોય છે. ખુલ્લા અંતરાલોમાં એક સીમા હોય છે: કાં તો ઉપલી અથવા નીચેની. જો વિકલ્પો ચડતા અથવા ઉતરતા ક્રમમાં ગોઠવાયેલા હોય, તો પંક્તિઓ કહેવામાં આવે છે ક્રમાંકિત

વિવિધતા શ્રેણી માટે, બે પ્રકારના આવર્તન પ્રતિભાવ વિકલ્પો છે: સંચિત આવર્તન અને સંચિત આવર્તન. સંચિત આવર્તન દર્શાવે છે કે કેટલા અવલોકનો લાક્ષણિકતાના મૂલ્યે આપેલ મૂલ્ય કરતાં ઓછા મૂલ્યો લીધા. સંચિત આવર્તન અગાઉના જૂથોની તમામ ફ્રીક્વન્સીઝ સાથે આપેલ જૂથ માટે લાક્ષણિકતાના આવર્તન મૂલ્યોનો સરવાળો કરીને નક્કી કરવામાં આવે છે. સંચિત આવર્તન અવલોકન એકમોના પ્રમાણને લાક્ષણિકતા આપે છે જેની વિશેષતા મૂલ્યો આપેલ જૂથની ઉપલી મર્યાદા કરતાં વધી નથી. આમ, સંચિત આવર્તન સંપૂર્ણતામાં વિકલ્પોનું પ્રમાણ દર્શાવે છે કે જેનું મૂલ્ય આપેલ કરતાં વધુ ન હોય. આવર્તન, આવર્તન, સંપૂર્ણ અને સંબંધિત ઘનતા, સંચિત આવર્તન અને આવર્તન એ વેરિઅન્ટની તીવ્રતાની લાક્ષણિકતાઓ છે.

વસ્તીના આંકડાકીય એકમોની લાક્ષણિકતાઓમાં ભિન્નતા, તેમજ વિતરણની પ્રકૃતિ, વિવિધતા શ્રેણીના સૂચકો અને લાક્ષણિકતાઓનો ઉપયોગ કરીને અભ્યાસ કરવામાં આવે છે, જેમાં શ્રેણીનું સરેરાશ સ્તર, સરેરાશ રેખીય વિચલન, પ્રમાણભૂત વિચલન, વિક્ષેપનો સમાવેશ થાય છે. , ઓસિલેશન, ભિન્નતા, અસમપ્રમાણતા, કર્ટોસિસ, વગેરેના ગુણાંક.

સરેરાશ મૂલ્યોનો ઉપયોગ વિતરણ કેન્દ્રની લાક્ષણિકતા માટે થાય છે. સરેરાશ એ એક સામાન્યીકરણ આંકડાકીય લાક્ષણિકતા છે જેમાં અભ્યાસ કરવામાં આવતી વસ્તીના સભ્યો દ્વારા કબજામાં રહેલી લાક્ષણિકતાના લાક્ષણિક સ્તરનું પ્રમાણ નક્કી કરવામાં આવે છે. જો કે, વિવિધ વિતરણ પેટર્ન સાથે અંકગણિત માધ્યમોના સંયોગના કિસ્સાઓ શક્ય છે, તેથી, વિવિધતા શ્રેણીની આંકડાકીય લાક્ષણિકતાઓ તરીકે, કહેવાતા માળખાકીય માધ્યમોની ગણતરી કરવામાં આવે છે - મોડ, મધ્ય, તેમજ ક્વોન્ટાઇલ્સ, જે વિતરણ શ્રેણીને સમાન ભાગોમાં વિભાજિત કરે છે. (ચતુર્થાંશ, ડેસિલ્સ, પર્સન્ટાઇલ્સ, વગેરે).

ફેશન -આ એક લાક્ષણિકતાનું મૂલ્ય છે જે વિતરણ શ્રેણીમાં તેના અન્ય મૂલ્યો કરતાં વધુ વખત જોવા મળે છે. સ્વતંત્ર શ્રેણી માટે, આ સૌથી વધુ આવર્તન સાથેનો વિકલ્પ છે. અંતરાલ વિવિધતા શ્રેણીમાં, મોડને નિર્ધારિત કરવા માટે, તે કયા અંતરાલમાં સ્થિત છે તે નક્કી કરવું જરૂરી છે, કહેવાતા મોડલ અંતરાલ. સમાન અંતરાલો સાથેની વિવિધતા શ્રેણીમાં, મોડલ અંતરાલ સૌથી વધુ આવર્તન દ્વારા નક્કી કરવામાં આવે છે, અસમાન અંતરાલો સાથે શ્રેણીમાં - પરંતુ સૌથી વધુ વિતરણ ઘનતા દ્વારા. પછી સૂત્રનો ઉપયોગ સમાન અંતરાલો પર પંક્તિઓમાં મોડ નક્કી કરવા માટે થાય છે

જ્યાં Mo એ ફેશન મૂલ્ય છે; xMo - મોડલ અંતરાલની નીચી મર્યાદા; h-મોડલ અંતરાલ પહોળાઈ; / Mo - મોડલ અંતરાલની આવર્તન; / Mo j એ પ્રીમોડલ અંતરાલની આવર્તન છે; / Mo+1 એ પોસ્ટ-મોડલ અંતરાલની આવર્તન છે અને આ ગણતરીના સૂત્રમાં અસમાન અંતરાલો સાથેની શ્રેણી માટે, ફ્રીક્વન્સીઝ / Mo, / Mo, / Moને બદલે, વિતરણ ઘનતાનો ઉપયોગ કરવો જોઈએ મન 0 _| , મન 0> UMO+"

જો સિંગલ મોડ હોય, તો રેન્ડમ ચલના સંભવિત વિતરણને યુનિમોડલ કહેવામાં આવે છે; જો ત્યાં એક કરતાં વધુ મોડ હોય, તો તેને મલ્ટિમોડલ (પોલિમોડલ, મલ્ટિમોડલ) કહેવામાં આવે છે, બે મોડના કિસ્સામાં - બિમોડલ. એક નિયમ તરીકે, બહુવિધતા સૂચવે છે કે અભ્યાસ હેઠળનું વિતરણ સામાન્ય વિતરણ કાયદાનું પાલન કરતું નથી. સજાતીય વસ્તી, એક નિયમ તરીકે, એકલ-શિરોબિંદુ વિતરણ દ્વારા વર્ગીકૃત થયેલ છે. મલ્ટિવર્ટેક્સ પણ અભ્યાસ કરવામાં આવી રહેલી વસ્તીની વિવિધતા સૂચવે છે. બે અથવા વધુ શિરોબિંદુઓનો દેખાવ વધુ એકરૂપ જૂથોને ઓળખવા માટે ડેટાને ફરીથી જૂથબદ્ધ કરવું જરૂરી બનાવે છે.

અંતરાલ વિવિધતા શ્રેણીમાં, હિસ્ટોગ્રામનો ઉપયોગ કરીને મોડને ગ્રાફિકલી રીતે નક્કી કરી શકાય છે. આ કરવા માટે, હિસ્ટોગ્રામના ઉચ્ચતમ કૉલમના ટોચના બિંદુઓથી બે અડીને આવેલા કૉલમના ટોચના બિંદુઓ સુધી બે છેદતી રેખાઓ દોરો. પછી, તેમના આંતરછેદના બિંદુથી, એક કાટખૂણે એબ્સીસા અક્ષ પર નીચે આવે છે. લંબને અનુરૂપ x-અક્ષ પરની વિશેષતાનું મૂલ્ય મોડ છે. ઘણા કિસ્સાઓમાં, જ્યારે વસ્તીને સામાન્યકૃત સૂચક તરીકે દર્શાવવામાં આવે છે, ત્યારે અંકગણિત સરેરાશને બદલે મોડને પ્રાધાન્ય આપવામાં આવે છે.

મધ્યક -આ એટ્રિબ્યુટનું કેન્દ્રિય મૂલ્ય છે; તે વિતરણની ક્રમાંકિત શ્રેણીના કેન્દ્રિય સભ્ય પાસે છે. અલગ શ્રેણીમાં, મધ્યનું મૂલ્ય શોધવા માટે, તેનો સીરીયલ નંબર પ્રથમ નિર્ધારિત કરવામાં આવે છે. આ કરવા માટે, જો એકમોની સંખ્યા વિચિત્ર હોય, તો તમામ ફ્રીક્વન્સીઝના સરવાળામાં એક ઉમેરવામાં આવે છે, અને સંખ્યાને બે વડે વિભાજિત કરવામાં આવે છે. જો ત્યાં એક પંક્તિમાં સમાન સંખ્યાના એકમો હોય, તો ત્યાં બે મધ્ય એકમો હશે, તેથી આ કિસ્સામાં મધ્યકને બે મધ્ય એકમોના મૂલ્યોની સરેરાશ તરીકે વ્યાખ્યાયિત કરવામાં આવે છે. આમ, એક અલગ ભિન્નતા શ્રેણીમાં મધ્યક એ મૂલ્ય છે જે શ્રેણીને સમાન સંખ્યામાં વિકલ્પો ધરાવતા બે ભાગોમાં વિભાજિત કરે છે.

અંતરાલ શ્રેણીમાં, મધ્યકનો સીરીયલ નંબર નક્કી કર્યા પછી, મધ્યવર્તી અંતરાલ સંચિત ફ્રીક્વન્સીઝ (આવર્તન) નો ઉપયોગ કરીને જોવા મળે છે, અને પછી મધ્યકની ગણતરી માટે સૂત્રનો ઉપયોગ કરીને, મધ્યકનું મૂલ્ય પોતે જ નક્કી કરવામાં આવે છે:

જ્યાં હું સરેરાશ મૂલ્ય છે; x હું -મધ્ય અંતરાલની નીચી મર્યાદા; h-મધ્ય અંતરાલની પહોળાઈ; - વિતરણ શ્રેણીની ફ્રીક્વન્સીઝનો સરવાળો; /D - પૂર્વ-મધ્ય અંતરાલની સંચિત આવર્તન; / મી - મધ્ય અંતરાલની આવર્તન.

ક્યુમ્યુલેટનો ઉપયોગ કરીને મધ્યકને ગ્રાફિકલી શોધી શકાય છે. આ કરવા માટે, ક્યુમ્યુલેટની સંચિત ફ્રીક્વન્સીઝ (ફ્રીક્વન્સીઝ) ના સ્કેલ પર, મધ્યની ક્રમાંકિત સંખ્યાને અનુરૂપ બિંદુથી, એક સીધી રેખા એબ્સિસા અક્ષની સમાંતર દોરવામાં આવે છે જ્યાં સુધી તે ક્યુમ્યુલેટ સાથે છેદે નહીં. આગળ, ક્યુમ્યુલેટ સાથે દર્શાવેલ રેખાના આંતરછેદના બિંદુથી, એક કાટખૂણે એબ્સીસા અક્ષ પર નીચે આવે છે. દોરેલા ઓર્ડિનેટ (લંબ) ને અનુરૂપ x-અક્ષ પરના લક્ષણનું મૂલ્ય મધ્યક છે.

મધ્યક નીચેના ગુણધર્મો દ્વારા વર્ગીકૃત થયેલ છે.

  • 1. તે તે વિશેષતા મૂલ્યો પર આધારિત નથી જે તેની બંને બાજુએ સ્થિત છે.
  • 2. તેની પાસે લઘુત્તમતાનો ગુણધર્મ છે, જેનો અર્થ છે કે મધ્યકમાંથી વિશેષતા મૂલ્યોના સંપૂર્ણ વિચલનોનો સરવાળો અન્ય કોઈપણ મૂલ્યમાંથી વિશેષતા મૂલ્યોના વિચલનની તુલનામાં લઘુત્તમ મૂલ્ય દર્શાવે છે.
  • 3. જ્યારે જાણીતા મધ્યક સાથે બે વિતરણોને જોડવામાં આવે છે, ત્યારે નવા વિતરણના મધ્યકના મૂલ્યની અગાઉથી આગાહી કરવી અશક્ય છે.

સાર્વજનિક સેવા બિંદુઓ - શાળાઓ, ક્લિનિક્સ, ગેસ સ્ટેશનો, પાણીના પંપ, વગેરેના સ્થાનને ડિઝાઇન કરતી વખતે મધ્યના આ ગુણધર્મોનો વ્યાપકપણે ઉપયોગ થાય છે. ઉદાહરણ તરીકે, જો શહેરના ચોક્કસ બ્લોકમાં ક્લિનિક બનાવવાનું આયોજન કરવામાં આવ્યું છે, તો તેને બ્લોકમાં એવા બિંદુએ સ્થિત કરવું વધુ યોગ્ય રહેશે જે બ્લોકની લંબાઈને નહીં, પરંતુ રહેવાસીઓની સંખ્યાને અડધી કરે.

મોડ, મધ્ય અને અંકગણિત સરેરાશનો ગુણોત્તર એકંદરમાં લાક્ષણિકતાના વિતરણની પ્રકૃતિ સૂચવે છે અને અમને વિતરણની સમપ્રમાણતાનું મૂલ્યાંકન કરવાની મંજૂરી આપે છે. જો x Me પછી શ્રેણીની જમણી બાજુની અસમપ્રમાણતા છે. સામાન્ય વિતરણ સાથે X -હું - મો.

K. પીયર્સન, વિવિધ પ્રકારના વળાંકોના સંરેખણના આધારે, નિર્ધારિત કર્યું કે સાધારણ અસમપ્રમાણ વિતરણો માટે અંકગણિત સરેરાશ, મધ્ય અને સ્થિતિ વચ્ચેના નીચેના અંદાજિત સંબંધો માન્ય છે:

જ્યાં હું સરેરાશ મૂલ્ય છે; મો - ફેશનનો અર્થ; x અંકગણિત - અંકગણિત સરેરાશનું મૂલ્ય.

જો ભિન્નતા શ્રેણીની રચનાનો વધુ વિગતવાર અભ્યાસ કરવાની જરૂર હોય, તો પછી મધ્યકની સમાન લાક્ષણિકતા મૂલ્યોની ગણતરી કરો. આવા લાક્ષણિક મૂલ્યો તમામ વિતરણ એકમોને સમાન સંખ્યામાં વિભાજિત કરે છે તેમને ક્વોન્ટાઇલ્સ અથવા ગ્રેડિયન્ટ્સ કહેવામાં આવે છે. ક્વોન્ટાઈલ્સને ક્વાર્ટાઈલ્સ, ડેસીલ્સ, પર્સન્ટાઈલ્સ વગેરેમાં વિભાજિત કરવામાં આવે છે.

ચતુર્થાંશ વસ્તીને ચાર સમાન ભાગોમાં વહેંચે છે. પ્રથમ ત્રિમાસિક અંતરાલ અગાઉ નિર્ધારિત કર્યા પછી પ્રથમ ચતુર્થાંશની ગણતરી પ્રથમ ચતુર્થાંશની ગણતરી માટેના સૂત્રનો ઉપયોગ કરીને મધ્યકની જેમ જ કરવામાં આવે છે:

જ્યાં Qi એ પ્રથમ ચતુર્થાંશનું મૂલ્ય છે; xQ^-પ્રથમ ચતુર્થાંશ શ્રેણીની નીચી મર્યાદા; h- પ્રથમ ક્વાર્ટરના અંતરાલની પહોળાઈ; /, - અંતરાલ શ્રેણીની ફ્રીક્વન્સીઝ;

પ્રથમ ચતુર્થાંશ અંતરાલ પહેલાના અંતરાલમાં સંચિત આવર્તન; Jq ( - પ્રથમ ચતુર્થાંશ અંતરાલની આવર્તન.

પ્રથમ ચતુર્થાંશ દર્શાવે છે કે વસ્તીના 25% એકમો તેના મૂલ્ય કરતા ઓછા છે, અને 75% વધુ છે. બીજો ચતુર્થાંશ મધ્યક સમાન છે, એટલે કે. પ્રશ્ન 2 =મને.

સાદ્રશ્ય દ્વારા, ત્રીજા ચતુર્થાંશની ગણતરી કરવામાં આવે છે, જેમાં પ્રથમ ત્રીજો ત્રિમાસિક અંતરાલ મળ્યો હતો:

ત્રીજા ચતુર્થાંશ શ્રેણીની નીચી મર્યાદા ક્યાં છે; h- ત્રીજા ચતુર્થાંશ અંતરાલની પહોળાઈ; /, - અંતરાલ શ્રેણીની ફ્રીક્વન્સીઝ; /X" -પૂર્વવર્તી અંતરાલમાં સંચિત આવર્તન

જી

ત્રીજા ચતુર્થાંશ અંતરાલ; Jq એ ત્રીજા ચતુર્થાંશ અંતરાલની આવર્તન છે.

ત્રીજો ચતુર્થાંશ દર્શાવે છે કે વસ્તીના 75% એકમો તેના મૂલ્ય કરતા ઓછા છે, અને 25% વધુ છે.

ત્રીજા અને પ્રથમ ચતુર્થાંશ વચ્ચેનો તફાવત ઇન્ટરક્વાર્ટાઇલ શ્રેણી છે:

જ્યાં Aq એ ઇન્ટરક્વાર્ટાઇલ રેન્જનું મૂલ્ય છે; પ્રશ્ન 3 -ત્રીજા ચતુર્થાંશ મૂલ્ય; Q, પ્રથમ ચતુર્થાંશનું મૂલ્ય છે.

Deciles વસ્તીને 10 સમાન ભાગોમાં વહેંચે છે. ડેસિલ એ વિતરણ શ્રેણીમાં લાક્ષણિકતાનું મૂલ્ય છે જે વસ્તીના કદના દસમા ભાગને અનુરૂપ છે. ચતુર્થાંશ સાથે સામ્યતા દ્વારા, પ્રથમ દશાંશ દર્શાવે છે કે વસ્તીના એકમોના 10% તેના મૂલ્ય કરતા ઓછા છે, અને 90% વધારે છે, અને નવમો દશાંશ દર્શાવે છે કે વસ્તીના એકમોના 90% તેના મૂલ્ય કરતા ઓછા છે, અને 10% વધારે નવમા અને પ્રથમ ડેસિલ્સનો ગુણોત્તર, એટલે કે. 10% સૌથી વધુ સમૃદ્ધ અને 10% ઓછી સમૃદ્ધ વસ્તીની આવકના સ્તરના ગુણોત્તરને માપવા માટે આવકના તફાવતના અભ્યાસમાં ડેસિલ ગુણાંકનો વ્યાપકપણે ઉપયોગ થાય છે. ટકાવારી ક્રમાંકિત વસ્તીને 100 સમાન ભાગોમાં વિભાજિત કરે છે. પર્સન્ટાઈલ્સની ગણતરી, અર્થ અને એપ્લીકેશન ડેસીલ સમાન છે.

ક્વાર્ટાઇલ્સ, ડેસીલ્સ અને અન્ય માળખાકીય લાક્ષણિકતાઓ ગ્રાફિકલી ક્યુમ્યુલેટ્સનો ઉપયોગ કરીને મધ્યક સાથે સામ્યતા દ્વારા નક્કી કરી શકાય છે.

વિવિધતાના કદને માપવા માટે, નીચેના સૂચકાંકોનો ઉપયોગ કરવામાં આવે છે: વિવિધતાની શ્રેણી, સરેરાશ રેખીય વિચલન, પ્રમાણભૂત વિચલન, વિક્ષેપ. વિવિધતા શ્રેણીની તીવ્રતા શ્રેણીના આત્યંતિક સભ્યોના વિતરણની રેન્ડમનેસ પર સંપૂર્ણપણે આધાર રાખે છે. આ સૂચક એવા કિસ્સાઓમાં રસ ધરાવે છે જ્યાં લાક્ષણિકતાના મૂલ્યોમાં વધઘટનું કંપનવિસ્તાર શું છે તે જાણવું મહત્વપૂર્ણ છે:

જ્યાં આર-વિવિધતાની શ્રેણીનું મૂલ્ય; x મહત્તમ - વિશેષતાનું મહત્તમ મૂલ્ય; x tt -લક્ષણનું ન્યૂનતમ મૂલ્ય.

વિવિધતાની શ્રેણીની ગણતરી કરતી વખતે, શ્રેણીના સભ્યોની વિશાળ બહુમતીનું મૂલ્ય ધ્યાનમાં લેવામાં આવતું નથી, જ્યારે વિવિધતા શ્રેણી સભ્યના દરેક મૂલ્ય સાથે સંકળાયેલી હોય છે. સૂચકાંકો જે તેમના સરેરાશ મૂલ્યમાંથી લાક્ષણિકતાના વ્યક્તિગત મૂલ્યોના વિચલનોથી મેળવેલા સરેરાશ છે તેમાં આ ખામી નથી: સરેરાશ રેખીય વિચલન અને પ્રમાણભૂત વિચલન. સરેરાશથી વ્યક્તિગત વિચલનો અને ચોક્કસ લક્ષણની પરિવર્તનશીલતા વચ્ચે સીધો સંબંધ છે. વધઘટ જેટલી મજબૂત, એવરેજથી વિચલનોનું ચોક્કસ કદ જેટલું વધારે છે.

સરેરાશ રેખીય વિચલન એ તેમના સરેરાશ મૂલ્યમાંથી વ્યક્તિગત વિકલ્પોના વિચલનોના સંપૂર્ણ મૂલ્યોનો અંકગણિત સરેરાશ છે.

જૂથ વિનાના ડેટા માટે સરેરાશ રેખીય વિચલન

જ્યાં /pr એ સરેરાશ રેખીય વિચલનનું મૂલ્ય છે; x, - એ એટ્રિબ્યુટનું મૂલ્ય છે; X - p -વસ્તીમાં એકમોની સંખ્યા.

જૂથબદ્ધ શ્રેણીનું સરેરાશ રેખીય વિચલન

જ્યાં / vz - સરેરાશ રેખીય વિચલનનું મૂલ્ય; x, લક્ષણનું મૂલ્ય છે; X -અભ્યાસ કરવામાં આવતી વસ્તી માટે લાક્ષણિકતાનું સરેરાશ મૂલ્ય; / - અલગ જૂથમાં વસ્તી એકમોની સંખ્યા.

આ કિસ્સામાં, વિચલનોના ચિહ્નોને અવગણવામાં આવે છે, અન્યથા તમામ વિચલનોનો સરવાળો શૂન્ય સમાન હશે. સરેરાશ રેખીય વિચલન, વિશ્લેષિત ડેટાના જૂથના આધારે, વિવિધ સૂત્રોનો ઉપયોગ કરીને ગણવામાં આવે છે: જૂથબદ્ધ અને જૂથ વિનાના ડેટા માટે. તેના સંમેલનને લીધે, સરેરાશ રેખીય વિચલન, વિવિધતાના અન્ય સૂચકાંકોથી અલગ, વ્યવહારમાં પ્રમાણમાં ભાગ્યે જ ઉપયોગમાં લેવાય છે (ખાસ કરીને, ડિલિવરીની એકરૂપતા સંબંધિત કરારની જવાબદારીઓની પરિપૂર્ણતાની લાક્ષણિકતા માટે; વિદેશી વેપાર ટર્નઓવરના વિશ્લેષણમાં, રચના કર્મચારીઓની, ઉત્પાદનની લય, ઉત્પાદનની ગુણવત્તા, ઉત્પાદનની તકનીકી લાક્ષણિકતાઓને ધ્યાનમાં લેતા અને વગેરે).

પ્રમાણભૂત વિચલન એ લાક્ષણિકતા દર્શાવે છે કે જે લાક્ષણિકતાનો અભ્યાસ કરવામાં આવી રહ્યો છે તેના વ્યક્તિગત મૂલ્યો વસ્તીના સરેરાશ મૂલ્યથી કેટલા વિચલિત થાય છે, અને અભ્યાસ કરવામાં આવી રહેલી લાક્ષણિકતાના માપનના એકમોમાં દર્શાવવામાં આવે છે. પ્રમાણભૂત વિચલન, વિવિધતાના મુખ્ય માપદંડોમાંનું એક હોવાને કારણે, એક સમાન વસ્તીમાં લાક્ષણિકતાની વિવિધતાની મર્યાદાઓનું મૂલ્યાંકન કરવા, સામાન્ય વિતરણ વળાંકના ઓર્ડિનેટ મૂલ્યો નક્કી કરવા તેમજ સંબંધિત ગણતરીઓમાં વ્યાપકપણે ઉપયોગમાં લેવાય છે. નમૂનાના નિરીક્ષણનું સંગઠન અને નમૂનાની લાક્ષણિકતાઓની ચોકસાઈ સ્થાપિત કરવી. જૂથ વિનાના ડેટાના પ્રમાણભૂત વિચલનની ગણતરી નીચેના અલ્ગોરિધમનો ઉપયોગ કરીને કરવામાં આવે છે: સરેરાશમાંથી દરેક વિચલનનો વર્ગ કરવામાં આવે છે, બધા ચોરસનો સરવાળો કરવામાં આવે છે, ત્યારબાદ વર્ગોના સરવાળાને શ્રેણીની શરતોની સંખ્યા દ્વારા વિભાજિત કરવામાં આવે છે અને તેમાંથી વર્ગમૂળ કાઢવામાં આવે છે. ભાગ

જ્યાં IIP એ પ્રમાણભૂત વિચલનનું મૂલ્ય છે; Xj-લક્ષણ મૂલ્ય; એક્સ- અભ્યાસ કરવામાં આવતી વસ્તી માટે લાક્ષણિકતાનું સરેરાશ મૂલ્ય; p -વસ્તીમાં એકમોની સંખ્યા.

જૂથબદ્ધ વિશ્લેષિત ડેટા માટે, ડેટાના પ્રમાણભૂત વિચલનની ગણતરી ભારિત સૂત્રનો ઉપયોગ કરીને કરવામાં આવે છે.

જ્યાં - પ્રમાણભૂત વિચલન મૂલ્ય; Xj-લક્ષણ મૂલ્ય; X -અભ્યાસ કરવામાં આવતી વસ્તી માટે લાક્ષણિકતાનું સરેરાશ મૂલ્ય; f x -ચોક્કસ જૂથમાં વસ્તી એકમોની સંખ્યા.

બંને કિસ્સાઓમાં મૂળ હેઠળની અભિવ્યક્તિને વિભિન્નતા કહેવામાં આવે છે. આમ, વિક્ષેપની ગણતરી તેમના સરેરાશ મૂલ્યમાંથી વિશેષતા મૂલ્યોના વિચલનોના સરેરાશ વર્ગ તરીકે કરવામાં આવે છે. અવિભાજિત (સરળ) વિશેષતા મૂલ્યો માટે, ભિન્નતા નીચે પ્રમાણે નક્કી કરવામાં આવે છે:

ભારિત લાક્ષણિકતા મૂલ્યો માટે

ભિન્નતાની ગણતરી માટે એક ખાસ સરળ પદ્ધતિ પણ છે: સામાન્ય રીતે

વજન વગરના (સરળ) લાક્ષણિકતા મૂલ્યો માટે ભારિત લાક્ષણિકતા મૂલ્યો માટે
શૂન્ય-આધારિત પદ્ધતિનો ઉપયોગ કરીને

જ્યાં 2 એ વિક્ષેપ મૂલ્ય છે; x, - એ એટ્રિબ્યુટનું મૂલ્ય છે; X -લાક્ષણિકતાનું સરેરાશ મૂલ્ય, h-જૂથ અંતરાલ મૂલ્ય, ટી 1 -વજન (A =

આંકડાઓમાં વિક્ષેપની પોતાની અભિવ્યક્તિ છે અને તે વિવિધતાના સૌથી મહત્વપૂર્ણ સૂચકોમાંનું એક છે. તે અભ્યાસ કરવામાં આવતી લાક્ષણિકતાના માપનના એકમોના વર્ગને અનુરૂપ એકમોમાં માપવામાં આવે છે.

વિક્ષેપમાં નીચેના ગુણધર્મો છે.

  • 1. સ્થિર મૂલ્યનું વિચલન શૂન્ય છે.
  • 2. સમાન મૂલ્ય A દ્વારા લાક્ષણિકતાના તમામ મૂલ્યોને ઘટાડવાથી વિક્ષેપનું મૂલ્ય બદલાતું નથી. આનો અર્થ એ છે કે વિચલનોના સરેરાશ વર્ગની ગણતરી લાક્ષણિકતાના આપેલા મૂલ્યોથી નહીં, પરંતુ અમુક સ્થિર સંખ્યામાંથી તેમના વિચલનોથી કરી શકાય છે.
  • 3. માં કોઈપણ લાક્ષણિકતા મૂલ્યોને ઘટાડવું kવખત દ્વારા ફેલાવો ઘટાડે છે k 2 વખત, અને પ્રમાણભૂત વિચલન અંદર છે kવખત, એટલે કે વિશેષતાના તમામ મૂલ્યોને અમુક સ્થિર સંખ્યા દ્વારા વિભાજિત કરી શકાય છે (કહો, શ્રેણી અંતરાલના મૂલ્ય દ્વારા), પ્રમાણભૂત વિચલનની ગણતરી કરી શકાય છે, અને પછી સતત સંખ્યા દ્વારા ગુણાકાર કરી શકાય છે.
  • 4. જો આપણે કોઈપણ મૂલ્યમાંથી વિચલનોના સરેરાશ વર્ગની ગણતરી કરીએ અનેઅંકગણિત સરેરાશથી એક ડિગ્રી અથવા બીજાથી અલગ હોય, તો તે અંકગણિત સરેરાશમાંથી ગણતરી કરાયેલ વિચલનોના સરેરાશ વર્ગ કરતા હંમેશા વધારે હશે. વિચલનોનો સરેરાશ વર્ગ ખૂબ ચોક્કસ રકમથી વધારે હશે - સરેરાશ અને આ પરંપરાગત રીતે લેવાયેલ મૂલ્ય વચ્ચેના તફાવતના વર્ગ દ્વારા.

વૈકલ્પિક લાક્ષણિકતાના ભિન્નતામાં વસ્તીના એકમોમાં અભ્યાસ કરેલ મિલકતની હાજરી અથવા ગેરહાજરીમાં સમાવેશ થાય છે. જથ્થાત્મક રીતે, વૈકલ્પિક વિશેષતાની વિવિધતા બે મૂલ્યો દ્વારા વ્યક્ત કરવામાં આવે છે: અભ્યાસ કરેલ મિલકતના એકમની હાજરી એક (1) દ્વારા સૂચવવામાં આવે છે, અને તેની ગેરહાજરી શૂન્ય (0) દ્વારા સૂચવવામાં આવે છે. અભ્યાસ કરવામાં આવી રહેલી મિલકત ધરાવતા એકમોના પ્રમાણને P દ્વારા સૂચવવામાં આવે છે, અને જે એકમો પાસે આ મિલકત નથી તેનું પ્રમાણ આના દ્વારા સૂચવવામાં આવે છે. જી.આમ, વૈકલ્પિક વિશેષતાનો તફાવત આ મિલકત ધરાવતા એકમોના ગુણોત્તર (P) ના ગુણોત્તર સાથે આ મિલકત ધરાવતા ન હોય તેવા એકમોના ગુણોત્તર સમાન છે. (જી).વસ્તીમાં સૌથી મોટો તફાવત એવા કિસ્સાઓમાં પ્રાપ્ત થાય છે કે જ્યાં વસ્તીનો એક ભાગ, જે વસ્તીના કુલ જથ્થાના 50% નો હિસ્સો ધરાવે છે, તેની લાક્ષણિકતા છે, અને વસ્તીનો બીજો ભાગ, જે 50% જેટલો છે, તેની પાસે આ લાક્ષણિકતા નથી, અને વિક્ષેપ 0.25 ના મહત્તમ મૂલ્ય સુધી પહોંચે છે, t.e. પી = 0.5, જી= 1 - P = 1 - 0.5 = 0.5 અને o 2 = 0.5 0.5 = 0.25. આ સૂચકની નીચલી મર્યાદા શૂન્ય છે, જે એવી પરિસ્થિતિને અનુરૂપ છે કે જેમાં એકંદરમાં કોઈ ભિન્નતા નથી. વૈકલ્પિક લાક્ષણિકતાના ભિન્નતાનો વ્યવહારુ ઉપયોગ એ નમૂનાના અવલોકનો કરતી વખતે આત્મવિશ્વાસના અંતરાલો બાંધવાનો છે.

વિભિન્નતા અને પ્રમાણભૂત વિચલન જેટલું નાનું હશે, તેટલી વધુ એકરૂપ વસ્તી અને વધુ લાક્ષણિક સરેરાશ હશે. આંકડાઓની પ્રેક્ટિસમાં, ઘણી વાર વિવિધ લાક્ષણિકતાઓના ભિન્નતાઓની તુલના કરવાની જરૂર પડે છે. ઉદાહરણ તરીકે, કામદારોની ઉંમર અને તેમની લાયકાતો, સેવાની લંબાઈ અને વેતન, ખર્ચ અને નફો, સેવાની લંબાઈ અને શ્રમ ઉત્પાદકતા વગેરેમાં તફાવતોની તુલના કરવી રસપ્રદ છે. આવી સરખામણીઓ માટે, લાક્ષણિકતાઓની સંપૂર્ણ પરિવર્તનશીલતાના સૂચકાંકો અયોગ્ય છે: કામના અનુભવની પરિવર્તનશીલતાની તુલના કરવી અશક્ય છે, જે વર્ષોમાં વ્યક્ત કરવામાં આવે છે, વેતનની વિવિધતા સાથે, રુબેલ્સમાં વ્યક્ત કરવામાં આવે છે. આવી સરખામણીઓ હાથ ધરવા માટે, તેમજ વિવિધ અંકગણિત માધ્યમો સાથે ઘણી વસ્તીમાં સમાન લાક્ષણિકતાની પરિવર્તનશીલતાની સરખામણી કરવા માટે, વિવિધતા સૂચકાંકોનો ઉપયોગ કરવામાં આવે છે - ઓસિલેશનના ગુણાંક, વિવિધતાના રેખીય ગુણાંક અને વિવિધતાના ગુણાંક, જે માપ દર્શાવે છે. સરેરાશની આસપાસ આત્યંતિક મૂલ્યોની વધઘટ.

ઓસિલેશન ગુણાંક:

જ્યાં વી આર -ઓસિલેશન ગુણાંક મૂલ્ય; આર- વિવિધતાની શ્રેણીનું મૂલ્ય; X -

વિવિધતાનો રેખીય ગુણાંક"

જ્યાં વીજે-વિવિધતાના રેખીય ગુણાંકનું મૂલ્ય; હું -સરેરાશ રેખીય વિચલનનું મૂલ્ય; X -અભ્યાસ કરવામાં આવતી વસ્તી માટે લાક્ષણિકતાનું સરેરાશ મૂલ્ય.

વિવિધતાનો ગુણાંક:

જ્યાં વી એ -વિવિધતા મૂલ્યનો ગુણાંક; a એ પ્રમાણભૂત વિચલનનું મૂલ્ય છે; X -અભ્યાસ કરવામાં આવતી વસ્તી માટે લાક્ષણિકતાનું સરેરાશ મૂલ્ય.

ઓસિલેશનનો ગુણાંક એ અભ્યાસ કરવામાં આવી રહેલી લાક્ષણિકતાના સરેરાશ મૂલ્ય સાથે વિવિધતાની શ્રેણીનો ટકાવારી ગુણોત્તર છે, અને વિવિધતાનો રેખીય ગુણાંક એ અભ્યાસ કરવામાં આવી રહેલી લાક્ષણિકતાના સરેરાશ મૂલ્ય સાથે સરેરાશ રેખીય વિચલનનો ગુણોત્તર છે, જેને એક તરીકે વ્યક્ત કરવામાં આવે છે. ટકાવારી વિવિધતાનો ગુણાંક એ અભ્યાસ કરવામાં આવી રહેલી લાક્ષણિકતાના સરેરાશ મૂલ્યમાં પ્રમાણભૂત વિચલનની ટકાવારી છે. સંબંધિત મૂલ્ય તરીકે, ટકાવારી તરીકે દર્શાવવામાં આવે છે, વિવિધતાના ગુણાંકનો ઉપયોગ વિવિધ લાક્ષણિકતાઓની વિવિધતાની ડિગ્રીની તુલના કરવા માટે થાય છે. વિવિધતાના ગુણાંકનો ઉપયોગ કરીને, આંકડાકીય વસ્તીની એકરૂપતાનું મૂલ્યાંકન કરવામાં આવે છે. જો વિવિધતાનો ગુણાંક 33% કરતા ઓછો હોય, તો અભ્યાસ હેઠળની વસ્તી સજાતીય છે અને વિવિધતા નબળી છે. જો વિવિધતાનો ગુણાંક 33% થી વધુ હોય, તો અભ્યાસ હેઠળની વસ્તી વિજાતીય છે, વિવિધતા મજબૂત છે, અને સરેરાશ મૂલ્ય એટીપિકલ છે અને આ વસ્તીના સામાન્ય સૂચક તરીકે ઉપયોગ કરી શકાતો નથી. વધુમાં, વિવિધતાના ગુણાંકનો ઉપયોગ વિવિધ વસ્તીમાં એક લક્ષણની પરિવર્તનશીલતાની તુલના કરવા માટે થાય છે. ઉદાહરણ તરીકે, બે સાહસો પર કામદારોની સેવાની લંબાઈમાં તફાવતનું મૂલ્યાંકન કરવા. ગુણાંક મૂલ્ય જેટલું ઊંચું છે, લાક્ષણિકતાની વિવિધતા વધુ નોંધપાત્ર છે.

ગણતરી કરેલ ચતુર્થાંશના આધારે, સૂત્રનો ઉપયોગ કરીને ત્રિમાસિક ભિન્નતાના સંબંધિત સૂચકની ગણતરી કરવી પણ શક્ય છે.

જ્યાં પ્ર 2 અને

ઇન્ટરક્વાર્ટાઇલ રેન્જ સૂત્ર દ્વારા નક્કી કરવામાં આવે છે

આત્યંતિક મૂલ્યોના ઉપયોગ સાથે સંકળાયેલા ગેરફાયદાને ટાળવા માટે વિવિધતાની શ્રેણીને બદલે ચતુર્થાંશ વિચલનનો ઉપયોગ કરવામાં આવે છે:

અસમાન અંતરાલ વિવિધતા શ્રેણી માટે, વિતરણ ઘનતા પણ ગણવામાં આવે છે. તેને અનુરૂપ આવર્તનના ભાગ અથવા અંતરાલના મૂલ્ય દ્વારા વિભાજિત આવર્તન તરીકે વ્યાખ્યાયિત કરવામાં આવે છે. અસમાન અંતરાલ શ્રેણીમાં, નિરપેક્ષ અને સંબંધિત વિતરણ ઘનતાનો ઉપયોગ થાય છે. સંપૂર્ણ વિતરણ ઘનતા એ અંતરાલની એકમ લંબાઈ દીઠ આવર્તન છે. સાપેક્ષ વિતરણ ઘનતા એ અંતરાલની એકમ લંબાઈ દીઠ આવર્તન છે.

ઉપરોક્ત તમામ વિતરણ શ્રેણીઓ માટે સાચું છે જેનો વિતરણ કાયદો સામાન્ય વિતરણ કાયદા દ્વારા સારી રીતે વર્ણવેલ છે અથવા તેની નજીક છે.

આંકડાકીય પૃથ્થકરણમાં વિશેષ સ્થાન એ અભ્યાસ કરવામાં આવી રહેલી લાક્ષણિકતા અથવા ઘટનાના સરેરાશ સ્તરના નિર્ધારણનું છે. લક્ષણનું સરેરાશ સ્તર સરેરાશ મૂલ્યો દ્વારા માપવામાં આવે છે.

સરેરાશ મૂલ્ય અભ્યાસ કરવામાં આવી રહેલી લાક્ષણિકતાના સામાન્ય જથ્થાત્મક સ્તરને દર્શાવે છે અને તે આંકડાકીય વસ્તીની જૂથ મિલકત છે. તે એક અથવા બીજી દિશામાં વ્યક્તિગત અવલોકનોના રેન્ડમ વિચલનોને સ્તર આપે છે, નબળા પાડે છે અને અભ્યાસ કરવામાં આવતી લાક્ષણિકતાની મુખ્ય, લાક્ષણિક મિલકતને પ્રકાશિત કરે છે.

સરેરાશનો વ્યાપકપણે ઉપયોગ થાય છે:

1. વસ્તીના સ્વાસ્થ્યની સ્થિતિનું મૂલ્યાંકન કરવા માટે: શારીરિક વિકાસની લાક્ષણિકતાઓ (ઊંચાઈ, વજન, છાતીનો પરિઘ, વગેરે), વિવિધ રોગોના વ્યાપ અને અવધિને ઓળખવા, વસ્તી વિષયક સૂચકાંકોનું વિશ્લેષણ (વસ્તીનું મહત્વપૂર્ણ ચળવળ, સરેરાશ આયુષ્ય, વસ્તી પ્રજનન, સરેરાશ વસ્તી વગેરે).

2. તબીબી સંસ્થાઓ, તબીબી કર્મચારીઓની પ્રવૃત્તિઓનો અભ્યાસ કરવા અને તેમના કાર્યની ગુણવત્તાનું મૂલ્યાંકન કરવા, વિવિધ પ્રકારની તબીબી સંભાળ માટે વસ્તીની જરૂરિયાતોનું આયોજન અને નિર્ધારણ કરવા (દર વર્ષે રહેવાસી દીઠ વિનંતીઓ અથવા મુલાકાતોની સરેરાશ સંખ્યા, રહેવાની સરેરાશ લંબાઈ હોસ્પિટલમાં દર્દી, દર્દીની પરીક્ષાની સરેરાશ અવધિ, ડોકટરોની સરેરાશ ઉપલબ્ધતા, પથારી વગેરે).

3. સેનિટરી અને રોગચાળાની સ્થિતિ (વર્કશોપમાં હવાની ધૂળની સરેરાશ સામગ્રી, વ્યક્તિ દીઠ સરેરાશ વિસ્તાર, પ્રોટીન, ચરબી અને કાર્બોહાઇડ્રેટ્સનો સરેરાશ વપરાશ, વગેરે) ને દર્શાવવા માટે.

4. સામાન્ય અને રોગવિજ્ઞાનવિષયક પરિસ્થિતિઓમાં તબીબી અને શારીરિક સૂચકાંકો નક્કી કરવા માટે, પ્રયોગશાળા ડેટાની પ્રક્રિયા કરતી વખતે, સામાજિક, આરોગ્યપ્રદ, ક્લિનિકલ અને પ્રાયોગિક અભ્યાસોમાં નમૂનાના અભ્યાસના પરિણામોની વિશ્વસનીયતા સ્થાપિત કરવા.

સરેરાશ મૂલ્યોની ગણતરી વિવિધતા શ્રેણીના આધારે કરવામાં આવે છે. વિવિધતા શ્રેણીગુણાત્મક રીતે સજાતીય આંકડાકીય વસ્તી છે, જેનાં વ્યક્તિગત એકમો અભ્યાસ કરવામાં આવી રહેલી લાક્ષણિકતા અથવા ઘટનાના માત્રાત્મક તફાવતો દર્શાવે છે.

જથ્થાત્મક ભિન્નતા બે પ્રકારની હોઈ શકે છે: અખંડિત (અલગ) અને સતત.

એક અસંતુલિત (અલગ) લક્ષણ માત્ર પૂર્ણાંક તરીકે વ્યક્ત કરવામાં આવે છે અને તેમાં કોઈ મધ્યવર્તી મૂલ્યો હોઈ શકતા નથી (ઉદાહરણ તરીકે, મુલાકાતોની સંખ્યા, સાઇટની વસ્તી, કુટુંબમાં બાળકોની સંખ્યા, પોઈન્ટમાં રોગની તીવ્રતા , વગેરે).

સતત નિશાની અમુક મર્યાદાઓની અંદર કોઈપણ મૂલ્યો લઈ શકે છે, જેમાં અપૂર્ણાંકનો સમાવેશ થાય છે, અને તે ફક્ત આશરે વ્યક્ત કરવામાં આવે છે (ઉદાહરણ તરીકે, વજન - પુખ્ત વયના લોકો માટે તે કિલોગ્રામ સુધી મર્યાદિત હોઈ શકે છે, અને નવજાત શિશુઓ માટે - ગ્રામ; ઊંચાઈ, બ્લડ પ્રેશર, સમય દર્દીને જોવામાં ખર્ચ કર્યો, અને વગેરે).



વિવિધતા શ્રેણીમાં સમાવિષ્ટ દરેક વ્યક્તિગત લાક્ષણિકતા અથવા ઘટનાના ડિજિટલ મૂલ્યને વેરિઅન્ટ કહેવામાં આવે છે અને તેને અક્ષર દ્વારા નિયુક્ત કરવામાં આવે છે. વી . અન્ય સંકેતો પણ ગાણિતિક સાહિત્યમાં જોવા મળે છે, ઉદાહરણ તરીકે x અથવા y.

વિવિધતા શ્રેણી, જ્યાં દરેક વિકલ્પ એકવાર સૂચવવામાં આવે છે, તેને સરળ કહેવામાં આવે છે.કમ્પ્યુટર ડેટા પ્રોસેસિંગના કિસ્સામાં મોટાભાગની આંકડાકીય સમસ્યાઓમાં આવી શ્રેણીનો ઉપયોગ થાય છે.

જેમ જેમ અવલોકનોની સંખ્યામાં વધારો થાય છે તેમ, પુનરાવર્તિત વિવિધ મૂલ્યો થવાનું વલણ ધરાવે છે. આ કિસ્સામાં, તે બનાવવામાં આવે છે જૂથ વિવિધતા શ્રેણી, જ્યાં પુનરાવર્તનોની સંખ્યા સૂચવવામાં આવે છે (આવર્તન, અક્ષર દ્વારા સૂચિત " આર »).

ક્રમાંકિત વિવિધતા શ્રેણીચડતા અથવા ઉતરતા ક્રમમાં ગોઠવાયેલા વિકલ્પોનો સમાવેશ થાય છે. સરળ અને જૂથબદ્ધ શ્રેણી બંને રેન્કિંગ સાથે સંકલિત કરી શકાય છે.

અંતરાલ વિવિધતા શ્રેણીખૂબ મોટી સંખ્યામાં અવલોકન એકમો (1000 થી વધુ) સાથે, કમ્પ્યુટરના ઉપયોગ વિના કરવામાં આવતી અનુગામી ગણતરીઓને સરળ બનાવવા માટે સંકલિત.

સતત વિવિધતા શ્રેણીવિકલ્પ મૂલ્યોનો સમાવેશ થાય છે, જે કોઈપણ મૂલ્ય હોઈ શકે છે.

જો વિવિધતા શ્રેણીમાં લાક્ષણિકતા (ચલો) ના મૂલ્યો વ્યક્તિગત ચોક્કસ સંખ્યાઓના સ્વરૂપમાં આપવામાં આવે છે, તો આવી શ્રેણી કહેવામાં આવે છે. અલગ.

વિવિધતા શ્રેણીમાં પ્રતિબિંબિત લાક્ષણિકતાના મૂલ્યોની સામાન્ય લાક્ષણિકતાઓ એ સરેરાશ મૂલ્યો છે. તેમાંથી, સૌથી વધુ વપરાયેલ છે: અંકગણિત સરેરાશ એમ,ફેશન મોઅને મધ્યમ મને.આમાંની દરેક લાક્ષણિકતાઓ અનન્ય છે. તેઓ એકબીજાને બદલી શકતા નથી અને માત્ર એકસાથે તેઓ ભિન્નતા શ્રેણીના લક્ષણોને તદ્દન સંપૂર્ણ અને સંક્ષિપ્ત સ્વરૂપમાં રજૂ કરે છે.

ફેશન (મો) સૌથી વધુ વારંવાર બનતા વિકલ્પોના મૂલ્યને નામ આપો.

મધ્યક (હું) – આ ક્રમાંકિત વિવિધતા શ્રેણીને અડધા ભાગમાં વિભાજીત કરતા વિકલ્પનું મૂલ્ય છે (મીડિયનની દરેક બાજુએ વિકલ્પનો અડધો ભાગ છે). દુર્લભ કિસ્સાઓમાં, જ્યારે સપ્રમાણ ભિન્નતાની શ્રેણી હોય છે, ત્યારે મોડ અને મધ્ય એકબીજા સાથે સમાન હોય છે અને અંકગણિત સરેરાશના મૂલ્ય સાથે સુસંગત હોય છે.

વિકલ્પ મૂલ્યોની સૌથી લાક્ષણિક લાક્ષણિકતા છે અંકગણિત સરેરાશમૂલ્ય( એમ ). ગાણિતિક સાહિત્યમાં તે સૂચવવામાં આવે છે .

અંકગણિત સરેરાશ (એમ, ) એ અભ્યાસ કરવામાં આવતી ઘટનાની ચોક્કસ લાક્ષણિકતાની સામાન્ય માત્રાત્મક લાક્ષણિકતા છે, જે ગુણાત્મક રીતે એકરૂપ આંકડાકીય વસ્તી બનાવે છે. ત્યાં સરળ અને ભારિત અંકગણિત સરેરાશ છે. બધા વિકલ્પોનો સરવાળો કરીને અને આ વિવિધતા શ્રેણીમાં સમાવિષ્ટ વિકલ્પોની કુલ સંખ્યા દ્વારા આ સરવાળાને વિભાજિત કરીને સરળ ભિન્નતા શ્રેણી માટે સરળ અંકગણિત સરેરાશની ગણતરી કરવામાં આવે છે. ગણતરીઓ સૂત્ર અનુસાર હાથ ધરવામાં આવે છે:

,

ક્યાં: એમ - સરળ અંકગણિત સરેરાશ;

Σ વી - રકમ વિકલ્પ;

n- અવલોકનોની સંખ્યા.

જૂથબદ્ધ વિવિધતા શ્રેણીમાં, ભારિત અંકગણિત સરેરાશ નક્કી કરવામાં આવે છે. તેની ગણતરી માટેનું સૂત્ર:

,

ક્યાં: એમ - અંકગણિત ભારિત સરેરાશ;

Σ વી.પી - તેમની ફ્રીક્વન્સીઝ દ્વારા વેરિઅન્ટના ઉત્પાદનોનો સરવાળો;

n- અવલોકનોની સંખ્યા.

મોટી સંખ્યામાં અવલોકનો સાથે, મેન્યુઅલ ગણતરીઓના કિસ્સામાં, ક્ષણોની પદ્ધતિનો ઉપયોગ કરી શકાય છે.

અંકગણિત સરેરાશ નીચેના ગુણધર્મો ધરાવે છે:

· સરેરાશથી વિચલનોનો સરવાળો ( Σ ડી ) શૂન્યની બરાબર છે (કોષ્ટક 15 જુઓ);

· જ્યારે સમાન અવયવ (વિભાજક) દ્વારા તમામ વિકલ્પોનો ગુણાકાર (વિભાજક) કરવામાં આવે છે, ત્યારે અંકગણિત સરેરાશ સમાન અવયવ (વિભાજક) દ્વારા ગુણાકાર (વિભાજિત) થાય છે;

· જો તમે બધા વિકલ્પોમાં સમાન સંખ્યા ઉમેરો (બાદબાકી કરો), તો અંકગણિત સરેરાશ સમાન સંખ્યાથી વધે છે (ઘટે છે).

અંકગણિત સરેરાશ, જે શ્રેણીમાંથી તેઓની ગણતરી કરવામાં આવે છે તે શ્રેણીની પરિવર્તનશીલતાને ધ્યાનમાં લીધા વિના, પોતાને દ્વારા લેવામાં આવે છે, તે વિવિધતા શ્રેણીના ગુણધર્મોને સંપૂર્ણપણે પ્રતિબિંબિત કરી શકશે નહીં, ખાસ કરીને જ્યારે અન્ય સરેરાશ સાથે સરખામણી જરૂરી હોય. સરેરાશ જે મૂલ્યની નજીક છે તે સ્કેટરિંગની વિવિધ ડિગ્રી સાથે શ્રેણીમાંથી મેળવી શકાય છે. વ્યક્તિગત વિકલ્પો તેમની જથ્થાત્મક લાક્ષણિકતાઓના સંદર્ભમાં એકબીજાની જેટલા નજીક છે, ઓછા ફેલાવો (ઓસિલેશન, પરિવર્તનશીલતા)શ્રેણી, વધુ લાક્ષણિક તેની સરેરાશ.

મુખ્ય પરિમાણો જે અમને લક્ષણની પરિવર્તનશીલતાનું મૂલ્યાંકન કરવાની મંજૂરી આપે છે તે છે:

· અવકાશ;

· કંપનવિસ્તાર;

· પ્રમાણભૂત વિચલન;

· વિવિધતાનો ગુણાંક.

ભિન્નતા શ્રેણીની શ્રેણી અને કંપનવિસ્તાર દ્વારા લક્ષણની પરિવર્તનશીલતા અંદાજે નક્કી કરી શકાય છે. શ્રેણી શ્રેણીમાં મહત્તમ (V મહત્તમ) અને લઘુત્તમ (V મિનિટ) વિકલ્પો સૂચવે છે. કંપનવિસ્તાર (A m) આ વિકલ્પો વચ્ચેનો તફાવત છે: A m = V મહત્તમ - V મિનિટ.

વિવિધતા શ્રેણીની પરિવર્તનશીલતાનું મુખ્ય, સામાન્ય રીતે સ્વીકૃત માપ છે વિખેરવું (ડી ). પરંતુ સૌથી વધુ ઉપયોગમાં લેવાતું પરિમાણ એ વધુ અનુકૂળ છે, જે વિખેરવાના આધારે ગણવામાં આવે છે - પ્રમાણભૂત વિચલન ( σ ). તે વિચલનની તીવ્રતાને ધ્યાનમાં લે છે ( ડી ) દરેક વિવિધતા શ્રેણીના તેના અંકગણિત સરેરાશ ( d=V - M ).

સરેરાશથી વિચલનો સકારાત્મક અને નકારાત્મક હોઈ શકે છે, જ્યારે સારાંશ આપવામાં આવે ત્યારે તેઓ “0” (S d=0). આને અવગણવા માટે, વિચલન મૂલ્યો ( ડી) બીજા ઘાત સુધી વધારવામાં આવે છે અને સરેરાશ કરવામાં આવે છે. આમ, ભિન્નતા શ્રેણીનું વિક્ષેપ એ અંકગણિત સરેરાશમાંથી ચલના વિચલનોનો સરેરાશ વર્ગ છે અને સૂત્ર દ્વારા તેની ગણતરી કરવામાં આવે છે:

.

તે પરિવર્તનશીલતાની સૌથી મહત્વપૂર્ણ લાક્ષણિકતા છે અને તેનો ઉપયોગ ઘણા આંકડાકીય માપદંડોની ગણતરી કરવા માટે થાય છે.

વિક્ષેપને વિચલનોના વર્ગ તરીકે દર્શાવવામાં આવતું હોવાથી, તેનું મૂલ્ય અંકગણિત સરેરાશ સાથે સરખામણીમાં વાપરી શકાતું નથી. આ હેતુઓ માટે તેનો ઉપયોગ થાય છે પ્રમાણભૂત વિચલન, જે "સિગ્મા" ચિહ્ન દ્વારા નિયુક્ત કરવામાં આવે છે ( σ ). તે સરેરાશ મૂલ્યના સમાન એકમોમાં અંકગણિત સરેરાશ મૂલ્યમાંથી વિવિધતા શ્રેણીના તમામ ચલોના સરેરાશ વિચલનને દર્શાવે છે, જેથી તેઓ એકસાથે ઉપયોગમાં લઈ શકાય.

પ્રમાણભૂત વિચલન સૂત્ર દ્વારા નક્કી કરવામાં આવે છે:

ઉલ્લેખિત સૂત્ર લાગુ થાય છે જ્યારે અવલોકનોની સંખ્યા ( n ) 30 થી વધુ. નાની સંખ્યા સાથે n પ્રમાણભૂત વિચલન મૂલ્યમાં ગાણિતિક ઓફસેટ સાથે સંકળાયેલ ભૂલ હશે ( n - 1). આ સંદર્ભમાં, પ્રમાણભૂત વિચલનની ગણતરી કરવા માટેના સૂત્રમાં આવા પૂર્વગ્રહને ધ્યાનમાં લઈને વધુ સચોટ પરિણામ મેળવી શકાય છે:

પ્રમાણભૂત વિચલન (s ) એ રેન્ડમ ચલના પ્રમાણભૂત વિચલનનો અંદાજ છે એક્સતેના તફાવતના નિષ્પક્ષ અંદાજ પર આધારિત તેની ગાણિતિક અપેક્ષાને સંબંધિત.

મૂલ્યો સાથે n > 30 પ્રમાણભૂત વિચલન ( σ ) અને પ્રમાણભૂત વિચલન ( s ) સમાન હશે ( σ = સે ). તેથી, મોટા ભાગના વ્યવહારુ માર્ગદર્શિકાઓમાં આ માપદંડોને અલગ અલગ અર્થ ગણવામાં આવે છે. Excel માં, પ્રમાણભૂત વિચલનની ગણતરી =STDEV(રેન્જ) ફંક્શનનો ઉપયોગ કરીને કરી શકાય છે. અને પ્રમાણભૂત વિચલનની ગણતરી કરવા માટે, તમારે યોગ્ય સૂત્ર બનાવવાની જરૂર છે.

સરેરાશ ચોરસ અથવા પ્રમાણભૂત વિચલન તમને નિર્ધારિત કરવાની મંજૂરી આપે છે કે લાક્ષણિકતાના મૂલ્યો સરેરાશ મૂલ્યથી કેટલા અલગ હોઈ શકે છે. ધારો કે ઉનાળામાં સમાન સરેરાશ દૈનિક તાપમાન ધરાવતા બે શહેરો છે. આમાંથી એક શહેર દરિયાકિનારે આવેલું છે, અને બીજું ખંડ પર. તે જાણીતું છે કે દરિયાકાંઠે સ્થિત શહેરોમાં, દિવસના તાપમાનમાં તફાવતો અંતરિયાળ સ્થિત શહેરો કરતા નાના હોય છે. તેથી, દરિયાકાંઠાના શહેર માટે દિવસના તાપમાનનું પ્રમાણભૂત વિચલન બીજા શહેર કરતાં ઓછું હશે. વ્યવહારમાં, આનો અર્થ એ છે કે ખંડ પર સ્થિત શહેરમાં દરેક ચોક્કસ દિવસનું સરેરાશ હવાનું તાપમાન દરિયાકિનારા પરના શહેર કરતાં સરેરાશ કરતાં વધુ અલગ હશે. વધુમાં, પ્રમાણભૂત વિચલન તમને સંભવિતતાના જરૂરી સ્તર સાથે સરેરાશથી શક્ય તાપમાનના વિચલનોનું મૂલ્યાંકન કરવાની મંજૂરી આપે છે.

સંભાવના સિદ્ધાંત મુજબ, સામાન્ય વિતરણ કાયદાનું પાલન કરતી ઘટનાઓમાં, અંકગણિતના સરેરાશ મૂલ્યો, પ્રમાણભૂત વિચલન અને વિકલ્પો વચ્ચે સખત સંબંધ છે ( ત્રણ સિગ્મા નિયમ). ઉદાહરણ તરીકે, વિવિધ લાક્ષણિકતાના મૂલ્યોના 68.3% M ± 1 ની અંદર છે σ , 95.5% - M ± 2 ની અંદર σ અને 99.7% - M ± 3 ની અંદર σ .

પ્રમાણભૂત વિચલનનું મૂલ્ય અમને વિવિધતા શ્રેણી અને અભ્યાસ જૂથની એકરૂપતાની પ્રકૃતિનો ન્યાય કરવા દે છે. જો પ્રમાણભૂત વિચલનનું મૂલ્ય નાનું છે, તો આ અભ્યાસ કરવામાં આવી રહેલી ઘટનાની એકદમ ઉચ્ચ એકરૂપતા સૂચવે છે. આ કિસ્સામાં અંકગણિત સરેરાશને આપેલ વિવિધતા શ્રેણી માટે તદ્દન લાક્ષણિકતા ગણવી જોઈએ. જો કે, ખૂબ નાનું સિગ્મા મૂલ્ય અવલોકનોની કૃત્રિમ પસંદગી વિશે વિચારે છે. ખૂબ જ મોટા સિગ્મા સાથે, અંકગણિત સરેરાશ ઓછા અંશે વિવિધતા શ્રેણીની લાક્ષણિકતા દર્શાવે છે, જે અભ્યાસ હેઠળની લાક્ષણિકતા અથવા ઘટનાની નોંધપાત્ર પરિવર્તનશીલતા અથવા અભ્યાસ હેઠળના જૂથની વિવિધતા સૂચવે છે. જો કે, પ્રમાણભૂત વિચલનના મૂલ્યની સરખામણી માત્ર સમાન પરિમાણની વિશેષતાઓ માટે જ શક્ય છે. ખરેખર, જો આપણે નવજાત બાળકો અને પુખ્ત વયના લોકોના વજનની વિવિધતાની તુલના કરીએ, તો આપણે હંમેશા પુખ્ત વયના લોકોમાં ઉચ્ચ સિગ્મા મૂલ્યો મેળવીશું.

વિવિધ પરિમાણોના લક્ષણોની પરિવર્તનશીલતાની તુલનાનો ઉપયોગ કરીને કરી શકાય છે વિવિધતાના ગુણાંક. તે સરેરાશની ટકાવારી તરીકે વિવિધતાને વ્યક્ત કરે છે, જે વિવિધ લક્ષણો વચ્ચે સરખામણી કરવાની મંજૂરી આપે છે. તબીબી સાહિત્યમાં ભિન્નતાના ગુણાંક "" ચિહ્ન દ્વારા સૂચવવામાં આવે છે. સાથે ", અને ગાણિતિકમાં" વિ"અને સૂત્ર દ્વારા ગણતરી:

.

10% કરતા ઓછા ભિન્નતાના ગુણાંકના મૂલ્યો 10 થી 20% સુધીના નાના છૂટાછવાયા સૂચવે છે - લગભગ સરેરાશ, 20% થી વધુ - અંકગણિત સરેરાશની આસપાસ મજબૂત સ્કેટરિંગ વિશે.

અંકગણિત સરેરાશ સામાન્ય રીતે નમૂનાની વસ્તીના ડેટાના આધારે ગણવામાં આવે છે. વારંવાર અભ્યાસ સાથે, રેન્ડમ ઘટનાના પ્રભાવ હેઠળ, અંકગણિત સરેરાશ બદલાઈ શકે છે. આ એ હકીકતને કારણે છે કે, એક નિયમ તરીકે, નિરીક્ષણના સંભવિત એકમોનો માત્ર એક ભાગ અભ્યાસ કરવામાં આવે છે, એટલે કે, નમૂનાની વસ્તી. અભ્યાસ કરવામાં આવી રહેલી ઘટનાનું પ્રતિનિધિત્વ કરતા તમામ સંભવિત એકમો વિશેની માહિતી સમગ્ર વસ્તીનો અભ્યાસ કરીને મેળવી શકાય છે, જે હંમેશા શક્ય નથી. તે જ સમયે, પ્રાયોગિક ડેટાને સામાન્ય બનાવવાના હેતુ માટે, સામાન્ય વસ્તીમાં સરેરાશનું મૂલ્ય રસ ધરાવે છે. તેથી, અભ્યાસ હેઠળની ઘટના વિશે સામાન્ય નિષ્કર્ષ બનાવવા માટે, નમૂનાની વસ્તીના આધારે મેળવેલા પરિણામો આંકડાકીય પદ્ધતિઓનો ઉપયોગ કરીને સામાન્ય વસ્તીમાં સ્થાનાંતરિત થવું આવશ્યક છે.

નમૂનાના અભ્યાસ અને સામાન્ય વસ્તી વચ્ચેના કરારની ડિગ્રી નક્કી કરવા માટે, નમૂનાના નિરીક્ષણ દરમિયાન અનિવાર્યપણે ઉદ્દભવેલી ભૂલની તીવ્રતાનો અંદાજ કાઢવો જરૂરી છે. આ ભૂલ કહેવામાં આવે છે " પ્રતિનિધિત્વની ભૂલ"અથવા "અંકગણિત સરેરાશની સરેરાશ ભૂલ." તે વાસ્તવમાં પસંદગીના આંકડાકીય અવલોકનોમાંથી મેળવેલી સરેરાશ અને સમાન મૂલ્યો વચ્ચેનો તફાવત છે જે સમાન પદાર્થના સતત અભ્યાસથી મેળવવામાં આવશે, એટલે કે. સામાન્ય વસ્તીનો અભ્યાસ કરતી વખતે. નમૂનાનો અર્થ રેન્ડમ ચલ હોવાથી, આવી આગાહી સંશોધકને સ્વીકાર્ય સંભાવનાના સ્તર સાથે કરવામાં આવે છે. તબીબી સંશોધનમાં તે ઓછામાં ઓછું 95% છે.

પ્રતિનિધિત્વની ભૂલને નોંધણીની ભૂલો અથવા ધ્યાનની ભૂલો (સ્લિપ, ખોટી ગણતરી, ટાઈપો, વગેરે) સાથે ભેળસેળ કરી શકાતી નથી, જે પ્રયોગ દરમિયાન ઉપયોગમાં લેવાતી પર્યાપ્ત પદ્ધતિઓ અને સાધનો દ્વારા ઘટાડી શકાય છે.

પ્રતિનિધિત્વની ભૂલની તીવ્રતા નમૂનાના કદ અને લક્ષણની પરિવર્તનશીલતા બંને પર આધારિત છે. અવલોકનોની સંખ્યા જેટલી મોટી છે, નમૂના વસ્તીની નજીક છે અને ભૂલ ઓછી છે. ચિહ્ન જેટલું વધુ પરિવર્તનશીલ છે, આંકડાકીય ભૂલની તીવ્રતા વધારે છે.

વ્યવહારમાં, વિવિધતા શ્રેણીમાં પ્રતિનિધિત્વની ભૂલ નક્કી કરવા માટે, નીચેના સૂત્રનો ઉપયોગ કરવામાં આવે છે:

,

ક્યાં: m - પ્રતિનિધિત્વની ભૂલ;

σ - પ્રમાણભૂત વિચલન;

n- નમૂનામાં અવલોકનોની સંખ્યા.

સૂત્ર બતાવે છે કે સરેરાશ ભૂલનું કદ પ્રમાણભૂત વિચલન માટે સીધા પ્રમાણસર છે, એટલે કે, અભ્યાસ કરવામાં આવી રહેલી લાક્ષણિકતાની પરિવર્તનશીલતા, અને અવલોકનોની સંખ્યાના વર્ગમૂળના વિપરિત પ્રમાણસર છે.

સંબંધિત મૂલ્યોની ગણતરીના આધારે આંકડાકીય વિશ્લેષણ કરતી વખતે, વિવિધતા શ્રેણીનું નિર્માણ જરૂરી નથી. આ કિસ્સામાં, સંબંધિત સૂચકાંકો માટે સરેરાશ ભૂલનું નિર્ધારણ સરળ સૂત્રનો ઉપયોગ કરીને કરી શકાય છે:

,

ક્યાં: આર- સંબંધિત સૂચકનું મૂલ્ય, ટકાવારી, પીપીએમ, વગેરે તરીકે વ્યક્ત;

q– P નું પારસ્પરિક અને (1-P), (100-P), (1000-P), વગેરે તરીકે દર્શાવવામાં આવે છે, જેના આધારે સૂચકની ગણતરી કરવામાં આવે છે તેના આધારે;

n- નમૂનાની વસ્તીમાં અવલોકનોની સંખ્યા.

જો કે, સંબંધિત મૂલ્યો માટે પ્રતિનિધિત્વની ભૂલની ગણતરી કરવા માટેનો ઉલ્લેખિત સૂત્ર ફક્ત ત્યારે જ લાગુ થઈ શકે છે જ્યારે સૂચકનું મૂલ્ય તેના આધાર કરતા ઓછું હોય. સઘન સૂચકાંકોની ગણતરીના અસંખ્ય કેસોમાં, આ સ્થિતિ પૂરી થતી નથી, અને સૂચકને 100% અથવા 1000% કરતા વધુની સંખ્યા તરીકે વ્યક્ત કરી શકાય છે. આવી સ્થિતિમાં, વિવિધતા શ્રેણી બનાવવામાં આવે છે અને પ્રમાણભૂત વિચલનના આધારે સરેરાશ મૂલ્યોના સૂત્રનો ઉપયોગ કરીને પ્રતિનિધિત્વ ભૂલની ગણતરી કરવામાં આવે છે.

વસ્તીમાં અંકગણિત સરેરાશના મૂલ્યની આગાહી બે મૂલ્યો સૂચવીને કરવામાં આવે છે - લઘુત્તમ અને મહત્તમ. સંભવિત વિચલનોના આ આત્યંતિક મૂલ્યો, જેમાં વસ્તીના ઇચ્છિત સરેરાશ મૂલ્યમાં વધઘટ થઈ શકે છે, કહેવામાં આવે છે " ટ્રસ્ટની સીમાઓ».

સંભાવના સિદ્ધાંતના અનુમાનોએ સાબિત કર્યું છે કે 99.7% ની સંભાવના સાથે લાક્ષણિકતાના સામાન્ય વિતરણ સાથે, સરેરાશના વિચલનોના આત્યંતિક મૂલ્યો પ્રતિનિધિત્વ ભૂલના ત્રણ ગણા મૂલ્ય કરતાં વધુ નહીં હોય ( એમ ± 3 m ); 95.5% માં - સરેરાશ મૂલ્યની સરેરાશ ભૂલ કરતાં બમણા કરતાં વધુ નહીં ( એમ ± 2 m ); 68.3% માં - એક કરતાં વધુ સરેરાશ ભૂલ નહીં ( એમ ± 1 m ) (ફિગ. 9).

P%

ચોખા. 9. સામાન્ય વિતરણની સંભાવના ઘનતા.

નોંધ કરો કે ઉપરોક્ત નિવેદન સામાન્ય ગૌસીયન વિતરણ કાયદાનું પાલન કરતી વિશેષતા માટે જ સાચું છે.

દવાના ક્ષેત્ર સહિત મોટાભાગના પ્રાયોગિક અભ્યાસો માપ સાથે સંકળાયેલા છે, જેના પરિણામો આપેલ અંતરાલમાં લગભગ કોઈપણ મૂલ્ય લઈ શકે છે, તેથી, નિયમ તરીકે, તેઓ સતત રેન્ડમ ચલોના મોડેલ દ્વારા વર્ણવવામાં આવે છે. તેથી, મોટાભાગની આંકડાકીય પદ્ધતિઓ સતત વિતરણને ધ્યાનમાં લે છે. ગાણિતિક આંકડાશાસ્ત્રમાં મૂળભૂત ભૂમિકા ધરાવતી આવી જ એક વહેંચણી છે સામાન્ય, અથવા ગૌસીયન, વિતરણ.

આ સંખ્યાબંધ કારણોને લીધે છે.

1. સૌ પ્રથમ, સામાન્ય વિતરણનો ઉપયોગ કરીને ઘણા પ્રાયોગિક અવલોકનો સફળતાપૂર્વક વર્ણવી શકાય છે. તે તરત જ નોંધવું જોઈએ કે પ્રયોગમૂલક ડેટાનું કોઈ વિતરણ નથી કે જે બરાબર સામાન્ય હોય, કારણ કે સામાન્ય રીતે વિતરિત રેન્ડમ ચલ ની શ્રેણી માંથી છે, જેનો વ્યવહારમાં ક્યારેય સામનો થતો નથી. જો કે, સામાન્ય વિતરણ ઘણી વાર એક અંદાજ તરીકે સારી રીતે કામ કરે છે.

માનવ શરીરના વજન, ઊંચાઈ અને અન્ય શારીરિક માપદંડો માપવામાં આવે છે કે કેમ, પરિણામો હંમેશા ખૂબ મોટી સંખ્યામાં રેન્ડમ પરિબળો (કુદરતી કારણો અને માપન ભૂલો) દ્વારા પ્રભાવિત થાય છે.

તદુપરાંત, એક નિયમ તરીકે, આ દરેક પરિબળોની અસર નજીવી છે. અનુભવ દર્શાવે છે કે આવા કિસ્સાઓમાં પરિણામો લગભગ સામાન્ય રીતે વિતરિત કરવામાં આવશે.

2. રેન્ડમ સેમ્પલિંગ સાથે સંકળાયેલા ઘણા વિતરણો સામાન્ય બની જાય છે કારણ કે બાદનું પ્રમાણ વધે છે.

3. સામાન્ય વિતરણ અન્ય સતત વિતરણો (ઉદાહરણ તરીકે, ત્રાંસુ) ના અંદાજ તરીકે સારી રીતે અનુકૂળ છે.

4. સામાન્ય વિતરણમાં સંખ્યાબંધ સાનુકૂળ ગાણિતિક ગુણધર્મો છે, જે મોટાભાગે આંકડાઓમાં તેનો વ્યાપક ઉપયોગ સુનિશ્ચિત કરે છે.

તે જ સમયે, એ નોંધવું જોઈએ કે તબીબી ડેટામાં ઘણા પ્રાયોગિક વિતરણો છે જે સામાન્ય વિતરણ મોડેલ દ્વારા વર્ણવી શકાતા નથી. આ હેતુ માટે, આંકડાઓએ એવી પદ્ધતિઓ વિકસાવી છે જેને સામાન્ય રીતે "નોનપેરામેટ્રિક" કહેવામાં આવે છે.

આંકડાકીય પદ્ધતિની પસંદગી કે જે ચોક્કસ પ્રયોગમાંથી ડેટા પર પ્રક્રિયા કરવા માટે યોગ્ય છે તે તેના આધારે થવી જોઈએ કે મેળવેલ ડેટા સામાન્ય વિતરણ કાયદાને અનુસરે છે. આવર્તન વિતરણ હિસ્ટોગ્રામ (ગ્રાફ), તેમજ સંખ્યાબંધ આંકડાકીય માપદંડોનો ઉપયોગ કરીને સામાન્ય વિતરણ કાયદામાં સંકેતની ગૌણતા માટેની પૂર્વધારણાનું પરીક્ષણ કરવામાં આવે છે. તેમની વચ્ચે: અસમપ્રમાણતા માપદંડ ( );

b કર્ટોસિસ માટે પરીક્ષણ માટે માપદંડ ( );

g શાપિરો-વિલ્ક્સ ટેસ્ટ ( ) .

ડેટા વિતરણની પ્રકૃતિનું વિશ્લેષણ (જેને વિતરણની સામાન્યતા માટેનું પરીક્ષણ પણ કહેવાય છે) દરેક પરિમાણ માટે હાથ ધરવામાં આવે છે. પરિમાણનું વિતરણ સામાન્ય કાયદાને અનુરૂપ છે કે કેમ તે વિશ્વાસપૂર્વક નક્કી કરવા માટે, પૂરતી મોટી સંખ્યામાં અવલોકન એકમો (ઓછામાં ઓછા 30 મૂલ્યો) જરૂરી છે.

સામાન્ય વિતરણ માટે, skewness અને kurtosis માપદંડો મૂલ્ય 0 લે છે. જો વિતરણ જમણી તરફ ખસેડવામાં આવે છે અસમપ્રમાણતા માપદંડ ( > 0 (ધન અસમપ્રમાણતા), સાથે અસમપ્રમાણતા માપદંડ ( < 0 - график распределения смещен влево (отрицательная асимметрия). Критерий асимметрии проверяет форму кривой распределения. В случае нормального закона કર્ટોસિસ માટે પરીક્ષણ માટે માપદંડ ( =0. મુ કર્ટોસિસ માટે પરીક્ષણ માટે માપદંડ ( > 0 જો વિતરણ વળાંક વધુ તીવ્ર હોય છે કર્ટોસિસ માટે પરીક્ષણ માટે માપદંડ ( < 0 пик более сглаженный, чем функция нормального распределения.

શાપિરો-વિલ્ક્સ માપદંડનો ઉપયોગ કરીને સામાન્યતા ચકાસવા માટે, આ માપદંડનું મૂલ્ય જરૂરી મહત્વના સ્તરે અને અવલોકન એકમો (સ્વતંત્રતાની ડિગ્રી) ની સંખ્યાના આધારે આંકડાકીય કોષ્ટકોનો ઉપયોગ કરીને શોધવાનું છે. પરિશિષ્ટ 1. આ માપદંડના નાના મૂલ્યો પર, નિયમ તરીકે, સામાન્યતાની પૂર્વધારણાને નકારી કાઢવામાં આવે છે. ડબલ્યુ <0,8.

વિવિધતા શ્રેણીલાક્ષણિકતાના સંખ્યાત્મક મૂલ્યોની શ્રેણી છે.

વિવિધતા શ્રેણીની મુખ્ય લાક્ષણિકતાઓ: v – ચલ, p – તેની ઘટનાની આવર્તન.

વિવિધતા શ્રેણીના પ્રકાર:

    વિકલ્પોની ઘટનાની આવર્તન અનુસાર: સરળ - વિકલ્પ એકવાર થાય છે, ભારિત - વિકલ્પ બે અથવા વધુ વખત થાય છે;

    વિકલ્પોના સ્થાન દ્વારા: ક્રમાંકિત - વિકલ્પોને ઉતરતા અને ચડતા ક્રમમાં ગોઠવવામાં આવે છે, અનક્રમાંકિત - વિકલ્પો કોઈ ચોક્કસ ક્રમમાં લખેલા નથી;

    જૂથોમાં વિકલ્પને જોડીને: જૂથબદ્ધ - વિકલ્પો જૂથોમાં જોડવામાં આવે છે, જૂથ વિનાના - વિકલ્પો જૂથોમાં જોડાયેલા નથી;

    કદના વિકલ્પો દ્વારા: સતત - વિકલ્પો પૂર્ણાંક અને અપૂર્ણાંક સંખ્યા તરીકે વ્યક્ત કરવામાં આવે છે, સ્વતંત્ર - વિકલ્પો પૂર્ણાંક તરીકે દર્શાવવામાં આવે છે, જટિલ - વિકલ્પો સંબંધિત અથવા સરેરાશ મૂલ્ય દ્વારા દર્શાવવામાં આવે છે.

સરેરાશ મૂલ્યોની ગણતરી કરવાના હેતુથી વિવિધતા શ્રેણીનું સંકલન અને ઔપચારિકકરણ કરવામાં આવે છે.

વિવિધતા શ્રેણી રેકોર્ડિંગ ફોર્મ:

8. આરોગ્યસંભાળમાં સરેરાશ મૂલ્યો, પ્રકારો, ગણતરી પદ્ધતિઓ, એપ્લિકેશન

સરેરાશ મૂલ્યો- માત્રાત્મક લાક્ષણિકતાઓની સંચિત સામાન્યીકરણ લાક્ષણિકતા. સરેરાશની અરજી:

1. તબીબી સંસ્થાઓના કાર્યના સંગઠનની લાક્ષણિકતા અને તેમની પ્રવૃત્તિઓનું મૂલ્યાંકન કરવા માટે:

a) ક્લિનિકમાં: ડોકટરોના વર્કલોડના સૂચકાંકો, મુલાકાતોની સરેરાશ સંખ્યા, વિસ્તારના રહેવાસીઓની સરેરાશ સંખ્યા;

b) હૉસ્પિટલમાં: દર વર્ષે સરેરાશ કેટલા દિવસો બેડ ખુલ્લા હોય છે; હોસ્પિટલમાં રહેવાની સરેરાશ લંબાઈ;

c) સ્વચ્છતા, રોગશાસ્ત્ર અને જાહેર આરોગ્યના કેન્દ્રમાં: વ્યક્તિ દીઠ સરેરાશ વિસ્તાર (અથવા ઘન ક્ષમતા), સરેરાશ પોષક ધોરણો (પ્રોટીન, ચરબી, કાર્બોહાઇડ્રેટ્સ, વિટામિન્સ, ખનિજ ક્ષાર, કેલરી), સેનિટરી ધોરણો અને ધોરણો, વગેરે;

2. શારીરિક વિકાસની લાક્ષણિકતા (મુખ્ય માનવશાસ્ત્રીય લાક્ષણિકતાઓ, મોર્ફોલોજિકલ અને કાર્યાત્મક);

3. ક્લિનિકલ અને પ્રાયોગિક અભ્યાસોમાં સામાન્ય અને રોગવિજ્ઞાનવિષયક સ્થિતિમાં શરીરના તબીબી અને શારીરિક પરિમાણો નક્કી કરવા.

4. વિશેષ વૈજ્ઞાનિક સંશોધનમાં.

સરેરાશ મૂલ્યો અને સૂચકાંકો વચ્ચેનો તફાવત:

1. ગુણાંક વૈકલ્પિક લાક્ષણિકતા દર્શાવે છે જે આંકડાકીય વસ્તીના ચોક્કસ ભાગમાં જ થાય છે, જે થઈ શકે છે અથવા ન પણ થઈ શકે છે.

સરેરાશ મૂલ્યો એવી લાક્ષણિકતાઓને આવરી લે છે જે ટીમના તમામ સભ્યો માટે સામાન્ય છે, પરંતુ વિવિધ ડિગ્રીઓ (વજન, ઊંચાઈ, હોસ્પિટલમાં સારવારના દિવસો).

2. ગુણાત્મક લાક્ષણિકતાઓ માપવા માટે ગુણાંકનો ઉપયોગ થાય છે. સરેરાશ મૂલ્યો - વિવિધ માત્રાત્મક લાક્ષણિકતાઓ માટે.

સરેરાશના પ્રકારો:

    અંકગણિત સરેરાશ, તેની લાક્ષણિકતાઓ પ્રમાણભૂત વિચલન અને સરેરાશ ભૂલ છે

    મોડ અને મધ્ય. ફેશન (Mo)- આપેલ વસ્તીમાં અન્ય લોકો કરતા વધુ વખત જોવા મળતી લાક્ષણિકતાના મૂલ્યને અનુરૂપ છે. મધ્યક (હું)- આપેલ વસ્તીમાં સરેરાશ મૂલ્ય ધરાવે છે તે લાક્ષણિકતાનું મૂલ્ય. તે અવલોકનોની સંખ્યા અનુસાર શ્રેણીને 2 સમાન ભાગોમાં વિભાજિત કરે છે. અંકગણિત સરેરાશ (M)- મોડ અને મધ્યકથી વિપરીત, તે કરવામાં આવેલા તમામ અવલોકનો પર આધારિત છે, તેથી તે સમગ્ર વિતરણ માટે એક મહત્વપૂર્ણ લાક્ષણિકતા છે.

    અન્ય પ્રકારની સરેરાશ કે જેનો વિશેષ અભ્યાસમાં ઉપયોગ થાય છે: મૂળ એટલે ચોરસ, ઘન, હાર્મોનિક, ભૌમિતિક, પ્રગતિશીલ.

અંકગણિત સરેરાશઆંકડાકીય વસ્તીના સરેરાશ સ્તરને દર્શાવે છે.

એક સરળ શ્રેણી માટે, જ્યાં

∑v - રકમ વિકલ્પ,

n - અવલોકનોની સંખ્યા.

ભારિત શ્રેણી માટે, જ્યાં

∑vр – દરેક વિકલ્પના ઉત્પાદનોનો સરવાળો અને તેની ઘટનાની આવર્તન

n - અવલોકનોની સંખ્યા.

પ્રમાણભૂત વિચલનઅંકગણિત સરેરાશ અથવા સિગ્મા (σ) લાક્ષણિકતાની વિવિધતાને દર્શાવે છે

- એક સરળ પંક્તિ માટે

Σd 2 – અંકગણિત સરેરાશ અને દરેક વિકલ્પ વચ્ચેના તફાવતના વર્ગોનો સરવાળો (d = │M-V│)

n - અવલોકનોની સંખ્યા

- વજનવાળી શ્રેણી માટે

∑d 2 p – અંકગણિત સરેરાશ અને દરેક વિકલ્પ અને તેની ઘટનાની આવર્તન વચ્ચેના તફાવતના વર્ગોના ઉત્પાદનોનો સરવાળો,

n - અવલોકનોની સંખ્યા.

વિવિધતાની ડિગ્રી વિવિધતાના ગુણાંકની તીવ્રતા દ્વારા નક્કી કરી શકાય છે
. 20% થી વધુ મજબૂત વિવિધતા છે, 10-20% મધ્યમ વિવિધતા છે, 10% થી ઓછી નબળી વિવિધતા છે.

જો આપણે અંકગણિત સરેરાશ મૂલ્યમાં એક સિગ્મા (M ± 1σ) ઉમેરી અને બાદ કરીએ, તો સામાન્ય વિતરણ સાથે, ઓછામાં ઓછા 68.3% તમામ પ્રકારો (અવલોકનો) આ મર્યાદાઓની અંદર હશે, જેને અભ્યાસ કરવામાં આવી રહેલી ઘટના માટે ધોરણ માનવામાં આવે છે. . જો k 2 ± 2σ, તો તમામ અવલોકનોમાંથી 95.5% આ મર્યાદાઓની અંદર હશે, અને જો k M ± 3σ, તો તમામ અવલોકનોના 99.7% આ મર્યાદાઓની અંદર હશે. આમ, પ્રમાણભૂત વિચલન એ પ્રમાણભૂત વિચલન છે જે અમને ઉલ્લેખિત સીમાઓની અંદર અભ્યાસ કરવામાં આવતી લાક્ષણિકતાના આવા મૂલ્યની ઘટનાની સંભાવનાની આગાહી કરવા દે છે.

અંકગણિત સરેરાશની સરેરાશ ભૂલઅથવા પ્રતિનિધિત્વ પૂર્વગ્રહ. સરળ, ભારિત શ્રેણી અને ક્ષણોના નિયમ માટે:

.

સરેરાશ મૂલ્યોની ગણતરી કરવા માટે, તે જરૂરી છે: સામગ્રીની એકરૂપતા, અવલોકનોની પૂરતી સંખ્યા. જો અવલોકનોની સંખ્યા 30 કરતા ઓછી હોય, તો σ અને m ની ગણતરી કરવા માટેના સૂત્રોમાં n-1 નો ઉપયોગ થાય છે.

સરેરાશ ભૂલના કદ દ્વારા પ્રાપ્ત પરિણામનું મૂલ્યાંકન કરતી વખતે, આત્મવિશ્વાસ ગુણાંકનો ઉપયોગ કરવામાં આવે છે, જે સાચા જવાબની સંભાવનાને નિર્ધારિત કરવાનું શક્ય બનાવે છે, એટલે કે, તે સૂચવે છે કે નમૂનાની ભૂલનું પરિણામી મૂલ્ય કરતાં વધુ નહીં હોય સતત અવલોકનના પરિણામે થયેલી વાસ્તવિક ભૂલ. પરિણામે, આત્મવિશ્વાસની સંભાવનામાં વધારા સાથે, આત્મવિશ્વાસ અંતરાલની પહોળાઈ વધે છે, જે બદલામાં, ચુકાદાનો આત્મવિશ્વાસ અને પ્રાપ્ત પરિણામની સહાયતામાં વધારો કરે છે.

પંક્તિઓ બાંધી માત્રાત્મક ધોરણે, કહેવાય છે વિવિધતાલક્ષી.

વિતરણ શ્રેણી સમાવે છે વિકલ્પો(લાક્ષણિક મૂલ્યો) અને ફ્રીક્વન્સીઝ(જૂથોની સંખ્યા). સંબંધિત મૂલ્યો (અપૂર્ણાંક, ટકાવારી) તરીકે દર્શાવવામાં આવેલી આવર્તન કહેવામાં આવે છે ફ્રીક્વન્સીઝ. તમામ ફ્રીક્વન્સીઝના સરવાળાને વિતરણ શ્રેણીનું વોલ્યુમ કહેવામાં આવે છે.

પ્રકાર દ્વારા, વિતરણ શ્રેણી વિભાજિત કરવામાં આવે છે અલગ(લાક્ષણિકતાના અસંતુલિત મૂલ્યોના આધારે બનાવવામાં આવે છે) અને અંતરાલ(લાક્ષણિકતાના સતત મૂલ્યો પર આધારિત).

વિવિધતા શ્રેણીબે કૉલમ (અથવા પંક્તિઓ) રજૂ કરે છે; જેમાંથી એક વૈવિધ્યસભર લાક્ષણિકતાના વ્યક્તિગત મૂલ્યો પૂરા પાડે છે, જેને વેરિઅન્ટ્સ કહેવાય છે અને X દ્વારા સૂચવવામાં આવે છે; અને બીજામાં - દરેક વિકલ્પ કેટલી વાર (કેટલી વાર) થાય છે તે દર્શાવતી સંપૂર્ણ સંખ્યાઓ. બીજા સ્તંભમાંના સૂચકોને ફ્રીક્વન્સી કહેવામાં આવે છે અને પરંપરાગત રીતે f દ્વારા સૂચવવામાં આવે છે. ચાલો ફરી એકવાર નોંધ લઈએ કે બીજી કૉલમ સાપેક્ષ સૂચકાંકોનો પણ ઉપયોગ કરી શકે છે જે ફ્રીક્વન્સીના કુલ સરવાળામાં વ્યક્તિગત વિકલ્પોની આવર્તનના હિસ્સાને લાક્ષણિકતા આપે છે. આ સંબંધિત સૂચકાંકોને ફ્રીક્વન્સીઝ કહેવામાં આવે છે અને પરંપરાગત રીતે ω દ્વારા સૂચવવામાં આવે છે આ કિસ્સામાં તમામ ફ્રીક્વન્સીનો સરવાળો એક સમાન છે. જો કે, ફ્રીક્વન્સીઝને ટકાવારી તરીકે પણ વ્યક્ત કરી શકાય છે, અને પછી તમામ ફ્રીક્વન્સીનો સરવાળો 100% આપે છે.

જો વિવિધતા શ્રેણીના પ્રકારોને અલગ જથ્થાના સ્વરૂપમાં દર્શાવવામાં આવે છે, તો આવી વિવિધતા શ્રેણી કહેવામાં આવે છે અલગ

સતત લાક્ષણિકતાઓ માટે, વિવિધતા શ્રેણીઓ આ રીતે બનાવવામાં આવે છે અંતરાલ, એટલે કે, તેમાંના એટ્રિબ્યુટના મૂલ્યો "... થી..." વ્યક્ત કરવામાં આવે છે. આ કિસ્સામાં, આવા અંતરાલમાં લાક્ષણિકતાના લઘુત્તમ મૂલ્યોને અંતરાલની નીચલી મર્યાદા કહેવામાં આવે છે, અને મહત્તમ - ઉપલી મર્યાદા.

અંતરાલ વિવિધતા શ્રેણીઓ પણ અલગ લાક્ષણિકતાઓ માટે બનાવવામાં આવે છે જે વિશાળ શ્રેણીમાં બદલાય છે. અંતરાલ શ્રેણી સાથે હોઈ શકે છે સમાનઅને અસમાનઅંતરાલો પર.

ચાલો વિચાર કરીએ કે સમાન અંતરાલોનું મૂલ્ય કેવી રીતે નક્કી થાય છે. ચાલો નીચે આપેલ સૂચન રજૂ કરીએ:

i- અંતરાલ કદ;

- વસ્તી એકમો માટે લાક્ષણિકતાનું મહત્તમ મૂલ્ય;

- વસ્તી એકમો માટે લાક્ષણિકતાનું લઘુત્તમ મૂલ્ય;

n -ફાળવેલ જૂથોની સંખ્યા.

, જો n ઓળખાય છે.

જો ઓળખવાના જૂથોની સંખ્યા અગાઉથી નક્કી કરવી મુશ્કેલ હોય, તો પર્યાપ્ત વસ્તીના કદ સાથે શ્રેષ્ઠ અંતરાલના કદની ગણતરી કરવા માટે, 1926 માં સ્ટર્જેસ દ્વારા પ્રસ્તાવિત સૂત્રની ભલામણ કરી શકાય છે:

n = 1+ 3.322 લોગ N, જ્યાં N એ એકંદરમાં એકમોની સંખ્યા છે.

અભ્યાસના ઑબ્જેક્ટની લાક્ષણિકતાઓને ધ્યાનમાં લેતા, દરેક વ્યક્તિગત કેસમાં અસમાન અંતરાલોનું કદ નક્કી કરવામાં આવે છે.

આંકડાકીય નમૂનાનું વિતરણવિકલ્પોની સૂચિ અને તેમની અનુરૂપ ફ્રીક્વન્સીઝ (અથવા સંબંધિત ફ્રીક્વન્સીઝ) કૉલ કરો.

નમૂનાનું આંકડાકીય વિતરણ કોષ્ટકના સ્વરૂપમાં સ્પષ્ટ કરી શકાય છે, જેમાંના પ્રથમ સ્તંભમાં વિકલ્પો સ્થિત છે, અને બીજામાં - આ વિકલ્પોને અનુરૂપ ફ્રીક્વન્સીઝ ni, અથવા સંબંધિત ફ્રીક્વન્સીઝ પી .

નમૂનાનું આંકડાકીય વિતરણ

અંતરાલ શ્રેણી એ વિવિધતા શ્રેણી છે જેમાં તેમની રચના હેઠળની લાક્ષણિકતાઓના મૂલ્યો ચોક્કસ મર્યાદાઓ (અંતરાલ) ની અંદર વ્યક્ત કરવામાં આવે છે. આ કિસ્સામાં ફ્રીક્વન્સીઝ એ એટ્રિબ્યુટના વ્યક્તિગત મૂલ્યોને નહીં, પરંતુ સમગ્ર અંતરાલનો સંદર્ભ આપે છે.

અંતરાલ વિતરણ શ્રેણી સતત જથ્થાત્મક લાક્ષણિકતાઓ, તેમજ નોંધપાત્ર મર્યાદાઓમાં બદલાતી અલગ લાક્ષણિકતાઓના આધારે બનાવવામાં આવે છે.

અંતરાલ શ્રેણીને નમૂનાના આંકડાકીય વિતરણ દ્વારા રજૂ કરી શકાય છે જે અંતરાલો અને તેમની અનુરૂપ ફ્રીક્વન્સીઝ દર્શાવે છે. આ કિસ્સામાં, આ અંતરાલમાં આવતા ચલોની ફ્રીક્વન્સીનો સરવાળો અંતરાલની આવર્તન તરીકે લેવામાં આવે છે.

જથ્થાત્મક સતત લાક્ષણિકતાઓ દ્વારા જૂથબદ્ધ કરતી વખતે, અંતરાલનું કદ નક્કી કરવું મહત્વપૂર્ણ છે.

નમૂનાના સરેરાશ અને નમૂનાના તફાવત ઉપરાંત, વિવિધતા શ્રેણીની અન્ય લાક્ષણિકતાઓનો પણ ઉપયોગ થાય છે.

ફેશનસૌથી વધુ આવર્તન ધરાવતા વેરિઅન્ટને કહેવામાં આવે છે.

આંકડાકીય વિતરણ શ્રેણી- આ ચોક્કસ અલગ અલગ લાક્ષણિકતા અનુસાર જૂથોમાં વસ્તી એકમોનું ક્રમબદ્ધ વિતરણ છે.
વિતરણ શ્રેણીની રચના અંતર્ગત લાક્ષણિકતા પર આધાર રાખીને, ત્યાં છે એટ્રિબ્યુટિવ અને વેરિએશનલ ડિસ્ટ્રિબ્યુશન સિરીઝ.

સામાન્ય લાક્ષણિકતાની હાજરી એ આંકડાકીય વસ્તીની રચના માટેનો આધાર છે, જે અભ્યાસના પદાર્થોની સામાન્ય લાક્ષણિકતાઓનું વર્ણન અથવા માપન કરવાના પરિણામોનું પ્રતિનિધિત્વ કરે છે.

આંકડાશાસ્ત્રમાં અભ્યાસનો વિષય બદલાતી (વિવિધ) લાક્ષણિકતાઓ અથવા આંકડાકીય લાક્ષણિકતાઓ છે.

આંકડાકીય લાક્ષણિકતાઓના પ્રકાર.

વિતરણ શ્રેણીને વિશેષતા કહેવામાં આવે છેગુણવત્તા માપદંડ અનુસાર બાંધવામાં આવે છે. વિશેષતા- આ એક નિશાની છે જેનું નામ છે (ઉદાહરણ તરીકે, વ્યવસાય: સીમસ્ટ્રેસ, શિક્ષક, વગેરે).
વિતરણ શ્રેણી સામાન્ય રીતે કોષ્ટકોના સ્વરૂપમાં રજૂ કરવામાં આવે છે. કોષ્ટકમાં 2.8 એટ્રિબ્યુટ વિતરણ શ્રેણી બતાવે છે.
કોષ્ટક 2.8 - રશિયન ફેડરેશનના એક પ્રદેશના નાગરિકોને વકીલો દ્વારા પૂરી પાડવામાં આવતી કાનૂની સહાયના પ્રકારોનું વિતરણ.

વિવિધતા શ્રેણી- આ લાક્ષણિકતા (અથવા મૂલ્યોના અંતરાલો) અને તેમની ફ્રીક્વન્સીઝના મૂલ્યો છે.
વિવિધતા શ્રેણી વિતરણ શ્રેણી છે, માત્રાત્મક ધોરણે બાંધવામાં આવે છે. કોઈપણ વિવિધતા શ્રેણીમાં બે ઘટકોનો સમાવેશ થાય છે: વિકલ્પો અને ફ્રીક્વન્સીઝ.
વેરિએન્ટ્સ એ લાક્ષણિકતાના વ્યક્તિગત મૂલ્યો તરીકે ગણવામાં આવે છે જે તે વિવિધતા શ્રેણીમાં લે છે.
ફ્રીક્વન્સીઝ એ વ્યક્તિગત ભિન્નતા અથવા વિવિધતા શ્રેણીના દરેક જૂથની સંખ્યા છે, એટલે કે. આ સંખ્યાઓ છે જે દર્શાવે છે કે વિતરણ શ્રેણીમાં અમુક વિકલ્પો કેટલી વાર આવે છે. તમામ ફ્રીક્વન્સીઝનો સરવાળો સમગ્ર વસ્તીનું કદ, તેનું પ્રમાણ નક્કી કરે છે.
ફ્રીક્વન્સીઝ એ ફ્રીક્વન્સીઝ છે જે એકમના અપૂર્ણાંક તરીકે અથવા કુલની ટકાવારી તરીકે દર્શાવવામાં આવે છે. તદનુસાર, ફ્રીક્વન્સીઝનો સરવાળો 1 અથવા 100% જેટલો છે. વિવિધતા શ્રેણી વાસ્તવિક ડેટાના આધારે વિતરણ કાયદાના સ્વરૂપનો અંદાજ કાઢવાની મંજૂરી આપે છે.

લક્ષણની વિવિધતાની પ્રકૃતિ પર આધાર રાખીને, ત્યાં છે સ્વતંત્ર અને અંતરાલ વિવિધતા શ્રેણી.
એક અલગ ભિન્નતા શ્રેણીનું ઉદાહરણ કોષ્ટકમાં આપવામાં આવ્યું છે. 2.9.
કોષ્ટક 2.9 - રશિયન ફેડરેશનમાં 1989 માં વ્યક્તિગત એપાર્ટમેન્ટ્સમાં કબજે કરેલા રૂમની સંખ્યા દ્વારા પરિવારોનું વિતરણ.

કોષ્ટકની પ્રથમ કૉલમ એક અલગ ભિન્નતા શ્રેણી માટે વિકલ્પો રજૂ કરે છે, બીજી કૉલમ વિવિધતા શ્રેણીની ફ્રીક્વન્સીઝ ધરાવે છે, અને ત્રીજામાં આવર્તન સૂચકાંકો છે.

વિવિધતા શ્રેણી

સામાન્ય વસ્તીમાં ચોક્કસ જથ્થાત્મક લાક્ષણિકતાનો અભ્યાસ કરવામાં આવે છે. તેમાંથી વોલ્યુમનો નમૂનો અવ્યવસ્થિત રીતે કાઢવામાં આવે છે n, એટલે કે, નમૂના તત્વોની સંખ્યા બરાબર છે n. આંકડાકીય પ્રક્રિયાના પ્રથમ તબક્કે, રેન્જિંગનમૂનાઓ, એટલે કે નંબર ઓર્ડરિંગ x 1 , x 2 , …, x nચડતા. દરેક અવલોકન કરેલ મૂલ્ય x iકહેવાય છે વિકલ્પ. આવર્તન m iમૂલ્યના અવલોકનોની સંખ્યા છે x iનમૂનામાં. સંબંધિત આવર્તન (આવર્તન) w iઆવર્તન ગુણોત્તર છે m iનમૂનાના કદ માટે n: .
વિવિધતા શ્રેણીનો અભ્યાસ કરતી વખતે, સંચિત આવર્તન અને સંચિત આવર્તનના ખ્યાલોનો પણ ઉપયોગ થાય છે. દો xઅમુક સંખ્યા. પછી વિકલ્પોની સંખ્યા , જેના મૂલ્યો ઓછા છે x, સંચિત આવર્તન કહેવાય છે: x i માટે nસંચિત આવર્તન w i મહત્તમ કહેવાય છે.
જો તેના વ્યક્તિગત મૂલ્યો (ચલો) ચોક્કસ મર્યાદિત મૂલ્ય (સામાન્ય રીતે પૂર્ણાંક) દ્વારા એકબીજાથી ભિન્ન હોય તો લાક્ષણિકતાને સ્પષ્ટ રીતે ચલ કહેવામાં આવે છે. આવી લાક્ષણિકતાની વિવિધતા શ્રેણીને સ્વતંત્ર વિવિધતા શ્રેણી કહેવામાં આવે છે.

કોષ્ટક 1. એક અલગ ભિન્નતા આવર્તન શ્રેણીનું સામાન્ય દૃશ્ય

લાક્ષણિક મૂલ્યોx i x 1 x 2 x n
ફ્રીક્વન્સીઝm i મી 1 મીટર 2 m n

એક લાક્ષણિકતાને સતત બદલાતી કહેવામાં આવે છે જો તેના મૂલ્યો એક બીજાથી મનસ્વી રીતે નાની રકમથી અલગ હોય, એટલે કે. નિશાની ચોક્કસ અંતરાલમાં કોઈપણ મૂલ્ય લઈ શકે છે. આવી લાક્ષણિકતા માટે સતત વિવિધતા શ્રેણીને અંતરાલ કહેવામાં આવે છે.

કોષ્ટક 2. ફ્રીક્વન્સીઝની અંતરાલ વિવિધતા શ્રેણીનું સામાન્ય દૃશ્ય

કોષ્ટક 3. વિવિધતા શ્રેણીની ગ્રાફિક છબીઓ

પંક્તિબહુકોણ અથવા હિસ્ટોગ્રામપ્રયોગમૂલક વિતરણ કાર્ય
અલગ
અંતરાલ
અવલોકનોના પરિણામોની સમીક્ષા કરીને, તે નક્કી કરવામાં આવે છે કે દરેક ચોક્કસ અંતરાલમાં કેટલા વિવિધ મૂલ્યો આવે છે. એવું માનવામાં આવે છે કે દરેક અંતરાલ તેના એક છેડા સાથે સંબંધિત છે: કાં તો બધા કિસ્સાઓમાં ડાબે (વધુ વખત) અથવા બધા કિસ્સાઓમાં જમણે, અને ફ્રીક્વન્સીઝ અથવા ફ્રીક્વન્સીઝ ઉલ્લેખિત સીમાઓમાં સમાવિષ્ટ વિકલ્પોની સંખ્યા દર્શાવે છે. તફાવતો a i - a i +1આંશિક અંતરાલો કહેવાય છે. અનુગામી ગણતરીઓને સરળ બનાવવા માટે, અંતરાલ વિવિધતા શ્રેણીને શરતી રીતે અલગથી બદલી શકાય છે. આ કિસ્સામાં, સરેરાશ મૂલ્ય i-વિરામ વિકલ્પ તરીકે લેવામાં આવે છે x i, અને અનુરૂપ અંતરાલ આવર્તન m i- આ અંતરાલની આવર્તન માટે.
વિવિધતા શ્રેણીની ગ્રાફિકલ રજૂઆત માટે, બહુકોણ, હિસ્ટોગ્રામ, સંચિત વળાંક અને પ્રયોગમૂલક વિતરણ કાર્યનો સૌથી વધુ ઉપયોગ થાય છે.

કોષ્ટકમાં 2.3 (એપ્રિલ 1994માં સરેરાશ માથાદીઠ આવક દ્વારા રશિયન વસ્તીનું જૂથ) રજૂ કરવામાં આવ્યું છે. અંતરાલ વિવિધતા શ્રેણી.
ગ્રાફિકલ ઇમેજનો ઉપયોગ કરીને વિતરણ શ્રેણીનું વિશ્લેષણ કરવું અનુકૂળ છે, જે વિતરણના આકારને નક્કી કરવા દે છે. ભિન્નતા શ્રેણીની ફ્રીક્વન્સીઝમાં ફેરફારોની પ્રકૃતિનું દ્રશ્ય રજૂઆત દ્વારા આપવામાં આવે છે બહુકોણ અને હિસ્ટોગ્રામ.
બહુકોણનો ઉપયોગ જ્યારે અલગ ભિન્નતા શ્રેણી દર્શાવતી વખતે થાય છે.
ચાલો, ઉદાહરણ તરીકે, એપાર્ટમેન્ટના પ્રકાર (કોષ્ટક 2.10) દ્વારા હાઉસિંગ સ્ટોકના વિતરણનું ગ્રાફિકલી નિરૂપણ કરીએ.
કોષ્ટક 2.10 - એપાર્ટમેન્ટના પ્રકાર (શરતી આંકડાઓ) દ્વારા શહેરી વિસ્તારના હાઉસિંગ સ્ટોકનું વિતરણ.


ચોખા. હાઉસિંગ વિતરણ વિસ્તાર


માત્ર આવર્તન મૂલ્યો જ નહીં, પણ વિવિધતા શ્રેણીની ફ્રીક્વન્સીઝ પણ ઓર્ડિનેટ અક્ષો પર પ્લોટ કરી શકાય છે.
હિસ્ટોગ્રામનો ઉપયોગ અંતરાલ વિવિધતા શ્રેણીને દર્શાવવા માટે થાય છે. હિસ્ટોગ્રામ બનાવતી વખતે, અંતરાલોનાં મૂલ્યો એબ્સીસા અક્ષ પર રચાય છે, અને ફ્રીક્વન્સીઝને અનુરૂપ અંતરાલો પર બાંધવામાં આવેલા લંબચોરસ દ્વારા દર્શાવવામાં આવે છે. સમાન અંતરાલોના કિસ્સામાં કૉલમની ઊંચાઈ ફ્રીક્વન્સીઝના પ્રમાણસર હોવી જોઈએ. હિસ્ટોગ્રામ એ એક ગ્રાફ છે જેમાં શ્રેણીને એકબીજાને અડીને આવેલા બાર તરીકે દર્શાવવામાં આવે છે.
ચાલો કોષ્ટકમાં આપેલ અંતરાલ વિતરણ શ્રેણીનું ગ્રાફિકલી નિરૂપણ કરીએ. 2.11.
કોષ્ટક 2.11 - વ્યક્તિ દીઠ રહેવાની જગ્યાના કદ દ્વારા પરિવારોનું વિતરણ (શરતી આંકડાઓ).
N p/p વ્યક્તિ દીઠ રહેવાની જગ્યાના કદ દ્વારા પરિવારોના જૂથો વસવાટ કરો છો જગ્યાના આપેલ કદ સાથે પરિવારોની સંખ્યા પરિવારોની સંચિત સંખ્યા
1 3 – 5 10 10
2 5 – 7 20 30
3 7 – 9 40 70
4 9 – 11 30 100
5 11 – 13 15 115
કુલ 115 ----


ચોખા. 2.2. વ્યક્તિ દીઠ રહેવાની જગ્યાના કદ દ્વારા પરિવારોના વિતરણનો હિસ્ટોગ્રામ


સંચિત શ્રેણી (કોષ્ટક 2.11) ના ડેટાનો ઉપયોગ કરીને, અમે રચના કરીએ છીએ સંચિત વિતરણ.


ચોખા. 2.3. વ્યક્તિ દીઠ રહેવાની જગ્યાના કદ દ્વારા પરિવારોનું સંચિત વિતરણ


ક્યુમ્યુલેટના સ્વરૂપમાં વિવિધતા શ્રેણીનું પ્રતિનિધિત્વ ખાસ કરીને વિવિધતા શ્રેણી માટે અસરકારક છે જેની ફ્રીક્વન્સીઝ શ્રેણી ફ્રીક્વન્સીઝના સરવાળાના અપૂર્ણાંક અથવા ટકાવારી તરીકે વ્યક્ત કરવામાં આવે છે.
જો આપણે ક્યૂમ્યુલેટ્સના રૂપમાં વિવિધતા શ્રેણીને ગ્રાફિકલી દર્શાવતી વખતે અક્ષો બદલીએ, તો આપણને મળે છે ઓગીવા. ફિગ માં. 2.4 કોષ્ટકમાંના ડેટાના આધારે રચાયેલ ઓગિવ બતાવે છે. 2.11.
હિસ્ટોગ્રામને લંબચોરસની બાજુઓના મધ્યબિંદુઓ શોધીને અને પછી આ બિંદુઓને સીધી રેખાઓ સાથે જોડીને વિતરણ બહુકોણમાં રૂપાંતરિત કરી શકાય છે. પરિણામી વિતરણ બહુકોણ ફિગમાં બતાવવામાં આવ્યું છે. ડોટેડ લાઇન સાથે 2.2.
અસમાન અંતરાલો સાથે ભિન્નતા શ્રેણીના વિતરણનો હિસ્ટોગ્રામ બનાવતી વખતે, તે ઓર્ડિનેટ અક્ષ સાથે રચાયેલ ફ્રીક્વન્સીઝ નથી, પરંતુ અનુરૂપ અંતરાલોમાં લાક્ષણિકતાની વિતરણ ઘનતા છે.
વિતરણ ઘનતા એ એકમ અંતરાલ પહોળાઈ દીઠ ગણતરી કરેલ આવર્તન છે, એટલે કે. અંતરાલ મૂલ્યના એકમ દીઠ દરેક જૂથમાં કેટલા એકમો છે. વિતરણ ઘનતાની ગણતરીનું ઉદાહરણ કોષ્ટકમાં રજૂ કરવામાં આવ્યું છે. 2.12.
કોષ્ટક 2.12 - કર્મચારીઓની સંખ્યા દ્વારા સાહસોનું વિતરણ (શરતી આંકડા)
N p/p કર્મચારીઓ, લોકોની સંખ્યા દ્વારા સાહસોના જૂથો. સાહસોની સંખ્યા અંતરાલ કદ, લોકો. વિતરણ ઘનતા
1 2 3=1/2
1 20 સુધી 15 20 0,75
2 20 – 80 27 60 0,25
3 80 – 150 35 70 0,5
4 150 – 300 60 150 0,4
5 300 – 500 10 200 0,05
કુલ 147 ---- ----

વિવિધતા શ્રેણીને ગ્રાફિકલી રજૂ કરવા માટે પણ વાપરી શકાય છે સંચિત વળાંક. ક્યુમ્યુલેટ (સમ વળાંક) નો ઉપયોગ કરીને, સંચિત ફ્રીક્વન્સીઝની શ્રેણી દર્શાવવામાં આવી છે. સંચિત ફ્રીક્વન્સીઝ ક્રમશઃ સમગ્ર જૂથોમાં ફ્રીક્વન્સીઝનો સરવાળો કરીને નિર્ધારિત કરવામાં આવે છે અને દર્શાવે છે કે વસ્તીમાં કેટલા એકમો વિચારણા હેઠળના મૂલ્ય કરતાં વધારે મૂલ્ય ધરાવતા નથી.


ચોખા. 2.4. વ્યક્તિ દીઠ રહેવાની જગ્યાના કદ દ્વારા પરિવારોના વિતરણનો ઓગિવ

અંતરાલ ભિન્નતા શ્રેણીના ક્યુમ્યુલેટ્સનું નિર્માણ કરતી વખતે, શ્રેણીના પ્રકારો એબ્સીસા અક્ષ સાથે પ્લોટ કરવામાં આવે છે, અને સંચિત ફ્રીક્વન્સીઝ ઓર્ડિનેટ અક્ષ સાથે પ્લોટ કરવામાં આવે છે.



શું તમને લેખ ગમ્યો? તમારા મિત્રો સાથે શેર કરો!