વિવિધતા શ્રેણી કેવી રીતે બનાવવી. આંકડાકીય સારાંશ અને જૂથીકરણ

લેબોરેટરી વર્ક નંબર 1. આંકડાકીય માહિતીની પ્રાથમિક પ્રક્રિયા

વિતરણ શ્રેણીનું નિર્માણ

કોઈપણ એક લાક્ષણિકતા અનુસાર જૂથોમાં વસ્તી એકમોનું ક્રમબદ્ધ વિતરણ કહેવામાં આવે છે વિતરણની નજીક . આ કિસ્સામાં, લાક્ષણિકતા કાં તો માત્રાત્મક હોઈ શકે છે, પછી શ્રેણી કહેવામાં આવે છે વિવિધતાલક્ષી , અને ગુણાત્મક, પછી શ્રેણી કહેવામાં આવે છે વિશેષતા . તેથી, ઉદાહરણ તરીકે, શહેરની વસ્તી વિવિધતા શ્રેણીમાં વય જૂથો દ્વારા અથવા વિશેષતા શ્રેણીમાં વ્યાવસાયિક જોડાણ દ્વારા વિતરિત કરી શકાય છે (અલબત્ત, વિતરણ શ્રેણીના નિર્માણ માટે ઘણી વધુ ગુણાત્મક અને માત્રાત્મક લાક્ષણિકતાઓ પ્રસ્તાવિત કરી શકાય છે; પસંદગી લાક્ષણિકતા આંકડાકીય સંશોધનના કાર્ય દ્વારા નક્કી કરવામાં આવે છે).

કોઈપણ વિતરણ શ્રેણી બે ઘટકો દ્વારા વર્ગીકૃત થયેલ છે:

- વિકલ્પ(x i) - આ નમૂનાની વસ્તીમાં એકમોની લાક્ષણિકતાના વ્યક્તિગત મૂલ્યો છે. વિવિધતા શ્રેણી માટે, વિકલ્પ સંખ્યાત્મક મૂલ્યો લે છે, વિશેષતા શ્રેણી માટે - ગુણાત્મક (ઉદાહરણ તરીકે, x = "સિવિલ સર્વન્ટ");

- આવર્તન(એન i) – ચોક્કસ લક્ષણ મૂલ્ય કેટલી વાર થાય છે તે દર્શાવતી સંખ્યા. જો આવર્તનને સંબંધિત સંખ્યા તરીકે દર્શાવવામાં આવે છે (એટલે ​​​​કે, વસ્તીના કુલ જથ્થામાં વિકલ્પોના આપેલ મૂલ્યને અનુરૂપ વસ્તીના ઘટકોનું પ્રમાણ), તો તેને કહેવામાં આવે છે સંબંધિત આવર્તનઅથવા આવર્તન.

વિવિધતા શ્રેણી આ હોઈ શકે છે:

- અલગ, જ્યારે અભ્યાસ કરવામાં આવતી લાક્ષણિકતા ચોક્કસ સંખ્યા (સામાન્ય રીતે પૂર્ણાંક) દ્વારા દર્શાવવામાં આવે છે.

- અંતરાલ, જ્યારે સીમાઓ "થી" અને "થી" ને સતત બદલાતી લાક્ષણિકતા માટે વ્યાખ્યાયિત કરવામાં આવે છે. એક અંતરાલ શ્રેણી પણ બનાવવામાં આવે છે જો અલગ અલગ લાક્ષણિકતાના મૂલ્યોનો સમૂહ મોટો હોય.

એક અંતરાલ શ્રેણી સમાન લંબાઈના અંતરાલો (સમાન-અંતરાલ શ્રેણી) અને અસમાન અંતરાલો સાથે બંને બનાવી શકાય છે, જો આ આંકડાકીય અભ્યાસની શરતો દ્વારા નિર્ધારિત કરવામાં આવે છે. ઉદાહરણ તરીકે, નીચેના અંતરાલો સાથે વસ્તી આવક વિતરણની શ્રેણી ધ્યાનમાં લઈ શકાય છે:<5тыс р., 5-10 тыс р., 10-20 тыс.р., 20-50 тыс р., и т.д. Если цель исследования не определяет способ построения интервального ряда, то строится равноинтервальный ряд, число интервалов в котором определяется по формуле Стерджесса:



જ્યાં k એ અંતરાલોની સંખ્યા છે, n એ નમૂનાનું કદ છે. (અલબત્ત, સૂત્ર સામાન્ય રીતે અપૂર્ણાંક સંખ્યા આપે છે, અને પરિણામી સંખ્યાની નજીકના પૂર્ણાંકને અંતરાલની સંખ્યા તરીકે પસંદ કરવામાં આવે છે.) આ કિસ્સામાં અંતરાલની લંબાઈ સૂત્ર દ્વારા નક્કી કરવામાં આવે છે.

.

ગ્રાફિકલી, વિવિધતા શ્રેણી ફોર્મમાં રજૂ કરી શકાય છે હિસ્ટોગ્રામ(અંતરાલ શ્રેણીના દરેક અંતરાલની ઉપર આ અંતરાલની આવર્તનને અનુરૂપ ઊંચાઈનો "કૉલમ" બાંધવામાં આવે છે), વિતરણ બહુકોણ(બિંદુઓને જોડતી તૂટેલી રેખા ( x i;n i) અથવા સંચિત કરે છે(સંચિત ફ્રીક્વન્સીઝ પર બનેલ છે, એટલે કે દરેક વિશેષતા મૂલ્ય માટે, આપેલ એક કરતાં ઓછી વિશેષતા મૂલ્ય સાથેના ઑબ્જેક્ટના સમૂહમાં ઘટનાની આવર્તન લેવામાં આવે છે).

Excel માં કામ કરતી વખતે, નીચેના કાર્યોનો ઉપયોગ વિવિધતા શ્રેણી બનાવવા માટે કરી શકાય છે:

તપાસો( ડેટા એરે) - નમૂનાનું કદ નક્કી કરવા માટે. દલીલ એ કોષોની શ્રેણી છે જેમાં નમૂનાનો ડેટા રહે છે.

COUNTIF( શ્રેણી; માપદંડ) - એટ્રિબ્યુટ અથવા વેરિયેશનલ સીરિઝ બનાવવા માટે વાપરી શકાય છે. દલીલો એ એટ્રિબ્યુટ અને માપદંડના નમૂના મૂલ્યોની શ્રેણીની શ્રેણી છે - વિશેષતાનું આંકડાકીય અથવા ટેક્સ્ટ મૂલ્ય અથવા તે કોષની સંખ્યા જેમાં તે સ્થિત છે. પરિણામ એ નમૂનામાં તે મૂલ્યની ઘટનાની આવર્તન છે.

આવર્તન( ડેટાની શ્રેણી; અંતરાલોની શ્રેણી) - વિવિધતા શ્રેણી બનાવવા માટે. દલીલો એ નમૂના ડેટા એરેની શ્રેણી અને અંતરાલ કૉલમ છે. જો તમારે એક અલગ શ્રેણી બનાવવાની જરૂર હોય, તો વિકલ્પોના મૂલ્યો અહીં સૂચવવામાં આવે છે જો તે અંતરાલ શ્રેણી છે, તો પછી અંતરાલોની ઉપરની સીમાઓ (તેમને "ખિસ્સા" પણ કહેવામાં આવે છે). પરિણામ ફ્રીક્વન્સીઝની કોલમ હોવાથી, તમારે CTRL+SHIFT+ENTER દબાવીને ફંક્શન એન્ટ્રી પૂર્ણ કરવી પડશે. નોંધ કરો કે જ્યારે કોઈ ફંક્શનનો પરિચય આપતી વખતે અંતરાલોની શ્રેણીનો ઉલ્લેખ કરો, ત્યારે તમારે તેમાં છેલ્લું મૂલ્ય નિર્દિષ્ટ કરવાની જરૂર નથી - બધા મૂલ્યો કે જે અગાઉના "ખિસ્સા" માં શામેલ ન હતા તે અનુરૂપ "પોકેટ" માં મૂકવામાં આવશે. આ કેટલીકવાર છેલ્લી ખિસ્સામાં સૌથી મોટા નમૂનાનું મૂલ્ય આપમેળે ન મૂકવાની ભૂલને ટાળવામાં મદદ કરી શકે છે.

વધુમાં, જટિલ જૂથો માટે (કેટલીક લાક્ષણિકતાઓ પર આધારિત), "પીવટ કોષ્ટકો" સાધનનો ઉપયોગ કરો. તેઓનો ઉપયોગ એટ્રિબ્યુટ અને વેરિયેશન સિરીઝ બનાવવા માટે પણ થઈ શકે છે, પરંતુ આ બિનજરૂરી રીતે કાર્યને જટિલ બનાવે છે. ઉપરાંત, વિવિધતા શ્રેણી અને હિસ્ટોગ્રામ બનાવવા માટે, "વિશ્લેષણ પેકેજ" એડ-ઇનમાંથી "હિસ્ટોગ્રામ" પ્રક્રિયા છે (એક્સેલમાં એડ-ઇન્સનો ઉપયોગ કરવા માટે, તમારે પહેલા તેને ડાઉનલોડ કરવું આવશ્યક છે; તે ડિફોલ્ટ રૂપે ઇન્સ્ટોલ કરેલા નથી)

ચાલો પ્રાથમિક ડેટા પ્રોસેસિંગની પ્રક્રિયાને નીચેના ઉદાહરણો સાથે સમજાવીએ.

ઉદાહરણ 1.1. 60 પરિવારોની માત્રાત્મક રચના પરનો ડેટા છે.

વિવિધતા શ્રેણી અને વિતરણ બહુકોણ બનાવો

ઉકેલ.

ચાલો એક્સેલ કોષ્ટકો ખોલીએ. ચાલો A1:L5 શ્રેણીમાં ડેટા એરે દાખલ કરીએ. જો તમે ઇલેક્ટ્રોનિક સ્વરૂપમાં દસ્તાવેજનો અભ્યાસ કરી રહ્યાં છો (ઉદાહરણ તરીકે, વર્ડ ફોર્મેટમાં), આ કરવા માટે, ફક્ત ડેટા સાથે કોષ્ટક પસંદ કરો અને તેને ક્લિપબોર્ડ પર કૉપિ કરો, પછી સેલ A1 પસંદ કરો અને ડેટા પેસ્ટ કરો - તેઓ આપમેળે કબજે કરશે. યોગ્ય શ્રેણી. ચાલો સેમ્પલ સાઇઝ n - સેમ્પલ ડેટાની સંખ્યાની ગણતરી કરીએ આ કરવા માટે, B7 સેલમાં ફોર્મ્યુલા =COUNT(A1:L5) દાખલ કરો. નોંધ કરો કે ફોર્મ્યુલામાં ઇચ્છિત શ્રેણી દાખલ કરવા માટે, કીબોર્ડથી તેનું હોદ્દો દાખલ કરવું જરૂરી નથી; ચાલો સેલ B8 માં સૂત્ર =MIN(A1:L5) દાખલ કરીને નમૂનામાં લઘુત્તમ અને મહત્તમ મૂલ્યો નક્કી કરીએ અને B9: =MAX(A1:L5).

ફિગ.1.1 ઉદાહરણ 1. એક્સેલ કોષ્ટકોમાં આંકડાકીય માહિતીની પ્રાથમિક પ્રક્રિયા

આગળ, અમે અંતરાલોના કૉલમ (ચલ મૂલ્યો) અને આવર્તન કૉલમ માટે નામ દાખલ કરીને વિવિધતા શ્રેણી બનાવવા માટે કોષ્ટક તૈયાર કરીશું. અંતરાલો કૉલમમાં, B12:B17 શ્રેણીને કબજે કરીને, લઘુત્તમ (1) થી મહત્તમ (6) સુધી લાક્ષણિક મૂલ્યો દાખલ કરો. ફ્રીક્વન્સી કોલમ પસંદ કરો, ફોર્મ્યુલા =FREQUENCY(A1:L5,B12:B17) દાખલ કરો અને કી સંયોજન CTRL+SHIFT+ENTER દબાવો

ફિગ. 1.2 ઉદાહરણ 1. વિવિધતા શ્રેણીનું નિર્માણ

નિયંત્રિત કરવા માટે, ચાલો SUM ફંક્શનનો ઉપયોગ કરીને ફ્રીક્વન્સીઝના સરવાળાની ગણતરી કરીએ ("હોમ" ટૅબ પર "સંપાદન" જૂથમાં ફંક્શન આઇકન S), ગણતરી કરેલ સરવાળો સેલ B7 માં અગાઉ ગણતરી કરેલ નમૂના વોલ્યુમ સાથે મેળ ખાતો હોવો જોઈએ.

હવે ચાલો બહુકોણ બનાવીએ: પરિણામી આવર્તન શ્રેણી પસંદ કર્યા પછી, "ઇનસર્ટ" ટેબ પર "ગ્રાફ" આદેશ પસંદ કરો. ડિફૉલ્ટ રૂપે, આડી અક્ષ પરના મૂલ્યો ઓર્ડિનલ નંબર્સ હશે - અમારા કિસ્સામાં 1 થી 6 સુધી, જે વિકલ્પોના મૂલ્યો (ટેરિફ શ્રેણીઓની સંખ્યા) સાથે સુસંગત છે.

ચાર્ટ શ્રેણી "શ્રેણી 1" નું નામ કાં તો "ડિઝાઇન" ટેબના સમાન "ડેટા પસંદ કરો" વિકલ્પનો ઉપયોગ કરીને બદલી શકાય છે, અથવા ફક્ત કાઢી નાખી શકાય છે.

ફિગ.1.3. ઉદાહરણ 1. આવર્તન બહુકોણનું નિર્માણ

ઉદાહરણ 1.2. 50 સ્ત્રોતોમાંથી પ્રદૂષકોના ઉત્સર્જન અંગેના ડેટા છે:

10,4 18,6 10,3 26,0 45,0 18,2 17,3 19,2 25,8 18,7
28,2 25,2 18,4 17,5 41,8 14,6 10,0 37,8 10,5 16,0
18,1 16,8 38,5 37,7 17,9 29,0 10,1 28,0 12,0 14,0
14,2 20,8 13,5 42,4 15,5 17,9 19, 10,8 12,1 12,4
12,9 12,6 16,8 19,7 18,3 36,8 15,0 37,0 13,0 19,5

સમાન-અંતરાલ શ્રેણી બનાવો, હિસ્ટોગ્રામ બનાવો

ઉકેલ

ચાલો ડેટા એરેને એક્સેલ શીટમાં દાખલ કરીએ, તે રેન્જ A1:J5 પર કબજો કરશે જેમ કે અગાઉના કાર્યમાં, અમે નમૂનાનું કદ n, નમૂનામાં ન્યૂનતમ અને મહત્તમ મૂલ્યો નક્કી કરીશું. હવેથી આપણને અલગ શ્રેણીની જરૂર નથી, પરંતુ અંતરાલ શ્રેણીની જરૂર છે, અને સમસ્યામાં અંતરાલોની સંખ્યા નિર્દિષ્ટ નથી, અમે સ્ટર્જેસ સૂત્રનો ઉપયોગ કરીને k અંતરાલોની સંખ્યાની ગણતરી કરીએ છીએ. આ કરવા માટે, B10 સેલમાં સૂત્ર =1+3.322*LOG10(B7) દાખલ કરો.

ફિગ.1.4. ઉદાહરણ 2. સમાન-અંતરાલ શ્રેણીનું નિર્માણ

પરિણામી મૂલ્ય પૂર્ણાંક નથી, તે લગભગ 6.64 છે. k=7 સાથે અંતરાલોની લંબાઈ પૂર્ણાંક તરીકે દર્શાવવામાં આવશે (k=6 ના કેસથી વિપરીત), અમે સેલ C10 માં આ મૂલ્ય દાખલ કરીને k=7 પસંદ કરીએ છીએ. અમે સૂત્ર =(B9-B8)/C10 દાખલ કરીને સેલ B11 માં અંતરાલ d ની લંબાઈની ગણતરી કરીએ છીએ.

ચાલો અંતરાલોની શ્રેણીને વ્યાખ્યાયિત કરીએ, જે દરેક 7 અંતરાલો માટે ઉપલી મર્યાદા દર્શાવે છે. આ કરવા માટે, સેલ E8 માં આપણે ફોર્મ્યુલા =B8+B11 દાખલ કરીને પ્રથમ અંતરાલની ઉપલી મર્યાદાની ગણતરી કરીએ છીએ; સેલ E9 માં ફોર્મ્યુલા =E8+B11 દાખલ કરીને બીજા અંતરાલની ઉપલી મર્યાદા. અંતરાલોની ઉપરની સીમાઓના બાકીના મૂલ્યોની ગણતરી કરવા માટે, અમે $ ચિહ્નનો ઉપયોગ કરીને દાખલ કરેલ ફોર્મ્યુલામાં સેલ B11 ની સંખ્યાને ઠીક કરીએ છીએ, જેથી સેલ E9 માં ફોર્મ્યુલા =E8+B$11 ફોર્મ લે, અને કૉપિ કરો. સેલ E9 થી સેલ E10-E14 ની સામગ્રી. પ્રાપ્ત થયેલ છેલ્લું મૂલ્ય સેલ B9 માં અગાઉ ગણતરી કરેલ નમૂનાના મહત્તમ મૂલ્યની બરાબર છે.

ફિગ.1.5. ઉદાહરણ 2. સમાન-અંતરાલ શ્રેણીનું નિર્માણ


હવે ચાલો FREQUENCY ફંક્શનનો ઉપયોગ કરીને "પોકેટ્સ" ની એરે ભરીએ, જેમ કે ઉદાહરણ 1 માં કરવામાં આવ્યું હતું.

ફિગ.1.6. ઉદાહરણ 2. સમાન-અંતરાલ શ્રેણીનું નિર્માણ

પરિણામી વિવિધતા શ્રેણીનો ઉપયોગ કરીને, અમે હિસ્ટોગ્રામ બનાવીશું: ફ્રીક્વન્સી કોલમ પસંદ કરો અને "ઇનસર્ટ" ટેબ પર "હિસ્ટોગ્રામ" પસંદ કરો. હિસ્ટોગ્રામ પ્રાપ્ત કર્યા પછી, ચાલો તેમાંના આડા અક્ષના લેબલોને અંતરાલની શ્રેણીમાંના મૂલ્યોમાં બદલીએ, આ કરવા માટે, "ડિઝાઇનર" ટૅબનો "ડેટા પસંદ કરો" વિકલ્પ પસંદ કરો. દેખાતી વિંડોમાં, "હોરિઝોન્ટલ એક્સિસ લેબલ્સ" વિભાગ માટે "બદલો" આદેશ પસંદ કરો અને માઉસ વડે તેને પસંદ કરીને વિકલ્પો માટે મૂલ્યોની શ્રેણી દાખલ કરો.

ફિગ.1.7. ઉદાહરણ 2. હિસ્ટોગ્રામ બનાવવું

ફિગ.1.8. ઉદાહરણ 2. હિસ્ટોગ્રામ બનાવવું

એક અલગ ભિન્નતા શ્રેણી અલગ લાક્ષણિકતાઓ માટે બનાવવામાં આવી છે.

એક અલગ ભિન્નતા શ્રેણી બનાવવા માટે, તમારે નીચેના પગલાં ભરવાની જરૂર છે: 1) લાક્ષણિકતાના અભ્યાસ કરેલ મૂલ્યના વધતા ક્રમમાં નિરીક્ષણના એકમોને ગોઠવો,

2) વિશેષતા x i ના તમામ સંભવિત મૂલ્યો નક્કી કરો, તેમને ચડતા ક્રમમાં ગોઠવો,

લક્ષણનું મૂલ્ય, i .

લક્ષણ મૂલ્યની આવર્તન અને સૂચવો f i . શ્રેણીની તમામ ફ્રીક્વન્સીઝનો સરવાળો અભ્યાસ કરવામાં આવી રહેલી વસ્તીના ઘટકોની સંખ્યા જેટલો છે.

ઉદાહરણ 1 .

પરીક્ષામાં વિદ્યાર્થીઓએ મેળવેલા ગ્રેડની યાદી: 3; 4; 3; 5; 4; 2; 2; 4; 4; 3; 5; 2; 4; 5; 4; 3; 4; 3; 3; 4; 4; 2; 2; 5; 5; 4; 5; 2; 3; 4; 4; 3; 4; 5; 2; 5; 5; 4; 3; 3; 4; 2; 4; 4; 5; 4; 3; 5; 3; 5; 4; 4; 5; 4; 4; 5; 4; 5; 5; 5.

આ રહ્યો નંબર એક્સ - ગ્રેડએક અલગ રેન્ડમ ચલ છે, અને અંદાજોની પરિણામી સૂચિ છેઆંકડાકીય (અવલોકનક્ષમ) ડેટા .

    અભ્યાસ કરેલ લાક્ષણિકતા મૂલ્યના ચડતા ક્રમમાં અવલોકન એકમો ગોઠવો:

2; 2; 2; 2; 2; 2; 2; 2; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5.

2) વિશેષતા x i ના તમામ સંભવિત મૂલ્યો નક્કી કરો, તેમને ચડતા ક્રમમાં ક્રમ આપો:

આ ઉદાહરણમાં, તમામ અંદાજોને નીચેના મૂલ્યો સાથે ચાર જૂથોમાં વિભાજિત કરી શકાય છે: 2; 3; 4; 5.

અવલોકન કરેલ ડેટાના ચોક્કસ જૂથને અનુરૂપ રેન્ડમ ચલનું મૂલ્ય કહેવામાં આવે છે લક્ષણનું મૂલ્ય, વિકલ્પ (વિકલ્પ) અને નિયુક્ત x i .

સંખ્યા કે જે દર્શાવે છે કે સંખ્યાબંધ અવલોકનોમાં લાક્ષણિકતાનું અનુરૂપ મૂલ્ય કેટલી વખત થાય છે તેને કહેવામાં આવે છે. લક્ષણ મૂલ્યની આવર્તન અને સૂચવો f i .

અમારા ઉદાહરણ માટે

સ્કોર 2 થાય છે - 8 વખત,

સ્કોર 3 થાય છે - 12 વખત,

સ્કોર 4 થાય છે - 23 વખત,

રેટિંગ 5 થાય છે - 17 વખત.

કુલ 60 રેટિંગ છે.

4) પ્રાપ્ત ડેટાને બે પંક્તિઓ (કૉલમ) ના કોષ્ટકમાં લખો - x i અને f i.

આ ડેટાના આધારે, એક અલગ ભિન્નતા શ્રેણી બાંધવી શક્ય છે

સ્વતંત્ર વિવિધતા શ્રેણી - આ એક ટેબલ છે જેમાં અભ્યાસ કરવામાં આવી રહેલી લાક્ષણિકતાના બનતા મૂલ્યોને ચડતા ક્રમમાં વ્યક્તિગત મૂલ્યો અને તેમની ફ્રીક્વન્સીઝ તરીકે દર્શાવવામાં આવે છે.

  1. અંતરાલ વિવિધતા શ્રેણીનું નિર્માણ

ડિસ્ક્રીટ વેરિએશનલ સીરિઝ ઉપરાંત, ઈન્ટરવલ વેરિએશનલ સીરિઝ જેવા ડેટાને જૂથબદ્ધ કરવાની પદ્ધતિનો વારંવાર સામનો કરવો પડે છે.

અંતરાલ શ્રેણી બનાવવામાં આવે છે જો:

    ચિહ્નમાં પરિવર્તનની સતત પ્રકૃતિ છે;

    ત્યાં ઘણાં અલગ મૂલ્યો હતા (10 થી વધુ)

    સ્વતંત્ર મૂલ્યોની આવર્તન ખૂબ જ નાની છે (પ્રમાણમાં મોટી સંખ્યામાં અવલોકન એકમો સાથે 1-3 થી વધુ નહીં);

    સમાન ફ્રીક્વન્સીઝ સાથે સુવિધાના ઘણા અલગ મૂલ્યો.

અંતરાલ વિવિધતા શ્રેણી એ કોષ્ટકના સ્વરૂપમાં ડેટાને જૂથબદ્ધ કરવાની એક રીત છે જેમાં બે કૉલમ હોય છે (મૂલ્યોના અંતરાલના સ્વરૂપમાં લાક્ષણિકતાના મૂલ્યો અને દરેક અંતરાલની આવર્તન).

એક અલગ શ્રેણીથી વિપરીત, અંતરાલ શ્રેણીની લાક્ષણિકતાના મૂલ્યો વ્યક્તિગત મૂલ્યો દ્વારા નહીં, પરંતુ મૂલ્યોના અંતરાલ ("થી - થી") દ્વારા દર્શાવવામાં આવે છે.

દરેક પસંદ કરેલ અંતરાલમાં કેટલા અવલોકન એકમો પડ્યા તે દર્શાવે છે તે સંખ્યા કહેવાય છે લક્ષણ મૂલ્યની આવર્તન અને સૂચવો f i . શ્રેણીની તમામ ફ્રીક્વન્સીઝનો સરવાળો અભ્યાસ કરવામાં આવતી વસ્તીમાં તત્વો (નિરીક્ષણના એકમો)ની સંખ્યા જેટલો છે.

જો એકમમાં અંતરાલની ઉપરની મર્યાદા જેટલી લાક્ષણિકતા મૂલ્ય હોય, તો તેને આગલા અંતરાલને સોંપવું જોઈએ.

ઉદાહરણ તરીકે, 100 સે.મી.ની ઊંચાઈ ધરાવતું બાળક 2જી અંતરાલમાં આવશે, પ્રથમમાં નહીં; અને 130 સે.મી.ની ઊંચાઈ ધરાવતું બાળક છેલ્લા અંતરાલમાં આવશે, ત્રીજામાં નહીં.

આ ડેટાના આધારે, અંતરાલ વિવિધતા શ્રેણી બનાવી શકાય છે.

દરેક અંતરાલમાં નીચું બાઉન્ડ (xn), એક અપર બાઉન્ડ (xw) અને અંતરાલ પહોળાઈ ( i).

ઇન્ટરવલ બાઉન્ડ્રી એ એટ્રિબ્યુટનું મૂલ્ય છે જે બે અંતરાલની સીમા પર આવેલું છે.

બાળકોની ઊંચાઈ (સે.મી.)

બાળકોની ઊંચાઈ (સે.મી.)

બાળકોની સંખ્યા

130 થી વધુ

જો કોઈ અંતરાલમાં ઉપલી અને નીચેની સીમા હોય, તો તેને કહેવામાં આવે છે બંધ અંતરાલ. જો કોઈ અંતરાલમાં માત્ર નીચી અથવા માત્ર ઉપલી સીમા હોય, તો તે છે - ખુલ્લું અંતરાલ.માત્ર પ્રથમ અથવા ખૂબ જ છેલ્લો અંતરાલ ખુલ્લું હોઈ શકે છે. ઉપરના ઉદાહરણમાં, છેલ્લું અંતરાલ ખુલ્લું છે.

અંતરાલ પહોળાઈ (i) - ઉપલા અને નીચલા મર્યાદા વચ્ચેનો તફાવત.

i = x n - x in

ખુલ્લા અંતરાલની પહોળાઈ નજીકના બંધ અંતરાલની પહોળાઈ જેટલી જ હોવાનું માનવામાં આવે છે.

બાળકોની ઊંચાઈ (સે.મી.)

બાળકોની સંખ્યા

અંતરાલ પહોળાઈ (i)

ગણતરીઓ માટે 130+20=150

20 (કારણ કે નજીકના બંધ અંતરાલની પહોળાઈ 20 છે)

તમામ અંતરાલ શ્રેણીઓ સમાન અંતરાલો સાથે અંતરાલ શ્રેણી અને અસમાન અંતરાલો સાથે અંતરાલ શ્રેણીમાં વિભાજિત કરવામાં આવે છે. . સમાન અંતરાલ સાથે અંતરવાળી પંક્તિઓમાં, તમામ અંતરાલોની પહોળાઈ સમાન હોય છે. અસમાન અંતરાલો સાથે અંતરાલ શ્રેણીમાં, અંતરાલોની પહોળાઈ અલગ હોય છે.

વિચારણા હેઠળના ઉદાહરણમાં - અસમાન અંતરાલો સાથે અંતરાલ શ્રેણી.

શરત:

કામદારોની વય રચના (વર્ષ) પર ડેટા છે: 18, 38, 28, 29, 26, 38, 34, 22, 28, 30, 22, 23, 35, 33, 27, 24, 30, 32, 28 , 25, 29, 26, 31, 24, 29, 27, 32, 25, 29, 29.

    1. અંતરાલ વિતરણ શ્રેણી બનાવો.
    2. શ્રેણીની ગ્રાફિકલ રજૂઆત બનાવો.
    3. ગ્રાફિકલી મોડ અને મધ્ય નક્કી કરો.

ઉકેલ:

1) સ્ટર્જેસ સૂત્ર મુજબ, વસ્તીને 1 + 3.322 lg 30 = 6 જૂથોમાં વિભાજિત કરવી આવશ્યક છે.

મહત્તમ ઉંમર - 38, ન્યૂનતમ - 18.

અંતરાલની પહોળાઈ અંતરાલોનો છેડો પૂર્ણાંક હોવો જોઈએ, તેથી આપણે વસ્તીને 5 જૂથોમાં વિભાજીત કરીએ છીએ. અંતરાલ પહોળાઈ - 4.

ગણતરીઓને સરળ બનાવવા માટે, અમે ડેટાને ચડતા ક્રમમાં ગોઠવીશું: 18, 22, 22, 23, 24, 24, 25, 25, 26, 26, 27, 27, 28, 28, 28, 29, 29, 29, 29, 29, 30, 30, 31, 32, 32, 33, 34, 35, 38, 38.

કામદારોની વય વિતરણ

ગ્રાફિકલી, શ્રેણીને હિસ્ટોગ્રામ અથવા બહુકોણ તરીકે દર્શાવી શકાય છે. હિસ્ટોગ્રામ - બાર ચાર્ટ. કૉલમનો આધાર અંતરાલની પહોળાઈ છે. સ્તંભની ઊંચાઈ આવર્તન જેટલી છે.

બહુકોણ (અથવા વિતરણ બહુકોણ) - આવર્તન ગ્રાફ. હિસ્ટોગ્રામનો ઉપયોગ કરીને તેને બનાવવા માટે, અમે લંબચોરસની ઉપરની બાજુઓના મધ્યબિંદુઓને જોડીએ છીએ. આપણે ઓક્સ અક્ષ પરના બહુકોણને x ના આત્યંતિક મૂલ્યોથી અડધા અંતરાલના બરાબર અંતરે બંધ કરીએ છીએ.

મોડ (Mo) એ અભ્યાસ કરવામાં આવી રહેલી લાક્ષણિકતાનું મૂલ્ય છે, જે આપેલ વસ્તીમાં મોટાભાગે જોવા મળે છે.

હિસ્ટોગ્રામમાંથી મોડ નક્કી કરવા માટે, તમારે સૌથી વધુ લંબચોરસ પસંદ કરવાની જરૂર છે, આ લંબચોરસના જમણા શિરોબિંદુથી પાછલા લંબચોરસના ઉપરના જમણા ખૂણે એક રેખા દોરો અને મોડલ લંબચોરસના ડાબા શિરોબિંદુમાંથી એક રેખા દોરો. અનુગામી લંબચોરસનું ડાબું શિરોબિંદુ. આ રેખાઓના આંતરછેદના બિંદુથી, x-અક્ષ પર લંબ દોરો. આ abscissa ફેશન હશે. મો ≈ 27.5. આનો અર્થ એ છે કે આ વસ્તીમાં સૌથી સામાન્ય વય 27-28 વર્ષની છે.

મધ્યક (Me) એ અભ્યાસ કરવામાં આવી રહેલી લાક્ષણિકતાનું મૂલ્ય છે, જે ક્રમાંકિત વિવિધતા શ્રેણીની મધ્યમાં છે.

આપણે ક્યુમ્યુલેટનો ઉપયોગ કરીને મધ્યક શોધીએ છીએ. ક્યુમ્યુલેટ્સ - સંચિત ફ્રીક્વન્સીઝનો આલેખ. એબ્સીસાસ શ્રેણીના પ્રકારો છે. ઓર્ડિનેટ્સ સંચિત ફ્રીક્વન્સીઝ છે.

ક્યુમ્યુલેટ પર મધ્યક નક્કી કરવા માટે, અમને સંચિત ફ્રીક્વન્સીઝના 50% (અમારા કિસ્સામાં, 15) ને અનુરૂપ ઓર્ડિનેટ અક્ષ સાથે એક બિંદુ મળે છે, તેમાંથી એક સીધી રેખા દોરો, ઑક્સ અક્ષની સમાંતર, અને બિંદુથી ક્યુમ્યુલેટ સાથે તેનું આંતરછેદ, x અક્ષ પર લંબ દોરો. એબ્સીસા મધ્યક છે. હું ≈ 25.9. આનો અર્થ એ થયો કે આ વસ્તીમાં અડધા કામદારોની ઉંમર 26 વર્ષથી ઓછી છે.

2. વિતરણ શ્રેણીનો ખ્યાલ. અલગ અને અંતરાલ વિતરણ શ્રેણી

વિતરણ પંક્તિઓવિશિષ્ટ પ્રકારના જૂથો કહેવામાં આવે છે જેમાં દરેક લાક્ષણિકતા, લાક્ષણિકતાઓના જૂથ અથવા લાક્ષણિકતાઓના વર્ગ માટે જૂથમાં એકમોની સંખ્યા અથવા એકંદર કુલમાં આ સંખ્યાનું પ્રમાણ જાણીતું છે. તે. વિતરણ શ્રેણી- વિશેષતા મૂલ્યોનો ક્રમબદ્ધ સમૂહ, તેમના અનુરૂપ વજન સાથે ચડતા અથવા ઉતરતા ક્રમમાં ગોઠવાયેલ. વિતરણ શ્રેણી ક્યાં તો માત્રાત્મક અથવા વિશેષતા લાક્ષણિકતાઓ દ્વારા બનાવી શકાય છે.

જથ્થાત્મક ધોરણે બાંધવામાં આવેલી વિતરણ શ્રેણીને વિવિધતા શ્રેણી કહેવામાં આવે છે. તેઓ થાય છે સ્વતંત્ર અને અંતરાલ. વિતરણ શ્રેણી સતત બદલાતી લાક્ષણિકતા (જ્યારે લાક્ષણિકતા કોઈપણ અંતરાલમાં કોઈપણ મૂલ્યો લઈ શકે છે) અને અલગ અલગ લાક્ષણિકતા (તે સખત રીતે વ્યાખ્યાયિત પૂર્ણાંક મૂલ્યો લે છે) પર આધારિત બનાવી શકાય છે.

અલગવિતરણની વિવિધતા શ્રેણી એ તેમની અનુરૂપ ફ્રીક્વન્સી અથવા વિગતો સાથેના વિકલ્પોનો ક્રમાંકિત સમૂહ છે. એક અલગ શ્રેણીના પ્રકારો એક લાક્ષણિકતાના મૂલ્યોને સ્પષ્ટપણે સતત બદલતા હોય છે, સામાન્ય રીતે ગણતરીનું પરિણામ.

અલગ

ભિન્નતા શ્રેણી સામાન્ય રીતે બનાવવામાં આવે છે જો અભ્યાસ કરવામાં આવી રહેલી લાક્ષણિકતાના મૂલ્યો એક બીજાથી ચોક્કસ મર્યાદિત રકમ કરતા ઓછા ન હોઈ શકે. અલગ શ્રેણીમાં, લાક્ષણિકતાના બિંદુ મૂલ્યો ઉલ્લેખિત છે. ઉદાહરણ : કદ દ્વારા દર મહિને સ્ટોર્સ દ્વારા વેચાતા પુરુષોના સુટ્સનું વિતરણ.

અંતરાલ

ભિન્નતા શ્રેણી એ દરેકમાં આવતા ચલના મૂલ્યોની અનુરૂપ ફ્રીક્વન્સીઝ અથવા ફ્રીક્વન્સીઝ સાથે રેન્ડમ ચલના મૂલ્યોમાં ભિન્નતાના અંતરાલોનો ક્રમબદ્ધ સમૂહ છે. અંતરાલ શ્રેણી સતત બદલાતી લાક્ષણિકતાના વિતરણનું વિશ્લેષણ કરવા માટે રચાયેલ છે, જેનું મૂલ્ય મોટાભાગે માપ અથવા તોલ દ્વારા રેકોર્ડ કરવામાં આવે છે. આવી શ્રેણીના પ્રકારો જૂથો છે.

ઉદાહરણ : રકમ દ્વારા કરિયાણાની દુકાનમાં ખરીદીનું વિતરણ.

જો અલગ ભિન્નતા શ્રેણીમાં આવર્તન પ્રતિભાવ શ્રેણીના ચલ સાથે સીધો સંબંધ ધરાવે છે, તો અંતરાલ શ્રેણીમાં તે ચલોના જૂથનો સંદર્ભ આપે છે.

તેમના ગ્રાફિકલ પ્રતિનિધિત્વનો ઉપયોગ કરીને વિતરણ શ્રેણીનું વિશ્લેષણ કરવું અનુકૂળ છે, જે વિતરણના આકાર અને પેટર્નને નક્કી કરવા માટે પરવાનગી આપે છે. એક અલગ શ્રેણીને ગ્રાફ પર તૂટેલી રેખા તરીકે દર્શાવવામાં આવી છે - વિતરણ બહુકોણ. તેને બાંધવા માટે, લંબચોરસ સંકલન પ્રણાલીમાં, વિવિધ લાક્ષણિકતાના ક્રમાંકિત (ક્રમાંકિત) મૂલ્યો એબ્સિસા અક્ષ સાથે સમાન સ્કેલ પર પ્લોટ કરવામાં આવે છે, અને ફ્રીક્વન્સીઝને વ્યક્ત કરવા માટેનો સ્કેલ ઓર્ડિનેટ અક્ષ સાથે રચાયેલ છે.

અંતરાલ શ્રેણીઓ તરીકે દર્શાવવામાં આવી છે વિતરણ હિસ્ટોગ્રામ(એટલે ​​​​કે, બાર ચાર્ટ્સ).

હિસ્ટોગ્રામ બનાવતી વખતે, અંતરાલોના મૂલ્યો એબ્સીસા અક્ષ પર રચાય છે, અને ફ્રીક્વન્સીઝને અનુરૂપ અંતરાલો પર બાંધવામાં આવેલા લંબચોરસ દ્વારા દર્શાવવામાં આવે છે. સમાન અંતરાલોના કિસ્સામાં કૉલમની ઊંચાઈ ફ્રીક્વન્સીઝના પ્રમાણસર હોવી જોઈએ.

કોઈપણ હિસ્ટોગ્રામને વિતરણ બહુકોણમાં રૂપાંતરિત કરી શકાય છે આ કરવા માટે, તેના લંબચોરસના શિરોબિંદુઓને સીધા સેગમેન્ટ્સ સાથે જોડવું જરૂરી છે.

2. ઉત્પાદન વોલ્યુમમાં ફેરફાર પર સરેરાશ આઉટપુટ અને સરેરાશ હેડકાઉન્ટના પ્રભાવનું વિશ્લેષણ કરવા માટે ઇન્ડેક્સ પદ્ધતિ

અનુક્રમણિકા પદ્ધતિગતિશીલતાનું પૃથ્થકરણ કરવા અને સામાન્ય સૂચકાંકો તેમજ આ સૂચકોના સ્તરોમાં ફેરફારને પ્રભાવિત કરતા પરિબળોની સરખામણી કરવા માટે વપરાય છે. સૂચકાંકોનો ઉપયોગ કરીને, ઉત્પાદન વોલ્યુમમાં ફેરફાર પર સરેરાશ આઉટપુટ અને સરેરાશ હેડકાઉન્ટના પ્રભાવને ઓળખવું શક્ય છે. વિશ્લેષણાત્મક સૂચકાંકોની સિસ્ટમ બનાવીને આ સમસ્યા ઉકેલાય છે.

ઉત્પાદનના જથ્થાનો સૂચકાંક કર્મચારીઓની સરેરાશ સંખ્યાના અનુક્રમણિકા સાથે સંબંધિત છે અને ઉત્પાદનના જથ્થા (Q) આઉટપુટ સાથે સંબંધિત છે તે જ રીતે સરેરાશ આઉટપુટનો ઇન્ડેક્સ w)અને સંખ્યાઓ ( આર) .

અમે નિષ્કર્ષ પર આવી શકીએ છીએ કે ઉત્પાદનનું પ્રમાણ સરેરાશ આઉટપુટ અને સરેરાશ હેડકાઉન્ટના ઉત્પાદન જેટલું હશે:

Q = w r,જ્યાં Q ઉત્પાદનનું પ્રમાણ છે,

w - સરેરાશ આઉટપુટ,

r - કર્મચારીઓની સરેરાશ સંખ્યા.

જેમ તમે જોઈ શકો છો, અમે સ્ટેટિક્સમાં ઘટનાના સંબંધ વિશે વાત કરી રહ્યા છીએ: બે પરિબળોનું ઉત્પાદન પરિણામી ઘટનાનું કુલ વોલ્યુમ આપે છે. તે પણ સ્પષ્ટ છે કે આ જોડાણ કાર્યાત્મક છે તેથી, સૂચકાંકોનો ઉપયોગ કરીને આ જોડાણની ગતિશીલતાનો અભ્યાસ કરવામાં આવે છે. આપેલ ઉદાહરણ માટે, આ નીચેની સિસ્ટમ છે:

Jw × Jr = Jwr.

ઉદાહરણ તરીકે, ઉત્પાદન વોલ્યુમ ઇન્ડેક્સ Jwr, ઉત્પાદક ઘટનાના ઇન્ડેક્સ તરીકે, બે પરિબળ સૂચકાંકોમાં વિઘટિત થઈ શકે છે: સરેરાશ આઉટપુટ ઇન્ડેક્સ (Jw) અને સરેરાશ હેડકાઉન્ટ ઇન્ડેક્સ (Jr):

ઈન્ડેક્સ ઈન્ડેક્સ ઈન્ડેક્સ

સરેરાશ પગારપત્રકનું પ્રમાણ

ઉત્પાદન આઉટપુટ નંબર

જ્યાં જે ડબલ્યુ- Laspeyres ફોર્મ્યુલાનો ઉપયોગ કરીને શ્રમ ઉત્પાદકતા સૂચકાંકની ગણતરી;

જુનિયર- પાશે સૂત્રનો ઉપયોગ કરીને ગણતરી કરાયેલ કર્મચારીઓની સંખ્યાનો અનુક્રમણિકા.

ઇન્ડેક્સ સિસ્ટમ્સનો ઉપયોગ પ્રદર્શન સૂચકના સ્તરની રચના પર વ્યક્તિગત પરિબળોના પ્રભાવને નિર્ધારિત કરવા માટે થાય છે;

ઉપરોક્ત સૂચકાંકોની પ્રણાલીના આધારે, કોઈ પણ પરિબળોના પ્રભાવમાં વિઘટિત, ઉત્પાદન વોલ્યુમમાં સંપૂર્ણ વધારો શોધી શકે છે.

1. ઉત્પાદન વોલ્યુમમાં સામાન્ય વધારો:

∆wr = ∑w 1 r 1 - ∑w 0 r 0 .

2. સરેરાશ આઉટપુટ સૂચકની ક્રિયાને કારણે વધારો:

∆wr/w = ∑w 1 r 1 - ∑w 0 r 1 .

3. સરેરાશ હેડકાઉન્ટ સૂચકની ક્રિયાને કારણે વધારો:

∆wr/r = ∑w 0 r 1 - ∑w 0 r 0

∆wr = ∆wr/w + ∆wr/r.

ઉદાહરણ.નીચેનો ડેટા જાણીતો છે

અમે નિર્ધારિત કરી શકીએ છીએ કે ઉત્પાદન વોલ્યુમ સાપેક્ષ અને સંપૂર્ણ શરતોમાં કેવી રીતે બદલાયું છે અને વ્યક્તિગત પરિબળોએ આ ફેરફારને કેવી રીતે પ્રભાવિત કર્યો છે.

ઉત્પાદનનું પ્રમાણ હતું:

આધાર સમયગાળામાં

w 0 * r 0 = 2000 * 90 = 180000,

અને રિપોર્ટિંગમાં

w 1 * r 1 = 2100 * 100 = 210000.

પરિણામે, ઉત્પાદનનું પ્રમાણ 30,000 અથવા 1.16% વધ્યું.

∆wr=∑w 1 r 1 -∑w 0 r 0= (210000-180000)=30000

અથવા (210000:180000)*100%=1.16%.

ઉત્પાદનના જથ્થામાં આ ફેરફાર આના કારણે હતો:

1) સરેરાશ હેડકાઉન્ટમાં 10 લોકો અથવા 111.1% નો વધારો

r 1 / r 0 = 100 / 90 = 1.11 અથવા 111.1%.

સંપૂર્ણ શબ્દોમાં, આ પરિબળને લીધે, ઉત્પાદનના જથ્થામાં 20,000 નો વધારો થયો:

w 0 r 1 – w 0 r 0 = w 0 (r 1 -r 0) = 2000 (100-90) = 20000.

2) સરેરાશ આઉટપુટમાં 105% અથવા 10,000 નો વધારો:

w 1 r 1 /w 0 r 1 = 2100*100/2000*100 = 1.05 અથવા 105%.

સંપૂર્ણ શબ્દોમાં, વધારો છે:

w 1 r 1 – w 0 r 1 = (w 1 -w 0)r 1 = (2100-2000)*100 = 10000.

તેથી, પરિબળોનો સંયુક્ત પ્રભાવ હતો:

1. સંપૂર્ણ શબ્દોમાં

10000 + 20000 = 30000

2. સંબંધિત દ્રષ્ટિએ

1,11 * 1,05 = 1,16 (116%)

તેથી, વધારો 1.16% છે. બંને પરિણામો અગાઉ પ્રાપ્ત થયા હતા.

અનુવાદમાં "ઇન્ડેક્સ" શબ્દનો અર્થ નિર્દેશક, સૂચક છે. આંકડાઓમાં, અનુક્રમણિકાને સંબંધિત સૂચક તરીકે અર્થઘટન કરવામાં આવે છે જે સમય, અવકાશ અથવા યોજનાની તુલનામાં ઘટનામાં ફેરફારને દર્શાવે છે. અનુક્રમણિકા સાપેક્ષ મૂલ્ય હોવાથી, સૂચકાંકોના નામ સંબંધિત મૂલ્યોના નામ સાથે વ્યંજન છે.

એવા કિસ્સાઓમાં કે જ્યાં આપણે તુલનાત્મક ઉત્પાદનોમાં સમય જતાં ફેરફારોનું વિશ્લેષણ કરીએ છીએ, અમે પ્રશ્ન ઉઠાવી શકીએ છીએ કે અનુક્રમણિકાના ઘટકો (કિંમત, ભૌતિક વોલ્યુમ, ઉત્પાદનનું માળખું અથવા વ્યક્તિગત પ્રકારના ઉત્પાદનોનું વેચાણ) વિવિધ પરિસ્થિતિઓ (વિવિધ વિસ્તારોમાં) હેઠળ કેવી રીતે બદલાય છે. . આ સંદર્ભમાં, સતત રચના, ચલ રચના અને માળખાકીય ફેરફારોના સૂચકાંકો બનાવવામાં આવે છે.

સ્થાયી (નિશ્ચિત) રચનાની અનુક્રમણિકા -આ એક અનુક્રમણિકા છે જે વસ્તીના સમાન નિશ્ચિત માળખા માટે સરેરાશ મૂલ્યની ગતિશીલતાને લાક્ષણિકતા આપે છે.

સતત રચનાના સૂચકાંકના નિર્માણનો સિદ્ધાંત એ સમાન વજન સાથે અનુક્રમિત સૂચકના ભારિત સરેરાશ સ્તરની ગણતરી કરીને અનુક્રમિત મૂલ્ય પર વજનના બંધારણમાં થતા ફેરફારોની અસરને દૂર કરવાનો છે.

અચળ રચના સૂચકાંક એકંદર અનુક્રમણિકાના સ્વરૂપમાં સમાન છે. એકંદર સ્વરૂપ સૌથી સામાન્ય છે.

અચળ રચનાના અનુક્રમણિકાની ગણતરી એક સમયગાળાના સ્તર પર નિશ્ચિત વજન સાથે કરવામાં આવે છે અને માત્ર અનુક્રમિત મૂલ્યમાં ફેરફાર દર્શાવે છે. સમાન વજન સાથે અનુક્રમિત સૂચકના વેઇટેડ એવરેજ લેવલની ગણતરી કરીને અચળ રચનાનું સૂચક અનુક્રમિત મૂલ્ય પર વજનના બંધારણમાં થતા ફેરફારોની અસરને દૂર કરે છે. અચલ રચનાના સૂચકાંકો અસાધારણ ઘટનાની સતત રચનાના આધારે ગણતરી કરાયેલ સૂચકાંકોની તુલના કરે છે.

મોટી માત્રામાં માહિતીની પ્રક્રિયા કરતી વખતે, જે આધુનિક વૈજ્ઞાનિક વિકાસ હાથ ધરતી વખતે ખાસ કરીને મહત્વપૂર્ણ છે, સંશોધકને સ્રોત ડેટાને યોગ્ય રીતે જૂથબદ્ધ કરવાનું ગંભીર કાર્યનો સામનો કરવો પડે છે. જો ડેટા પ્રકૃતિમાં અલગ હોય, તો પછી, જેમ આપણે જોયું તેમ, કોઈ સમસ્યા ઊભી થતી નથી - તમારે ફક્ત દરેક સુવિધાની આવૃત્તિની ગણતરી કરવાની જરૂર છે. જો અભ્યાસ હેઠળ લાક્ષણિકતા છે સતતપાત્ર (જે વ્યવહારમાં વધુ સામાન્ય છે), પછી વિશેષતા જૂથ અંતરાલોની શ્રેષ્ઠ સંખ્યા પસંદ કરવી એ કોઈ પણ રીતે તુચ્છ કાર્ય નથી.

સતત રેન્ડમ ચલોનું જૂથ કરવા માટે, લાક્ષણિકતાની સમગ્ર વિવિધતા શ્રેણીને અમુક ચોક્કસ સંખ્યામાં અંતરાલોમાં વિભાજિત કરવામાં આવે છે. થી.

જૂથ અંતરાલ (સતત) વિવિધતા શ્રેણીએટ્રિબ્યુટ () ના મૂલ્ય દ્વારા ક્રમાંકિત અંતરાલો કહેવામાં આવે છે, જ્યાં r"th અંતરાલમાં આવતા અવલોકનોની સંખ્યા અથવા સંબંધિત ફ્રીક્વન્સીઝ (), અનુરૂપ ફ્રીક્વન્સીઝ () સાથે એકસાથે સૂચવવામાં આવે છે:

લાક્ષણિક મૂલ્ય અંતરાલો

mi આવર્તન

હિસ્ટોગ્રામઅને ક્યુમ્યુલેટ (ઓગીવા),અમારા દ્વારા પહેલાથી જ વિગતવાર ચર્ચા કરવામાં આવી છે, તે ડેટા વિઝ્યુલાઇઝેશનનું એક ઉત્તમ માધ્યમ છે, જે તમને ડેટાના બંધારણનો પ્રાથમિક વિચાર મેળવવા માટે પરવાનગી આપે છે. આવા આલેખ (ફિગ. 1.15) એ સ્વતંત્ર ડેટાની જેમ જ સતત ડેટા માટે બનાવવામાં આવે છે, માત્ર એ હકીકતને ધ્યાનમાં લેતા કે સતત ડેટા કોઈપણ મૂલ્યોને લઈને, તેમના સંભવિત મૂલ્યોના પ્રદેશને સંપૂર્ણપણે ભરે છે.

ચોખા. 1.15.

તેથી જ હિસ્ટોગ્રામ અને ક્યુમ્યુલેટ પરના સ્તંભો એકબીજાને સ્પર્શતા હોવા જોઈએ અને એવા કોઈ ક્ષેત્રો ન હોવા જોઈએ કે જ્યાં એટ્રિબ્યુટ વેલ્યુ શક્ય તેટલી અંદર ન આવતી હોય(એટલે ​​​​કે, હિસ્ટોગ્રામ અને ક્યુમ્યુલેટ્સમાં એબ્સીસા અક્ષ સાથે "છિદ્રો" ન હોવા જોઈએ, જેમાં ફિગ. 1.16ની જેમ અભ્યાસ કરવામાં આવતા ચલના મૂલ્યો શામેલ નથી). બારની ઊંચાઈ આવર્તનને અનુરૂપ છે - આપેલ અંતરાલમાં આવતા અવલોકનોની સંખ્યા અથવા સંબંધિત આવર્તન - અવલોકનોનું પ્રમાણ. અંતરાલ છેદવું જોઈએ નહીંઅને સામાન્ય રીતે સમાન પહોળાઈ હોય છે.

ચોખા. 1.16.

હિસ્ટોગ્રામ અને બહુકોણ એ સંભાવના ઘનતા વળાંક (વિભેદક કાર્ય) ના અંદાજો છે. f(x)સૈદ્ધાંતિક વિતરણ, સંભાવના સિદ્ધાંતના અભ્યાસક્રમમાં ગણવામાં આવે છે. તેથી, માત્રાત્મક સતત ડેટાની પ્રાથમિક આંકડાકીય પ્રક્રિયામાં તેમનું બાંધકામ એટલું મહત્વનું છે - તેમના દેખાવ દ્વારા કોઈ કાલ્પનિક વિતરણ કાયદાનો નિર્ણય કરી શકે છે.

ક્યુમ્યુલેટ – અંતરાલ વિવિધતા શ્રેણીની સંચિત ફ્રીક્વન્સીઝ (આવર્તન) નો વળાંક. સંચિત વિતરણ કાર્યના આલેખને ક્યુમ્યુલેટ સાથે સરખાવવામાં આવે છે F(x), સંભાવના સિદ્ધાંત અભ્યાસક્રમમાં પણ ચર્ચા કરવામાં આવી છે.

મૂળભૂત રીતે, હિસ્ટોગ્રામ અને ક્યુમ્યુલેટની વિભાવનાઓ ખાસ કરીને સતત ડેટા અને તેમની અંતરાલ વિવિધતા શ્રેણી સાથે સંકળાયેલા છે, કારણ કે તેમના આલેખ અનુક્રમે સંભાવના ઘનતા કાર્ય અને વિતરણ કાર્યના પ્રયોગમૂલક અંદાજો છે.

અંતરાલ વિવિધતા શ્રેણીનું નિર્માણ અંતરાલોની સંખ્યા નક્કી કરવા સાથે શરૂ થાય છે kઅને આ કાર્ય કદાચ અભ્યાસ હેઠળના મુદ્દામાં સૌથી મુશ્કેલ, મહત્વપૂર્ણ અને વિવાદાસ્પદ છે.

અંતરાલોની સંખ્યા ખૂબ નાની ન હોવી જોઈએ, કારણ કે આ હિસ્ટોગ્રામને ખૂબ સરળ બનાવશે ( ઓવરસ્મૂથ),મૂળ ડેટાની પરિવર્તનશીલતાની તમામ સુવિધાઓ ગુમાવે છે - ફિગમાં. 1.17 તમે જોઈ શકો છો કે તે જ ડેટા કે જેના પર ફિગમાં આલેખ છે. 1.15, ઓછા અંતરાલ (ડાબે ગ્રાફ) સાથે હિસ્ટોગ્રામ બનાવવા માટે વપરાય છે.

તે જ સમયે, અંતરાલોની સંખ્યા ખૂબ મોટી હોવી જોઈએ નહીં - અન્યથા અમે આંકડાકીય અક્ષ સાથે અભ્યાસ કરેલા ડેટાની વિતરણ ઘનતાનો અંદાજ લગાવી શકીશું નહીં: હિસ્ટોગ્રામ ઓછી સ્મૂથ હશે. (અંડર સ્મૂથ),ખાલી અંતરાલો સાથે, અસમાન (ફિગ. 1.17, જમણો ગ્રાફ જુઓ).

ચોખા. 1.17.

અંતરાલોની સૌથી વધુ પ્રાધાન્યક્ષમ સંખ્યા કેવી રીતે નક્કી કરવી?

1926 માં પાછા, હર્બર્ટ સ્ટર્જ્સે અંતરાલોની સંખ્યાની ગણતરી માટે એક સૂત્ર પ્રસ્તાવિત કર્યું જેમાં અભ્યાસ કરવામાં આવી રહેલા લાક્ષણિકતાના મૂલ્યોના મૂળ સમૂહને વિભાજિત કરવું જરૂરી છે. આ સૂત્ર ખરેખર અત્યંત લોકપ્રિય બની ગયું છે - મોટાભાગના આંકડાકીય પાઠ્યપુસ્તકો તેને ઓફર કરે છે, અને ઘણા આંકડાકીય પેકેજો મૂળભૂત રીતે તેનો ઉપયોગ કરે છે. આ કેટલું વાજબી છે અને તમામ સંજોગોમાં તે ખૂબ જ ગંભીર પ્રશ્ન છે.

તો, સ્ટર્જ્સ ફોર્મ્યુલા શેના પર આધારિત છે?

દ્વિપદી વિતરણને ધ્યાનમાં લો)

શું તમને લેખ ગમ્યો? તમારા મિત્રો સાથે શેર કરો!