પ્રમાણભૂત વિચલન ઓળંગતું નથી. માનક વિચલન, ગણતરી પદ્ધતિ, એપ્લિકેશન

કોઈપણ આંકડાકીય પૃથ્થકરણનું સંચાલન ગણતરીઓ વિના અકલ્પ્ય છે. આ લેખમાં આપણે એક્સેલમાં ભિન્નતા, પ્રમાણભૂત વિચલન, વિવિધતાના ગુણાંક અને અન્ય આંકડાકીય સૂચકાંકોની ગણતરી કેવી રીતે કરવી તે જોઈશું.

મહત્તમ અને ન્યૂનતમ મૂલ્ય

સરેરાશ રેખીય વિચલન

સરેરાશ રેખીય વિચલન એ વિશ્લેષણ કરેલ ડેટા સેટમાંથી નિરપેક્ષ (મોડ્યુલો) વિચલનોની સરેરાશ છે. ગાણિતિક સૂત્ર છે:

a- સરેરાશ રેખીય વિચલન,

એક્સ- વિશ્લેષણ સૂચક,

- સૂચકનું સરેરાશ મૂલ્ય,

n

Excel માં આ ફંકશન કહેવાય છે SROTCL.

SROTCL ફંક્શન પસંદ કર્યા પછી, અમે ડેટા રેન્જ સૂચવીએ છીએ કે જેના પર ગણતરી થવી જોઈએ. "ઓકે" ક્લિક કરો.

વિખેરી નાખવું

(મોડ્યુલ 111)

કદાચ દરેક જણ જાણતું નથી કે શું , તેથી હું સમજાવીશ, તે એક માપ છે જે ગાણિતિક અપેક્ષાની આસપાસના ડેટાના ફેલાવાને દર્શાવે છે. જો કે, સામાન્ય રીતે માત્ર એક નમૂનો જ ઉપલબ્ધ હોય છે, તેથી નીચે આપેલા વિભિન્ન સૂત્રનો ઉપયોગ થાય છે:

s 2- અવલોકન ડેટામાંથી ગણતરી કરેલ નમૂનાની વિસંગતતા,

એક્સ- વ્યક્તિગત મૂલ્યો,

- નમૂના માટે અંકગણિત સરેરાશ,

n- વિશ્લેષણ કરેલ ડેટા સેટમાં મૂલ્યોની સંખ્યા.

અનુરૂપ એક્સેલ કાર્ય છે ડીઆઈએસપી.જી. પ્રમાણમાં નાના નમૂનાઓનું વિશ્લેષણ કરતી વખતે (લગભગ 30 અવલોકનો સુધી), તમારે ઉપયોગ કરવો જોઈએ, જેની ગણતરી નીચેના સૂત્રનો ઉપયોગ કરીને કરવામાં આવે છે.

તફાવત, જેમ તમે જોઈ શકો છો, માત્ર છેદમાં છે. એક્સેલ પાસે સેમ્પલ નિષ્પક્ષ ભિન્નતાની ગણતરી કરવા માટેનું કાર્ય છે ડીઆઈએસપી.બી.

ઇચ્છિત વિકલ્પ પસંદ કરો (સામાન્ય અથવા પસંદગીયુક્ત), શ્રેણી સૂચવો અને "ઓકે" બટનને ક્લિક કરો. વિચલનોના પ્રારંભિક વર્ગીકરણને કારણે પરિણામી મૂલ્ય ખૂબ મોટું હોઈ શકે છે. આંકડાઓમાં વિક્ષેપ એ ખૂબ જ મહત્વપૂર્ણ સૂચક છે, પરંતુ તેનો ઉપયોગ સામાન્ય રીતે તેના શુદ્ધ સ્વરૂપમાં થતો નથી, પરંતુ વધુ ગણતરીઓ માટે થાય છે.

પ્રમાણભૂત વિચલન

પ્રમાણભૂત વિચલન (RMS) એ વિભિન્નતાનું મૂળ છે. આ સૂચકને પ્રમાણભૂત વિચલન પણ કહેવામાં આવે છે અને સૂત્રનો ઉપયોગ કરીને ગણતરી કરવામાં આવે છે:

સામાન્ય વસ્તી દ્વારા

નમૂના દ્વારા

તમે ભિન્નતાનું મૂળ લઈ શકો છો, પરંતુ એક્સેલ પ્રમાણભૂત વિચલન માટે તૈયાર કાર્યો ધરાવે છે: STDEV.Gઅને STDEV.V(અનુક્રમે સામાન્ય અને નમૂના વસ્તી માટે).

માનક અને પ્રમાણભૂત વિચલન, હું પુનરાવર્તન કરું છું, સમાનાર્થી છે.

આગળ, હંમેશની જેમ, ઇચ્છિત શ્રેણી સૂચવો અને "ઓકે" પર ક્લિક કરો. પ્રમાણભૂત વિચલન વિશ્લેષિત સૂચક તરીકે માપના સમાન એકમો ધરાવે છે, અને તેથી તે મૂળ ડેટા સાથે તુલનાત્મક છે. નીચે આ વિશે વધુ.

વિવિધતાનો ગુણાંક

ઉપર ચર્ચા કરાયેલા તમામ સૂચકાંકો સ્રોત ડેટાના સ્કેલ સાથે જોડાયેલા છે અને કોઈને વિશ્લેષિત વસ્તીની વિવિધતાનો અલંકારિક વિચાર મેળવવાની મંજૂરી આપતા નથી. ડેટાના વિક્ષેપના સંબંધિત માપ મેળવવા માટે, ઉપયોગ કરો વિવિધતાના ગુણાંક, જે ભાગાકાર દ્વારા ગણવામાં આવે છે પ્રમાણભૂત વિચલનપર અંકગણિત સરેરાશ. વિવિધતાના ગુણાંક માટેનું સૂત્ર સરળ છે:

એક્સેલમાં વિવિધતાના ગુણાંકની ગણતરી કરવા માટે કોઈ તૈયાર કાર્ય નથી, જે કોઈ મોટી સમસ્યા નથી. પ્રમાણભૂત વિચલનને સરેરાશ દ્વારા વિભાજીત કરીને ગણતરી કરી શકાય છે. આ કરવા માટે, ફોર્મ્યુલા બારમાં લખો:

ધોરણ વિચલન.જી()/સરેરાશ()

ડેટા શ્રેણી કૌંસમાં દર્શાવેલ છે. જો જરૂરી હોય તો, નમૂના પ્રમાણભૂત વિચલન (STDEV.B) નો ઉપયોગ કરો.

વિવિધતાના ગુણાંકને સામાન્ય રીતે ટકાવારી તરીકે દર્શાવવામાં આવે છે, તેથી તમે ટકાવારીના ફોર્મેટમાં સૂત્ર સાથે કોષને ફ્રેમ કરી શકો છો. જરૂરી બટન "હોમ" ટેબ પર રિબન પર સ્થિત છે:

તમે ઇચ્છિત કોષને હાઇલાઇટ કર્યા પછી અને જમણું-ક્લિક કર્યા પછી સંદર્ભ મેનૂમાંથી પસંદ કરીને પણ ફોર્મેટ બદલી શકો છો.

વિવિધતાના ગુણાંક, મૂલ્યોના સ્કેટરના અન્ય સૂચકાંકોથી વિપરીત, ડેટા ભિન્નતાના સ્વતંત્ર અને અત્યંત માહિતીપ્રદ સૂચક તરીકે ઉપયોગમાં લેવાય છે. આંકડાઓમાં, તે સામાન્ય રીતે સ્વીકારવામાં આવે છે કે જો વિવિધતાનો ગુણાંક 33% કરતા ઓછો હોય, તો ડેટા સમૂહ સજાતીય છે, જો 33% કરતા વધુ હોય, તો તે વિજાતીય છે. આ માહિતી ડેટાના પ્રારંભિક પાત્રાલેખન માટે અને વધુ વિશ્લેષણ માટેની તકો ઓળખવા માટે ઉપયોગી થઈ શકે છે. આ ઉપરાંત, ટકાવારી તરીકે માપવામાં આવતા વિવિધતાના ગુણાંક, તમને તેમના સ્કેલ અને માપનના એકમોને ધ્યાનમાં લીધા વિના, વિવિધ ડેટાના વિખેરવાની ડિગ્રીની તુલના કરવાની મંજૂરી આપે છે. ઉપયોગી મિલકત.

ઓસિલેશન ગુણાંક

આજે ડેટાના વિક્ષેપનું બીજું સૂચક ઓસિલેશન ગુણાંક છે. આ વિવિધતાની શ્રેણી (મહત્તમ અને લઘુત્તમ મૂલ્યો વચ્ચેનો તફાવત) અને સરેરાશનો ગુણોત્તર છે. ત્યાં કોઈ તૈયાર એક્સેલ ફોર્મ્યુલા નથી, તેથી તમારે ત્રણ કાર્યોને જોડવા પડશે: MAX, MIN, AVERAGE.

ઓસિલેશનનો ગુણાંક સરેરાશની તુલનામાં વિવિધતાની હદ દર્શાવે છે, જેનો ઉપયોગ વિવિધ ડેટા સેટની તુલના કરવા માટે પણ થઈ શકે છે.

સામાન્ય રીતે, એક્સેલનો ઉપયોગ કરીને, ઘણા આંકડાકીય સૂચકાંકોની ગણતરી ખૂબ જ સરળ રીતે કરવામાં આવે છે. જો કંઈક સ્પષ્ટ ન હોય, તો તમે હંમેશા ફંક્શન ઇન્સર્ટમાં શોધ બોક્સનો ઉપયોગ કરી શકો છો. સારું, Google મદદ કરવા માટે અહીં છે.

સેમ્પલ સર્વે મુજબ, થાપણદારોને શહેરની Sberbank માં તેમની થાપણના કદ અનુસાર જૂથબદ્ધ કરવામાં આવ્યા હતા:

વ્યાખ્યાયિત કરો:

1) વિવિધતાનો અવકાશ;

2) સરેરાશ થાપણ કદ;

3) સરેરાશ રેખીય વિચલન;

4) વિખેરવું;

5) પ્રમાણભૂત વિચલન;

6) યોગદાનની વિવિધતાનો ગુણાંક.

ઉકેલ:

આ વિતરણ શ્રેણીમાં ખુલ્લા અંતરાલોનો સમાવેશ થાય છે. આવી શ્રેણીમાં, પ્રથમ જૂથના અંતરાલનું મૂલ્ય પરંપરાગત રીતે પછીના જૂથના અંતરાલના મૂલ્ય જેટલું માનવામાં આવે છે, અને છેલ્લા જૂથના અંતરાલનું મૂલ્ય તેના અંતરાલના મૂલ્ય જેટલું હોય છે. અગાઉનું એક.

બીજા જૂથના અંતરાલનું મૂલ્ય 200 જેટલું છે, તેથી, પ્રથમ જૂથનું મૂલ્ય પણ 200 જેટલું છે. ઉપાંત્ય જૂથના અંતરાલનું મૂલ્ય 200 જેટલું છે, જેનો અર્થ છે કે છેલ્લો અંતરાલ પણ 200 નું મૂલ્ય છે.

1) ચાલો ભિન્નતાની શ્રેણીને એટ્રિબ્યુટના સૌથી મોટા અને નાના મૂલ્ય વચ્ચેના તફાવત તરીકે વ્યાખ્યાયિત કરીએ:

ડિપોઝિટના કદમાં વિવિધતાની શ્રેણી 1000 રુબેલ્સ છે.

2) યોગદાનનું સરેરાશ કદ ભારિત અંકગણિત સરેરાશ સૂત્રનો ઉપયોગ કરીને નક્કી કરવામાં આવશે.

ચાલો પહેલા દરેક અંતરાલમાં એટ્રિબ્યુટનું અલગ મૂલ્ય નક્કી કરીએ. આ કરવા માટે, સાદા અંકગણિત સરેરાશ સૂત્રનો ઉપયોગ કરીને, આપણે અંતરાલોના મધ્યબિંદુઓ શોધીએ છીએ.

પ્રથમ અંતરાલનું સરેરાશ મૂલ્ય હશે:

બીજો - 500, વગેરે.

ચાલો કોષ્ટકમાં ગણતરીના પરિણામો દાખલ કરીએ:

જમા રકમ, ઘસવું.થાપણદારોની સંખ્યા, એફઅંતરાલની મધ્યમાં, xxf
200-400 32 300 9600
400-600 56 500 28000
600-800 120 700 84000
800-1000 104 900 93600
1000-1200 88 1100 96800
કુલ 400 - 312000

શહેરની Sberbank માં સરેરાશ થાપણ 780 રુબેલ્સ હશે:

3) સરેરાશ રેખીય વિચલન એ એકંદર સરેરાશમાંથી લાક્ષણિકતાના વ્યક્તિગત મૂલ્યોના સંપૂર્ણ વિચલનોનો અંકગણિત સરેરાશ છે:

અંતરાલ વિતરણ શ્રેણીમાં સરેરાશ રેખીય વિચલનની ગણતરી કરવાની પ્રક્રિયા નીચે મુજબ છે:

1. ભારિત અંકગણિત સરેરાશની ગણતરી કરવામાં આવે છે, જેમ કે ફકરા 2 માં બતાવ્યા પ્રમાણે).

2. સરેરાશથી સંપૂર્ણ વિચલનો નક્કી કરવામાં આવે છે:

3. પરિણામી વિચલનો ફ્રીક્વન્સીઝ દ્વારા ગુણાકાર કરવામાં આવે છે:

4. ચિહ્નને ધ્યાનમાં લીધા વિના ભારિત વિચલનોનો સરવાળો શોધો:

5. ભારિત વિચલનોનો સરવાળો ફ્રીક્વન્સીઝના સરવાળા દ્વારા વિભાજિત થાય છે:

ગણતરી ડેટા કોષ્ટકનો ઉપયોગ કરવો અનુકૂળ છે:

જમા રકમ, ઘસવું.થાપણદારોની સંખ્યા, એફઅંતરાલની મધ્યમાં, x
200-400 32 300 -480 480 15360
400-600 56 500 -280 280 15680
600-800 120 700 -80 80 9600
800-1000 104 900 120 120 12480
1000-1200 88 1100 320 320 28160
કુલ 400 - - - 81280

Sberbank ગ્રાહકોની ડિપોઝિટના કદનું સરેરાશ રેખીય વિચલન 203.2 રુબેલ્સ છે.

4) વિક્ષેપ એ અંકગણિત સરેરાશમાંથી દરેક લક્ષણ મૂલ્યના વર્ગ વિચલનોનો અંકગણિત સરેરાશ છે.

અંતરાલ વિતરણ શ્રેણીમાં તફાવતની ગણતરી સૂત્રનો ઉપયોગ કરીને હાથ ધરવામાં આવે છે:

આ કિસ્સામાં વિભિન્નતાની ગણતરી કરવાની પ્રક્રિયા નીચે મુજબ છે:

1. ભારાંકિત અંકગણિત સરેરાશ નક્કી કરો, ફકરા 2 માં બતાવ્યા પ્રમાણે).

2. સરેરાશમાંથી વિચલનો શોધો:

3. સરેરાશમાંથી દરેક વિકલ્પના વિચલનનો વર્ગ કરો:

4. વિચલનોના વર્ગોને વજન (આવર્તન) દ્વારા ગુણાકાર કરો:

5. પરિણામી ઉત્પાદનોનો સરવાળો કરો:

6. પરિણામી રકમને વજનના સરવાળા (આવર્તન) દ્વારા વિભાજિત કરવામાં આવે છે:

ચાલો ગણતરીઓને કોષ્ટકમાં મૂકીએ:

જમા રકમ, ઘસવું.થાપણદારોની સંખ્યા, એફઅંતરાલની મધ્યમાં, x
200-400 32 300 -480 230400 7372800
400-600 56 500 -280 78400 4390400
600-800 120 700 -80 6400 768000
800-1000 104 900 120 14400 1497600
1000-1200 88 1100 320 102400 9011200
કુલ 400 - - - 23040000

એકંદરમાં લક્ષણની વિવિધતાના કદના સામાન્યીકરણ લાક્ષણિકતા તરીકે વ્યાખ્યાયિત. તે અંકગણિત સરેરાશમાંથી વિશેષતાના વ્યક્તિગત મૂલ્યોના સરેરાશ ચોરસ વિચલનના વર્ગમૂળની બરાબર છે, એટલે કે. નું મૂળ અને આના જેવું શોધી શકાય છે:

1. પ્રાથમિક પંક્તિ માટે:

2. વિવિધતા શ્રેણી માટે:

પ્રમાણભૂત વિચલન સૂત્રનું રૂપાંતર તેને વ્યવહારિક ગણતરીઓ માટે વધુ અનુકૂળ સ્વરૂપમાં લાવે છે:

પ્રમાણભૂત વિચલનસરેરાશ ચોક્કસ વિકલ્પો તેમના સરેરાશ મૂલ્યથી કેટલા વિચલિત થાય છે તે નિર્ધારિત કરે છે, અને તે લાક્ષણિકતાની પરિવર્તનશીલતાનું સંપૂર્ણ માપ પણ છે અને તે વિકલ્પો જેવા જ એકમોમાં વ્યક્ત થાય છે, અને તેથી સારી રીતે અર્થઘટન કરવામાં આવે છે.

પ્રમાણભૂત વિચલન શોધવાના ઉદાહરણો: ,

વૈકલ્પિક લાક્ષણિકતાઓ માટે, પ્રમાણભૂત વિચલન સૂત્ર આના જેવો દેખાય છે:

જ્યાં p એ વસ્તીમાં એકમોનું પ્રમાણ છે જે ચોક્કસ લાક્ષણિકતા ધરાવે છે;

q એ એકમોનું પ્રમાણ છે જેમાં આ લાક્ષણિકતા નથી.

સરેરાશ રેખીય વિચલનનો ખ્યાલ

સરેરાશ રેખીય વિચલનમાંથી વ્યક્તિગત વિકલ્પોના વિચલનોના સંપૂર્ણ મૂલ્યોના અંકગણિત સરેરાશ તરીકે વ્યાખ્યાયિત કરવામાં આવે છે.

1. પ્રાથમિક પંક્તિ માટે:

2. વિવિધતા શ્રેણી માટે:

જ્યાં સરવાળો n છે વિવિધતા શ્રેણીની ફ્રીક્વન્સીઝનો સરવાળો.

સરેરાશ રેખીય વિચલન શોધવાનું ઉદાહરણ:

ભિન્નતાની શ્રેણી પર વિક્ષેપના માપ તરીકે સરેરાશ સંપૂર્ણ વિચલનનો ફાયદો સ્પષ્ટ છે, કારણ કે આ માપ તમામ સંભવિત વિચલનોને ધ્યાનમાં લેવા પર આધારિત છે. પરંતુ આ સૂચકમાં નોંધપાત્ર ખામીઓ છે. વિચલનોના બીજગણિત ચિહ્નોનો મનસ્વી અસ્વીકાર એ હકીકત તરફ દોરી શકે છે કે આ સૂચકના ગાણિતિક ગુણધર્મો પ્રાથમિકથી દૂર છે. સંભવિત ગણતરીઓ સાથે સંકળાયેલી સમસ્યાઓ હલ કરતી વખતે આ સરેરાશ સંપૂર્ણ વિચલનનો ઉપયોગ કરવાનું ખૂબ મુશ્કેલ બનાવે છે.

તેથી, લાક્ષણિકતાના ભિન્નતાના માપદંડ તરીકે સરેરાશ રેખીય વિચલનનો ભાગ્યે જ આંકડાકીય પ્રેક્ટિસમાં ઉપયોગ થાય છે, એટલે કે જ્યારે સંકેતોને ધ્યાનમાં લીધા વિના સૂચકાંકોનો સારાંશ આપવામાં આવે ત્યારે આર્થિક અર્થ થાય છે. તેની મદદથી, ઉદાહરણ તરીકે, વિદેશી વેપારનું ટર્નઓવર, કામદારોની રચના, ઉત્પાદનની લય વગેરેનું વિશ્લેષણ કરવામાં આવે છે.

મીન ચોરસ

સરેરાશ ચોરસ લાગુ પડે છે, ઉદાહરણ તરીકે, n ચોરસ વિભાગોની બાજુઓના સરેરાશ કદ, થડ, પાઈપો, વગેરેના સરેરાશ વ્યાસની ગણતરી કરવા માટે. તેને બે પ્રકારમાં વહેંચવામાં આવે છે.

સરળ સરેરાશ ચોરસ. જો, જ્યારે લાક્ષણિકતાના વ્યક્તિગત મૂલ્યોને સરેરાશ મૂલ્ય સાથે બદલી રહ્યા હોય, ત્યારે મૂળ મૂલ્યોના ચોરસનો સરવાળો યથાવત રાખવો જરૂરી છે, તો સરેરાશ એ ચતુર્ભુજ સરેરાશ મૂલ્ય હશે.

તે વ્યક્તિગત વિશેષતા મૂલ્યોના વર્ગોના સરવાળાને તેમની સંખ્યા દ્વારા વિભાજિત કરવાના ભાગનું વર્ગમૂળ છે:

ભારિત સરેરાશ ચોરસની ગણતરી સૂત્રનો ઉપયોગ કરીને કરવામાં આવે છે:

જ્યાં f વજનનું ચિહ્ન છે.

સરેરાશ ઘન

સરેરાશ ઘન લાગુ પડે છે, ઉદાહરણ તરીકે, બાજુ અને સમઘનનું સરેરાશ લંબાઈ નક્કી કરતી વખતે. તે બે પ્રકારમાં વહેંચાયેલું છે.
સરેરાશ ઘન સરળ:

અંતરાલ વિતરણ શ્રેણીમાં સરેરાશ મૂલ્યો અને વિક્ષેપની ગણતરી કરતી વખતે, વિશેષતાના સાચા મૂલ્યોને અંતરાલોના કેન્દ્રિય મૂલ્યો દ્વારા બદલવામાં આવે છે, જે અંતરાલમાં સમાવિષ્ટ મૂલ્યોના અંકગણિત સરેરાશથી અલગ હોય છે. આ ભિન્નતાની ગણતરી કરતી વખતે પદ્ધતિસરની ભૂલ તરફ દોરી જાય છે. વી.એફ. શેપર્ડે નક્કી કર્યું વિચલનની ગણતરીમાં ભૂલ, જૂથબદ્ધ ડેટાના ઉપયોગને કારણે, અંતરાલના મૂલ્યના ચોરસનો 1/12 છે, ફેલાવાની તીવ્રતા વધારવાની દિશામાં અને ઘટાડવાની દિશામાં.

શેપર્ડ સુધારોજો વિતરણ સામાન્યની નજીક હોય, ભિન્નતાની સતત પ્રકૃતિ સાથેની લાક્ષણિકતા સાથે સંબંધિત હોય અને પ્રારંભિક ડેટાની નોંધપાત્ર માત્રા (n > 500) પર આધારિત હોય તો તેનો ઉપયોગ કરવો જોઈએ. જો કે, એ હકીકતના આધારે કે કેટલાક કિસ્સાઓમાં બંને ભૂલો, જુદી જુદી દિશામાં કાર્ય કરે છે, એકબીજાને વળતર આપે છે, કેટલીકવાર સુધારણા રજૂ કરવાનો ઇનકાર કરવો શક્ય છે.

વિભિન્નતા અને પ્રમાણભૂત વિચલન જેટલું નાનું હશે, તેટલી વધુ એકરૂપ વસ્તી અને વધુ લાક્ષણિક સરેરાશ હશે.
આંકડાઓની પ્રેક્ટિસમાં, ઘણી વાર વિવિધ લાક્ષણિકતાઓના ભિન્નતાઓની તુલના કરવાની જરૂર પડે છે. ઉદાહરણ તરીકે, કામદારોની ઉંમર અને તેમની લાયકાતો, સેવાની લંબાઈ અને વેતન, ખર્ચ અને નફો, સેવાની લંબાઈ અને શ્રમ ઉત્પાદકતા વગેરેની વિવિધતાઓની તુલના કરવી ખૂબ જ રસપ્રદ છે. આવી સરખામણીઓ માટે, લાક્ષણિકતાઓની સંપૂર્ણ પરિવર્તનશીલતાના સૂચકાંકો અયોગ્ય છે: કામના અનુભવની પરિવર્તનશીલતાની તુલના કરવી અશક્ય છે, જે વર્ષોમાં વ્યક્ત કરવામાં આવે છે, વેતનની વિવિધતા સાથે, રુબેલ્સમાં વ્યક્ત કરવામાં આવે છે.

આવી સરખામણીઓ હાથ ધરવા, તેમજ વિવિધ અંકગણિત સરેરાશ સાથે ઘણી વસ્તીમાં સમાન લાક્ષણિકતાની પરિવર્તનશીલતાની તુલના કરવા માટે, વિવિધતાના સંબંધિત સૂચકનો ઉપયોગ કરવામાં આવે છે - વિવિધતાના ગુણાંક.

માળખાકીય સરેરાશ

આંકડાકીય વિતરણોમાં કેન્દ્રીય વલણને લાક્ષણિકતા આપવા માટે, અંકગણિત સરેરાશ સાથે, લાક્ષણિકતા Xના ચોક્કસ મૂલ્યનો ઉપયોગ કરવો ઘણીવાર તર્કસંગત છે, જે વિતરણ શ્રેણીમાં તેના સ્થાનની ચોક્કસ વિશેષતાઓને કારણે, તેના સ્તરને લાક્ષણિકતા આપી શકે છે.

આ ખાસ કરીને મહત્વનું છે જ્યારે વિતરણ શ્રેણીમાં લાક્ષણિકતાના આત્યંતિક મૂલ્યોની અસ્પષ્ટ સીમાઓ હોય છે. આ સંદર્ભે, અંકગણિત સરેરાશનું ચોક્કસ નિર્ધારણ સામાન્ય રીતે અશક્ય અથવા ખૂબ જ મુશ્કેલ હોય છે. આવા કિસ્સાઓમાં, સરેરાશ સ્તરને લઈને નક્કી કરી શકાય છે, ઉદાહરણ તરીકે, આવર્તન શ્રેણીની મધ્યમાં સ્થિત હોય અથવા વર્તમાન શ્રેણીમાં મોટાભાગે જોવા મળે છે તે લક્ષણનું મૂલ્ય.

આવા મૂલ્યો ફક્ત ફ્રીક્વન્સીઝની પ્રકૃતિ પર આધારિત છે, એટલે કે, વિતરણની રચના પર. તેઓ ફ્રીક્વન્સીઝની શ્રેણીમાં સ્થાનમાં લાક્ષણિક છે, તેથી આવા મૂલ્યોને વિતરણના કેન્દ્રની લાક્ષણિકતાઓ તરીકે ગણવામાં આવે છે અને તેથી માળખાકીય સરેરાશની વ્યાખ્યા પ્રાપ્ત થાય છે. તેનો ઉપયોગ એટ્રિબ્યુટ મૂલ્યોની વિતરણ શ્રેણીની આંતરિક રચના અને બંધારણનો અભ્યાસ કરવા માટે થાય છે. આવા સૂચકાંકોમાં શામેલ છે:

પ્રમાણભૂત વિચલન(સમાનાર્થી: પ્રમાણભૂત વિચલન, પ્રમાણભૂત વિચલન, ચોરસ વિચલન; સંબંધિત શરતો: પ્રમાણભૂત વિચલન, પ્રમાણભૂત ફેલાવો) - સંભાવના સિદ્ધાંત અને આંકડાઓમાં, તેની ગાણિતિક અપેક્ષાને સંબંધિત રેન્ડમ ચલના મૂલ્યોના વિખેરવાનું સૌથી સામાન્ય સૂચક છે. મૂલ્યોના નમૂનાઓની મર્યાદિત એરે સાથે, ગાણિતિક અપેક્ષાને બદલે, નમૂનાઓના સમૂહના અંકગણિત સરેરાશનો ઉપયોગ થાય છે.

જ્ઞાનકોશીય YouTube

  • 1 / 5

    પ્રમાણભૂત વિચલન રેન્ડમ ચલના માપનના એકમોમાં માપવામાં આવે છે અને અંકગણિત સરેરાશની પ્રમાણભૂત ભૂલની ગણતરી કરતી વખતે, આત્મવિશ્વાસ અંતરાલ બાંધતી વખતે, આંકડાકીય રીતે પૂર્વધારણાઓનું પરીક્ષણ કરતી વખતે, રેન્ડમ ચલો વચ્ચેના રેખીય સંબંધને માપતી વખતે વપરાય છે. રેન્ડમ ચલના ભિન્નતાના વર્ગમૂળ તરીકે વ્યાખ્યાયિત.

    માનક વિચલન:

    s = n n − 1 σ 2 = 1 n − 1 ∑ i = 1 n (x i − x ¯) 2 ;
    • નોંધ: ઘણી વાર એમએસડી (રુટ મીન સ્ક્વેર ડેવિએશન) અને એસટીડી (સ્ટાન્ડર્ડ ડેવિએશન) ના નામોમાં તેમના સૂત્રો સાથે વિસંગતતાઓ જોવા મળે છે. ઉદાહરણ તરીકે, પાયથોન પ્રોગ્રામિંગ લેંગ્વેજના numPy મોડ્યુલમાં, std() ફંક્શનને "સ્ટાન્ડર્ડ ડેવિએશન" તરીકે વર્ણવવામાં આવ્યું છે, જ્યારે ફોર્મ્યુલા પ્રમાણભૂત વિચલન (નમૂનાના મૂળ દ્વારા વિભાજન) ને પ્રતિબિંબિત કરે છે. Excel માં, STANDARDEVAL() ફંક્શન અલગ છે (n-1 ના રુટ દ્વારા વિભાજન).

    પ્રમાણભૂત વિચલન(રેન્ડમ ચલના પ્રમાણભૂત વિચલનનો અંદાજ xતેના તફાવતના નિષ્પક્ષ અંદાજ પર આધારિત તેની ગાણિતિક અપેક્ષાને સંબંધિત) s (\ ડિસ્પ્લેસ્ટાઈલ ઓ):

    σ = 1 n ∑ i = 1 n (x i − x ¯) 2 .

    (\Displaystyle \sigma =(\sqrt ((\frac (1)(n))\sum _(i=1)^(n)\left(x_(i)-(\bar (x))\જમણે) ^(2))).) જ્યાંσ 2 (\Displaystyle \sigma ^(2)) - ફેલાવો; - x i (\displaystyle x_(i)) i પસંદગીનું તત્વ; n (\Displaystyle n)

    - નમૂનાનું કદ;

    - નમૂનાનો અંકગણિત સરેરાશ:

    x ¯ = 1 n ∑ i = 1 n x i = 1 n (x 1 + … + x n) .

    (\Displaystyle (\bar (x))=(\frac (1)(n))\sum _(i=1)^(n)x_(i)=(\frac (1)(n))(x_ (1)+\ldots +x_(n)).)

    (\Displaystyle (\bar (x))=(\frac (1)(n))\sum _(i=1)^(n)x_(i)=(\frac (1)(n))(x_ (1)+\ldots +x_(n)).) (એ નોંધવું જોઇએ કે બંને અંદાજો પક્ષપાતી છે. સામાન્ય કિસ્સામાં, નિષ્પક્ષ અંદાજ બાંધવો અશક્ય છે. જો કે, નિષ્પક્ષ તફાવતના અંદાજ પર આધારિત અંદાજ સુસંગત છે. GOST R 8.736-2011 અનુસાર, આ વિભાગના બીજા સૂત્રનો ઉપયોગ કરીને પ્રમાણભૂત વિચલનની ગણતરી કરવામાં આવે છે. કૃપા કરીને પરિણામો તપાસો. ત્રણ સિગ્મા નિયમ 3 σ (\displaystyle 3\sigma ) ) - સામાન્ય રીતે વિતરિત રેન્ડમ ચલના લગભગ તમામ મૂલ્યો અંતરાલમાં હોય છે(x ¯ − 3 σ; x ¯ + 3 σ) (\displaystyle \left((\bar (x))-3\sigma ;(\bar (x))+3\sigma \right))

    . વધુ કડક રીતે - અંદાજે 0.9973 સંભાવના સાથે, સામાન્ય રીતે વિતરિત રેન્ડમ ચલનું મૂલ્ય નિર્દિષ્ટ અંતરાલમાં રહેલું છે (જો કે મૂલ્ય ) - સામાન્ય રીતે વિતરિત રેન્ડમ ચલના લગભગ તમામ મૂલ્યો અંતરાલમાં હોય છે x ¯ (\Displaystyle (\bar (x))) સાચું છે, અને નમૂના પ્રક્રિયાના પરિણામે પ્રાપ્ત થયું નથી).જો સાચી કિંમત અજ્ઞાત છે, તો તમારે ઉપયોગ કરવો જોઈએ નહીંσ (\ડિસ્પ્લેસ્ટાઈલ \સિગ્મા ) અજ્ઞાત છે, તો તમારે ઉપયોગ કરવો જોઈએ નહીં .

    , એ

    s

    ઉદાહરણ તરીકે, અમારી પાસે ત્રણ નંબર સેટ છે: (0, 0, 14, 14), (0, 6, 8, 14) અને (6, 6, 8, 8). ત્રણેય સેટમાં સરેરાશ મૂલ્યો 7, અને પ્રમાણભૂત વિચલનો, અનુક્રમે, 7, 5 અને 1 ની બરાબર હોય છે. છેલ્લા સેટમાં એક નાનું પ્રમાણભૂત વિચલન હોય છે, કારણ કે સમૂહમાંના મૂલ્યો સરેરાશ મૂલ્યની આસપાસ જૂથબદ્ધ હોય છે; પ્રથમ સેટમાં સૌથી વધુ પ્રમાણભૂત વિચલન મૂલ્ય છે - સેટની અંદરના મૂલ્યો સરેરાશ મૂલ્યથી મોટા પ્રમાણમાં અલગ પડે છે.

    સામાન્ય અર્થમાં, પ્રમાણભૂત વિચલનને અનિશ્ચિતતાનું માપ ગણી શકાય. ઉદાહરણ તરીકે, ભૌતિકશાસ્ત્રમાં, પ્રમાણભૂત વિચલનનો ઉપયોગ અમુક જથ્થાના ક્રમિક માપની શ્રેણીની ભૂલ નક્કી કરવા માટે થાય છે. સિદ્ધાંત દ્વારા અનુમાનિત મૂલ્યની તુલનામાં અભ્યાસ હેઠળની ઘટનાની વાજબીતા નક્કી કરવા માટે આ મૂલ્ય ખૂબ જ મહત્વપૂર્ણ છે: જો માપનું સરેરાશ મૂલ્ય સિદ્ધાંત (મોટા પ્રમાણભૂત વિચલન) દ્વારા અનુમાનિત મૂલ્યોથી ઘણું અલગ હોય, પછી પ્રાપ્ત મૂલ્યો અથવા તેમને મેળવવાની પદ્ધતિ ફરીથી તપાસવી જોઈએ. પોર્ટફોલિયો જોખમ સાથે ઓળખાય છે.

    આબોહવા

    ધારો કે સમાન સરેરાશ મહત્તમ દૈનિક તાપમાન ધરાવતા બે શહેરો છે, પરંતુ એક દરિયાકિનારે અને બીજું મેદાન પર સ્થિત છે. તે જાણીતું છે કે દરિયાકાંઠે સ્થિત શહેરોમાં દિવસના સમયના તાપમાનમાં ઘણા જુદા જુદા હોય છે જે અંતરિયાળ સ્થિત શહેરો કરતા ઓછા હોય છે. તેથી, દરિયાકાંઠાના શહેર માટે મહત્તમ દૈનિક તાપમાનનું પ્રમાણભૂત વિચલન બીજા શહેર કરતાં ઓછું હશે, તેમ છતાં તેનું સરેરાશ મૂલ્ય સમાન છે, જેનો વ્યવહારિક અર્થ એ છે કે કોઈ પણ દિવસે મહત્તમ હવાનું તાપમાન હોવાની સંભાવના વર્ષનું સરેરાશ મૂલ્ય કરતાં વધુ અલગ હશે, જે અંતરિયાળ સ્થિત શહેર માટે વધુ હશે.

    રમતગમત

    ચાલો માની લઈએ કે કેટલીક ફૂટબોલ ટીમો છે જેને અમુક પરિમાણોના સેટ પર રેટ કરવામાં આવે છે, ઉદાહરણ તરીકે, કરેલા ગોલની સંખ્યા અને સ્વીકૃત, સ્કોર કરવાની તકો વગેરે. આ જૂથની શ્રેષ્ઠ ટીમના મૂલ્યો વધુ સારી હશે તેવી સંભાવના છે. વધુ પરિમાણો પર. પ્રસ્તુત કરેલ દરેક પરિમાણો માટે ટીમનું પ્રમાણભૂત વિચલન જેટલું નાનું છે, તેટલું વધુ અનુમાનિત ટીમનું પરિણામ સંતુલિત છે; બીજી બાજુ, મોટી પ્રમાણભૂત વિચલન ધરાવતી ટીમ માટે પરિણામની આગાહી કરવી મુશ્કેલ છે, જે બદલામાં અસંતુલન દ્વારા સમજાવવામાં આવે છે, ઉદાહરણ તરીકે, મજબૂત સંરક્ષણ પરંતુ નબળા હુમલા.

    ટીમના પરિમાણોના પ્રમાણભૂત વિચલનનો ઉપયોગ કરીને, એક અંશે અથવા બીજી રીતે, બે ટીમો વચ્ચેની મેચના પરિણામની આગાહી કરવી, ટીમોની શક્તિ અને નબળાઈઓનું મૂલ્યાંકન કરવું અને તેથી લડાઈની પસંદ કરેલી પદ્ધતિઓ શક્ય બનાવે છે.

    પૂર્વધારણાઓના આંકડાકીય પરીક્ષણમાં, જ્યારે રેન્ડમ ચલો વચ્ચેના રેખીય સંબંધને માપવામાં આવે છે.

    માનક વિચલન:

    પ્રમાણભૂત વિચલન(રેન્ડમ વેરીએબલ ફ્લોરના પ્રમાણભૂત વિચલનનો અંદાજ, આપણી આસપાસની દિવાલો અને છત, xતેના તફાવતના નિષ્પક્ષ અંદાજના આધારે તેની ગાણિતિક અપેક્ષાને સંબંધિત):

    વિખેરવું ક્યાં છે; - ફ્લોર, આપણી આસપાસની દિવાલો અને છત, x i (\displaystyle x_(i))પસંદગીનું તત્વ; - નમૂનાનું કદ; - નમૂનાનો અંકગણિત સરેરાશ:

    એ નોંધવું જોઇએ કે બંને અંદાજો પક્ષપાતી છે. સામાન્ય કિસ્સામાં, નિષ્પક્ષ અંદાજ બાંધવો અશક્ય છે. જો કે, નિષ્પક્ષ તફાવતના અંદાજ પર આધારિત અંદાજ સુસંગત છે.

    (\Displaystyle (\bar (x))=(\frac (1)(n))\sum _(i=1)^(n)x_(i)=(\frac (1)(n))(x_ (1)+\ldots +x_(n)).)

    (\Displaystyle (\bar (x))=(\frac (1)(n))\sum _(i=1)^(n)x_(i)=(\frac (1)(n))(x_ (1)+\ldots +x_(n)).)() - સામાન્ય રીતે વિતરિત રેન્ડમ ચલના લગભગ તમામ મૂલ્યો અંતરાલમાં હોય છે. વધુ કડક રીતે - 99.7% કરતા ઓછા આત્મવિશ્વાસ સાથે, સામાન્ય રીતે વિતરિત રેન્ડમ ચલનું મૂલ્ય નિર્દિષ્ટ અંતરાલમાં રહેલું છે (જો કે મૂલ્ય સાચું હોય અને નમૂના પ્રક્રિયાના પરિણામે પ્રાપ્ત ન થયું હોય).

    જો સાચું મૂલ્ય અજાણ્યું હોય, તો આપણે તેનો નહીં, પરંતુ ફ્લોર, આપણી આસપાસની દિવાલો અને છતનો ઉપયોગ કરવો જોઈએ, અજ્ઞાત છે, તો તમારે ઉપયોગ કરવો જોઈએ નહીં. આમ, ત્રણ સિગ્માનો નિયમ ત્રણ માળ, આપણી આસપાસની દિવાલો અને છતના નિયમમાં પરિવર્તિત થાય છે, અજ્ઞાત છે, તો તમારે ઉપયોગ કરવો જોઈએ નહીં .

    , એ

    મોટા પ્રમાણભૂત વિચલન મૂલ્ય સેટના સરેરાશ મૂલ્ય સાથે પ્રસ્તુત સમૂહમાં મૂલ્યોનો મોટો ફેલાવો દર્શાવે છે; એક નાનું મૂલ્ય, તે મુજબ, બતાવે છે કે સમૂહમાં મૂલ્યો મધ્યમ મૂલ્યની આસપાસ જૂથ થયેલ છે.

    ઉદાહરણ તરીકે, અમારી પાસે ત્રણ નંબર સેટ છે: (0, 0, 14, 14), (0, 6, 8, 14) અને (6, 6, 8, 8). ત્રણેય સેટમાં સરેરાશ મૂલ્યો 7, અને પ્રમાણભૂત વિચલનો, અનુક્રમે, 7, 5 અને 1 ની બરાબર હોય છે. છેલ્લા સેટમાં એક નાનું પ્રમાણભૂત વિચલન હોય છે, કારણ કે સમૂહમાંના મૂલ્યો સરેરાશ મૂલ્યની આસપાસ જૂથબદ્ધ હોય છે; પ્રથમ સેટમાં સૌથી વધુ પ્રમાણભૂત વિચલન મૂલ્ય છે - સેટની અંદરના મૂલ્યો સરેરાશ મૂલ્યથી મોટા પ્રમાણમાં અલગ પડે છે.

    સામાન્ય અર્થમાં, પ્રમાણભૂત વિચલનને અનિશ્ચિતતાનું માપ ગણી શકાય. ઉદાહરણ તરીકે, ભૌતિકશાસ્ત્રમાં, પ્રમાણભૂત વિચલનનો ઉપયોગ અમુક જથ્થાના ક્રમિક માપની શ્રેણીની ભૂલ નક્કી કરવા માટે થાય છે. સિદ્ધાંત દ્વારા અનુમાનિત મૂલ્યની તુલનામાં અભ્યાસ હેઠળની ઘટનાની વાજબીતા નક્કી કરવા માટે આ મૂલ્ય ખૂબ જ મહત્વપૂર્ણ છે: જો માપનું સરેરાશ મૂલ્ય સિદ્ધાંત (મોટા પ્રમાણભૂત વિચલન) દ્વારા અનુમાનિત મૂલ્યોથી ઘણું અલગ હોય, પછી પ્રાપ્ત મૂલ્યો અથવા તેમને મેળવવાની પદ્ધતિ ફરીથી તપાસવી જોઈએ.

    પ્રાયોગિક એપ્લિકેશન

    વ્યવહારમાં, પ્રમાણભૂત વિચલન તમને નિર્ધારિત કરવાની મંજૂરી આપે છે કે સેટમાંના મૂલ્યો સરેરાશ મૂલ્યથી કેટલા અલગ હોઈ શકે છે.

    આબોહવા

    ધારો કે સમાન સરેરાશ મહત્તમ દૈનિક તાપમાન ધરાવતા બે શહેરો છે, પરંતુ એક દરિયાકિનારે સ્થિત છે અને બીજું અંતરિયાળ છે. તે જાણીતું છે કે દરિયાકાંઠે સ્થિત શહેરોમાં દિવસના સમયના તાપમાનમાં ઘણા જુદા જુદા હોય છે જે અંતરિયાળ સ્થિત શહેરો કરતા ઓછા હોય છે. તેથી, દરિયાકાંઠાના શહેર માટે મહત્તમ દૈનિક તાપમાનનું પ્રમાણભૂત વિચલન બીજા શહેર કરતાં ઓછું હશે, તેમ છતાં તેનું સરેરાશ મૂલ્ય સમાન છે, જેનો વ્યવહારિક અર્થ એ છે કે કોઈ પણ દિવસે મહત્તમ હવાનું તાપમાન હોવાની સંભાવના વર્ષનું સરેરાશ મૂલ્ય કરતાં વધુ અલગ હશે, જે અંતરિયાળ સ્થિત શહેર માટે વધુ હશે.

    રમતગમત

    ચાલો માની લઈએ કે કેટલીક ફૂટબોલ ટીમો છે જેને અમુક પરિમાણોના સેટ પર રેટ કરવામાં આવે છે, ઉદાહરણ તરીકે, કરેલા ગોલની સંખ્યા અને સ્વીકૃત, સ્કોર કરવાની તકો વગેરે. આ જૂથની શ્રેષ્ઠ ટીમના મૂલ્યો વધુ સારી હશે તેવી સંભાવના છે. વધુ પરિમાણો પર. પ્રસ્તુત કરેલ દરેક પરિમાણો માટે ટીમનું પ્રમાણભૂત વિચલન જેટલું નાનું છે, તેટલું વધુ અનુમાનિત ટીમનું પરિણામ સંતુલિત છે; બીજી બાજુ, મોટી પ્રમાણભૂત વિચલન ધરાવતી ટીમ માટે પરિણામની આગાહી કરવી મુશ્કેલ છે, જે બદલામાં અસંતુલન દ્વારા સમજાવવામાં આવે છે, ઉદાહરણ તરીકે, મજબૂત સંરક્ષણ પરંતુ નબળા હુમલા.

    ટીમના પરિમાણોના પ્રમાણભૂત વિચલનનો ઉપયોગ કરીને, એક અંશે અથવા બીજી રીતે, બે ટીમો વચ્ચેની મેચના પરિણામની આગાહી કરવી, ટીમોની શક્તિ અને નબળાઈઓનું મૂલ્યાંકન કરવું અને તેથી લડાઈની પસંદ કરેલી પદ્ધતિઓ શક્ય બનાવે છે.

    ટેકનિકલ વિશ્લેષણ

    પણ જુઓ

    સાહિત્ય

    * બોરોવિકોવ, વી.આંકડા. કમ્પ્યુટર પર ડેટા વિશ્લેષણની કળા: વ્યાવસાયિકો માટે / વી. બોરોવિકોવ. - સેન્ટ પીટર્સબર્ગ. : પીટર, 2003. - 688 પૃ. - ISBN 5-272-00078-1.



શું તમને લેખ ગમ્યો? તમારા મિત્રો સાથે શેર કરો!