કોઈપણ આંકડાકીય પૃથ્થકરણનું સંચાલન ગણતરીઓ વિના અકલ્પ્ય છે. આ લેખમાં આપણે એક્સેલમાં ભિન્નતા, પ્રમાણભૂત વિચલન, વિવિધતાના ગુણાંક અને અન્ય આંકડાકીય સૂચકાંકોની ગણતરી કેવી રીતે કરવી તે જોઈશું.
મહત્તમ અને ન્યૂનતમ મૂલ્ય
સરેરાશ રેખીય વિચલન
સરેરાશ રેખીય વિચલન એ વિશ્લેષણ કરેલ ડેટા સેટમાંથી નિરપેક્ષ (મોડ્યુલો) વિચલનોની સરેરાશ છે. ગાણિતિક સૂત્ર છે:
a- સરેરાશ રેખીય વિચલન,
એક્સ- વિશ્લેષણ સૂચક,
X̅- સૂચકનું સરેરાશ મૂલ્ય,
n
Excel માં આ ફંકશન કહેવાય છે SROTCL.
SROTCL ફંક્શન પસંદ કર્યા પછી, અમે ડેટા રેન્જ સૂચવીએ છીએ કે જેના પર ગણતરી થવી જોઈએ. "ઓકે" ક્લિક કરો.
વિખેરી નાખવું
(મોડ્યુલ 111)
કદાચ દરેક જણ જાણતું નથી કે શું , તેથી હું સમજાવીશ, તે એક માપ છે જે ગાણિતિક અપેક્ષાની આસપાસના ડેટાના ફેલાવાને દર્શાવે છે. જો કે, સામાન્ય રીતે માત્ર એક નમૂનો જ ઉપલબ્ધ હોય છે, તેથી નીચે આપેલા વિભિન્ન સૂત્રનો ઉપયોગ થાય છે:
s 2- અવલોકન ડેટામાંથી ગણતરી કરેલ નમૂનાની વિસંગતતા,
એક્સ- વ્યક્તિગત મૂલ્યો,
X̅- નમૂના માટે અંકગણિત સરેરાશ,
n- વિશ્લેષણ કરેલ ડેટા સેટમાં મૂલ્યોની સંખ્યા.
અનુરૂપ એક્સેલ કાર્ય છે ડીઆઈએસપી.જી. પ્રમાણમાં નાના નમૂનાઓનું વિશ્લેષણ કરતી વખતે (લગભગ 30 અવલોકનો સુધી), તમારે ઉપયોગ કરવો જોઈએ, જેની ગણતરી નીચેના સૂત્રનો ઉપયોગ કરીને કરવામાં આવે છે.
તફાવત, જેમ તમે જોઈ શકો છો, માત્ર છેદમાં છે. એક્સેલ પાસે સેમ્પલ નિષ્પક્ષ ભિન્નતાની ગણતરી કરવા માટેનું કાર્ય છે ડીઆઈએસપી.બી.
ઇચ્છિત વિકલ્પ પસંદ કરો (સામાન્ય અથવા પસંદગીયુક્ત), શ્રેણી સૂચવો અને "ઓકે" બટનને ક્લિક કરો. વિચલનોના પ્રારંભિક વર્ગીકરણને કારણે પરિણામી મૂલ્ય ખૂબ મોટું હોઈ શકે છે. આંકડાઓમાં વિક્ષેપ એ ખૂબ જ મહત્વપૂર્ણ સૂચક છે, પરંતુ તેનો ઉપયોગ સામાન્ય રીતે તેના શુદ્ધ સ્વરૂપમાં થતો નથી, પરંતુ વધુ ગણતરીઓ માટે થાય છે.
પ્રમાણભૂત વિચલન
પ્રમાણભૂત વિચલન (RMS) એ વિભિન્નતાનું મૂળ છે. આ સૂચકને પ્રમાણભૂત વિચલન પણ કહેવામાં આવે છે અને સૂત્રનો ઉપયોગ કરીને ગણતરી કરવામાં આવે છે:
સામાન્ય વસ્તી દ્વારા
નમૂના દ્વારા
તમે ભિન્નતાનું મૂળ લઈ શકો છો, પરંતુ એક્સેલ પ્રમાણભૂત વિચલન માટે તૈયાર કાર્યો ધરાવે છે: STDEV.Gઅને STDEV.V(અનુક્રમે સામાન્ય અને નમૂના વસ્તી માટે).
માનક અને પ્રમાણભૂત વિચલન, હું પુનરાવર્તન કરું છું, સમાનાર્થી છે.
આગળ, હંમેશની જેમ, ઇચ્છિત શ્રેણી સૂચવો અને "ઓકે" પર ક્લિક કરો. પ્રમાણભૂત વિચલન વિશ્લેષિત સૂચક તરીકે માપના સમાન એકમો ધરાવે છે, અને તેથી તે મૂળ ડેટા સાથે તુલનાત્મક છે. નીચે આ વિશે વધુ.
વિવિધતાનો ગુણાંક
ઉપર ચર્ચા કરાયેલા તમામ સૂચકાંકો સ્રોત ડેટાના સ્કેલ સાથે જોડાયેલા છે અને કોઈને વિશ્લેષિત વસ્તીની વિવિધતાનો અલંકારિક વિચાર મેળવવાની મંજૂરી આપતા નથી. ડેટાના વિક્ષેપના સંબંધિત માપ મેળવવા માટે, ઉપયોગ કરો વિવિધતાના ગુણાંક, જે ભાગાકાર દ્વારા ગણવામાં આવે છે પ્રમાણભૂત વિચલનપર અંકગણિત સરેરાશ. વિવિધતાના ગુણાંક માટેનું સૂત્ર સરળ છે:
એક્સેલમાં વિવિધતાના ગુણાંકની ગણતરી કરવા માટે કોઈ તૈયાર કાર્ય નથી, જે કોઈ મોટી સમસ્યા નથી. પ્રમાણભૂત વિચલનને સરેરાશ દ્વારા વિભાજીત કરીને ગણતરી કરી શકાય છે. આ કરવા માટે, ફોર્મ્યુલા બારમાં લખો:
ધોરણ વિચલન.જી()/સરેરાશ()
ડેટા શ્રેણી કૌંસમાં દર્શાવેલ છે. જો જરૂરી હોય તો, નમૂના પ્રમાણભૂત વિચલન (STDEV.B) નો ઉપયોગ કરો.
વિવિધતાના ગુણાંકને સામાન્ય રીતે ટકાવારી તરીકે દર્શાવવામાં આવે છે, તેથી તમે ટકાવારીના ફોર્મેટમાં સૂત્ર સાથે કોષને ફ્રેમ કરી શકો છો. જરૂરી બટન "હોમ" ટેબ પર રિબન પર સ્થિત છે:
તમે ઇચ્છિત કોષને હાઇલાઇટ કર્યા પછી અને જમણું-ક્લિક કર્યા પછી સંદર્ભ મેનૂમાંથી પસંદ કરીને પણ ફોર્મેટ બદલી શકો છો.
વિવિધતાના ગુણાંક, મૂલ્યોના સ્કેટરના અન્ય સૂચકાંકોથી વિપરીત, ડેટા ભિન્નતાના સ્વતંત્ર અને અત્યંત માહિતીપ્રદ સૂચક તરીકે ઉપયોગમાં લેવાય છે. આંકડાઓમાં, તે સામાન્ય રીતે સ્વીકારવામાં આવે છે કે જો વિવિધતાનો ગુણાંક 33% કરતા ઓછો હોય, તો ડેટા સમૂહ સજાતીય છે, જો 33% કરતા વધુ હોય, તો તે વિજાતીય છે. આ માહિતી ડેટાના પ્રારંભિક પાત્રાલેખન માટે અને વધુ વિશ્લેષણ માટેની તકો ઓળખવા માટે ઉપયોગી થઈ શકે છે. આ ઉપરાંત, ટકાવારી તરીકે માપવામાં આવતા વિવિધતાના ગુણાંક, તમને તેમના સ્કેલ અને માપનના એકમોને ધ્યાનમાં લીધા વિના, વિવિધ ડેટાના વિખેરવાની ડિગ્રીની તુલના કરવાની મંજૂરી આપે છે. ઉપયોગી મિલકત.
ઓસિલેશન ગુણાંક
આજે ડેટાના વિક્ષેપનું બીજું સૂચક ઓસિલેશન ગુણાંક છે. આ વિવિધતાની શ્રેણી (મહત્તમ અને લઘુત્તમ મૂલ્યો વચ્ચેનો તફાવત) અને સરેરાશનો ગુણોત્તર છે. ત્યાં કોઈ તૈયાર એક્સેલ ફોર્મ્યુલા નથી, તેથી તમારે ત્રણ કાર્યોને જોડવા પડશે: MAX, MIN, AVERAGE.
ઓસિલેશનનો ગુણાંક સરેરાશની તુલનામાં વિવિધતાની હદ દર્શાવે છે, જેનો ઉપયોગ વિવિધ ડેટા સેટની તુલના કરવા માટે પણ થઈ શકે છે.
સામાન્ય રીતે, એક્સેલનો ઉપયોગ કરીને, ઘણા આંકડાકીય સૂચકાંકોની ગણતરી ખૂબ જ સરળ રીતે કરવામાં આવે છે. જો કંઈક સ્પષ્ટ ન હોય, તો તમે હંમેશા ફંક્શન ઇન્સર્ટમાં શોધ બોક્સનો ઉપયોગ કરી શકો છો. સારું, Google મદદ કરવા માટે અહીં છે.
સેમ્પલ સર્વે મુજબ, થાપણદારોને શહેરની Sberbank માં તેમની થાપણના કદ અનુસાર જૂથબદ્ધ કરવામાં આવ્યા હતા:
વ્યાખ્યાયિત કરો:
1) વિવિધતાનો અવકાશ;
2) સરેરાશ થાપણ કદ;
3) સરેરાશ રેખીય વિચલન;
4) વિખેરવું;
5) પ્રમાણભૂત વિચલન;
6) યોગદાનની વિવિધતાનો ગુણાંક.
ઉકેલ:
આ વિતરણ શ્રેણીમાં ખુલ્લા અંતરાલોનો સમાવેશ થાય છે. આવી શ્રેણીમાં, પ્રથમ જૂથના અંતરાલનું મૂલ્ય પરંપરાગત રીતે પછીના જૂથના અંતરાલના મૂલ્ય જેટલું માનવામાં આવે છે, અને છેલ્લા જૂથના અંતરાલનું મૂલ્ય તેના અંતરાલના મૂલ્ય જેટલું હોય છે. અગાઉનું એક.
બીજા જૂથના અંતરાલનું મૂલ્ય 200 જેટલું છે, તેથી, પ્રથમ જૂથનું મૂલ્ય પણ 200 જેટલું છે. ઉપાંત્ય જૂથના અંતરાલનું મૂલ્ય 200 જેટલું છે, જેનો અર્થ છે કે છેલ્લો અંતરાલ પણ 200 નું મૂલ્ય છે.
1) ચાલો ભિન્નતાની શ્રેણીને એટ્રિબ્યુટના સૌથી મોટા અને નાના મૂલ્ય વચ્ચેના તફાવત તરીકે વ્યાખ્યાયિત કરીએ:
ડિપોઝિટના કદમાં વિવિધતાની શ્રેણી 1000 રુબેલ્સ છે.
2) યોગદાનનું સરેરાશ કદ ભારિત અંકગણિત સરેરાશ સૂત્રનો ઉપયોગ કરીને નક્કી કરવામાં આવશે.
ચાલો પહેલા દરેક અંતરાલમાં એટ્રિબ્યુટનું અલગ મૂલ્ય નક્કી કરીએ. આ કરવા માટે, સાદા અંકગણિત સરેરાશ સૂત્રનો ઉપયોગ કરીને, આપણે અંતરાલોના મધ્યબિંદુઓ શોધીએ છીએ.
પ્રથમ અંતરાલનું સરેરાશ મૂલ્ય હશે:
બીજો - 500, વગેરે.
ચાલો કોષ્ટકમાં ગણતરીના પરિણામો દાખલ કરીએ:
જમા રકમ, ઘસવું. | થાપણદારોની સંખ્યા, એફ | અંતરાલની મધ્યમાં, x | xf |
---|---|---|---|
200-400 | 32 | 300 | 9600 |
400-600 | 56 | 500 | 28000 |
600-800 | 120 | 700 | 84000 |
800-1000 | 104 | 900 | 93600 |
1000-1200 | 88 | 1100 | 96800 |
કુલ | 400 | - | 312000 |
શહેરની Sberbank માં સરેરાશ થાપણ 780 રુબેલ્સ હશે:
3) સરેરાશ રેખીય વિચલન એ એકંદર સરેરાશમાંથી લાક્ષણિકતાના વ્યક્તિગત મૂલ્યોના સંપૂર્ણ વિચલનોનો અંકગણિત સરેરાશ છે:
અંતરાલ વિતરણ શ્રેણીમાં સરેરાશ રેખીય વિચલનની ગણતરી કરવાની પ્રક્રિયા નીચે મુજબ છે:
1. ભારિત અંકગણિત સરેરાશની ગણતરી કરવામાં આવે છે, જેમ કે ફકરા 2 માં બતાવ્યા પ્રમાણે).
2. સરેરાશથી સંપૂર્ણ વિચલનો નક્કી કરવામાં આવે છે:
3. પરિણામી વિચલનો ફ્રીક્વન્સીઝ દ્વારા ગુણાકાર કરવામાં આવે છે:
4. ચિહ્નને ધ્યાનમાં લીધા વિના ભારિત વિચલનોનો સરવાળો શોધો:
5. ભારિત વિચલનોનો સરવાળો ફ્રીક્વન્સીઝના સરવાળા દ્વારા વિભાજિત થાય છે:
ગણતરી ડેટા કોષ્ટકનો ઉપયોગ કરવો અનુકૂળ છે:
જમા રકમ, ઘસવું. | થાપણદારોની સંખ્યા, એફ | અંતરાલની મધ્યમાં, x | |||
---|---|---|---|---|---|
200-400 | 32 | 300 | -480 | 480 | 15360 |
400-600 | 56 | 500 | -280 | 280 | 15680 |
600-800 | 120 | 700 | -80 | 80 | 9600 |
800-1000 | 104 | 900 | 120 | 120 | 12480 |
1000-1200 | 88 | 1100 | 320 | 320 | 28160 |
કુલ | 400 | - | - | - | 81280 |
Sberbank ગ્રાહકોની ડિપોઝિટના કદનું સરેરાશ રેખીય વિચલન 203.2 રુબેલ્સ છે.
4) વિક્ષેપ એ અંકગણિત સરેરાશમાંથી દરેક લક્ષણ મૂલ્યના વર્ગ વિચલનોનો અંકગણિત સરેરાશ છે.
અંતરાલ વિતરણ શ્રેણીમાં તફાવતની ગણતરી સૂત્રનો ઉપયોગ કરીને હાથ ધરવામાં આવે છે:
આ કિસ્સામાં વિભિન્નતાની ગણતરી કરવાની પ્રક્રિયા નીચે મુજબ છે:
1. ભારાંકિત અંકગણિત સરેરાશ નક્કી કરો, ફકરા 2 માં બતાવ્યા પ્રમાણે).
2. સરેરાશમાંથી વિચલનો શોધો:
3. સરેરાશમાંથી દરેક વિકલ્પના વિચલનનો વર્ગ કરો:
4. વિચલનોના વર્ગોને વજન (આવર્તન) દ્વારા ગુણાકાર કરો:
5. પરિણામી ઉત્પાદનોનો સરવાળો કરો:
6. પરિણામી રકમને વજનના સરવાળા (આવર્તન) દ્વારા વિભાજિત કરવામાં આવે છે:
ચાલો ગણતરીઓને કોષ્ટકમાં મૂકીએ:
જમા રકમ, ઘસવું. | થાપણદારોની સંખ્યા, એફ | અંતરાલની મધ્યમાં, x | |||
---|---|---|---|---|---|
200-400 | 32 | 300 | -480 | 230400 | 7372800 |
400-600 | 56 | 500 | -280 | 78400 | 4390400 |
600-800 | 120 | 700 | -80 | 6400 | 768000 |
800-1000 | 104 | 900 | 120 | 14400 | 1497600 |
1000-1200 | 88 | 1100 | 320 | 102400 | 9011200 |
કુલ | 400 | - | - | - | 23040000 |
એકંદરમાં લક્ષણની વિવિધતાના કદના સામાન્યીકરણ લાક્ષણિકતા તરીકે વ્યાખ્યાયિત. તે અંકગણિત સરેરાશમાંથી વિશેષતાના વ્યક્તિગત મૂલ્યોના સરેરાશ ચોરસ વિચલનના વર્ગમૂળની બરાબર છે, એટલે કે. નું મૂળ અને આના જેવું શોધી શકાય છે:
1. પ્રાથમિક પંક્તિ માટે:
2. વિવિધતા શ્રેણી માટે:
પ્રમાણભૂત વિચલન સૂત્રનું રૂપાંતર તેને વ્યવહારિક ગણતરીઓ માટે વધુ અનુકૂળ સ્વરૂપમાં લાવે છે:
પ્રમાણભૂત વિચલનસરેરાશ ચોક્કસ વિકલ્પો તેમના સરેરાશ મૂલ્યથી કેટલા વિચલિત થાય છે તે નિર્ધારિત કરે છે, અને તે લાક્ષણિકતાની પરિવર્તનશીલતાનું સંપૂર્ણ માપ પણ છે અને તે વિકલ્પો જેવા જ એકમોમાં વ્યક્ત થાય છે, અને તેથી સારી રીતે અર્થઘટન કરવામાં આવે છે.
પ્રમાણભૂત વિચલન શોધવાના ઉદાહરણો: ,
વૈકલ્પિક લાક્ષણિકતાઓ માટે, પ્રમાણભૂત વિચલન સૂત્ર આના જેવો દેખાય છે:
જ્યાં p એ વસ્તીમાં એકમોનું પ્રમાણ છે જે ચોક્કસ લાક્ષણિકતા ધરાવે છે;
q એ એકમોનું પ્રમાણ છે જેમાં આ લાક્ષણિકતા નથી.
સરેરાશ રેખીય વિચલનનો ખ્યાલ
સરેરાશ રેખીય વિચલનમાંથી વ્યક્તિગત વિકલ્પોના વિચલનોના સંપૂર્ણ મૂલ્યોના અંકગણિત સરેરાશ તરીકે વ્યાખ્યાયિત કરવામાં આવે છે.
1. પ્રાથમિક પંક્તિ માટે:
2. વિવિધતા શ્રેણી માટે:
જ્યાં સરવાળો n છે વિવિધતા શ્રેણીની ફ્રીક્વન્સીઝનો સરવાળો.
સરેરાશ રેખીય વિચલન શોધવાનું ઉદાહરણ:
ભિન્નતાની શ્રેણી પર વિક્ષેપના માપ તરીકે સરેરાશ સંપૂર્ણ વિચલનનો ફાયદો સ્પષ્ટ છે, કારણ કે આ માપ તમામ સંભવિત વિચલનોને ધ્યાનમાં લેવા પર આધારિત છે. પરંતુ આ સૂચકમાં નોંધપાત્ર ખામીઓ છે. વિચલનોના બીજગણિત ચિહ્નોનો મનસ્વી અસ્વીકાર એ હકીકત તરફ દોરી શકે છે કે આ સૂચકના ગાણિતિક ગુણધર્મો પ્રાથમિકથી દૂર છે. સંભવિત ગણતરીઓ સાથે સંકળાયેલી સમસ્યાઓ હલ કરતી વખતે આ સરેરાશ સંપૂર્ણ વિચલનનો ઉપયોગ કરવાનું ખૂબ મુશ્કેલ બનાવે છે.
તેથી, લાક્ષણિકતાના ભિન્નતાના માપદંડ તરીકે સરેરાશ રેખીય વિચલનનો ભાગ્યે જ આંકડાકીય પ્રેક્ટિસમાં ઉપયોગ થાય છે, એટલે કે જ્યારે સંકેતોને ધ્યાનમાં લીધા વિના સૂચકાંકોનો સારાંશ આપવામાં આવે ત્યારે આર્થિક અર્થ થાય છે. તેની મદદથી, ઉદાહરણ તરીકે, વિદેશી વેપારનું ટર્નઓવર, કામદારોની રચના, ઉત્પાદનની લય વગેરેનું વિશ્લેષણ કરવામાં આવે છે.
મીન ચોરસ
સરેરાશ ચોરસ લાગુ પડે છે, ઉદાહરણ તરીકે, n ચોરસ વિભાગોની બાજુઓના સરેરાશ કદ, થડ, પાઈપો, વગેરેના સરેરાશ વ્યાસની ગણતરી કરવા માટે. તેને બે પ્રકારમાં વહેંચવામાં આવે છે.
સરળ સરેરાશ ચોરસ. જો, જ્યારે લાક્ષણિકતાના વ્યક્તિગત મૂલ્યોને સરેરાશ મૂલ્ય સાથે બદલી રહ્યા હોય, ત્યારે મૂળ મૂલ્યોના ચોરસનો સરવાળો યથાવત રાખવો જરૂરી છે, તો સરેરાશ એ ચતુર્ભુજ સરેરાશ મૂલ્ય હશે.
તે વ્યક્તિગત વિશેષતા મૂલ્યોના વર્ગોના સરવાળાને તેમની સંખ્યા દ્વારા વિભાજિત કરવાના ભાગનું વર્ગમૂળ છે:
ભારિત સરેરાશ ચોરસની ગણતરી સૂત્રનો ઉપયોગ કરીને કરવામાં આવે છે:
જ્યાં f વજનનું ચિહ્ન છે.
સરેરાશ ઘન
સરેરાશ ઘન લાગુ પડે છે, ઉદાહરણ તરીકે, બાજુ અને સમઘનનું સરેરાશ લંબાઈ નક્કી કરતી વખતે. તે બે પ્રકારમાં વહેંચાયેલું છે.
સરેરાશ ઘન સરળ:
અંતરાલ વિતરણ શ્રેણીમાં સરેરાશ મૂલ્યો અને વિક્ષેપની ગણતરી કરતી વખતે, વિશેષતાના સાચા મૂલ્યોને અંતરાલોના કેન્દ્રિય મૂલ્યો દ્વારા બદલવામાં આવે છે, જે અંતરાલમાં સમાવિષ્ટ મૂલ્યોના અંકગણિત સરેરાશથી અલગ હોય છે. આ ભિન્નતાની ગણતરી કરતી વખતે પદ્ધતિસરની ભૂલ તરફ દોરી જાય છે. વી.એફ. શેપર્ડે નક્કી કર્યું વિચલનની ગણતરીમાં ભૂલ, જૂથબદ્ધ ડેટાના ઉપયોગને કારણે, અંતરાલના મૂલ્યના ચોરસનો 1/12 છે, ફેલાવાની તીવ્રતા વધારવાની દિશામાં અને ઘટાડવાની દિશામાં.
શેપર્ડ સુધારોજો વિતરણ સામાન્યની નજીક હોય, ભિન્નતાની સતત પ્રકૃતિ સાથેની લાક્ષણિકતા સાથે સંબંધિત હોય અને પ્રારંભિક ડેટાની નોંધપાત્ર માત્રા (n > 500) પર આધારિત હોય તો તેનો ઉપયોગ કરવો જોઈએ. જો કે, એ હકીકતના આધારે કે કેટલાક કિસ્સાઓમાં બંને ભૂલો, જુદી જુદી દિશામાં કાર્ય કરે છે, એકબીજાને વળતર આપે છે, કેટલીકવાર સુધારણા રજૂ કરવાનો ઇનકાર કરવો શક્ય છે.
વિભિન્નતા અને પ્રમાણભૂત વિચલન જેટલું નાનું હશે, તેટલી વધુ એકરૂપ વસ્તી અને વધુ લાક્ષણિક સરેરાશ હશે.
આંકડાઓની પ્રેક્ટિસમાં, ઘણી વાર વિવિધ લાક્ષણિકતાઓના ભિન્નતાઓની તુલના કરવાની જરૂર પડે છે. ઉદાહરણ તરીકે, કામદારોની ઉંમર અને તેમની લાયકાતો, સેવાની લંબાઈ અને વેતન, ખર્ચ અને નફો, સેવાની લંબાઈ અને શ્રમ ઉત્પાદકતા વગેરેની વિવિધતાઓની તુલના કરવી ખૂબ જ રસપ્રદ છે. આવી સરખામણીઓ માટે, લાક્ષણિકતાઓની સંપૂર્ણ પરિવર્તનશીલતાના સૂચકાંકો અયોગ્ય છે: કામના અનુભવની પરિવર્તનશીલતાની તુલના કરવી અશક્ય છે, જે વર્ષોમાં વ્યક્ત કરવામાં આવે છે, વેતનની વિવિધતા સાથે, રુબેલ્સમાં વ્યક્ત કરવામાં આવે છે.
આવી સરખામણીઓ હાથ ધરવા, તેમજ વિવિધ અંકગણિત સરેરાશ સાથે ઘણી વસ્તીમાં સમાન લાક્ષણિકતાની પરિવર્તનશીલતાની તુલના કરવા માટે, વિવિધતાના સંબંધિત સૂચકનો ઉપયોગ કરવામાં આવે છે - વિવિધતાના ગુણાંક.
માળખાકીય સરેરાશ
આંકડાકીય વિતરણોમાં કેન્દ્રીય વલણને લાક્ષણિકતા આપવા માટે, અંકગણિત સરેરાશ સાથે, લાક્ષણિકતા Xના ચોક્કસ મૂલ્યનો ઉપયોગ કરવો ઘણીવાર તર્કસંગત છે, જે વિતરણ શ્રેણીમાં તેના સ્થાનની ચોક્કસ વિશેષતાઓને કારણે, તેના સ્તરને લાક્ષણિકતા આપી શકે છે.
આ ખાસ કરીને મહત્વનું છે જ્યારે વિતરણ શ્રેણીમાં લાક્ષણિકતાના આત્યંતિક મૂલ્યોની અસ્પષ્ટ સીમાઓ હોય છે. આ સંદર્ભે, અંકગણિત સરેરાશનું ચોક્કસ નિર્ધારણ સામાન્ય રીતે અશક્ય અથવા ખૂબ જ મુશ્કેલ હોય છે. આવા કિસ્સાઓમાં, સરેરાશ સ્તરને લઈને નક્કી કરી શકાય છે, ઉદાહરણ તરીકે, આવર્તન શ્રેણીની મધ્યમાં સ્થિત હોય અથવા વર્તમાન શ્રેણીમાં મોટાભાગે જોવા મળે છે તે લક્ષણનું મૂલ્ય.
આવા મૂલ્યો ફક્ત ફ્રીક્વન્સીઝની પ્રકૃતિ પર આધારિત છે, એટલે કે, વિતરણની રચના પર. તેઓ ફ્રીક્વન્સીઝની શ્રેણીમાં સ્થાનમાં લાક્ષણિક છે, તેથી આવા મૂલ્યોને વિતરણના કેન્દ્રની લાક્ષણિકતાઓ તરીકે ગણવામાં આવે છે અને તેથી માળખાકીય સરેરાશની વ્યાખ્યા પ્રાપ્ત થાય છે. તેનો ઉપયોગ એટ્રિબ્યુટ મૂલ્યોની વિતરણ શ્રેણીની આંતરિક રચના અને બંધારણનો અભ્યાસ કરવા માટે થાય છે. આવા સૂચકાંકોમાં શામેલ છે:
પ્રમાણભૂત વિચલન(સમાનાર્થી: પ્રમાણભૂત વિચલન, પ્રમાણભૂત વિચલન, ચોરસ વિચલન; સંબંધિત શરતો: પ્રમાણભૂત વિચલન, પ્રમાણભૂત ફેલાવો) - સંભાવના સિદ્ધાંત અને આંકડાઓમાં, તેની ગાણિતિક અપેક્ષાને સંબંધિત રેન્ડમ ચલના મૂલ્યોના વિખેરવાનું સૌથી સામાન્ય સૂચક છે. મૂલ્યોના નમૂનાઓની મર્યાદિત એરે સાથે, ગાણિતિક અપેક્ષાને બદલે, નમૂનાઓના સમૂહના અંકગણિત સરેરાશનો ઉપયોગ થાય છે.
જ્ઞાનકોશીય YouTube
-
1 / 5
પ્રમાણભૂત વિચલન રેન્ડમ ચલના માપનના એકમોમાં માપવામાં આવે છે અને અંકગણિત સરેરાશની પ્રમાણભૂત ભૂલની ગણતરી કરતી વખતે, આત્મવિશ્વાસ અંતરાલ બાંધતી વખતે, આંકડાકીય રીતે પૂર્વધારણાઓનું પરીક્ષણ કરતી વખતે, રેન્ડમ ચલો વચ્ચેના રેખીય સંબંધને માપતી વખતે વપરાય છે. રેન્ડમ ચલના ભિન્નતાના વર્ગમૂળ તરીકે વ્યાખ્યાયિત.
માનક વિચલન:
s = n n − 1 σ 2 = 1 n − 1 ∑ i = 1 n (x i − x ¯) 2 ;- નોંધ: ઘણી વાર એમએસડી (રુટ મીન સ્ક્વેર ડેવિએશન) અને એસટીડી (સ્ટાન્ડર્ડ ડેવિએશન) ના નામોમાં તેમના સૂત્રો સાથે વિસંગતતાઓ જોવા મળે છે. ઉદાહરણ તરીકે, પાયથોન પ્રોગ્રામિંગ લેંગ્વેજના numPy મોડ્યુલમાં, std() ફંક્શનને "સ્ટાન્ડર્ડ ડેવિએશન" તરીકે વર્ણવવામાં આવ્યું છે, જ્યારે ફોર્મ્યુલા પ્રમાણભૂત વિચલન (નમૂનાના મૂળ દ્વારા વિભાજન) ને પ્રતિબિંબિત કરે છે. Excel માં, STANDARDEVAL() ફંક્શન અલગ છે (n-1 ના રુટ દ્વારા વિભાજન).
પ્રમાણભૂત વિચલન(રેન્ડમ ચલના પ્રમાણભૂત વિચલનનો અંદાજ xતેના તફાવતના નિષ્પક્ષ અંદાજ પર આધારિત તેની ગાણિતિક અપેક્ષાને સંબંધિત) s (\ ડિસ્પ્લેસ્ટાઈલ ઓ):
σ = 1 n ∑ i = 1 n (x i − x ¯) 2 .(\Displaystyle \sigma =(\sqrt ((\frac (1)(n))\sum _(i=1)^(n)\left(x_(i)-(\bar (x))\જમણે) ^(2))).) જ્યાંσ 2 (\Displaystyle \sigma ^(2)) - ફેલાવો; - x i (\displaystyle x_(i)) i પસંદગીનું તત્વ; n (\Displaystyle n)
- નમૂનાનું કદ;- નમૂનાનો અંકગણિત સરેરાશ:
x ¯ = 1 n ∑ i = 1 n x i = 1 n (x 1 + … + x n) .
(\Displaystyle (\bar (x))=(\frac (1)(n))\sum _(i=1)^(n)x_(i)=(\frac (1)(n))(x_ (1)+\ldots +x_(n)).)
(\Displaystyle (\bar (x))=(\frac (1)(n))\sum _(i=1)^(n)x_(i)=(\frac (1)(n))(x_ (1)+\ldots +x_(n)).) (એ નોંધવું જોઇએ કે બંને અંદાજો પક્ષપાતી છે. સામાન્ય કિસ્સામાં, નિષ્પક્ષ અંદાજ બાંધવો અશક્ય છે. જો કે, નિષ્પક્ષ તફાવતના અંદાજ પર આધારિત અંદાજ સુસંગત છે. GOST R 8.736-2011 અનુસાર, આ વિભાગના બીજા સૂત્રનો ઉપયોગ કરીને પ્રમાણભૂત વિચલનની ગણતરી કરવામાં આવે છે. કૃપા કરીને પરિણામો તપાસો. ત્રણ સિગ્મા નિયમ 3 σ (\displaystyle 3\sigma ) ) - સામાન્ય રીતે વિતરિત રેન્ડમ ચલના લગભગ તમામ મૂલ્યો અંતરાલમાં હોય છે(x ¯ − 3 σ; x ¯ + 3 σ) (\displaystyle \left((\bar (x))-3\sigma ;(\bar (x))+3\sigma \right))
. વધુ કડક રીતે - અંદાજે 0.9973 સંભાવના સાથે, સામાન્ય રીતે વિતરિત રેન્ડમ ચલનું મૂલ્ય નિર્દિષ્ટ અંતરાલમાં રહેલું છે (જો કે મૂલ્ય ) - સામાન્ય રીતે વિતરિત રેન્ડમ ચલના લગભગ તમામ મૂલ્યો અંતરાલમાં હોય છે x ¯ (\Displaystyle (\bar (x))) સાચું છે, અને નમૂના પ્રક્રિયાના પરિણામે પ્રાપ્ત થયું નથી).જો સાચી કિંમત અજ્ઞાત છે, તો તમારે ઉપયોગ કરવો જોઈએ નહીંσ (\ડિસ્પ્લેસ્ટાઈલ \સિગ્મા ) અજ્ઞાત છે, તો તમારે ઉપયોગ કરવો જોઈએ નહીં .
, એ
s
ઉદાહરણ તરીકે, અમારી પાસે ત્રણ નંબર સેટ છે: (0, 0, 14, 14), (0, 6, 8, 14) અને (6, 6, 8, 8). ત્રણેય સેટમાં સરેરાશ મૂલ્યો 7, અને પ્રમાણભૂત વિચલનો, અનુક્રમે, 7, 5 અને 1 ની બરાબર હોય છે. છેલ્લા સેટમાં એક નાનું પ્રમાણભૂત વિચલન હોય છે, કારણ કે સમૂહમાંના મૂલ્યો સરેરાશ મૂલ્યની આસપાસ જૂથબદ્ધ હોય છે; પ્રથમ સેટમાં સૌથી વધુ પ્રમાણભૂત વિચલન મૂલ્ય છે - સેટની અંદરના મૂલ્યો સરેરાશ મૂલ્યથી મોટા પ્રમાણમાં અલગ પડે છે.
સામાન્ય અર્થમાં, પ્રમાણભૂત વિચલનને અનિશ્ચિતતાનું માપ ગણી શકાય. ઉદાહરણ તરીકે, ભૌતિકશાસ્ત્રમાં, પ્રમાણભૂત વિચલનનો ઉપયોગ અમુક જથ્થાના ક્રમિક માપની શ્રેણીની ભૂલ નક્કી કરવા માટે થાય છે. સિદ્ધાંત દ્વારા અનુમાનિત મૂલ્યની તુલનામાં અભ્યાસ હેઠળની ઘટનાની વાજબીતા નક્કી કરવા માટે આ મૂલ્ય ખૂબ જ મહત્વપૂર્ણ છે: જો માપનું સરેરાશ મૂલ્ય સિદ્ધાંત (મોટા પ્રમાણભૂત વિચલન) દ્વારા અનુમાનિત મૂલ્યોથી ઘણું અલગ હોય, પછી પ્રાપ્ત મૂલ્યો અથવા તેમને મેળવવાની પદ્ધતિ ફરીથી તપાસવી જોઈએ. પોર્ટફોલિયો જોખમ સાથે ઓળખાય છે.
આબોહવા
ધારો કે સમાન સરેરાશ મહત્તમ દૈનિક તાપમાન ધરાવતા બે શહેરો છે, પરંતુ એક દરિયાકિનારે અને બીજું મેદાન પર સ્થિત છે. તે જાણીતું છે કે દરિયાકાંઠે સ્થિત શહેરોમાં દિવસના સમયના તાપમાનમાં ઘણા જુદા જુદા હોય છે જે અંતરિયાળ સ્થિત શહેરો કરતા ઓછા હોય છે. તેથી, દરિયાકાંઠાના શહેર માટે મહત્તમ દૈનિક તાપમાનનું પ્રમાણભૂત વિચલન બીજા શહેર કરતાં ઓછું હશે, તેમ છતાં તેનું સરેરાશ મૂલ્ય સમાન છે, જેનો વ્યવહારિક અર્થ એ છે કે કોઈ પણ દિવસે મહત્તમ હવાનું તાપમાન હોવાની સંભાવના વર્ષનું સરેરાશ મૂલ્ય કરતાં વધુ અલગ હશે, જે અંતરિયાળ સ્થિત શહેર માટે વધુ હશે.
રમતગમત
ચાલો માની લઈએ કે કેટલીક ફૂટબોલ ટીમો છે જેને અમુક પરિમાણોના સેટ પર રેટ કરવામાં આવે છે, ઉદાહરણ તરીકે, કરેલા ગોલની સંખ્યા અને સ્વીકૃત, સ્કોર કરવાની તકો વગેરે. આ જૂથની શ્રેષ્ઠ ટીમના મૂલ્યો વધુ સારી હશે તેવી સંભાવના છે. વધુ પરિમાણો પર. પ્રસ્તુત કરેલ દરેક પરિમાણો માટે ટીમનું પ્રમાણભૂત વિચલન જેટલું નાનું છે, તેટલું વધુ અનુમાનિત ટીમનું પરિણામ સંતુલિત છે; બીજી બાજુ, મોટી પ્રમાણભૂત વિચલન ધરાવતી ટીમ માટે પરિણામની આગાહી કરવી મુશ્કેલ છે, જે બદલામાં અસંતુલન દ્વારા સમજાવવામાં આવે છે, ઉદાહરણ તરીકે, મજબૂત સંરક્ષણ પરંતુ નબળા હુમલા.
ટીમના પરિમાણોના પ્રમાણભૂત વિચલનનો ઉપયોગ કરીને, એક અંશે અથવા બીજી રીતે, બે ટીમો વચ્ચેની મેચના પરિણામની આગાહી કરવી, ટીમોની શક્તિ અને નબળાઈઓનું મૂલ્યાંકન કરવું અને તેથી લડાઈની પસંદ કરેલી પદ્ધતિઓ શક્ય બનાવે છે.
પૂર્વધારણાઓના આંકડાકીય પરીક્ષણમાં, જ્યારે રેન્ડમ ચલો વચ્ચેના રેખીય સંબંધને માપવામાં આવે છે.
માનક વિચલન:
પ્રમાણભૂત વિચલન(રેન્ડમ વેરીએબલ ફ્લોરના પ્રમાણભૂત વિચલનનો અંદાજ, આપણી આસપાસની દિવાલો અને છત, xતેના તફાવતના નિષ્પક્ષ અંદાજના આધારે તેની ગાણિતિક અપેક્ષાને સંબંધિત):
વિખેરવું ક્યાં છે; - ફ્લોર, આપણી આસપાસની દિવાલો અને છત, x i (\displaystyle x_(i))પસંદગીનું તત્વ; - નમૂનાનું કદ; - નમૂનાનો અંકગણિત સરેરાશ:
એ નોંધવું જોઇએ કે બંને અંદાજો પક્ષપાતી છે. સામાન્ય કિસ્સામાં, નિષ્પક્ષ અંદાજ બાંધવો અશક્ય છે. જો કે, નિષ્પક્ષ તફાવતના અંદાજ પર આધારિત અંદાજ સુસંગત છે.
(\Displaystyle (\bar (x))=(\frac (1)(n))\sum _(i=1)^(n)x_(i)=(\frac (1)(n))(x_ (1)+\ldots +x_(n)).)
(\Displaystyle (\bar (x))=(\frac (1)(n))\sum _(i=1)^(n)x_(i)=(\frac (1)(n))(x_ (1)+\ldots +x_(n)).)() - સામાન્ય રીતે વિતરિત રેન્ડમ ચલના લગભગ તમામ મૂલ્યો અંતરાલમાં હોય છે. વધુ કડક રીતે - 99.7% કરતા ઓછા આત્મવિશ્વાસ સાથે, સામાન્ય રીતે વિતરિત રેન્ડમ ચલનું મૂલ્ય નિર્દિષ્ટ અંતરાલમાં રહેલું છે (જો કે મૂલ્ય સાચું હોય અને નમૂના પ્રક્રિયાના પરિણામે પ્રાપ્ત ન થયું હોય).
જો સાચું મૂલ્ય અજાણ્યું હોય, તો આપણે તેનો નહીં, પરંતુ ફ્લોર, આપણી આસપાસની દિવાલો અને છતનો ઉપયોગ કરવો જોઈએ, અજ્ઞાત છે, તો તમારે ઉપયોગ કરવો જોઈએ નહીં. આમ, ત્રણ સિગ્માનો નિયમ ત્રણ માળ, આપણી આસપાસની દિવાલો અને છતના નિયમમાં પરિવર્તિત થાય છે, અજ્ઞાત છે, તો તમારે ઉપયોગ કરવો જોઈએ નહીં .
, એ
મોટા પ્રમાણભૂત વિચલન મૂલ્ય સેટના સરેરાશ મૂલ્ય સાથે પ્રસ્તુત સમૂહમાં મૂલ્યોનો મોટો ફેલાવો દર્શાવે છે; એક નાનું મૂલ્ય, તે મુજબ, બતાવે છે કે સમૂહમાં મૂલ્યો મધ્યમ મૂલ્યની આસપાસ જૂથ થયેલ છે.
ઉદાહરણ તરીકે, અમારી પાસે ત્રણ નંબર સેટ છે: (0, 0, 14, 14), (0, 6, 8, 14) અને (6, 6, 8, 8). ત્રણેય સેટમાં સરેરાશ મૂલ્યો 7, અને પ્રમાણભૂત વિચલનો, અનુક્રમે, 7, 5 અને 1 ની બરાબર હોય છે. છેલ્લા સેટમાં એક નાનું પ્રમાણભૂત વિચલન હોય છે, કારણ કે સમૂહમાંના મૂલ્યો સરેરાશ મૂલ્યની આસપાસ જૂથબદ્ધ હોય છે; પ્રથમ સેટમાં સૌથી વધુ પ્રમાણભૂત વિચલન મૂલ્ય છે - સેટની અંદરના મૂલ્યો સરેરાશ મૂલ્યથી મોટા પ્રમાણમાં અલગ પડે છે.
સામાન્ય અર્થમાં, પ્રમાણભૂત વિચલનને અનિશ્ચિતતાનું માપ ગણી શકાય. ઉદાહરણ તરીકે, ભૌતિકશાસ્ત્રમાં, પ્રમાણભૂત વિચલનનો ઉપયોગ અમુક જથ્થાના ક્રમિક માપની શ્રેણીની ભૂલ નક્કી કરવા માટે થાય છે. સિદ્ધાંત દ્વારા અનુમાનિત મૂલ્યની તુલનામાં અભ્યાસ હેઠળની ઘટનાની વાજબીતા નક્કી કરવા માટે આ મૂલ્ય ખૂબ જ મહત્વપૂર્ણ છે: જો માપનું સરેરાશ મૂલ્ય સિદ્ધાંત (મોટા પ્રમાણભૂત વિચલન) દ્વારા અનુમાનિત મૂલ્યોથી ઘણું અલગ હોય, પછી પ્રાપ્ત મૂલ્યો અથવા તેમને મેળવવાની પદ્ધતિ ફરીથી તપાસવી જોઈએ.
પ્રાયોગિક એપ્લિકેશન
વ્યવહારમાં, પ્રમાણભૂત વિચલન તમને નિર્ધારિત કરવાની મંજૂરી આપે છે કે સેટમાંના મૂલ્યો સરેરાશ મૂલ્યથી કેટલા અલગ હોઈ શકે છે.
આબોહવા
ધારો કે સમાન સરેરાશ મહત્તમ દૈનિક તાપમાન ધરાવતા બે શહેરો છે, પરંતુ એક દરિયાકિનારે સ્થિત છે અને બીજું અંતરિયાળ છે. તે જાણીતું છે કે દરિયાકાંઠે સ્થિત શહેરોમાં દિવસના સમયના તાપમાનમાં ઘણા જુદા જુદા હોય છે જે અંતરિયાળ સ્થિત શહેરો કરતા ઓછા હોય છે. તેથી, દરિયાકાંઠાના શહેર માટે મહત્તમ દૈનિક તાપમાનનું પ્રમાણભૂત વિચલન બીજા શહેર કરતાં ઓછું હશે, તેમ છતાં તેનું સરેરાશ મૂલ્ય સમાન છે, જેનો વ્યવહારિક અર્થ એ છે કે કોઈ પણ દિવસે મહત્તમ હવાનું તાપમાન હોવાની સંભાવના વર્ષનું સરેરાશ મૂલ્ય કરતાં વધુ અલગ હશે, જે અંતરિયાળ સ્થિત શહેર માટે વધુ હશે.
રમતગમત
ચાલો માની લઈએ કે કેટલીક ફૂટબોલ ટીમો છે જેને અમુક પરિમાણોના સેટ પર રેટ કરવામાં આવે છે, ઉદાહરણ તરીકે, કરેલા ગોલની સંખ્યા અને સ્વીકૃત, સ્કોર કરવાની તકો વગેરે. આ જૂથની શ્રેષ્ઠ ટીમના મૂલ્યો વધુ સારી હશે તેવી સંભાવના છે. વધુ પરિમાણો પર. પ્રસ્તુત કરેલ દરેક પરિમાણો માટે ટીમનું પ્રમાણભૂત વિચલન જેટલું નાનું છે, તેટલું વધુ અનુમાનિત ટીમનું પરિણામ સંતુલિત છે; બીજી બાજુ, મોટી પ્રમાણભૂત વિચલન ધરાવતી ટીમ માટે પરિણામની આગાહી કરવી મુશ્કેલ છે, જે બદલામાં અસંતુલન દ્વારા સમજાવવામાં આવે છે, ઉદાહરણ તરીકે, મજબૂત સંરક્ષણ પરંતુ નબળા હુમલા.
ટીમના પરિમાણોના પ્રમાણભૂત વિચલનનો ઉપયોગ કરીને, એક અંશે અથવા બીજી રીતે, બે ટીમો વચ્ચેની મેચના પરિણામની આગાહી કરવી, ટીમોની શક્તિ અને નબળાઈઓનું મૂલ્યાંકન કરવું અને તેથી લડાઈની પસંદ કરેલી પદ્ધતિઓ શક્ય બનાવે છે.
ટેકનિકલ વિશ્લેષણ
પણ જુઓ
સાહિત્ય
આ લેખ કાઢી નાખવાની દરખાસ્ત છે. કારણોની સમજૂતી અને અનુરૂપ ચર્ચા પૃષ્ઠ પર મળી શકે છે વિકિપીડિયા: કાઢી નાખવામાં આવશે/ડિસેમ્બર 17, 2012.
જ્યારે ચર્ચા પ્રક્રિયા પૂર્ણ થઈ નથી, ત્યારે તમે લેખને સુધારવાનો પ્રયાસ કરી શકો છો, પરંતુ તમારે સામગ્રીનું નામ બદલવા અથવા કાઢી નાખવાનું ટાળવું જોઈએ, વધુ વિગતો માટે આગળની ક્રિયા માર્ગદર્શિકા જુઓ.
ચર્ચાના અંત સુધી કાઢી નાખવા માટેના ચિહ્નને દૂર કરશો નહીં. સંચાલકો: અહીં લિંક્સ, ઇતિહાસ (છેલ્લે સંશોધિત), લોગ, કાઢી નાખો.* બોરોવિકોવ, વી.આંકડા. કમ્પ્યુટર પર ડેટા વિશ્લેષણની કળા: વ્યાવસાયિકો માટે / વી. બોરોવિકોવ. - સેન્ટ પીટર્સબર્ગ. : પીટર, 2003. - 688 પૃ. - ISBN 5-272-00078-1.
આંકડાકીય સૂચકાંકો વર્ણનાત્મક
આંકડાસતત
ડેટાશીયર ફેક્ટર સરેરાશ (અંકગણિત, ભૌમિતિક, હાર્મોનિક) મધ્ય મોડ શ્રેણી ભિન્નતા રેન્ક · પ્રમાણભૂત વિચલન· વિવિધતાના ગુણાંક · ક્વોન્ટાઇલ (ડેસિલ, પર્સેન્ટાઇલ/પર્સેન્ટાઇલ/સેન્ટાઇલ) પળો અપેક્ષા · ભિન્નતા · વિકૃતિ · કુર્ટોસિસ અલગ
ડેટાઆવર્તન · આકસ્મિક કોષ્ટક આંકડાકીય
આઉટપુટ અને
પરીક્ષા
પૂર્વધારણાઓઆંકડાકીય
નિષ્કર્ષઆત્મવિશ્વાસ અંતરાલ (ફ્રિક્વન્ટિસ્ટ પ્રોબેબિલિટી) વિશ્વસનીયતા અંતરાલ (બેયેશિયન અનુમાન) આંકડાકીય મહત્વ મેટા-વિશ્લેષણ આયોજન
પ્રયોગવસ્તી · નમૂના ડિઝાઇન · વિસ્તાર નમૂના · પ્રતિકૃતિ · ક્લસ્ટરિંગ · સંવેદનશીલતા અને વિશિષ્ટતા નમૂનાનું કદ આંકડાકીય શક્તિ · અસરનું માપ · પ્રમાણભૂત ભૂલ એકંદરે રેટિંગ બાયસિયન ઉકેલ અંદાજ ·