શોટ દરમિયાન હિટની સંભાવના વિશે સમસ્યાઓનું નિરાકરણ. ઘટનાની સંભાવના અને આંકડાકીય વિતરણ નક્કી કરવું

માપદંડનું વર્ણન

માપદંડનો હેતુ

પીયર્સનની ચી-સ્ક્વેર ટેસ્ટ

વ્યાખ્યાન સામગ્રી

વિષય 6. લક્ષણના વિતરણમાં તફાવતોને ઓળખવા

પીયર્સન માપદંડ: માપદંડનો હેતુ, તેનું વર્ણન, એપ્લિકેશનનો અવકાશ, ગણતરી અલ્ગોરિધમ.

પરિણામોની સરખામણી કરવા માટે કોલમોગોરોવ-સ્મિર્નોવ ટેસ્ટ માત્રાત્મક માપન: માપદંડનો હેતુ, તેનું વર્ણન, અવકાશ, ગણતરી અલ્ગોરિધમ.

આ વિષયનો અભ્યાસ કરતી વખતે, તે ધ્યાનમાં લેવું જરૂરી છે કે બંને માપદંડ નોનપેરામેટ્રિક છે તેઓ ફ્રીક્વન્સીઝ સાથે કાર્ય કરે છે. કૃપા કરીને ચૂકવણી કરો ખાસ ધ્યાનગણવામાં માપદંડ માટે નિર્ણય નિયમો પર: આ નિયમો વિરુદ્ધ હોઈ શકે છે. કૃપા કરીને માપદંડની અરજીમાં મર્યાદાઓની કાળજીપૂર્વક સમીક્ષા કરો.

વ્યાખ્યાન સામગ્રીનો અભ્યાસ કર્યા પછી, જવાબ આપો પ્રશ્નો પર નિયંત્રણ રાખો, તમારી નોંધોમાં તમારા જવાબો લખો.

પીયર્સન ચી-સ્ક્વેર ટેસ્ટ વિતરણની સરખામણી સહિત અનેક સમસ્યાઓનું નિરાકરણ લાવી શકે છે.

χ 2 પરીક્ષણનો ઉપયોગ બે હેતુઓ માટે થાય છે;

1) સરખામણી માટે પ્રયોગમૂલકસાથે લાક્ષણિકતાનું વિતરણ સૈદ્ધાંતિક -સમાન, સામાન્ય અથવા અન્યથા;

2) સરખામણી માટે બે, ત્રણ અથવા વધુ પ્રયોગમૂલકસમાન લાક્ષણિકતાના વિતરણો, એટલે કે, તેમની એકરૂપતા તપાસવા માટે;

3) સિસ્ટમમાં સ્ટોકેસ્ટિક (સંભવિત) સ્વતંત્રતાનું મૂલ્યાંકન કરવું રેન્ડમ ઘટનાઓવગેરે

χ 2 માપદંડ એ પ્રશ્નનો જવાબ આપે છે કે શું તેઓ સમાન આવર્તન સાથે થાય છે વિવિધ અર્થોસાઇન ઇન પ્રયોગમૂલક અને સૈદ્ધાંતિક વિતરણોઅથવા બે અથવા વધુ પ્રયોગમૂલક વિતરણોમાં.

પદ્ધતિનો ફાયદો એ છે કે તે નામોના સ્કેલથી શરૂ કરીને, કોઈપણ સ્કેલ પર પ્રસ્તુત સુવિધાઓના વિતરણની તુલના કરવાની મંજૂરી આપે છે. ખૂબ માં સરળ કેસવૈકલ્પિક વિતરણ ("હા - ના", "ખામીને મંજૂરી આપી - ખામીને મંજૂરી આપી નથી", "સમસ્યા હલ કરી - સમસ્યા હલ કરી નથી", વગેરે), અમે પહેલેથી જ χ 2 માપદંડ લાગુ કરી શકીએ છીએ.

1. નમૂનાનું કદ પૂરતું મોટું હોવું જોઈએ: N>30. જ્યારે એન<30 критерий χ 2 дает весьма приближенные значения. Точность крите­рия повышается при больших N.

2. દરેક કોષ્ટક કોષ માટે સૈદ્ધાંતિક આવર્તન 5: f ≥ 5 કરતા ઓછી ન હોવી જોઈએ . આનો અર્થ એ થયો કે જો અંકોની સંખ્યા પૂર્વનિર્ધારિત હોય અને બદલી શકાતી નથી, તો આપણે χ 2 પદ્ધતિ લાગુ કરી શકતા નથી. , અવલોકનોની ચોક્કસ લઘુત્તમ સંખ્યા એકઠા કર્યા વિના. જો, ઉદાહરણ તરીકે, અમે અમારી ધારણાઓને ચકાસવા માગીએ છીએ કે ટ્રસ્ટ ટેલિફોન સેવા પર કૉલ્સની આવર્તન અઠવાડિયાના 7 દિવસમાં અસમાન રીતે વિતરિત કરવામાં આવે છે, તો અમને 5-7 = 35 કૉલ્સની જરૂર પડશે. આમ, જો અંકોની સંખ્યા (k)અગાઉથી આપેલ છે, જેમ કે આ કિસ્સામાં, અવલોકનોની ન્યૂનતમ સંખ્યા (N મિનિટ) સૂત્ર દ્વારા નક્કી કરવામાં આવે છે: .



3. પસંદ કરેલ શ્રેણીઓએ સમગ્ર વિતરણને "સ્કૂપ આઉટ" કરવું જોઈએ, એટલે કે, લાક્ષણિકતાઓની વિવિધતાની સમગ્ર શ્રેણીને આવરી લેવી જોઈએ. આ કિસ્સામાં, વર્ગોમાં જૂથીકરણ તમામ તુલનાત્મક વિતરણોમાં સમાન હોવું જોઈએ.

4. માત્ર 2 મૂલ્યો લેતી સુવિધાઓના વિતરણની સરખામણી કરતી વખતે "સતત સુધારણા" કરવી જરૂરી છે. કરેક્શન કરતી વખતે, χ 2 નું મૂલ્ય ઘટે છે (સતત સુધારણા સાથેનું ઉદાહરણ જુઓ).

5. શ્રેણીઓ બિન-ઓવરલેપિંગ હોવી જોઈએ: જો કોઈ અવલોકન એક શ્રેણીને સોંપવામાં આવે છે, તો તે હવે અન્ય કોઈપણ શ્રેણીને સોંપી શકાશે નહીં. રેન્ક દ્વારા અવલોકનોનો સરવાળો હંમેશા અવલોકનોની કુલ સંખ્યા જેટલો હોવો જોઈએ.

χ 2 માપદંડની ગણતરી માટે અલ્ગોરિધમ

1. નીચેના પ્રકારનાં લક્ષણ મૂલ્યોના પરસ્પર જોડાણનું કોષ્ટક બનાવો (આવશ્યક રીતે, આ એક દ્વિ-પરિમાણીય વિવિધતા શ્રેણી છે જેમાં સંયુક્ત લક્ષણ મૂલ્યોની ઘટનાની આવર્તન દર્શાવેલ છે) - કોષ્ટક 19. કોષ્ટકમાં શામેલ છે શરતી ફ્રીક્વન્સીઝ, જેને આપણે સામાન્ય શબ્દોમાં f ij તરીકે દર્શાવીશું. ઉદાહરણ તરીકે, લાક્ષણિકતાના ગ્રેડેશનની સંખ્યા એક્સ 3 (k=3) બરાબર છે, લાક્ષણિકતાના ક્રમાંકની સંખ્યા ખાતેબરાબર 4 (m=4); પછી i 1 થી k સુધી બદલાય છે, અને j 1 થી m સુધી બદલાય છે.

કોષ્ટક 19

x i y j x 1 x 2 x 3
1 પર f 11 f 21 f 31 f -1
2 પર f 12 f 22 f 32 f -2
3 પર f 13 f 23 f 33 f -3
4 પર f 14 f 24 f 34 f -4
f 1- f 2- f 3- એન

2. આગળ, ગણતરીની સગવડ માટે, અમે પરસ્પર આકસ્મિકતાના મૂળ કોષ્ટકને નીચેના સ્વરૂપના કોષ્ટકમાં રૂપાંતરિત કરીએ છીએ (કોષ્ટક 20), શરતી ફ્રીક્વન્સી સાથે કૉલમને એકની નીચે મૂકીને: કોષ્ટકમાં શ્રેણીઓના નામ દાખલ કરો (કૉલમ 1 અને 2) અને અનુરૂપ પ્રયોગમૂલક ફ્રીક્વન્સીઝ (3જી કૉલમ ).

કોષ્ટક 20

x i y જે f ij f ij * f ij - f ij * (f ij – f ij *) 2 (f ij – f ij *) 2 / f ij *
1 2 3 4 5 6 7
x 1 1 પર f 11 f 11*
x 1 2 પર f 12 f 12*
x 1 3 પર f 13 f 13*
x 1 4 પર f 14 f 14*
x 2 1 પર f 21 f 21 *
x 2 2 પર f 22 f 22 *
x 2 3 પર f 23 f 23 *
x 2 4 પર f 24 f 24 *
x 3 1 પર f 31 f 31 *
x 3 2 પર f 32 f 32 *
x 3 3 પર f 33 f 33 *
x 3 4 પર f 34 f 34*
∑=………….

3. દરેક પ્રયોગમૂલક આવર્તનની બાજુમાં, સૈદ્ધાંતિક આવર્તન (4 થી સ્તંભ) લખો, જેની ગણતરી નીચેના સૂત્રનો ઉપયોગ કરીને કરવામાં આવે છે (સંબંધિત રેખામાંની કુલ ફ્રીક્વન્સીને અનુરૂપ સ્તંભની કુલ આવર્તન દ્વારા ગુણાકાર કરવામાં આવે છે અને કુલ સંખ્યા વડે ભાગવામાં આવે છે. અવલોકનો):

5. સૂત્રનો ઉપયોગ કરીને સ્વતંત્રતાની ડિગ્રીની સંખ્યા નક્કી કરો: ν=(k-1)(m-1) , જ્યાં k-વિશેષતા અંકોની સંખ્યા એક્સ, m - ચિહ્નના અંકોની સંખ્યા ખાતે.

જો ν=1 હોય, તો "સતતતા" માટે સુધારો કરો અને તેને કૉલમ 5a માં લખો.

સાતત્ય સુધારણામાં શરતી અને સૈદ્ધાંતિક આવર્તન વચ્ચેના તફાવતમાંથી અન્ય 0.5 બાદબાકીનો સમાવેશ થાય છે. પછી અમારા કોષ્ટકમાં કૉલમ હેડિંગ આના જેવો દેખાશે (કોષ્ટક 21):

કોષ્ટક 21

એક્સ ખાતે f ij f ij * f ij - f ij * f ij – f ij * – 0.5 (f ij – f ij * – 0.5) 2 (f ij – f ij * – 0.5) 2 / f ij *
1 2 3 4 5 5a 6 7

6. પરિણામી તફાવતોને ચોરસ કરો અને તેમને 6ઠ્ઠી કૉલમમાં દાખલ કરો.

7. પરિણામી ચોરસ તફાવતોને સૈદ્ધાંતિક આવર્તન દ્વારા વિભાજીત કરો અને 7મી કૉલમમાં પરિણામો લખો.

8. 7મી કૉલમના મૂલ્યોનો સરવાળો કરો. પરિણામી રકમ χ 2 em તરીકે નિયુક્ત કરવામાં આવી છે.

9. નિર્ણય નિયમ:

માપદંડના ગણતરી કરેલ મૂલ્યની તુલના જટિલ (અથવા ટેબ્યુલેટેડ) મૂલ્ય સાથે કરવી આવશ્યક છે. નિર્ણાયક મૂલ્ય પીયર્સન χ 2 માપદંડના નિર્ણાયક મૂલ્યોના કોષ્ટક અનુસાર સ્વતંત્રતાની ડિગ્રીની સંખ્યા પર આધારિત છે (જુઓ પરિશિષ્ટ 1.6).

જો χ 2 calc ≥ χ 2 કોષ્ટક હોય, તો વિતરણો વચ્ચેની વિસંગતતા આંકડાકીય રીતે નોંધપાત્ર છે, અથવા લાક્ષણિકતાઓ સતત બદલાતી રહે છે, અથવા લાક્ષણિકતાઓ વચ્ચેનો સંબંધ આંકડાકીય રીતે નોંધપાત્ર છે.

જો χ 2 ની ગણતરી કરવામાં આવે< χ 2 табл, то расхождения между рас­пределениями статистически недостоверны, или признаки изменяются несогласованно, или связи между признаками нет.

23. ચી-સ્ક્વેર અને વિદ્યાર્થી વિતરણનો ખ્યાલ અને ગ્રાફિકલ વ્યૂ

1) સ્વતંત્રતાના n ડિગ્રી સાથેનું વિતરણ (ચી-ચોરસ) એ n સ્વતંત્ર માનક સામાન્ય રેન્ડમ ચલોના વર્ગોના સરવાળાનું વિતરણ છે.

વિતરણ (ચી-ચોરસ)- વિતરણ રેન્ડમ ચલ(અને તે દરેકની ગાણિતિક અપેક્ષા 0 છે, અને પ્રમાણભૂત વિચલન 1 છે)

રેન્ડમ ચલો ક્યાં છે સ્વતંત્ર અને સમાન વિતરણ છે. આ કિસ્સામાં, શરતોની સંખ્યા, એટલે કે, ચી-સ્ક્વેર વિતરણની "સ્વતંત્રતાની ડિગ્રીની સંખ્યા" કહેવાય છે. ચી-સ્ક્વેર નંબર એક પરિમાણ દ્વારા નક્કી કરવામાં આવે છે, સ્વતંત્રતાની ડિગ્રીની સંખ્યા. સ્વતંત્રતાની ડિગ્રીની સંખ્યામાં વધારો થતાં, વિતરણ ધીમે ધીમે સામાન્યની નજીક આવે છે.

પછી તેમના ચોરસનો સરવાળો

સ્વતંત્રતાના k = n ડિગ્રી સાથે કહેવાતા ચી-સ્ક્વેર કાયદા અનુસાર વિતરિત કરાયેલ રેન્ડમ ચલ છે; જો શબ્દો અમુક સંબંધ દ્વારા સંબંધિત હોય (ઉદાહરણ તરીકે, ), તો સ્વતંત્રતાની ડિગ્રીની સંખ્યા k = n – 1.

આ વિતરણની ઘનતા

અહીં - ગામા કાર્ય; ખાસ કરીને, Г(n + 1) = n! .

તેથી, ચી-સ્ક્વેર વિતરણ એક પરિમાણ દ્વારા નક્કી કરવામાં આવે છે - સ્વતંત્રતા k ની ડિગ્રીની સંખ્યા.

ટિપ્પણી 1. જેમ જેમ સ્વતંત્રતાની ડિગ્રીની સંખ્યામાં વધારો થાય છે તેમ, ચી-સ્ક્વેર વિતરણ ધીમે ધીમે સામાન્યની નજીક આવે છે.

રિમાર્ક 2. ચી-સ્ક્વેર ડિસ્ટ્રિબ્યુશનનો ઉપયોગ કરીને, વ્યવહારમાં જોવા મળતા અન્ય ઘણા વિતરણો નક્કી કરવામાં આવે છે, ઉદાહરણ તરીકે, રેન્ડમ ચલનું વિતરણ - રેન્ડમ વેક્ટરની લંબાઈ (X1, X2,..., Xn), કોઓર્ડિનેટ્સ જે સ્વતંત્ર છે અને સામાન્ય કાયદા અનુસાર વિતરિત કરવામાં આવે છે.

આર. હેલ્મર્ટ (1876) અને કે. પીયર્સન (1900) દ્વારા χ2 વિતરણની પ્રથમ વિચારણા કરવામાં આવી હતી.

Math.expect.=n; D=2n

2) વિદ્યાર્થી વિતરણ

બે સ્વતંત્ર રેન્ડમ ચલોને ધ્યાનમાં લો: Z, જેનું સામાન્ય વિતરણ છે અને સામાન્યકૃત છે (એટલે ​​​​કે, M(Z) = 0, σ(Z) = 1), અને V, જે k સાથે ચી-સ્ક્વેર કાયદા અનુસાર વિતરિત કરવામાં આવે છે. સ્વતંત્રતાની ડિગ્રી. પછી મૂલ્ય

સ્વતંત્રતાના k ડિગ્રી સાથે ટી-વિતરણ અથવા વિદ્યાર્થી વિતરણ તરીકે ઓળખાતું વિતરણ ધરાવે છે. આ કિસ્સામાં, k ને વિદ્યાર્થી વિતરણની "સ્વતંત્રતાની ડિગ્રીની સંખ્યા" કહેવામાં આવે છે.

જેમ જેમ સ્વતંત્રતાની ડિગ્રીની સંખ્યામાં વધારો થાય છે તેમ, વિદ્યાર્થીઓનું વિતરણ ઝડપથી સામાન્ય થાય છે.

આ વિતરણ 1908 માં અંગ્રેજી આંકડાશાસ્ત્રી ડબલ્યુ. ગોસેટ દ્વારા રજૂ કરવામાં આવ્યું હતું, જેઓ બિયર ફેક્ટરીમાં કામ કરતા હતા. આ ફેક્ટરીમાં આર્થિક અને તકનીકી નિર્ણયો લેવા માટે સંભવિત અને આંકડાકીય પદ્ધતિઓનો ઉપયોગ કરવામાં આવ્યો હતો, તેથી તેના મેનેજમેન્ટે વી. ગોસેટને તેમના પોતાના નામ હેઠળ વૈજ્ઞાનિક લેખો પ્રકાશિત કરવાની મનાઈ ફરમાવી હતી. આ રીતે, વી. ગોસેટ દ્વારા વિકસિત સંભવિત અને આંકડાકીય પદ્ધતિઓના સ્વરૂપમાં વેપારના રહસ્યો અને "જાણવું" સુરક્ષિત કરવામાં આવ્યું હતું. જો કે, તેમને "વિદ્યાર્થી" ઉપનામ હેઠળ પ્રકાશિત કરવાની તક મળી. ગોસેટ-સ્ટુડન્ટ વાર્તા દર્શાવે છે કે સો વર્ષ પહેલાં પણ, યુકેના સંચાલકો નિર્ણય લેવાની સંભવિત અને આંકડાકીય પદ્ધતિઓની વધુ આર્થિક કાર્યક્ષમતાથી વાકેફ હતા.

ચી-ચોરસબે વર્ગીકૃત ચલો વચ્ચેના સંબંધના મહત્વને ચકાસવા માટે પીયર્સન એ સૌથી સરળ કસોટી છે. પીયર્સન માપદંડ એ હકીકત પર આધારિત છે કે બે-ઇનપુટ કોષ્ટકમાં અપેક્ષિતપૂર્વધારણા હેઠળ ફ્રીક્વન્સીઝ "ચલો વચ્ચે કોઈ અવલંબન નથી" સીધી ગણતરી કરી શકાય છે. કલ્પના કરો કે 20 પુરુષો અને 20 સ્ત્રીઓને સ્પાર્કલિંગ વોટર (બ્રાન્ડ અથવા બ્રાન્ડ બી). જો પસંદગી અને લિંગ વચ્ચે કોઈ જોડાણ નથી, તો સ્વાભાવિક રીતે અપેક્ષાબ્રાન્ડની સમાન પસંદગી અને બ્રાન્ડ્સ બીદરેક લિંગ માટે.

આંકડાઓનો અર્થ ચી-ચોરસઅને તેનું મહત્વનું સ્તર અવલોકનોની કુલ સંખ્યા અને કોષ્ટકમાં કોષોની સંખ્યા પર આધારિત છે. વિભાગમાં ચર્ચા કરેલ સિદ્ધાંતો અનુસાર , જો અવલોકનોની સંખ્યા મોટી હોય તો અપેક્ષિત ફ્રીક્વન્સીઝના પ્રમાણમાં નાના વિચલનો નોંધપાત્ર સાબિત થશે.

માપદંડનો ઉપયોગ કરવામાં માત્ર એક નોંધપાત્ર મર્યાદા છે ચી-ચોરસ(અવલોકનોની અવ્યવસ્થિત પસંદગીની સ્પષ્ટ ધારણા સિવાય), જે એ છે કે અપેક્ષિત ફ્રીક્વન્સીઝ બહુ નાની ન હોવી જોઈએ. આ એ હકીકતને કારણે છે કે માપદંડ ચી-ચોરસસ્વભાવની તપાસ દ્વારા સંભાવનાઓદરેક કોષમાં; અને જો કોષોમાં અપેક્ષિત ફ્રીક્વન્સીઝ નાની થઈ જાય, ઉદાહરણ તરીકે 5 કરતાં ઓછી, તો ઉપલબ્ધ ફ્રીક્વન્સીઝનો ઉપયોગ કરીને આ સંભાવનાઓનો પૂરતી ચોકસાઈ સાથે અંદાજ લગાવી શકાતો નથી. વધુ ચર્ચા માટે, Everitt (1977), Hays (1988), અથવા Kendall and Stuart (1979) જુઓ.

ચી-સ્ક્વેર ટેસ્ટ (મહત્તમ સંભાવના પદ્ધતિ).મહત્તમ સંભાવના ચી-ચોરસમાપદંડ તરીકે આકસ્મિક કોષ્ટકોમાં સંબંધો સંબંધિત સમાન પૂર્વધારણાને ચકાસવાનો હેતુ છે ચી-ચોરસપીયર્સન. જો કે, તેની ગણતરી મહત્તમ સંભાવના પદ્ધતિ પર આધારિત છે. વ્યવહારમાં, એમપી આંકડા ચી-ચોરસનિયમિત પીયર્સન આંકડાની તીવ્રતામાં ખૂબ નજીક ચી-ચોરસ. આ આંકડાઓ વિશે વધુ માહિતી Bishop, Fienberg, and Holland (1975) અથવા Fienberg (1977) માં મળી શકે છે. પ્રકરણમાં લૉગલાઇનર વિશ્લેષણઆ આંકડાઓની વધુ વિગતવાર ચર્ચા કરવામાં આવી છે.

યેટ્સનો સુધારો.આંકડાઓનો અંદાજ ચી-ચોરસકોષોમાં નાની સંખ્યામાં અવલોકનો સાથેના 2x2 કોષ્ટકો માટે વર્ગીકરણ પહેલાં અપેક્ષિત અને અવલોકન કરેલ ફ્રીક્વન્સીઝ વચ્ચેના તફાવતના ચોક્કસ મૂલ્યને 0.5 સુધી ઘટાડીને સુધારી શકાય છે (કહેવાતા યેટ્સ સુધારો). યેટ્સ કરેક્શન, જે અંદાજને વધુ મધ્યમ બનાવે છે, તે સામાન્ય રીતે એવા કિસ્સાઓમાં લાગુ કરવામાં આવે છે કે જ્યાં કોષ્ટકોમાં માત્ર નાની ફ્રીક્વન્સી હોય છે, ઉદાહરણ તરીકે, જ્યારે કેટલીક અપેક્ષિત ફ્રીક્વન્સી 10 કરતા ઓછી થઈ જાય છે (વધુ ચર્ચા માટે જુઓ, Conover, 1974; Everitt, 1977; Hays , 1988; કેન્ડલ અને સ્ટુઅર્ટ, 1979 અને મેન્ટેલ, 1974).

ફિશરની ચોક્કસ કસોટી.આ માપદંડ માત્ર 2x2 કોષ્ટકો માટે જ લાગુ પડે છે. માપદંડ નીચેના તર્ક પર આધારિત છે. કોષ્ટકમાં સીમાંત આવર્તન જોતાં, ધારો કે બંને ટેબ્યુલેટેડ ચલો સ્વતંત્ર છે. ચાલો આપણે આપણી જાતને પ્રશ્ન પૂછીએ: આપેલ સીમાંત રાશિઓના આધારે, કોષ્ટકમાં જોવાયેલી ફ્રીક્વન્સીઝ મેળવવાની સંભાવના શું છે? તે તારણ આપે છે કે આ સંભાવનાની ગણતરી કરવામાં આવે છે બરાબરસીમાંત રાશિઓના આધારે બનાવી શકાય તેવા તમામ કોષ્ટકોની ગણતરી. આમ, ફિશરનો માપદંડ ગણતરી કરે છે ચોક્કસનલ પૂર્વધારણા હેઠળ અવલોકન કરેલ ફ્રીક્વન્સીઝની ઘટનાની સંભાવના (ટેબ્યુલેટેડ ચલો વચ્ચે કોઈ સંબંધ નથી). પરિણામોનું કોષ્ટક એકતરફી અને બે બાજુના સ્તરો દર્શાવે છે.

મેકનેમર ચી-સ્ક્વેર.જ્યારે 2x2 કોષ્ટકમાં ફ્રીક્વન્સીઝ દર્શાવે છે ત્યારે આ માપદંડ લાગુ થાય છે આશ્રિતનમૂનાઓ ઉદાહરણ તરીકે, પ્રયોગ પહેલાં અને પછી સમાન વ્યક્તિઓના અવલોકનો. ખાસ કરીને, તમે સેમેસ્ટરની શરૂઆતમાં અને અંતે ગણિતમાં ન્યૂનતમ સિદ્ધિ ધરાવતા વિદ્યાર્થીઓની સંખ્યા અથવા જાહેરાત પહેલાં અને પછી સમાન ઉત્તરદાતાઓની પસંદગીઓની ગણતરી કરી શકો છો. બે મૂલ્યોની ગણતરી કરવામાં આવે છે ચી-ચોરસ: A/Dઅને B/C. A/D ચી-ચોરસકોષોમાં ફ્રીક્વન્સીઝની પૂર્વધારણાનું પરીક્ષણ કરે છે અને ડી(ઉપર ડાબે, નીચે જમણે) સમાન છે. B/C ચી-સ્ક્વેરકોષોમાં ફ્રીક્વન્સીઝની સમાનતા વિશેની પૂર્વધારણાનું પરીક્ષણ કરે છે બીઅને સી(ઉપર જમણે, નીચે ડાબે).

ફી ગુણાંક.ફી ચોરસ 2x2 કોષ્ટકમાં બે ચલો વચ્ચેના સંબંધનું માપ દર્શાવે છે. તેના મૂલ્યો અલગ અલગ હોય છે 0 (ચલો વચ્ચે કોઈ અવલંબન નથી; ચી-ચોરસ = 0.0 ) પહેલાં 1 (કોષ્ટકમાંના બે પરિબળો વચ્ચેનો સંપૂર્ણ સંબંધ). વિગતો માટે, કેસ્ટેલન અને સિગેલ (1988, પૃષ્ઠ 232) જુઓ.

ટેટ્રાકોરિક સહસંબંધ.આ આંકડાની ગણતરી માત્ર 2x2 ક્રોસસ્ટેબ્યુલેશન કોષ્ટકો પર કરવામાં આવે છે (અને લાગુ કરવામાં આવે છે). જો 2x2 કોષ્ટકને બે વર્ગોમાં બે સતત ચલોના મૂલ્યોના (કૃત્રિમ) વિભાજનના પરિણામ તરીકે જોઈ શકાય છે, તો ટેટ્રાકોરિક સહસંબંધ ગુણાંક આપણને આ બે ચલો વચ્ચેના સંબંધનો અંદાજ કાઢવાની મંજૂરી આપે છે.

જોડાણ ગુણાંક.આકસ્મિક ગુણાંક આંકડાકીય રીતે આધારિત છે ચી-ચોરસઆકસ્મિક કોષ્ટકમાં લક્ષણોના સંબંધનું માપ (પિયર્સન દ્વારા પ્રસ્તાવિત). પરંપરાગત આંકડાઓ પર આ ગુણાંકનો ફાયદો ચી-ચોરસઅર્થઘટન કરવું સરળ છે, કારણ કે તેના ફેરફારની શ્રેણી થી રેન્જમાં છે 0 પહેલાં 1 (જ્યાં 0 કોષ્ટકમાં લાક્ષણિકતાઓની સ્વતંત્રતાના કેસને અનુરૂપ છે, અને ગુણાંકમાં વધારો જોડાણની ડિગ્રીમાં વધારો દર્શાવે છે). આકસ્મિક ગુણાંકનો ગેરલાભ એ છે કે તેનું મહત્તમ મૂલ્ય કોષ્ટકના કદ પર "આધારિત" છે. વર્ગોની સંખ્યા મર્યાદિત ન હોય તો જ આ ગુણાંક 1 ના મૂલ્ય સુધી પહોંચી શકે છે (જુઓ સીગેલ, 1956, પૃષ્ઠ 201).

સંચાર પગલાંનું અર્થઘટન.જોડાણના માપદંડોની નોંધપાત્ર ખામી (ઉપર ચર્ચા કરવામાં આવી છે) એ સંભવના પરંપરાગત દ્રષ્ટિએ અથવા "વિવિધતાના પ્રમાણને સમજાવેલ" માં અર્થઘટન કરવામાં મુશ્કેલી છે, જેમ કે સહસંબંધ ગુણાંકના કિસ્સામાં. આરપીયર્સન (જુઓ સહસંબંધ). તેથી, કોઈ સામાન્ય રીતે સ્વીકૃત માપદંડ અથવા જોડાણનું ગુણાંક નથી.

રેન્ક પર આધારિત આંકડા.વ્યવહારમાં ઉદભવતી ઘણી સમસ્યાઓમાં, અમારી પાસે માત્ર માપન છે ક્રમબદ્ધ સ્કેલ (જુઓ આંકડાઓની મૂળભૂત વિભાવનાઓ). આ ખાસ કરીને મનોવિજ્ઞાન, સમાજશાસ્ત્ર અને માણસના અભ્યાસ સાથે સંબંધિત અન્ય વિદ્યાશાખાઓના ક્ષેત્રના માપને લાગુ પડે છે. ધારો કે તમે ચોક્કસ રમતો પ્રત્યેના તેમના વલણને જાણવા માટે સંખ્યાબંધ ઉત્તરદાતાઓની મુલાકાત લીધી. તમે નીચેની સ્થિતિઓ સાથે સ્કેલ પર માપનું પ્રતિનિધિત્વ કરો છો: (1) હંમેશા, (2) સામાન્ય રીતે, (3) ક્યારેકઅને (4) ક્યારેય. દેખીતી રીતે જવાબ ક્યારેક મને આશ્ચર્ય થાય છેજવાબ કરતાં પ્રતિવાદીનો ઓછો રસ દર્શાવે છે મને સામાન્ય રીતે રસ છેવગેરે આમ, ઉત્તરદાતાઓની રુચિની ડિગ્રીનો ઓર્ડર (ક્રમ) કરવો શક્ય છે. આ ઓર્ડિનલ સ્કેલનું એક વિશિષ્ટ ઉદાહરણ છે. ઑર્ડિનલ સ્કેલ પર માપવામાં આવતા ચલો તેમના પોતાના પ્રકારના સહસંબંધો ધરાવે છે જે વ્યક્તિને નિર્ભરતાનું મૂલ્યાંકન કરવાની મંજૂરી આપે છે.

આર સ્પીયરમેન.આંકડા આરસ્પીયરમેનનો અર્થ એ જ રીતે કરી શકાય છે જે રીતે પીયર્સન સહસંબંધ ( આરપિયર્સન) વિભિન્નતાના સ્પષ્ટ પ્રમાણના સંદર્ભમાં (ધ્યાનમાં રાખીને, જો કે, સ્પીયરમેનના આંકડાની ગણતરી રેન્ક દ્વારા કરવામાં આવે છે). એવું માનવામાં આવે છે કે ચલો ઓછામાં ઓછા માં માપવામાં આવે છે ક્રમબદ્ધસ્કેલ સ્પીયરમેનના ક્રમના સહસંબંધ, તેની શક્તિ અને અસરકારકતાની વ્યાપક ચર્ચા મળી શકે છે, ઉદાહરણ તરીકે, ગિબન્સ (1985), હેઝ (1981), મેકનેમર (1969), સિગેલ (1956), સિગેલ અને કેસ્ટેલન (1988), કેન્ડલ (1948). ), ઓલ્ડ્સ (1949) અને હોટેલિંગ એન્ડ પેબસ્ટ (1936).

ટાઉ કેન્ડલ.આંકડા tauકેન્ડલની સમકક્ષ આરકેટલીક મૂળભૂત ધારણાઓ હેઠળ સ્પીયરમેન. તેમની શક્તિઓ પણ સમકક્ષ હોય છે. જો કે, સામાન્ય રીતે મૂલ્યો આરસ્પીયરમેન અને tauકેન્ડલ અલગ છે કારણ કે તેઓ તેમના આંતરિક તર્ક અને તેમની ગણતરી કરવાની રીત બંનેમાં ભિન્ન છે. સિગેલ અને કેસ્ટેલન (1988) માં, લેખકોએ આ બે આંકડા વચ્ચેનો સંબંધ નીચે પ્રમાણે વ્યક્ત કર્યો:

1 < = 3 * Тау Кендалла - 2 * R Спирмена < = 1

વધુ અગત્યનું, કેન્ડલના આંકડા tauઅને સ્પીયરમેન આરવિવિધ અર્થઘટન છે: જ્યારે આંકડા આરસ્પીયરમેનને આંકડાઓના સીધા એનાલોગ તરીકે ગણી શકાય આરપીયર્સન, રેન્ક દ્વારા ગણવામાં આવે છે, કેન્ડલ આંકડા tauતેના બદલે પર આધારિત છે સંભાવનાઓ. વધુ સ્પષ્ટ રીતે, તે પરીક્ષણ કરે છે કે અવલોકન કરેલ ડેટા બે જથ્થા માટે સમાન ક્રમમાં હોવાની સંભાવના અને તે અલગ ક્રમમાં હોવાની સંભાવના વચ્ચે તફાવત છે. કેન્ડલ (1948, 1975), એવરિટ (1977), અને સિગેલ અને કેસ્ટેલન (1988) ખૂબ વિગતવાર ચર્ચા કરે છે tauકેન્ડલ. સામાન્ય રીતે બે આંકડાની ગણતરી કરવામાં આવે છે tauકેન્ડલ: tau bઅને tau c. આ પગલાં તેઓ જે રીતે મેળ ખાતા રેન્કને હેન્ડલ કરે છે તેમાં જ અલગ પડે છે. મોટા ભાગના કિસ્સાઓમાં તેમના અર્થ તદ્દન સમાન છે. જો મતભેદો ઊભા થાય, તો એવું લાગે છે કે બે મૂલ્યોમાંથી નાનાને ધ્યાનમાં લેવાનો સૌથી સલામત રસ્તો છે.

સોમરનો d ગુણાંક: d(X|Y), d(Y|X).આંકડા ડીસોમરનું માપ એ બે ચલો વચ્ચેના સંબંધનું બિન-સપ્રમાણ માપ છે. આ આંકડાની નજીક છે tau b(જુઓ સીગેલ અને કેસ્ટેલન, 1988, પૃષ્ઠ. 303-310).

ગામા આંકડા.જો ડેટા, આંકડાઓમાં ઘણા મેળ ખાતા મૂલ્યો છે ગામાપ્રાધાન્યક્ષમ આરસ્પીયરમેન અથવા tauકેન્ડલ. મૂળભૂત ધારણાઓ, આંકડાઓની દ્રષ્ટિએ ગામાઆંકડાની સમકક્ષ આરસ્પીયરમેન અથવા કેન્ડલની ટાઈ. તેનું અર્થઘટન અને ગણતરીઓ સ્પીયરમેનના આર આંકડા કરતાં કેન્ડલના ટાઉના આંકડાઓ સાથે વધુ સમાન છે. ટૂંકમાં કહીએ તો, ગામાપણ રજૂ કરે છે સંભાવના; વધુ સ્પષ્ટ રીતે કહીએ તો, બે ચલોનો રેન્ક ક્રમ મેળ ખાતી હોય તેવી સંભાવના વચ્ચેનો તફાવત, તે ન હોય તેવી સંભાવના બાદ, મેચોની સંભાવનાને એક બાદ કરીને ભાગ્યા. તેથી આંકડા ગામામૂળભૂત રીતે સમકક્ષ tauકેન્ડલ, સિવાય કે મેચોને સામાન્યીકરણમાં સ્પષ્ટપણે ધ્યાનમાં લેવામાં આવે છે. આંકડાઓની વિગતવાર ચર્ચા ગામા Goodman and Kruskal (1954, 1959, 1963, 1972), Siegel (1956), અને Siegel and Castellan (1988) માં શોધી શકાય છે.

અનિશ્ચિતતા ગુણાંક.આ ગુણાંક માપે છે માહિતી સંચારપરિબળો વચ્ચે (કોષ્ટકની પંક્તિઓ અને કૉલમ). ખ્યાલ માહિતી અવલંબનઆવર્તન કોષ્ટકોના વિશ્લેષણ માટે માહિતી-સૈદ્ધાંતિક અભિગમમાં ઉદ્દભવે છે, આ મુદ્દાની સ્પષ્ટતા માટે સંબંધિત માર્ગદર્શિકાઓનો સંદર્ભ લઈ શકાય છે (જુઓ કુલબેક, 1959; કુ અને કુલબેક, 1968; કુ, વર્નર, અને કુલબેક, 1971; બિશપ પણ જુઓ , ફિએનબર્ગ, અને હોલેન્ડ, 1975, પૃષ્ઠ 344-348). આંકડા એસ(Y, X) સપ્રમાણ છે અને ચલમાં માહિતીની માત્રાને માપે છે વાયચલને સંબંધિત એક્સઅથવા ચલમાં એક્સચલને સંબંધિત વાય. આંકડા S(X|Y)અને S(Y|X)દિશા નિર્ભરતા વ્યક્ત કરો.

બહુપરીમાણીય પ્રતિભાવો અને દ્વિભાષી. મલ્ટિવેરિયેટ રિસ્પોન્સ અને મલ્ટિવેરિયેટ ડિકોટોમીઝ જેવા ચલો એવી પરિસ્થિતિઓમાં ઉદ્ભવે છે જ્યાં સંશોધકને માત્ર ઘટનાઓની "સરળ" ફ્રીક્વન્સીમાં જ નહીં, પણ આ ઘટનાઓના કેટલાક (ઘણી વખત અસંરચિત) ગુણાત્મક ગુણધર્મોમાં પણ રસ હોય છે. બહુપરીમાણીય ચલો (પરિબળો) ની પ્રકૃતિ ઉદાહરણો દ્વારા શ્રેષ્ઠ રીતે સમજી શકાય છે.

  • · બહુપરીમાણીય પ્રતિભાવો
  • · બહુપરીમાણીય દ્વિપક્ષીયતા
  • · મલ્ટિવેરિયેટ રિસ્પોન્સ અને ડિકોટોમીઝનું ક્રોસસ્ટેબ્યુલેશન
  • મલ્ટિવેરિયેટ પ્રતિસાદો સાથે ચલોનું જોડી પ્રમાણે ક્રોસસ્ટેબ્યુલેશન
  • અંતિમ ટિપ્પણી

બહુપરીમાણીય પ્રતિભાવો.કલ્પના કરો કે મોટા માર્કેટિંગ સંશોધનની પ્રક્રિયામાં, તમે ગ્રાહકોને તેમના દૃષ્ટિકોણથી 3 શ્રેષ્ઠ સોફ્ટ ડ્રિંક્સનું નામ આપવાનું કહ્યું છે. એક સામાન્ય પ્રશ્ન આના જેવો દેખાઈ શકે છે.

માં એપ્લિકેશનને ધ્યાનમાં લોએમ.એસએક્સેલસરળ પૂર્વધારણાઓનું પરીક્ષણ કરવા માટે પીયર્સન ચી-સ્ક્વેર ટેસ્ટ.

પ્રાયોગિક ડેટા પ્રાપ્ત કર્યા પછી (એટલે ​​​​કે જ્યારે ત્યાં કેટલાક હોય છે નમૂના) સામાન્ય રીતે વિતરણ કાયદાની પસંદગી કરવામાં આવે છે જે આપેલ દ્વારા રજૂ કરાયેલ રેન્ડમ ચલનું શ્રેષ્ઠ વર્ણન કરે છે નમૂના. પસંદ કરેલ સૈદ્ધાંતિક વિતરણ કાયદા દ્વારા પ્રાયોગિક ડેટાને કેટલી સારી રીતે વર્ણવવામાં આવે છે તે તપાસી રહ્યું છે કરાર માપદંડ. શૂન્ય પૂર્વધારણા, સામાન્ય રીતે કેટલાક સૈદ્ધાંતિક કાયદામાં રેન્ડમ ચલના વિતરણની સમાનતા વિશે એક પૂર્વધારણા છે.

ચાલો પહેલા એપ્લિકેશન જોઈએ પીયર્સનનો ગુડનેસ-ઓફ-ફિટ ટેસ્ટ X 2 (ચી-ચોરસ)સરળ પૂર્વધારણાઓના સંબંધમાં (સૈદ્ધાંતિક વિતરણના પરિમાણો જાણીતા માનવામાં આવે છે). પછી - , જ્યારે માત્ર વિતરણનો આકાર ઉલ્લેખિત હોય, અને આ વિતરણના પરિમાણો અને મૂલ્ય આંકડા X 2 તેના આધારે મૂલ્યાંકન/ગણતરી કરવામાં આવે છે નમૂનાઓ.

નૉૅધ: અંગ્રેજી ભાષાના સાહિત્યમાં, અરજીની પ્રક્રિયા પિયર્સન ગુડનેસ-ઓફ-ફિટ ટેસ્ટ X 2 એક નામ છે ફિટ ટેસ્ટની ચી-સ્ક્વેર સારીતા.

ચાલો પૂર્વધારણાઓનું પરીક્ષણ કરવાની પ્રક્રિયાને યાદ કરીએ:

  • આધારિત નમૂનાઓમૂલ્યની ગણતરી કરવામાં આવે છે આંકડા, જે ચકાસવામાં આવી રહેલી પૂર્વધારણાના પ્રકારને અનુરૂપ છે. ઉદાહરણ તરીકે, વપરાયેલ માટે t- આંકડા(જો ખબર ન હોય તો);
  • સત્યને આધીન નલ પૂર્વધારણા, આનું વિતરણ આંકડાજાણીતું છે અને તેનો ઉપયોગ સંભાવનાઓની ગણતરી કરવા માટે થઈ શકે છે (ઉદાહરણ તરીકે, માટે t- આંકડાઆ);
  • ના આધારે ગણવામાં આવે છે નમૂનાઓઅર્થ આંકડાઆપેલ મૂલ્ય માટે નિર્ણાયક મૂલ્ય સાથે સરખામણી ();
  • નલ પૂર્વધારણાઅસ્વીકાર જો કિંમત આંકડાજટિલ કરતાં વધારે (અથવા જો આ મૂલ્ય મેળવવાની સંભાવના આંકડા() ઓછા મહત્વ સ્તર, જે સમકક્ષ અભિગમ છે).

ચાલો હાથ ધરીએ પૂર્વધારણા પરીક્ષણવિવિધ વિતરણો માટે.

અલગ કેસ

ધારો કે બે લોકો ડાઇસ રમી રહ્યા છે. દરેક ખેલાડી પાસે ડાઇસનો પોતાનો સેટ હોય છે. ખેલાડીઓ એકસાથે 3 ડાઇસ ફેરવે છે. દરેક રાઉન્ડ તે જીતે છે જે એક સમયે સૌથી વધુ છગ્ગા ફટકારે છે. પરિણામો નોંધવામાં આવે છે. 100 રાઉન્ડ પછી, એક ખેલાડીને શંકા હતી કે તેના વિરોધીના ડાઇસ અસમપ્રમાણ છે, કારણ કે તે ઘણીવાર જીતે છે (તે ઘણીવાર છગ્ગા ફેંકે છે). તેણે વિશ્લેષણ કરવાનું નક્કી કર્યું કે આવા સંખ્યાબંધ દુશ્મન પરિણામોની સંભાવના કેટલી છે.

નૉૅધ: કારણ કે ત્યાં 3 સમઘન છે, પછી તમે એક સમયે 0 રોલ કરી શકો છો; 1; 2 અથવા 3 છગ્ગા, એટલે કે. રેન્ડમ ચલ 4 મૂલ્યો લઈ શકે છે.

સંભાવના સિદ્ધાંત પરથી આપણે જાણીએ છીએ કે જો ડાઇસ સપ્રમાણ હોય, તો સિક્સ મેળવવાની સંભાવના પાળે છે. તેથી, 100 રાઉન્ડ પછી, ફોર્મ્યુલાનો ઉપયોગ કરીને સિક્સરની ફ્રીક્વન્સીની ગણતરી કરી શકાય છે.
=BINOM.DIST(A7,3,1/6,FALSE)*100

સૂત્ર ધારે છે કે કોષમાં A7 એક રાઉન્ડમાં વળેલા સિક્સરની અનુરૂપ સંખ્યા ધરાવે છે.

નૉૅધ: ગણતરીઓ આપવામાં આવે છે ડિસ્ક્રીટ શીટ પર ઉદાહરણ ફાઇલ.

સરખામણી માટે અવલોકન કર્યું(અવલોકન કરેલ) અને સૈદ્ધાંતિક આવર્તન(અપેક્ષિત) વાપરવા માટે અનુકૂળ.

જો અવલોકન કરેલ ફ્રીક્વન્સી સૈદ્ધાંતિક વિતરણથી નોંધપાત્ર રીતે વિચલિત થાય છે, નલ પૂર્વધારણાસૈદ્ધાંતિક કાયદા અનુસાર રેન્ડમ ચલના વિતરણ વિશે નકારવું જોઈએ. એટલે કે, જો પ્રતિસ્પર્ધીનો ડાઇસ અસમપ્રમાણ હોય, તો અવલોકન કરેલ ફ્રીક્વન્સી તેનાથી "નોંધપાત્ર રીતે અલગ" હશે. દ્વિપદી વિતરણ.

અમારા કિસ્સામાં, પ્રથમ નજરમાં, ફ્રીક્વન્સીઝ એકદમ નજીક છે અને ગણતરીઓ વિના અસ્પષ્ટ નિષ્કર્ષ દોરવાનું મુશ્કેલ છે. લાગુ પીયર્સન ગુડનેસ-ઓફ-ફીટ ટેસ્ટ X 2, જેથી વ્યક્તિલક્ષી નિવેદનને બદલે "નોંધપાત્ર રીતે અલગ", જે સરખામણીના આધારે કરી શકાય. હિસ્ટોગ્રામ, ગાણિતિક રીતે સાચા વિધાનનો ઉપયોગ કરો.

અમે એ હકીકતનો ઉપયોગ કરીએ છીએ કે કારણે મોટી સંખ્યામાં કાયદોવધતા વોલ્યુમ સાથે અવલોકન કરેલ આવર્તન (અવલોકન કરેલ). નમૂનાઓ n સૈદ્ધાંતિક કાયદાને અનુરૂપ સંભાવના તરફ વલણ ધરાવે છે (અમારા કિસ્સામાં, દ્વિપદી કાયદો). અમારા કિસ્સામાં, નમૂનાનું કદ n 100 છે.

ચાલો પરિચય આપીએ પરીક્ષણ આંકડા, જેને આપણે X 2 દ્વારા દર્શાવીએ છીએ:

જ્યાં O l એ ઘટનાઓની અવલોકન કરેલ આવર્તન છે કે રેન્ડમ ચલ એ અમુક સ્વીકાર્ય મૂલ્યો લીધા છે, E l એ અનુરૂપ સૈદ્ધાંતિક આવર્તન છે (અપેક્ષિત). L એ મૂલ્યોની સંખ્યા છે જે રેન્ડમ ચલ લઈ શકે છે (અમારા કિસ્સામાં તે 4 છે).

સૂત્ર પરથી જોઈ શકાય છે, આ આંકડાસૈદ્ધાંતિક રાશિઓ માટે અવલોકન કરેલ ફ્રીક્વન્સીઝની નિકટતાનું માપ છે, એટલે કે. તેનો ઉપયોગ આ ફ્રીક્વન્સીઝ વચ્ચેના "અંતર"નો અંદાજ કાઢવા માટે થઈ શકે છે. જો આ "અંતરો" નો સરવાળો "ખૂબ મોટો" હોય, તો આ ફ્રીક્વન્સીઝ "નોંધપાત્ર રીતે અલગ" હોય છે. તે સ્પષ્ટ છે કે જો આપણું ક્યુબ સપ્રમાણ હોય (એટલે ​​કે લાગુ દ્વિપદી કાયદો), પછી "અંતર" નો સરવાળો "ખૂબ મોટો" હશે તેવી સંભાવના નાની હશે. આ સંભાવનાની ગણતરી કરવા માટે આપણે વિતરણ જાણવાની જરૂર છે આંકડા X 2 ( આંકડારેન્ડમ પર આધારિત X 2 ની ગણતરી નમૂનાઓ, તેથી તે રેન્ડમ ચલ છે અને તેથી, તેનું પોતાનું છે સંભાવના વિતરણ).

બહુપરીમાણીય એનાલોગમાંથી મોઇવર-લાપ્લેસ અભિન્ન પ્રમેયતે જાણીતું છે કે n->∞ માટે આપણું રેન્ડમ ચલ X 2 એ એસિમ્પટોટિક રીતે L - 1 ડિગ્રી સ્વતંત્રતા સાથે છે.

તેથી જો ગણતરી કરેલ મૂલ્ય આંકડા X 2 (આવર્તન વચ્ચેના "અંતર" નો સરવાળો) ચોક્કસ મર્યાદિત મૂલ્ય કરતાં વધુ હશે, પછી અમારી પાસે નકારવાનું કારણ હશે નલ પૂર્વધારણા. તપાસવા જેવું જ પેરામેટ્રિક પૂર્વધારણાઓ, મર્યાદા મૂલ્ય દ્વારા સેટ કરવામાં આવે છે મહત્વ સ્તર. જો X 2 આંકડા ગણતરી કરેલ કરતા ઓછા અથવા તેના સમાન મૂલ્ય લેશે તેવી સંભાવના ( પી- અર્થ), ઓછું હશે મહત્વ સ્તર, તે નલ પૂર્વધારણાનકારી શકાય છે.

અમારા કિસ્સામાં, આંકડાકીય મૂલ્ય 22.757 છે. X2 આંકડા 22.757 કરતા વધારે અથવા તેના બરાબર મૂલ્ય લેશે તેવી સંભાવના ખૂબ નાની છે (0.000045) અને સૂત્રોનો ઉપયોગ કરીને ગણતરી કરી શકાય છે.
=CHI2.DIST.PH(22.757,4-1)અથવા
=CHI2.TEST(નિરીક્ષણ કરેલ; અપેક્ષિત)

નૉૅધ: CHI2.TEST() ફંક્શન ખાસ કરીને બે સ્પષ્ટ ચલ (જુઓ) વચ્ચેના સંબંધને ચકાસવા માટે રચાયેલ છે.

સંભાવના 0.000045 સામાન્ય કરતાં નોંધપાત્ર રીતે ઓછી છે મહત્વ સ્તર 0.05. તેથી, ખેલાડી પાસે તેના પ્રતિસ્પર્ધીને અપ્રમાણિકતા અંગે શંકા કરવાનું દરેક કારણ છે ( નલ પૂર્વધારણાતેની પ્રામાણિકતા નકારી છે).

ઉપયોગ કરતી વખતે માપદંડ X 2તે ખાતરી કરવા માટે જરૂરી છે કે વોલ્યુમ નમૂનાઓ n પૂરતો મોટો હતો, અન્યથા વિતરણ અંદાજ માન્ય રહેશે નહીં આંકડા X 2. સામાન્ય રીતે એવું માનવામાં આવે છે કે આ માટે તે પર્યાપ્ત છે કે અવલોકન કરેલ ફ્રીક્વન્સીઝ 5 કરતા વધારે હોય. જો આવું ન હોય, તો નાની ફ્રીક્વન્સીઝને એકમાં જોડવામાં આવે છે અથવા અન્ય ફ્રીક્વન્સીમાં ઉમેરવામાં આવે છે, અને સંયુક્ત મૂલ્ય અસાઇન કરવામાં આવે છે. કુલ સંભાવનાઅને, તે મુજબ, સ્વતંત્રતાની ડિગ્રીની સંખ્યામાં ઘટાડો થાય છે X 2 વિતરણો.

એપ્લિકેશનની ગુણવત્તા સુધારવા માટે માપદંડ X 2(), પાર્ટીશન અંતરાલો ઘટાડવા માટે જરૂરી છે (L વધારો અને, તે મુજબ, સંખ્યામાં વધારો સ્વતંત્રતાની ડિગ્રી), જોકે, દરેક અંતરાલ (db>5) માં સમાવિષ્ટ અવલોકનોની સંખ્યા પરની મર્યાદા દ્વારા આને અટકાવવામાં આવે છે.

સતત કેસ

પિયર્સન ગુડનેસ-ઓફ-ફિટ ટેસ્ટ X 2 ના કિસ્સામાં પણ અરજી કરી શકાય છે.

ચાલો ચોક્કસ ધ્યાનમાં લઈએ નમૂના, 200 મૂલ્યોનો સમાવેશ કરે છે. શૂન્ય પૂર્વધારણાજણાવે છે કે નમૂનામાં થી બન્યું .

નૉૅધ: માં રેન્ડમ ચલો સતત શીટ પર ઉદાહરણ ફાઇલફોર્મ્યુલાનો ઉપયોગ કરીને બનાવેલ છે =NORM.ST.INV(RAND()). તેથી, નવા મૂલ્યો નમૂનાઓશીટની પુનઃગણતરી વખતે દર વખતે જનરેટ થાય છે.

વર્તમાન ડેટા સેટ યોગ્ય છે કે કેમ તે દૃષ્ટિની આકારણી કરી શકાય છે.

ડાયાગ્રામમાંથી જોઈ શકાય છે તેમ, નમૂનાના મૂલ્યો સીધી રેખા સાથે ખૂબ સારી રીતે બંધબેસે છે. જો કે, માટે તરીકે પૂર્વધારણા પરીક્ષણલાગુ પીયર્સન X 2 ગુડનેસ-ઓફ-ફીટ ટેસ્ટ.

આ કરવા માટે, અમે રેન્ડમ ચલના ફેરફારની શ્રેણીને 0.5 ના પગલા સાથે અંતરાલોમાં વિભાજીત કરીએ છીએ. ચાલો આપણે અવલોકન કરેલ અને ગણતરી કરીએ સૈદ્ધાંતિક આવર્તન. અમે FREQUENCY() ફંક્શનનો ઉપયોગ કરીને અવલોકન કરેલ ફ્રીક્વન્સીઝ અને NORM.ST.DIST() ફંક્શનનો ઉપયોગ કરીને સૈદ્ધાંતિક ફ્રિક્વન્સીની ગણતરી કરીએ છીએ.

નૉૅધ: માટે સમાન સ્વતંત્ર કેસ, તેની ખાતરી કરવી જરૂરી છે નમૂનાતદ્દન મોટું હતું, અને અંતરાલમાં >5 મૂલ્યોનો સમાવેશ થાય છે.

ચાલો X2 આંકડાની ગણતરી કરીએ અને આપેલ માટેના નિર્ણાયક મૂલ્ય સાથે તેની તુલના કરીએ મહત્વ સ્તર(0.05). કારણ કે અમે રેન્ડમ ચલના ફેરફારની શ્રેણીને 10 અંતરાલોમાં વિભાજીત કરીએ છીએ, પછી સ્વતંત્રતાની ડિગ્રીની સંખ્યા 9 છે. સૂત્રનો ઉપયોગ કરીને નિર્ણાયક મૂલ્યની ગણતરી કરી શકાય છે.
=CHI2.OBR.PH(0.05;9) અથવા
=CHI2.OBR(1-0.05;9)

ઉપરનો ચાર્ટ દર્શાવે છે કે આંકડાકીય મૂલ્ય 8.19 છે, જે નોંધપાત્ર રીતે વધારે છે નિર્ણાયક મૂલ્ય નલ પૂર્વધારણાનામંજૂર નથી.

નીચે જ્યાં છે નમૂનાઅસંભવિત મહત્વ લીધું અને તેના આધારે માપદંડ પીયર્સન સંમતિ X 2શૂન્ય પૂર્વધારણાને નકારી કાઢવામાં આવી હતી (ભલે રેન્ડમ મૂલ્યોસૂત્રનો ઉપયોગ કરીને બનાવવામાં આવ્યા હતા =NORM.ST.INV(RAND()), પૂરી પાડે છે નમૂનાથી પ્રમાણભૂત સામાન્ય વિતરણ).

શૂન્ય પૂર્વધારણાનકારવામાં આવ્યું છે, જો કે દૃષ્ટિની રીતે ડેટા સીધી રેખાની તદ્દન નજીક સ્થિત છે.

ચાલો એક ઉદાહરણ તરીકે પણ લઈએ નમૂના U(-3; 3) થી. આ કિસ્સામાં, ગ્રાફ પરથી પણ તે સ્પષ્ટ છે કે નલ પૂર્વધારણાનકારી કાઢવી જોઈએ.

માપદંડ પીયર્સન સંમતિ X 2તેની પુષ્ટિ પણ કરે છે નલ પૂર્વધારણાનકારી કાઢવી જોઈએ.



શું તમને લેખ ગમ્યો? તમારા મિત્રો સાથે શેર કરો!