ચી સ્ક્વેર ટેસ્ટનો ઉપયોગ કરીને. આંકડાઓની ક્લાસિકલ પદ્ધતિઓ: ચી-સ્ક્વેર ટેસ્ટ

χ 2 માપદંડનો હેતુ - પીયર્સન માપદંડ χ 2 માપદંડનો ઉપયોગ બે હેતુઓ માટે થાય છે: 1) સૈદ્ધાંતિક એક સાથે લાક્ષણિકતાના પ્રયોગમૂલક વિતરણની તુલના કરવા - સમાન, સામાન્ય અથવા અન્ય કોઈ; 2) સમાન લાક્ષણિકતાના બે, ત્રણ અથવા વધુ પ્રયોગમૂલક વિતરણોની તુલના કરવા.માપદંડનું વર્ણન χ 2 માપદંડ સમાન આવર્તન સાથે થાય છે કે કેમ તે પ્રશ્નનો જવાબ આપે છે વિવિધ અર્થોસાઇન ઇન પ્રયોગમૂલક અને સૈદ્ધાંતિક વિતરણોઅથવા બે અથવા વધુ પ્રયોગમૂલક વિતરણોમાં. પદ્ધતિનો ફાયદો એ છે કે તે નામોના સ્કેલથી શરૂ કરીને, કોઈપણ સ્કેલ પર પ્રસ્તુત સુવિધાઓના વિતરણની તુલના કરવાની મંજૂરી આપે છે. ખૂબ માંસરળ કેસ વૈકલ્પિક વિતરણ "હા - ના", "ખામીને મંજૂરી આપી - ખામીને મંજૂરી આપી નથી", "સમસ્યા ઉકેલી છે - સમસ્યા હલ કરી નથી", વગેરે. આપણે પહેલેથી જ χ 2 માપદંડ લાગુ કરી શકીએ છીએ.બે તુલનાત્મક વિતરણો વચ્ચેની વિસંગતતા જેટલી વધારે છે, તેટલી મોટી પ્રયોગમૂલક મહત્વχ 2. χ 2 ની સ્વચાલિત ગણતરી - પીયર્સન માપદંડ χ 2 - પીયર્સન માપદંડની સ્વચાલિત ગણતરી કરવા માટે, તમારે બે પગલાં ભરવા આવશ્યક છે:પગલું 1

. પ્રયોગમૂલક વિતરણની સંખ્યા સ્પષ્ટ કરો (1 થી 10 સુધી); પગલું 2. કોષ્ટકમાં પ્રયોગમૂલક ફ્રીક્વન્સીઝ દાખલ કરો;

પગલું 3

. જવાબ મેળવો. પીયર્સન માપદંડનો ફાયદો તેની સાર્વત્રિકતા છે: તેનો ઉપયોગ પૂર્વધારણાઓને ચકાસવા માટે થઈ શકે છે.વિવિધ કાયદા વિતરણો 1. સામાન્ય વિતરણની પૂર્વધારણાનું પરીક્ષણ.પૂરતા પ્રમાણમાં મોટા નમૂના મેળવવા દો nસાથે

મોટી સંખ્યામાં વિવિધ અર્થો 1 વિવિધ અર્થો 2 … વિકલ્પ તેની પ્રક્રિયા કરવાની સગવડ માટે, અમે અંતરાલને વિકલ્પના નાનાથી મોટા મૂલ્યમાં વિભાજીત કરીએ છીએ

s પીયર્સન માપદંડનો ફાયદો તેની સાર્વત્રિકતા છે: તેનો ઉપયોગ પૂર્વધારણાઓને ચકાસવા માટે થઈ શકે છે. 1 પીયર્સન માપદંડનો ફાયદો તેની સાર્વત્રિકતા છે: તેનો ઉપયોગ પૂર્વધારણાઓને ચકાસવા માટે થઈ શકે છે. 2 … સમાન ભાગો અને અમે ધારીશું કે દરેક અંતરાલમાં આવતા વિકલ્પોની કિંમતો અંતરાલના મધ્ય ભાગને નિર્દિષ્ટ કરતી સંખ્યાની લગભગ સમાન છે. દરેક અંતરાલમાં આવતા વિકલ્પોની સંખ્યાની ગણતરી કરીને, અમે કહેવાતા જૂથબદ્ધ નમૂના બનાવીશું: ,

વિકલ્પો……….. એક્સ x s ફ્રીક્વન્સીઝ…………. n s જ્યાં x i



અંતરાલોના મધ્યબિંદુઓના મૂલ્યો છે, અને n i - માં સમાવિષ્ટ વિકલ્પોની સંખ્યા i વસ્તીસમગ્ર વિતરિત સામાન્ય કાયદોપરિમાણો સાથે એમ(એક્સ) = , ડી(એક્સ) = પછી તમે નમૂનાના કદમાંથી સંખ્યાઓની સંખ્યા શોધી શકો છો પીયર્સન માપદંડનો ફાયદો તેની સાર્વત્રિકતા છે: તેનો ઉપયોગ પૂર્વધારણાઓને ચકાસવા માટે થઈ શકે છે., જે આ ધારણા હેઠળ દરેક અંતરાલમાં દેખાવા જોઈએ (એટલે ​​​​કે, સૈદ્ધાંતિક ફ્રીક્વન્સીઝ). આ કરવા માટે, લેપ્લેસ ફંક્શનના મૂલ્યોના કોષ્ટકનો ઉપયોગ કરીને, આપણે પ્રવેશવાની સંભાવના શોધીએ છીએ જ્યાંમી અંતરાલ:

,

વિકલ્પો……….. અને હુંઅને b i- સીમાઓ i-મી અંતરાલ. પ્રાપ્ત સંભાવનાઓને નમૂનાના કદ n દ્વારા ગુણાકાર કરીને, અમે સૈદ્ધાંતિક ફ્રીક્વન્સીઝ શોધીએ છીએ: p i = n·p i.અમારો ધ્યેય પ્રાયોગિક અને સૈદ્ધાંતિક ફ્રીક્વન્સીઝની તુલના કરવાનો છે, જે, અલબત્ત, એકબીજાથી અલગ છે, અને તે શોધવાનું છે કે શું આ તફાવતો નજીવા છે અને અભ્યાસના સામાન્ય વિતરણની પૂર્વધારણાને રદિયો આપતા નથી. રેન્ડમ ચલ, અથવા તેઓ એટલા મોટા છે કે તેઓ આ પૂર્વધારણાનો વિરોધાભાસ કરે છે. આ હેતુ માટે, રેન્ડમ ચલના રૂપમાં માપદંડનો ઉપયોગ કરવામાં આવે છે

. (20.1)

તેનો અર્થ સ્પષ્ટ છે: ભાગો કે જે વિચલનોના ચોરસ છે તેનો સારાંશ આપવામાં આવે છે પ્રયોગમૂલક આવર્તનસૈદ્ધાંતિક માંથી અનુરૂપ સૈદ્ધાંતિક ફ્રીક્વન્સીઝમાંથી બનાવવામાં આવે છે. તે સાબિત કરી શકાય છે કે, વસ્તીના વાસ્તવિક વિતરણ કાયદાને ધ્યાનમાં લીધા વિના, રેન્ડમ ચલ (20.1) નો વિતરણ કાયદો સ્વતંત્રતાની ડિગ્રીની સંખ્યા સાથે વિતરણ કાયદા (લેક્ચર 12 જુઓ) તરફ વલણ ધરાવે છે. k = s - 1 – આર, ક્યાં આર- નમૂનાના ડેટામાંથી અંદાજિત અપેક્ષિત વિતરણના પરિમાણોની સંખ્યા. તેથી, સામાન્ય વિતરણ બે પરિમાણો દ્વારા વર્ગીકૃત થયેલ છે k = s - 3. પસંદ કરેલ માપદંડ માટે, સ્થિતિ દ્વારા નિર્ધારિત, જમણી બાજુનો નિર્ણાયક પ્રદેશ બનાવવામાં આવે છે.

(20.2)

વિકલ્પો……….. α - મહત્વનું સ્તર. પરિણામે, નિર્ણાયક પ્રદેશ અસમાનતા દ્વારા આપવામાં આવે છે અને પૂર્વધારણાની સ્વીકૃતિનો વિસ્તાર છે.

તેથી, શૂન્ય પૂર્વધારણાને ચકાસવા માટે એન 0: વસ્તી સામાન્ય રીતે વિતરિત કરવામાં આવે છે - તમારે નમૂનામાંથી માપદંડના અવલોકન કરેલ મૂલ્યની ગણતરી કરવાની જરૂર છે:

, (20.1`)

અને વિતરણના નિર્ણાયક બિંદુઓના કોષ્ટકમાંથી χ 2 શોધો નિર્ણાયક બિંદુમદદથી જાણીતા મૂલ્યોα અને k = s - 3. જો - શૂન્ય પૂર્વધારણા સ્વીકારવામાં આવે છે, જો તે નકારવામાં આવે છે.

2. સમાન વિતરણની પૂર્વધારણાનું પરીક્ષણ.

અંદાજિત સંભાવના ઘનતા સાથે વસ્તી સમાનરૂપે વિતરિત થયેલ છે તે પૂર્વધારણાને ચકાસવા માટે પીયર્સન ટેસ્ટનો ઉપયોગ કરતી વખતે

પરિમાણોનો અંદાજ કાઢવા માટે, ઉપલબ્ધ નમૂનામાંથી મૂલ્યની ગણતરી કરવી જરૂરી છે અને bસૂત્રો અનુસાર:

વિકલ્પો……….. A*અને b*- આકારણીઓ અને b. ખરેખર, માટે સમાન વિતરણ એમ(એક્સ) = , , જ્યાં તમે નક્કી કરવા માટે સિસ્ટમ મેળવી શકો છો A*અને b*: , જેનો ઉકેલ સમીકરણો છે (20.3).

પછી, એમ ધારીને , તમે સૂત્રોનો ઉપયોગ કરીને સૈદ્ધાંતિક ફ્રીક્વન્સીઝ શોધી શકો છો

અહીં n- અંતરાલોની સંખ્યા જેમાં નમૂનાને વિભાજિત કરવામાં આવે છે.

પિયર્સન માપદંડનું અવલોકન કરેલ મૂલ્ય સૂત્ર (20.1`) નો ઉપયોગ કરીને ગણવામાં આવે છે, અને સ્વતંત્રતાની ડિગ્રીની સંખ્યાને ધ્યાનમાં રાખીને, કોષ્ટકનો ઉપયોગ કરીને નિર્ણાયક મૂલ્યની ગણતરી કરવામાં આવે છે. k = s - 3. આ પછી, નિર્ણાયક પ્રદેશની સીમાઓ એ જ રીતે નક્કી કરવામાં આવે છે જેમ કે સામાન્ય વિતરણની પૂર્વધારણાના પરીક્ષણ માટે.

3. ઘાતાંકીય વિતરણ વિશેની પૂર્વધારણાનું પરીક્ષણ કરવું.

આ કિસ્સામાં, હાલના નમૂનાને સમાન લંબાઈના અંતરાલોમાં વિભાજિત કર્યા પછી, અમે વિકલ્પોના ક્રમને ધ્યાનમાં લઈએ છીએ, એકબીજાથી સમાન અંતરે છે (અમે ધારીએ છીએ કે તમામ વિકલ્પો જે આમાં આવે છે જ્યાં- મી અંતરાલ, તેના મધ્ય સાથે સુસંગત મૂલ્ય લો), અને તેમની અનુરૂપ ફ્રીક્વન્સીઝ n i(નમૂના વિકલ્પોની સંખ્યા શામેલ છે જ્યાં- મી અંતરાલ). ચાલો આ ડેટા પરથી ગણતરી કરીએ અને પરિમાણના અંદાજ તરીકે લઈએ λ કદ પછી સૂત્રનો ઉપયોગ કરીને સૈદ્ધાંતિક ફ્રીક્વન્સીઝની ગણતરી કરવામાં આવે છે

પછી અવલોકન કરેલ અને નિર્ણાયક મૂલ્યપીયર્સન માપદંડ એ હકીકતને ધ્યાનમાં લે છે કે સ્વતંત્રતાની ડિગ્રીની સંખ્યા k = s - 2.

1. તુલનાત્મક સૂચકાંકો માપવામાં આવશ્યક છે નજીવા સ્કેલ(ઉદાહરણ તરીકે, દર્દીનું લિંગ પુરુષ કે સ્ત્રી છે) અથવા માં ક્રમબદ્ધ(ઉદાહરણ તરીકે, ધમનીના હાયપરટેન્શનની ડિગ્રી, 0 થી 3 સુધીના મૂલ્યો લેતી).

2. આ પદ્ધતિજ્યારે પરિબળ અને પરિણામ બંને દ્વિસંગી ચલો છે, એટલે કે, તેમની પાસે માત્ર બે જ છે શક્ય મૂલ્યો(ઉદાહરણ તરીકે, પુરૂષ અથવા સ્ત્રી લિંગ, એનામેનેસિસમાં ચોક્કસ રોગની હાજરી અથવા ગેરહાજરી...). જ્યારે પરિબળ અને (અથવા) પરિણામ ત્રણ અથવા વધુ મૂલ્યો લે છે ત્યારે પીયર્સન ચી-સ્ક્વેર ટેસ્ટનો ઉપયોગ મલ્ટિફિલ્ડ કોષ્ટકોના વિશ્લેષણના કિસ્સામાં પણ થઈ શકે છે.

3. તુલનાત્મક જૂથો સ્વતંત્ર હોવા જોઈએ, એટલે કે, "પહેલાં-પછી" અવલોકનોની સરખામણી કરતી વખતે ચી-સ્ક્વેર ટેસ્ટનો ઉપયોગ થવો જોઈએ નહીં. મેકનેમર ટેસ્ટ(બે સંબંધિત વસ્તીની સરખામણી કરતી વખતે) અથવા ગણતરી કરેલ કોકરાનની ક્યૂ ટેસ્ટ(ત્રણ અથવા વધુ જૂથોની સરખામણીના કિસ્સામાં).

4. ચાર-ક્ષેત્ર કોષ્ટકોનું વિશ્લેષણ કરતી વખતે અપેક્ષિત મૂલ્યોદરેક કોષમાં ઓછામાં ઓછા 10 હોવા જોઈએ. જો ઓછામાં ઓછા એક કોષમાં અપેક્ષિત ઘટના 5 થી 9 સુધીનું મૂલ્ય લે છે, તો ચી-સ્ક્વેર ટેસ્ટની ગણતરી કરવી આવશ્યક છે યેટ્સના સુધારા સાથે. જો ઓછામાં ઓછા એક કોષમાં અપેક્ષિત ઘટના 5 કરતા ઓછી હોય, તો વિશ્લેષણનો ઉપયોગ કરવો જોઈએ ફિશરની ચોક્કસ કસોટી.

5. મલ્ટિફિલ્ડ કોષ્ટકોનું વિશ્લેષણ કરતી વખતે, 20% કરતા વધુ કોષોમાં અવલોકનોની અપેક્ષિત સંખ્યા 5 કરતા ઓછી હોવી જોઈએ નહીં.

ચી-સ્ક્વેર ટેસ્ટની ગણતરી કરવા માટે તમારે આની જરૂર છે:

1. અવલોકનોની અપેક્ષિત સંખ્યાની ગણતરી કરોપંક્તિઓ અને કૉલમના સરવાળાને ગુણાકાર કરીને અને પછી પરિણામી ઉત્પાદનને વિભાજીત કરીને કુલ સંખ્યાઅવલોકનો સામાન્ય દૃશ્યઅપેક્ષિત મૂલ્યોનું કોષ્ટક નીચે પ્રસ્તુત છે:

ત્યાં એક પરિણામ છે (1) કોઈ પરિણામ નથી (0) કુલ
એક જોખમ પરિબળ છે (1) (A+B)*(A+C) / (A+B+C+D) (A+B)*(B+D)/ (A+B+C+D) A+B
કોઈ જોખમ પરિબળ નથી (0) (C+D)*(A+C)/ (A+B+C+D) (C+D)*(B+D)/ (A+B+C+D) C+D
કુલ A+C B+D A+B+C+D

2. χ 2 માપદંડની કિંમત શોધવીદ્વારા નીચેનું સૂત્ર:

વિકલ્પો……….. જ્યાં- લાઇન નંબર (1 થી આર સુધી), j- કૉલમ નંબર (1 થી c સુધી), ઓ આઈજી- સેલ ij માં અવલોકનોની વાસ્તવિક સંખ્યા, ઇ આઇ.જી- સેલ ij માં અવલોકનોની અપેક્ષિત સંખ્યા.

ઓછામાં ઓછા એક કોષમાં અપેક્ષિત ઘટનાની સંખ્યા 10 કરતા ઓછી હોય તેવા કિસ્સામાં, ચાર-ક્ષેત્ર કોષ્ટકોનું વિશ્લેષણ કરતી વખતે, તેની ગણતરી કરવી જોઈએ. યેટ્સ કરેક્શન સાથે ચી-સ્ક્વેર ટેસ્ટ. આ સુધારો પ્રકાર 1 ભૂલની સંભાવનાને ઘટાડે છે, એટલે કે, જ્યાં કોઈ ન હોય ત્યાં તફાવતો શોધવા. યેટ્સ કરેક્શન માંથી 0.5 બાદ કરવાનું છે સંપૂર્ણ મૂલ્યદરેક કોષમાં અવલોકનોની વાસ્તવિક અને અપેક્ષિત સંખ્યા વચ્ચેનો તફાવત, જે ચી-સ્ક્વેર ટેસ્ટના મૂલ્યમાં ઘટાડો તરફ દોરી જાય છે.

યેટ્સ કરેક્શન સાથે χ 2 માપદંડની ગણતરી માટેનું સૂત્ર નીચે મુજબ છે:

3. સ્વતંત્રતાની ડિગ્રીની સંખ્યા નક્કી કરવીસૂત્ર અનુસાર: f = (r – 1) × (c – 1). તદનુસાર, 2 પંક્તિઓ (r = 2) અને 2 કૉલમ (c = 2) સાથેના ચાર-ક્ષેત્રના કોષ્ટક માટે, સ્વતંત્રતાની ડિગ્રીની સંખ્યા f 2x2 = (2 - 1)*(2 - 1) = 1 છે.

4. અમે χ 2 માપદંડના મૂલ્યને નિર્ણાયક મૂલ્ય સાથે સરખાવીએ છીએસ્વતંત્રતા f ની ડિગ્રીની સંખ્યા પર (કોષ્ટક મુજબ).

આ અલ્ગોરિધમચાર-ક્ષેત્ર અને મલ્ટી-ફિલ્ડ કોષ્ટકો બંને માટે લાગુ.

પીયર્સન ચી-સ્ક્વેર ટેસ્ટના મૂલ્યનું અર્થઘટન કેવી રીતે કરવું?

જો χ 2 માપદંડનું પ્રાપ્ત મૂલ્ય નિર્ણાયક મૂલ્ય કરતાં વધારે હોય, તો અમે તારણ કાઢીએ છીએ કે અભ્યાસ કરેલ જોખમ પરિબળ અને મહત્વના યોગ્ય સ્તરે પરિણામ વચ્ચે આંકડાકીય સંબંધ છે.

પિયર્સન ચી-સ્ક્વેર ટેસ્ટની ગણતરીનું ઉદાહરણ

ચાલો વ્યાખ્યાયિત કરીએ આંકડાકીય મહત્વઉપર ચર્ચા કરેલ કોષ્ટક અનુસાર ધમનીના હાયપરટેન્શનની ઘટનાઓ પર ધૂમ્રપાન પરિબળનો પ્રભાવ:

1. દરેક કોષ માટે અપેક્ષિત મૂલ્યોની ગણતરી કરો:

2. પીયર્સન ચી-સ્ક્વેર ટેસ્ટનું મૂલ્ય શોધો:

χ 2 = (40-33.6) 2 /33.6 + (30-36.4) 2 /36.4 + (32-38.4) 2 /38.4 + (48-41.6) 2 /41.6 = 4.396.

3. સ્વતંત્રતાની ડિગ્રીની સંખ્યા f = (2-1)*(2-1) = 1. કોષ્ટકનો ઉપયોગ કરીને, આપણે પીયર્સન ચી-સ્ક્વેર ટેસ્ટનું નિર્ણાયક મૂલ્ય શોધીએ છીએ, જે મહત્વના સ્તરે p=0.05 અને સ્વતંત્રતા 1 ની ડિગ્રીની સંખ્યા 3.841 છે.

4. અમે ચી-સ્ક્વેર ટેસ્ટના મેળવેલ મૂલ્યની નિર્ણાયક સાથે સરખામણી કરીએ છીએ: 4.396 > 3.841, તેથી, ધૂમ્રપાનની હાજરી પર ધમનીના હાયપરટેન્શનની ઘટનાઓની અવલંબન આંકડાકીય રીતે નોંધપાત્ર છે. આ સંબંધનું મહત્વ સ્તર p ને અનુરૂપ છે<0.05.

સ્વતંત્રતાની ડિગ્રીની સંખ્યા, એફ p=0.05 પર χ 2 p=0.01 પર χ 2
3.841 6.635
5.991 9.21
7.815 11.345
9.488 13.277
11.07 15.086
12.592 16.812
14.067 18.475
15.507 20.09
16.919 21.666
18.307 23.209
19.675 24.725
21.026 26.217
22.362 27.688
23.685 29.141
24.996 30.578
26.296
27.587 33.409
28.869 34.805
30.144 36.191
31.41 37.566

આ નોંધમાં, χ 2 વિતરણનો ઉપયોગ નિશ્ચિત સંભાવના વિતરણ સાથે ડેટા સેટની સુસંગતતા ચકાસવા માટે થાય છે. કરાર માપદંડ ઘણીવાર તમે ચોક્કસ કેટેગરીના છો તેની સરખામણી એ ફ્રીક્વન્સીઝ સાથે કરવામાં આવે છે જે સૈદ્ધાંતિક રીતે અપેક્ષિત હશે જો ડેટા ખરેખર ઉલ્લેખિત વિતરણ ધરાવે છે.

χ 2 ગુડનેસ-ઓફ-ફિટ માપદંડનો ઉપયોગ કરીને પરીક્ષણ ઘણા તબક્કામાં કરવામાં આવે છે. પ્રથમ, ચોક્કસ સંભાવના વિતરણ નક્કી કરવામાં આવે છે અને મૂળ ડેટા સાથે તેની સરખામણી કરવામાં આવે છે. બીજું, એક પૂર્વધારણા પસંદ કરેલ સંભાવના વિતરણના પરિમાણો વિશે આગળ મૂકવામાં આવે છે (ઉદાહરણ તરીકે, તેની ગાણિતિક અપેક્ષા) અથવા તેમનું મૂલ્યાંકન હાથ ધરવામાં આવે છે. ત્રીજું, સૈદ્ધાંતિક વિતરણના આધારે, દરેક શ્રેણીને અનુરૂપ સૈદ્ધાંતિક સંભાવના નક્કી કરવામાં આવે છે. છેલ્લે, χ2 પરીક્ષણ આંકડાનો ઉપયોગ ડેટા અને વિતરણની સુસંગતતા ચકાસવા માટે થાય છે:

વિકલ્પો……….. f0- અવલોકન કરેલ આવર્તન, f e- સૈદ્ધાંતિક અથવા અપેક્ષિત આવર્તન, k- મર્જ કર્યા પછી બાકી રહેલી શ્રેણીઓની સંખ્યા, આર- અંદાજિત પરિમાણોની સંખ્યા.

નોંધ ડાઉનલોડ કરો અથવા ફોર્મેટ કરો, ઉદાહરણો ફોર્મેટમાં

પોઈસન વિતરણ માટે χ 2 ગુડનેસ-ઓફ-ફીટ ટેસ્ટનો ઉપયોગ કરવો

Excel માં આ સૂત્રનો ઉપયોગ કરીને ગણતરી કરવા માટે, =SUMPRODUCT() ફંક્શન (ફિગ. 1) નો ઉપયોગ કરવો અનુકૂળ છે.

પરિમાણનો અંદાજ કાઢવો λ તમે અંદાજનો ઉપયોગ કરી શકો છો . સૈદ્ધાંતિક આવર્તન એક્સસફળતાઓ (X = 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 અને વધુ) પરિમાણને અનુરૂપ λ = 2.9 ફંક્શન =POISSON.DIST(X;;FALSE) નો ઉપયોગ કરીને નક્કી કરી શકાય છે. નમૂનાના કદ દ્વારા પોઈસન સંભાવનાનો ગુણાકાર n, અમને સૈદ્ધાંતિક આવર્તન મળે છે f e(ફિગ. 2).

ચોખા. 2. પ્રતિ મિનિટ વાસ્તવિક અને સૈદ્ધાંતિક આગમન દર

ફિગમાંથી નીચે મુજબ. 2, નવ કે તેથી વધુ આગમનની સૈદ્ધાંતિક આવર્તન 1.0 થી વધુ નથી. દરેક કેટેગરીમાં 1.0 અથવા તેથી વધુની આવર્તન છે તેની ખાતરી કરવા માટે, "9 અથવા તેથી વધુ" કેટેગરી "8" કેટેગરી સાથે જોડવી જોઈએ. એટલે કે, નવ શ્રેણીઓ રહે છે (0, 1, 2, 3, 4, 5, 6, 7, 8 અને વધુ). પોઈસન વિતરણની ગાણિતિક અપેક્ષા નમૂનાના ડેટાના આધારે નક્કી કરવામાં આવતી હોવાથી, સ્વતંત્રતાની ડિગ્રીની સંખ્યા k – p – 1 = 9 – 1 – 1 = 7 જેટલી છે. 0.05 ના મહત્વના સ્તરનો ઉપયોગ કરીને, આપણે શોધીએ છીએ χ 2 આંકડાઓનું નિર્ણાયક મૂલ્ય, જે સૂત્ર =CHI2.OBR(1-0.05;7) = 14.067 અનુસાર સ્વતંત્રતાના 7 ડિગ્રી ધરાવે છે. નિર્ણય નિયમ નીચે પ્રમાણે ઘડવામાં આવે છે: પૂર્વધારણા એચ 0નકારવામાં આવે છે જો χ 2 > 14.067, અન્યથા પૂર્વધારણા એચ 0વિચલિત થતું નથી.

χ 2 ની ગણતરી કરવા માટે આપણે સૂત્ર (1) (ફિગ. 3) નો ઉપયોગ કરીએ છીએ.

ચોખા. 3. પોઈસન વિતરણ માટે χ 2 -ગુડનેસ-ઓફ-ફિટ માપદંડની ગણતરી

χ 2 = 2.277 થી< 14,067, следует, что гипотезу એચ 0નકારી શકાય નહીં. બીજા શબ્દોમાં કહીએ તો, અમારી પાસે એવું કહેવાનું કોઈ કારણ નથી કે બેંકમાં ગ્રાહકોનું આગમન પોઈસન વિતરણનું પાલન કરતું નથી.

સામાન્ય વિતરણ માટે χ 2 -ગુડનેસ-ઓફ-ફીટ ટેસ્ટની અરજી

અગાઉની નોંધોમાં, જ્યારે સંખ્યાત્મક ચલો વિશે પૂર્વધારણાઓનું પરીક્ષણ કરવામાં આવ્યું હતું, ત્યારે અમે ધાર્યું હતું કે અભ્યાસ હેઠળની વસ્તી સામાન્ય રીતે વિતરિત કરવામાં આવી હતી. આ ધારણાને ચકાસવા માટે, તમે ગ્રાફિકલ ટૂલ્સનો ઉપયોગ કરી શકો છો, ઉદાહરણ તરીકે, બોક્સ પ્લોટ અથવા સામાન્ય વિતરણ ગ્રાફ (વધુ વિગતો માટે, જુઓ). મુ મોટા વોલ્યુમોનમૂનાઓ, આ ધારણાઓને ચકાસવા માટે, તમે સામાન્ય વિતરણ માટે χ 2 ગુડનેસ-ઓફ-ફિટ ટેસ્ટનો ઉપયોગ કરી શકો છો.

ચાલો, ઉદાહરણ તરીકે, 158 રોકાણ ભંડોળના 5-વર્ષના વળતર પરના ડેટાને ધ્યાનમાં લઈએ (ફિગ. 4). ધારો કે તમે માનવા માંગો છો કે ડેટા સામાન્ય રીતે વિતરિત થાય છે કે કેમ. નલ અને વૈકલ્પિક પૂર્વધારણાઓ નીચે પ્રમાણે ઘડવામાં આવી છે: એચ 0: 5-વર્ષની ઉપજ સામાન્ય વિતરણને અનુસરે છે, એચ 1: 5-વર્ષની ઉપજ સામાન્ય વિતરણને અનુસરતી નથી. સામાન્ય વિતરણમાં બે પરિમાણો છે - ગાણિતિક અપેક્ષા μ અને પ્રમાણભૂત વિચલનσ, જેનો અંદાજ નમૂના ડેટાના આધારે કરી શકાય છે. IN આ કિસ્સામાં = 10.149 અને એસ = 4,773.

ચોખા. 4. 158 ફંડના પાંચ વર્ષના સરેરાશ વાર્ષિક વળતર પરનો ડેટા ધરાવતો ઓર્ડર કરેલ એરે

ભંડોળના વળતર પરના ડેટાને જૂથબદ્ધ કરી શકાય છે, ઉદાહરણ તરીકે, 5% (ફિગ. 5) ની પહોળાઈ સાથે વર્ગો (અંતરાલ) માં.

ચોખા. 5. 158 ફંડના પાંચ વર્ષના સરેરાશ વાર્ષિક વળતર માટે આવર્તન વિતરણ

સામાન્ય વિતરણ સતત હોવાથી, સામાન્ય વિતરણ વળાંક અને દરેક અંતરાલની સીમાઓ દ્વારા બંધાયેલા આંકડાઓનો વિસ્તાર નક્કી કરવો જરૂરી છે. વધુમાં, સામાન્ય વિતરણ સૈદ્ધાંતિક રીતે –∞ થી +∞ સુધીનું હોવાથી, વર્ગની સીમાઓની બહાર આવતા આકારોના વિસ્તારને ધ્યાનમાં લેવો જરૂરી છે. તેથી, બિંદુ -10 ની ડાબી તરફના સામાન્ય વળાંક હેઠળનો વિસ્તાર, Z મૂલ્યની ડાબી બાજુએ પ્રમાણિત સામાન્ય વળાંક હેઠળ પડેલા આકૃતિના વિસ્તાર જેટલો છે.

Z = (–10 – 10.149) / 4.773 = –4.22

Z = –4.22 મૂલ્યની ડાબી બાજુએ પ્રમાણિત સામાન્ય વળાંક હેઠળ સ્થિત આકૃતિનો વિસ્તાર સૂત્ર =NORM.DIST(-10;10.149;4.773;TRUE) દ્વારા નિર્ધારિત કરવામાં આવે છે અને તે લગભગ 0.00001 ની બરાબર છે. બિંદુઓ –10 અને –5 વચ્ચેના સામાન્ય વળાંક હેઠળ પડેલા આકૃતિના ક્ષેત્રફળની ગણતરી કરવા માટે, તમારે પહેલા બિંદુ –5 ની ડાબી બાજુએ પડેલી આકૃતિના ક્ષેત્રફળની ગણતરી કરવાની જરૂર છે: =NORM.DIST( -5,10.149,4.773,TRUE) = 0.00075 . તેથી, બિંદુઓ –10 અને –5 વચ્ચેના સામાન્ય વળાંક હેઠળ પડેલા આકૃતિનો વિસ્તાર 0.00075 – 0.00001 = 0.00074 છે. એ જ રીતે, તમે દરેક વર્ગની સીમાઓ દ્વારા મર્યાદિત આકૃતિના ક્ષેત્રફળની ગણતરી કરી શકો છો (ફિગ. 6).

ચોખા. 6. 5-વર્ષના વળતરના દરેક વર્ગ માટે વિસ્તારો અને અપેક્ષિત ફ્રીક્વન્સીઝ

તે જોઈ શકાય છે કે ચાર આત્યંતિક વર્ગો (બે લઘુત્તમ અને બે મહત્તમ) માં સૈદ્ધાંતિક આવર્તન 1 કરતા ઓછી છે, તેથી અમે વર્ગોને જોડીશું, જેમ કે આકૃતિ 7 માં બતાવ્યા પ્રમાણે.

ચોખા. 7. સામાન્ય વિતરણ માટે χ 2 ગુડનેસ-ઓફ-ફીટ ટેસ્ટના ઉપયોગ સાથે સંકળાયેલી ગણતરીઓ

સાથે ડેટા કરાર માટે અમે χ 2 માપદંડનો ઉપયોગ કરીએ છીએ સામાન્ય વિતરણસૂત્રનો ઉપયોગ કરીને (1). અમારા ઉદાહરણમાં, મર્જ કર્યા પછી, છ વર્ગો રહે છે. સેમ્પલ ડેટા પરથી અપેક્ષિત મૂલ્ય અને પ્રમાણભૂત વિચલનનો અંદાજ હોવાથી, સ્વતંત્રતાની ડિગ્રીની સંખ્યા છે kપી – 1 = 6 – 2 – 1 = 3. 0.05 ના મહત્વના સ્તરનો ઉપયોગ કરીને, અમે શોધીએ છીએ કે χ 2 આંકડાનું નિર્ણાયક મૂલ્ય, જેમાં ત્રણ ડિગ્રી સ્વતંત્રતા છે = CI2.OBR(1-0.05;F3) = 7.815. χ 2 ગુડનેસ-ઓફ-ફિટ માપદંડના ઉપયોગ સાથે સંકળાયેલી ગણતરીઓ ફિગમાં બતાવવામાં આવી છે. 7.

તે જોઈ શકાય છે કે χ 2 -statistic = 3.964< χ U 2 7,815, следовательно гипотезу એચ 0નકારી શકાય નહીં. બીજા શબ્દોમાં કહીએ તો, ઉચ્ચ વૃદ્ધિ પર કેન્દ્રિત રોકાણ ભંડોળના 5-વર્ષનું વળતર સામાન્ય વિતરણને આધીન નથી એવું ભારપૂર્વક જણાવવાનો અમારી પાસે કોઈ આધાર નથી.

કેટલાકમાં નવીનતમ નોંધોગણવામાં આવે છે વિવિધ અભિગમોસ્પષ્ટ માહિતીના વિશ્લેષણ માટે. બે અથવા વધુ સ્વતંત્ર નમૂનાઓના પૃથ્થકરણમાંથી મેળવેલ સ્પષ્ટ માહિતી વિશેની પૂર્વધારણાઓનું પરીક્ષણ કરવાની પદ્ધતિઓ વર્ણવવામાં આવી છે. ચી-સ્ક્વેર પરીક્ષણો ઉપરાંત, નોનપેરામેટ્રિક પ્રક્રિયાઓ ધ્યાનમાં લેવામાં આવે છે. વિલ્કોક્સન રેન્ક ટેસ્ટનું વર્ણન કરવામાં આવ્યું છે, જેનો ઉપયોગ એવી પરિસ્થિતિઓમાં થાય છે જ્યાં એપ્લિકેશનની શરતો પૂરી થતી નથી t- સમાનતાની પૂર્વધારણાના પરીક્ષણ માટે માપદંડ ગાણિતિક અપેક્ષાઓબે સ્વતંત્ર જૂથો, તેમજ ક્રુસ્કલ-વોલિસ ટેસ્ટ, જે એક પરિબળનો વિકલ્પ છે વિચલનનું વિશ્લેષણ(ફિગ. 8).

ચોખા. 8. બ્લોક ડાયાગ્રામસ્પષ્ટ ડેટા વિશે પૂર્વધારણાઓનું પરીક્ષણ કરવાની પદ્ધતિઓ

લેવિન એટ અલ મેનેજર્સ માટેના આંકડાઓ પુસ્તકમાંથી સામગ્રીનો ઉપયોગ કરવામાં આવે છે. – એમ.: વિલિયમ્સ, 2004. – પી. 763–769

જો χ 2 માપદંડનું પ્રાપ્ત મૂલ્ય નિર્ણાયક મૂલ્ય કરતાં વધારે હોય, તો અમે તારણ કાઢીએ છીએ કે અભ્યાસ કરેલ જોખમ પરિબળ અને મહત્વના યોગ્ય સ્તરે પરિણામ વચ્ચે આંકડાકીય સંબંધ છે.

પિયર્સન ચી-સ્ક્વેર ટેસ્ટની ગણતરીનું ઉદાહરણ

ચાલો ઉપર ચર્ચા કરેલ કોષ્ટકનો ઉપયોગ કરીને ધમનીના હાયપરટેન્શનની ઘટનાઓ પર ધૂમ્રપાન પરિબળના પ્રભાવનું આંકડાકીય મહત્વ નક્કી કરીએ:

1. દરેક કોષ માટે અપેક્ષિત મૂલ્યોની ગણતરી કરો:

2. પીયર્સન ચી-સ્ક્વેર ટેસ્ટનું મૂલ્ય શોધો:

χ 2 = (40-33.6) 2 /33.6 + (30-36.4) 2 /36.4 + (32-38.4) 2 /38.4 + (48-41.6) 2 /41.6 = 4.396.

3. સ્વતંત્રતાની ડિગ્રીની સંખ્યા f = (2-1)*(2-1) = 1. કોષ્ટકનો ઉપયોગ કરીને, આપણે પીયર્સન ચી-સ્ક્વેર ટેસ્ટનું નિર્ણાયક મૂલ્ય શોધીએ છીએ, જે મહત્વના સ્તરે p=0.05 અને સ્વતંત્રતા 1 ની ડિગ્રીની સંખ્યા 3.841 છે.

4. અમે ચી-સ્ક્વેર ટેસ્ટના મેળવેલ મૂલ્યની નિર્ણાયક સાથે સરખામણી કરીએ છીએ: 4.396 > 3.841, તેથી, ધૂમ્રપાનની હાજરી પર ધમનીના હાયપરટેન્શનની ઘટનાઓની અવલંબન આંકડાકીય રીતે નોંધપાત્ર છે. આ સંબંધનું મહત્વ સ્તર p ને અનુરૂપ છે<0.05.

ઉપરાંત, પિયર્સન ચી-સ્ક્વેર ટેસ્ટની ગણતરી સૂત્રનો ઉપયોગ કરીને કરવામાં આવે છે

પરંતુ 2x2 કોષ્ટક માટે, યેટ્સ કરેક્શન માપદંડ દ્વારા વધુ સચોટ પરિણામો મેળવવામાં આવે છે.

જો તે N(0)સ્વીકાર્યું,

કિસ્સામાં સ્વીકાર્યું H(1)

જ્યારે અવલોકનોની સંખ્યા ઓછી હોય અને કોષ્ટક કોષોમાં 5 કરતા ઓછી આવર્તન હોય, ત્યારે ચી-સ્ક્વેર ટેસ્ટ લાગુ પડતો નથી અને તેનો ઉપયોગ પૂર્વધારણાઓ ચકાસવા માટે થાય છે. ફિશરની ચોક્કસ કસોટી . આ માપદંડની ગણતરી કરવાની પ્રક્રિયા તદ્દન શ્રમ-સઘન છે, અને આ કિસ્સામાં કમ્પ્યુટર આંકડાકીય વિશ્લેષણ પ્રોગ્રામ્સનો ઉપયોગ કરવો વધુ સારું છે.

આકસ્મિક કોષ્ટકનો ઉપયોગ કરીને, તમે બે ગુણાત્મક લાક્ષણિકતાઓ વચ્ચેના જોડાણના માપની ગણતરી કરી શકો છો - આ યુલ એસોસિએશન ગુણાંક છે પ્ર (સહસંબંધ ગુણાંકને અનુરૂપ)

પ્ર 0 થી 1 ની રેન્જમાં આવેલું છે. એકની નજીકનો ગુણાંક લાક્ષણિકતાઓ વચ્ચે મજબૂત જોડાણ સૂચવે છે. જો તે શૂન્યની બરાબર છે, તો ત્યાં કોઈ જોડાણ નથી .

ફી-સ્ક્વેર ગુણાંક (φ 2) એ જ રીતે વપરાય છે

બેન્ચમાર્ક કાર્ય

કોષ્ટક ખોરાક સાથે અને વગર ડ્રોસોફિલાના જૂથોમાં પરિવર્તનની આવર્તન વચ્ચેના સંબંધનું વર્ણન કરે છે



આકસ્મિક કોષ્ટક વિશ્લેષણ

આકસ્મિક કોષ્ટકનું વિશ્લેષણ કરવા માટે, H 0 પૂર્વધારણા આગળ મૂકવામાં આવે છે, એટલે કે, અભ્યાસના પરિણામ પર અભ્યાસ કરવામાં આવતી લાક્ષણિકતાના પ્રભાવની ગેરહાજરી આ માટે, અપેક્ષિત આવર્તનની ગણતરી કરવામાં આવે છે અને એક અપેક્ષા કોષ્ટક બનાવવામાં આવે છે.

રાહ જોવાનું ટેબલ

જૂથો ચિલો પાક કુલ
મ્યુટેશન આપ્યું મ્યુટેશન આપ્યું નથી
વાસ્તવિક આવર્તન અપેક્ષિત આવર્તન વાસ્તવિક આવર્તન અપેક્ષિત આવર્તન
ખોરાક સાથે
ખોરાક આપ્યા વિના
કુલ

પદ્ધતિ નંબર 1

રાહ જોવાની આવર્તન નક્કી કરો:

2756 - એક્સ ;

2. 3561 – 3124

જો જૂથોમાં અવલોકનોની સંખ્યા ઓછી હોય, તો X 2 નો ઉપયોગ કરતી વખતે, અલગ વિતરણો માટે વાસ્તવિક અને અપેક્ષિત ફ્રીક્વન્સીની સરખામણી કરવાના કિસ્સામાં, અચોક્કસતા ઘટાડવા માટે, યેટ્સ કરેક્શનનો ઉપયોગ કરવામાં આવે છે.

આ પોસ્ટ સિદ્ધાંતમાં ચી ચોરસ માપદંડની ગણતરી કેવી રીતે કરવી તેનો જવાબ આપતી નથી, તેનો હેતુ સ્વચાલિત કેવી રીતે કરવો તે બતાવવાનો છે એક્સેલમાં ચી ચોરસ ગણતરી, ચી ચોરસ માપદંડની ગણતરી માટે કયા કાર્યો છે. કારણ કે તમારી પાસે હંમેશા SPSS અથવા R પ્રોગ્રામ નથી.
એક અર્થમાં, આ એક રિમાઇન્ડર છે અને HR સેમિનાર માટેના Analytics ના સહભાગીઓ માટે એક સંકેત છે, હું આશા રાખું છું કે તમે તમારા કાર્યમાં આ પદ્ધતિઓનો ઉપયોગ કરશો, આ પોસ્ટ અન્ય સંકેત હશે.
હું ડાઉનલોડ લિંક સાથે ફાઇલ પ્રદાન કરતો નથી, પરંતુ તમે ફક્ત મેં આપેલા ઉદાહરણ કોષ્ટકોની નકલ કરી શકો છો અને મેં આપેલા ડેટા અને સૂત્રોને અનુસરી શકો છો.

પરિચય

ઉદાહરણ તરીકે, અમે કોર્પોરેટ સર્વેક્ષણના પરિણામોના વિતરણની સ્વતંત્રતા (રેન્ડમનેસ/અનિયમિતતા) તપાસવા માંગીએ છીએ, જ્યાં પંક્તિઓમાં પ્રશ્નાવલીમાં કોઈપણ પ્રશ્નના જવાબો છે અને કૉલમમાં લંબાઈ દ્વારા વિતરણ છે. સેવા

તમે પીવટ ટેબલ દ્વારા ચી ચોરસની ગણતરી કરવા જાઓ છો જ્યારે તમારા ડેટાનો સંક્ષિપ્ત કોષ્ટકમાં સારાંશ આપવામાં આવે છે, ઉદાહરણ તરીકે આ ફોર્મમાં
કોષ્ટક નં. 1

1 વર્ષથી ઓછા

રેખાઓ દ્વારા સરવાળો

કૉલમ દ્વારા સરવાળો

એક્સેલમાં ચી ચોરસની ગણતરી કરવા માટે, નીચેના સૂત્રો છે

CHI2.TEST

ફોર્મ્યુલા CH2.TEST વિતરણની સ્વતંત્રતા (રેન્ડમનેસ / નોન-રેન્ડમનેસ) ની સંભાવનાની ગણતરી કરે છે

વાક્યરચના આ પ્રમાણે છે

CHI2.TEST(વાસ્તવિક_અંતરાલ, અપેક્ષિત_અંતરાલ)

અમારા કિસ્સામાં, વાસ્તવિક અંતરાલ એ કોષ્ટકની સામગ્રી છે, એટલે કે.

તે. બે કોષ્ટકો પ્રાપ્ત કર્યા - પ્રયોગમૂલક અને અપેક્ષિત (અથવા સૈદ્ધાંતિક આવર્તન) - અમે ખરેખર તફાવત મેળવવા, વર્ગીકરણ અને અન્ય ગણતરીઓ તેમજ નિર્ણાયક મૂલ્યોના કોષ્ટક સાથે તપાસ કરવાના કાર્યમાંથી પોતાને મુક્ત કરીએ છીએ.

અમારા કિસ્સામાં, CHI2.DIST.PH = 0.000466219908895455, જેમ કે CHI2.TEST સાથેના ઉદાહરણમાં

નોંધ

એક્સેલમાં ચી સ્ક્વેરની ગણતરી કરવા માટેની આ ફોર્મ્યુલા તમને 2X2 પરિમાણના કોષ્ટકોની ગણતરી માટે અનુકૂળ રહેશે, કારણ કે તમે જાતે જ ચી સ્ક્વેરને પ્રયોગમૂલક ગણો છો અને ગણતરીમાં સાતત્ય સુધારણા દાખલ કરી શકો છો.

નોંધ 2

CHI2.DIST એક સૂત્ર પણ છે (તમે તેને એક્સેલમાં અનિવાર્યપણે જોશો) - તે ડાબી બાજુની સંભાવનાની ગણતરી કરે છે (સાદા શબ્દોમાં, ડાબી બાજુવાળાને 1 તરીકે ગણવામાં આવે છે - જમણેરી એક, એટલે કે આપણે ફક્ત ચાલુ કરીએ છીએ. સૂત્ર સમાપ્ત, તેથી જ હું તેને Chi ચોરસની ગણતરીમાં આપતો નથી, અમારા ઉદાહરણમાં CHI2.DIST = 0.999533780091105.
કુલ CH2.DIST + CH2.DIST.PH = 1.

CH2.OBR.PH

ચી-સ્ક્વેર ડિસ્ટ્રિબ્યુશનની જમણી-પૂંછડીવાળી સંભાવનાનું વ્યુત્ક્રમ પરત કરે છે (અથવા સ્પષ્ટ સંભાવના સ્તર અને સ્વતંત્રતાની ડિગ્રીની સંખ્યા માટે ફક્ત ચી-ચોરસ મૂલ્ય)

સિનેક્સિસ

CH2.OBR.PH(સંભાવના;સ્વાતંત્ર્યની_ડિગ્રી)

નિષ્કર્ષ

સાચું કહું તો, પરિણામો કેટલી હદ સુધી પ્રાપ્ત થયા તે વિશે મારી પાસે ચોક્કસ માહિતી નથી એક્સેલમાં ચી ચોરસ ગણતરીઓ SPSS માં ચી ચોરસ પરિણામોથી અલગ છે. હું બરાબર સમજું છું. કે તેઓ અલગ પડે છે, જો માત્ર એટલા માટે કે જ્યારે સ્વતંત્ર રીતે ચી ચોરસની ગણતરી કરવામાં આવે ત્યારે, મૂલ્યો ગોળાકાર હોય છે અને દશાંશ સ્થાનોની ચોક્કસ સંખ્યા ખોવાઈ જાય છે. પરંતુ મને નથી લાગતું કે આ જટિલ છે. જ્યારે ચી સ્ક્વેર ડિસ્ટ્રિબ્યુશનની સંભાવના 0.05 ની થ્રેશોલ્ડ (p-વેલ્યુ) ની નજીક હોય ત્યારે જ હું તમારો વીમો લેવાની ભલામણ કરું છું.

તે ખૂબ સરસ નથી કે સાતત્ય સુધારણા ધ્યાનમાં લેવામાં આવી નથી - અમે 2X2 કોષ્ટકોમાં ઘણી ગણતરી કરીએ છીએ. તેથી, અમે 2X2 કોષ્ટકોની ગણતરીના કિસ્સામાં લગભગ કોઈ ઑપ્ટિમાઇઝેશન પ્રાપ્ત કરી શકતા નથી

સારું, તેમ છતાં, મને લાગે છે કે ઉપરોક્ત જ્ઞાન વધુ મહત્વપૂર્ણ બાબતો પર સમય બચાવવા માટે એક્સેલમાં ચી સ્ક્વેરની ગણતરી થોડી ઝડપી બનાવવા માટે પૂરતું છે.



શું તમને લેખ ગમ્યો? તમારા મિત્રો સાથે શેર કરો!