આંકડાકીય વિશ્વસનીયતાનો ખ્યાલ. આંકડાકીય મહત્વ અને આંકડાકીય માપદંડની વિભાવનાઓ

આંકડાઓમાં મહત્વનું સ્તર એ એક મહત્વપૂર્ણ સૂચક છે જે પ્રાપ્ત (અનુમાનિત) ડેટાની ચોકસાઈ અને સત્યમાં વિશ્વાસની ડિગ્રીને પ્રતિબિંબિત કરે છે. આ ખ્યાલનો વ્યાપકપણે વિવિધ ક્ષેત્રોમાં ઉપયોગ થાય છે: સમાજશાસ્ત્રીય સંશોધન હાથ ધરવાથી લઈને વૈજ્ઞાનિક પૂર્વધારણાઓના આંકડાકીય પરીક્ષણ સુધી.

વ્યાખ્યા

આંકડાકીય મહત્વનું સ્તર (અથવા આંકડાકીય રીતે નોંધપાત્ર પરિણામ) સંયોગ દ્વારા અભ્યાસ કરેલ સૂચકોની ઘટનાની સંભાવના દર્શાવે છે. ઘટનાનું એકંદર આંકડાકીય મહત્વ p-મૂલ્ય ગુણાંક (p-સ્તર) દ્વારા વ્યક્ત કરવામાં આવે છે. કોઈપણ પ્રયોગ અથવા અવલોકનમાં, એવી સંભાવના છે કે મેળવેલ ડેટા નમૂનાની ભૂલોને કારણે હતો. આ ખાસ કરીને સમાજશાસ્ત્ર માટે સાચું છે.

એટલે કે, આંકડાકીય રીતે નોંધપાત્ર મૂલ્ય એ એક મૂલ્ય છે જેની અવ્યવસ્થિત ઘટનાની સંભાવના અત્યંત નાની છે અથવા આત્યંતિક તરફ વલણ ધરાવે છે. આ સંદર્ભમાં આત્યંતિક એ ડિગ્રી માનવામાં આવે છે જેમાં આંકડા નલ પૂર્વધારણા (એક પૂર્વધારણા કે જે મેળવેલ નમૂનાના ડેટા સાથે સુસંગતતા માટે પરીક્ષણ કરવામાં આવે છે) થી વિચલિત થાય છે. વૈજ્ઞાનિક પ્રેક્ટિસમાં, મહત્વના સ્તરને ડેટા સંગ્રહ પહેલાં પસંદ કરવામાં આવે છે અને, નિયમ તરીકે, તેનો ગુણાંક 0.05 (5%) છે. સિસ્ટમો માટે જ્યાં ચોક્કસ મૂલ્યો અત્યંત મહત્વપૂર્ણ છે, આ આંકડો 0.01 (1%) અથવા ઓછો હોઈ શકે છે.

પૃષ્ઠભૂમિ

મહત્વના સ્તરનો ખ્યાલ બ્રિટિશ આંકડાશાસ્ત્રી અને આનુવંશિકશાસ્ત્રી રોનાલ્ડ ફિશર દ્વારા 1925 માં રજૂ કરવામાં આવ્યો હતો, જ્યારે તેઓ આંકડાકીય પૂર્વધારણાઓનું પરીક્ષણ કરવા માટેની તકનીક વિકસાવી રહ્યા હતા. કોઈપણ પ્રક્રિયાનું વિશ્લેષણ કરતી વખતે, ચોક્કસ ઘટનાની ચોક્કસ સંભાવના હોય છે. "માપન ભૂલ" ના ખ્યાલ હેઠળ આવતી સંભાવનાઓની નાની (અથવા સ્પષ્ટ નથી) ટકાવારી સાથે કામ કરતી વખતે મુશ્કેલીઓ ઊભી થાય છે.

આંકડાકીય માહિતી સાથે કામ કરતી વખતે કે જે તેમને ચકાસવા માટે પૂરતા વિશિષ્ટ નથી, વૈજ્ઞાનિકોને શૂન્ય પૂર્વધારણાની સમસ્યાનો સામનો કરવો પડે છે, જે ઓછી માત્રામાં કામ કરતા "અવરોધ" કરે છે. ફિશરે આવી પ્રણાલીઓ માટે 5% (0.05) પર ઘટનાઓની સંભાવનાને અનુકૂળ નમૂના કટ તરીકે નક્કી કરવાની દરખાસ્ત કરી, જે ગણતરીમાં શૂન્ય પૂર્વધારણાને નકારવા માટે પરવાનગી આપે છે.

નિશ્ચિત મતભેદનો પરિચય

1933 માં, વૈજ્ઞાનિકો જેર્ઝી ન્યુમેન અને એગોન પીયર્સન તેમના કાર્યોમાં ભલામણ કરી હતી કે મહત્વના ચોક્કસ સ્તરને અગાઉથી સ્થાપિત કરવામાં આવે (માહિતી સંગ્રહ પહેલાં). ચૂંટણી દરમિયાન આ નિયમોના ઉપયોગના ઉદાહરણો સ્પષ્ટપણે જોવા મળે છે. ચાલો કહીએ કે બે ઉમેદવારો છે, જેમાંથી એક ખૂબ જ લોકપ્રિય છે અને બીજા ઓછા જાણીતા છે. તે સ્પષ્ટ છે કે પ્રથમ ઉમેદવાર ચૂંટણી જીતશે, અને બીજાની શક્યતા શૂન્ય છે. તેઓ પ્રયત્ન કરે છે - પરંતુ સમાન નથી: ત્યાં હંમેશા બળની ઘટના, સનસનાટીભર્યા માહિતી, અણધાર્યા નિર્ણયોની સંભાવના છે જે આગાહીના ચૂંટણી પરિણામોને બદલી શકે છે.

નેમેન અને પિયર્સન સંમત થયા કે ફિશરનું મહત્વ 0.05 (α દ્વારા સૂચવવામાં આવે છે)નું સ્તર સૌથી યોગ્ય હતું. જો કે, ફિશરે પોતે 1956માં આ મૂલ્ય નક્કી કરવાનો વિરોધ કર્યો હતો. તેમનું માનવું હતું કે α નું સ્તર ચોક્કસ સંજોગો અનુસાર સેટ કરવું જોઈએ. ઉદાહરણ તરીકે, કણ ભૌતિકશાસ્ત્રમાં તે 0.01 છે.

p-સ્તરની કિંમત

પી-વેલ્યુ શબ્દનો સૌપ્રથમ ઉપયોગ બ્રાઉનલી દ્વારા 1960માં કરવામાં આવ્યો હતો. P-સ્તર (p-મૂલ્ય) એ એક સૂચક છે જે પરિણામોની સત્યતા સાથે વિપરીત રીતે સંબંધિત છે. ઉચ્ચતમ p-મૂલ્ય ગુણાંક ચલો વચ્ચેના નમૂનારૂપ સંબંધમાં વિશ્વાસના સૌથી નીચા સ્તરને અનુરૂપ છે.

આ મૂલ્ય પરિણામોના અર્થઘટન સાથે સંકળાયેલ ભૂલોની સંભાવનાને પ્રતિબિંબિત કરે છે. ચાલો p-સ્તર = 0.05 (1/20) ધારીએ. તે પાંચ ટકા સંભાવના દર્શાવે છે કે નમૂનામાં જોવા મળતા ચલો વચ્ચેનો સંબંધ એ નમૂનાની રેન્ડમ વિશેષતા છે. એટલે કે, જો આ અવલંબન ગેરહાજર હોય, તો વારંવાર સમાન પ્રયોગો સાથે, સરેરાશ, દરેક વીસમા અભ્યાસમાં કોઈ ચલ વચ્ચે સમાન અથવા વધુ અવલંબનની અપેક્ષા રાખી શકે છે. પી-લેવલ ઘણીવાર ભૂલ દર માટે "માર્જિન" તરીકે જોવામાં આવે છે.

માર્ગ દ્વારા, p-મૂલ્ય ચલો વચ્ચેના વાસ્તવિક સંબંધને પ્રતિબિંબિત કરી શકતું નથી, પરંતુ માત્ર ધારણાઓમાં ચોક્કસ સરેરાશ મૂલ્ય દર્શાવે છે. ખાસ કરીને, ડેટાનું અંતિમ વિશ્લેષણ પણ આ ગુણાંકના પસંદ કરેલા મૂલ્યો પર આધારિત હશે. p-સ્તર = 0.05 પર કેટલાક પરિણામો હશે, અને 0.01 ના સમાન ગુણાંક પર વિવિધ પરિણામો હશે.

આંકડાકીય પૂર્વધારણાઓનું પરીક્ષણ

પૂર્વધારણાઓનું પરીક્ષણ કરતી વખતે આંકડાકીય મહત્વનું સ્તર ખાસ કરીને મહત્વનું છે. ઉદાહરણ તરીકે, જ્યારે બે-બાજુવાળા પરીક્ષણની ગણતરી કરવામાં આવે છે, ત્યારે અસ્વીકાર ક્ષેત્રને નમૂના વિતરણના બંને છેડે સમાનરૂપે વિભાજિત કરવામાં આવે છે (શૂન્ય કોઓર્ડિનેટને સંબંધિત) અને પરિણામી ડેટાની સત્યતાની ગણતરી કરવામાં આવે છે.

ધારો કે, કોઈ ચોક્કસ પ્રક્રિયા (ઘટના)નું નિરીક્ષણ કરતી વખતે, તે તારણ આપે છે કે નવી આંકડાકીય માહિતી અગાઉના મૂલ્યોની તુલનામાં નાના ફેરફારો સૂચવે છે. તે જ સમયે, પરિણામોમાં વિસંગતતાઓ નાની છે, સ્પષ્ટ નથી, પરંતુ અભ્યાસ માટે મહત્વપૂર્ણ છે. નિષ્ણાતને મૂંઝવણનો સામનો કરવો પડે છે: શું ફેરફારો ખરેખર થઈ રહ્યા છે અથવા આ નમૂનાની ભૂલો છે (માપની અચોક્કસતા)?

આ કિસ્સામાં, તેઓ શૂન્ય પૂર્વધારણાનો ઉપયોગ કરે છે અથવા તેને નકારી કાઢે છે (એક ભૂલને દરેક વસ્તુનું શ્રેય આપે છે, અથવા સિસ્ટમમાં થયેલા ફેરફારને અયોગ્ય અનુભૂતિ તરીકે ઓળખે છે). સમસ્યા હલ કરવાની પ્રક્રિયા એકંદર આંકડાકીય મહત્વ (p-મૂલ્ય) અને મહત્વ સ્તર (α) ના ગુણોત્તર પર આધારિત છે. જો p-સ્તર< α, значит, нулевую гипотезу отвергают. Чем меньше р-value, тем более значимой является тестовая статистика.

વપરાયેલ મૂલ્યો

મહત્વનું સ્તર વિશ્લેષણ કરવામાં આવતી સામગ્રી પર આધારિત છે. વ્યવહારમાં, નીચેના નિશ્ચિત મૂલ્યોનો ઉપયોગ થાય છે:

  • α = 0.1 (અથવા 10%);
  • α = 0.05 (અથવા 5%);
  • α = 0.01 (અથવા 1%);
  • α = 0.001 (અથવા 0.1%).

વધુ સચોટ ગણતરીઓ જરૂરી છે, α ગુણાંકનો ઉપયોગ ઓછો થાય છે. સ્વાભાવિક રીતે, ભૌતિકશાસ્ત્ર, રસાયણશાસ્ત્ર, ફાર્માસ્યુટિકલ્સ અને જિનેટિક્સમાં આંકડાકીય આગાહીઓ રાજકીય વિજ્ઞાન અને સમાજશાસ્ત્ર કરતાં વધુ ચોકસાઈની જરૂર છે.

વિશિષ્ટ ક્ષેત્રોમાં મહત્વના થ્રેશોલ્ડ

પાર્ટિકલ ફિઝિક્સ અને મેન્યુફેક્ચરિંગ જેવા ઉચ્ચ-ચોકસાઇવાળા ક્ષેત્રોમાં, આંકડાકીય મહત્વ ઘણીવાર પ્રમાણભૂત વિચલન (સિગ્મા ગુણાંક દ્વારા સૂચવવામાં આવે છે - σ) સામાન્ય સંભાવના વિતરણ (ગૌસિયન વિતરણ) ના ગુણોત્તર તરીકે દર્શાવવામાં આવે છે. σ એ એક આંકડાકીય સૂચક છે જે ગાણિતિક અપેક્ષાઓની તુલનામાં ચોક્કસ જથ્થાના મૂલ્યોના વિક્ષેપને નિર્ધારિત કરે છે. ઘટનાઓની સંભાવનાને કાવતરું કરવા માટે વપરાય છે.

જ્ઞાનના ક્ષેત્રના આધારે, ગુણાંક σ મોટા પ્રમાણમાં બદલાય છે. ઉદાહરણ તરીકે, હિગ્સ બોસોનના અસ્તિત્વની આગાહી કરતી વખતે, પરિમાણ σ પાંચ (σ = 5) ની બરાબર છે, જે p-મૂલ્ય = 1/3.5 મિલિયનને અનુરૂપ છે, જેનોમ અભ્યાસમાં મહત્વનું સ્તર 5 × 10 - હોઈ શકે છે. 8, જે આ વિસ્તારો માટે અસામાન્ય નથી.

કાર્યક્ષમતા

તે ધ્યાનમાં લેવું આવશ્યક છે કે ગુણાંક α અને p-મૂલ્ય ચોક્કસ લાક્ષણિકતાઓ નથી. અભ્યાસ હેઠળની ઘટનાના આંકડામાં મહત્વનું સ્તર ગમે તે હોય, તે પૂર્વધારણાને સ્વીકારવા માટે બિનશરતી આધાર નથી. ઉદાહરણ તરીકે, α નું મૂલ્ય જેટલું નાનું છે, તે પૂર્વધારણા સ્થાપિત થવાની શક્યતા એટલી જ વધારે છે. જો કે, ભૂલનું જોખમ છે, જે અભ્યાસની આંકડાકીય શક્તિ (મહત્વ) ઘટાડે છે.

સંશોધકો કે જેઓ ફક્ત આંકડાકીય રીતે નોંધપાત્ર પરિણામો પર ધ્યાન કેન્દ્રિત કરે છે તેઓ ખોટા તારણો પર પહોંચી શકે છે. તે જ સમયે, તેમના કાર્યને બે વાર તપાસવું મુશ્કેલ છે, કારણ કે તેઓ ધારણાઓ લાગુ કરે છે (જે હકીકતમાં α અને p-મૂલ્યો છે). તેથી, આંકડાકીય મહત્વની ગણતરી સાથે, અન્ય સૂચક - આંકડાકીય અસરની તીવ્રતા નક્કી કરવા માટે હંમેશા ભલામણ કરવામાં આવે છે. અસરનું કદ એ અસરની તાકાતનું માત્રાત્મક માપ છે.

ચૂકવેલ સુવિધા.આંકડાકીય મહત્વની સુવિધા માત્ર પસંદગીની યોજનાઓ પર જ ઉપલબ્ધ છે. તે અંદર છે કે કેમ તે તપાસો.

તમે શોધી શકો છો કે સર્વેક્ષણમાં પ્રશ્નોના ઉત્તરદાતાઓના વિવિધ જૂથો તરફથી મળેલા પ્રતિભાવોમાં આંકડાકીય રીતે નોંધપાત્ર તફાવત છે કે કેમ. SurveyMonkey માં આંકડાકીય મહત્વની સુવિધાનો ઉપયોગ કરવા માટે, તમારે:

  • તમારા સર્વેક્ષણમાં પ્રશ્નમાં સરખામણીનો નિયમ ઉમેરતી વખતે આંકડાકીય મહત્વની સુવિધાને સક્ષમ કરો. વિઝ્યુઅલ સરખામણી માટે સર્વેક્ષણ પરિણામોને જૂથોમાં સૉર્ટ કરવા માટે સરખામણી કરવા માટે ઉત્તરદાતાઓના જૂથો પસંદ કરો.
  • ઉત્તરદાતાઓના વિવિધ જૂથો તરફથી મળેલા પ્રતિસાદોમાં આંકડાકીય રીતે નોંધપાત્ર તફાવતો ઓળખવા માટે તમારા સર્વેક્ષણ પ્રશ્નો માટેના ડેટા કોષ્ટકોનું પરીક્ષણ કરો.

આંકડાકીય મહત્વ જુઓ

નીચેના પગલાંને અનુસરીને, તમે એક સર્વે બનાવી શકો છો જે આંકડાકીય મહત્વ દર્શાવે છે.

1. તમારા સર્વેક્ષણમાં બંધ-સમાપ્ત પ્રશ્નો ઉમેરો

પરિણામોનું પૃથ્થકરણ કરતી વખતે આંકડાકીય મહત્વ દર્શાવવા માટે, તમારે તમારા સર્વેક્ષણમાં કોઈપણ પ્રશ્ન માટે સરખામણીનો નિયમ લાગુ કરવો પડશે.

જો તમે તમારી મોજણી ડિઝાઇનમાં નીચેનામાંથી એક પ્રકારના પ્રશ્નોનો ઉપયોગ કરો છો તો તમે સરખામણીનો નિયમ લાગુ કરી શકો છો અને જવાબોમાં આંકડાકીય મહત્વની ગણતરી કરી શકો છો:

તે સુનિશ્ચિત કરવું જરૂરી છે કે સૂચિત જવાબ વિકલ્પોને સંપૂર્ણ જૂથોમાં વિભાજિત કરી શકાય. જ્યારે તમે સરખામણીનો નિયમ બનાવો છો ત્યારે તમે સરખામણી માટે પસંદ કરો છો તે પ્રતિભાવ વિકલ્પોનો ઉપયોગ સમગ્ર સર્વેક્ષણ દરમિયાન ડેટાને ક્રોસટેબમાં ગોઠવવા માટે કરવામાં આવશે.

2. જવાબો એકત્રિત કરો

એકવાર તમે તમારું સર્વેક્ષણ પૂર્ણ કરી લો, પછી તેને વિતરિત કરવા માટે કલેક્ટર બનાવો. ત્યાં અનેક માર્ગો છે.

આંકડાકીય મહત્વને સક્રિય કરવા અને જોવા માટે તમે તમારા સરખામણી નિયમમાં ઉપયોગ કરવાની યોજના બનાવો છો તે દરેક પ્રતિભાવ વિકલ્પ માટે તમારે ઓછામાં ઓછા 30 પ્રતિસાદો પ્રાપ્ત કરવા આવશ્યક છે.

સર્વેનું ઉદાહરણ

તમે જાણવા માગો છો કે શું પુરુષો તમારા ઉત્પાદનોથી સ્ત્રીઓ કરતાં નોંધપાત્ર રીતે વધુ સંતુષ્ટ છે.

  1. તમારા સર્વેક્ષણમાં બે બહુવિધ પસંદગીના પ્રશ્નો ઉમેરો:
    તમારું લિંગ શું છે? (પુરુષ, સ્ત્રી)
    શું તમે અમારા ઉત્પાદનથી સંતુષ્ટ કે અસંતુષ્ટ છો? (સંતુષ્ટ, અસંતુષ્ટ)
  2. ખાતરી કરો કે ઓછામાં ઓછા 30 ઉત્તરદાતાઓ લિંગ પ્રશ્ન માટે "પુરુષ" પસંદ કરે છે અને ઓછામાં ઓછા 30 ઉત્તરદાતાઓ તેમના લિંગ તરીકે "સ્ત્રી" પસંદ કરે છે.
  3. "તમારું લિંગ શું છે?" પ્રશ્નમાં સરખામણીનો નિયમ ઉમેરો. અને તમારા જૂથ તરીકે બંને જવાબ વિકલ્પો પસંદ કરો.
  4. પ્રશ્ન ચાર્ટ નીચે ડેટા કોષ્ટકનો ઉપયોગ કરો "શું તમે અમારા ઉત્પાદનથી સંતુષ્ટ છો કે અસંતુષ્ટ છો?" કોઈપણ પ્રતિભાવ વિકલ્પો આંકડાકીય રીતે નોંધપાત્ર તફાવત દર્શાવે છે કે કેમ તે જોવા માટે

આંકડાકીય રીતે નોંધપાત્ર તફાવત શું છે?

આંકડાકીય રીતે નોંધપાત્ર તફાવતનો અર્થ એ છે કે આંકડાકીય વિશ્લેષણે નિર્ધારિત કર્યું છે કે ઉત્તરદાતાઓના એક જૂથના પ્રતિભાવો અને બીજા જૂથના પ્રતિભાવો વચ્ચે નોંધપાત્ર તફાવત છે. આંકડાકીય મહત્વનો અર્થ એ છે કે મેળવેલ સંખ્યાઓ નોંધપાત્ર રીતે અલગ છે. આવા જ્ઞાન તમને ડેટા વિશ્લેષણમાં ખૂબ મદદ કરશે. જો કે, તમે પ્રાપ્ત પરિણામોનું મહત્વ નક્કી કરો છો. તમે જ નક્કી કરો છો કે સર્વેક્ષણના પરિણામોનું અર્થઘટન કેવી રીતે કરવું અને તેના આધારે શું પગલાં લેવા જોઈએ.

ઉદાહરણ તરીકે, તમને પુરૂષ ગ્રાહકો કરતાં મહિલા ગ્રાહકો તરફથી વધુ ફરિયાદો મળે છે. આવો તફાવત વાસ્તવિક છે કે કેમ તે આપણે કેવી રીતે નક્કી કરી શકીએ અને તેના સંબંધમાં પગલાં લેવાની જરૂર છે કે કેમ? તમારા અવલોકનોને ચકાસવાની એક સરસ રીત એ છે કે એક સર્વેક્ષણ કરવું જે તમને બતાવશે કે પુરૂષ ગ્રાહકો તમારા ઉત્પાદનથી નોંધપાત્ર રીતે વધુ સંતુષ્ટ છે કે નહીં. આંકડાકીય સૂત્રનો ઉપયોગ કરીને, અમારું આંકડાકીય મહત્વ કાર્ય તમને તે નિર્ધારિત કરવાની ક્ષમતા આપશે કે તમારું ઉત્પાદન સ્ત્રીઓ કરતાં પુરુષો માટે ખરેખર વધુ આકર્ષક છે કે કેમ. આ તમને અનુમાન લગાવવાને બદલે તથ્યોના આધારે પગલાં લેવાની મંજૂરી આપશે.

આંકડાકીય રીતે નોંધપાત્ર તફાવત

જો તમારા પરિણામો ડેટા કોષ્ટકમાં પ્રકાશિત થાય છે, તો તેનો અર્થ એ છે કે ઉત્તરદાતાઓના બે જૂથો એકબીજાથી નોંધપાત્ર રીતે અલગ છે. "નોંધપાત્ર" શબ્દનો અર્થ એ નથી કે પરિણામી સંખ્યાઓનું કોઈ ખાસ મહત્વ અથવા મહત્વ છે, માત્ર એટલું જ કે તેમની વચ્ચે આંકડાકીય તફાવત છે.

આંકડાકીય રીતે નોંધપાત્ર તફાવત નથી

જો તમારા પરિણામો સંબંધિત ડેટા કોષ્ટકમાં પ્રકાશિત કરવામાં આવ્યાં નથી, તો તેનો અર્થ એ છે કે બે આંકડાઓની સરખામણીમાં તફાવત હોઈ શકે છે, તેમ છતાં તેમની વચ્ચે કોઈ આંકડાકીય તફાવત નથી.

આંકડાકીય રીતે નોંધપાત્ર તફાવતો વિનાના પ્રતિભાવો દર્શાવે છે કે તમે ઉપયોગ કરો છો તે નમૂનાના કદને જોતાં સરખામણી કરવામાં આવતી બે વસ્તુઓ વચ્ચે કોઈ નોંધપાત્ર તફાવત નથી, પરંતુ તેનો અર્થ એ નથી કે તે નોંધપાત્ર નથી. કદાચ નમૂનાનું કદ વધારીને, તમે આંકડાકીય રીતે નોંધપાત્ર તફાવતને ઓળખી શકશો.

નમૂનાનું કદ

જો તમારી પાસે ખૂબ જ નાનું નમૂનાનું કદ હોય, તો બે જૂથો વચ્ચે માત્ર ખૂબ મોટા તફાવતો નોંધપાત્ર હશે. જો તમારી પાસે નમૂનાનું કદ ખૂબ મોટું છે, તો નાના અને મોટા બંને તફાવતો નોંધપાત્ર તરીકે ગણવામાં આવશે.

જો કે, જો બે નંબરો આંકડાકીય રીતે અલગ હોય, તો તેનો અર્થ એ નથી કે પરિણામો વચ્ચેના તફાવતનો તમારા માટે કોઈ વ્યવહારિક અર્થ છે. તમારે તમારા માટે નક્કી કરવું પડશે કે તમારા સર્વેક્ષણ માટે કયા તફાવતો અર્થપૂર્ણ છે.

આંકડાકીય મહત્વની ગણતરી

અમે પ્રમાણભૂત 95% વિશ્વાસ સ્તરનો ઉપયોગ કરીને આંકડાકીય મહત્વની ગણતરી કરીએ છીએ. જો જવાબનો વિકલ્પ આંકડાકીય રીતે નોંધપાત્ર તરીકે દર્શાવવામાં આવ્યો હોય, તો તેનો અર્થ એ છે કે એકલા તક દ્વારા અથવા નમૂનાની ભૂલને કારણે બે જૂથો વચ્ચેના તફાવતની સંભાવના 5% કરતા ઓછી છે (ઘણીવાર આ રીતે બતાવવામાં આવે છે: p<0,05).

જૂથો વચ્ચે આંકડાકીય રીતે નોંધપાત્ર તફાવતોની ગણતરી કરવા માટે, અમે નીચેના સૂત્રોનો ઉપયોગ કરીએ છીએ:

પરિમાણ

વર્ણન

a1પ્રથમ જૂથના સહભાગીઓની ટકાવારી જેમણે ચોક્કસ રીતે પ્રશ્નનો જવાબ આપ્યો, આ જૂથના નમૂનાના કદ દ્વારા ગુણાકાર.
b1બીજા જૂથના સહભાગીઓની ટકાવારી જેમણે ચોક્કસ રીતે પ્રશ્નનો જવાબ આપ્યો, આ જૂથના નમૂનાના કદ દ્વારા ગુણાકાર.
પૂલ કરેલ નમૂનાનું પ્રમાણ (p)બંને જૂથોના બે શેરનું સંયોજન.
માનક ભૂલ (SE)તમારો હિસ્સો વાસ્તવિક શેરથી કેટલો અલગ છે તેનું સૂચક. નીચા મૂલ્યનો અર્થ એ છે કે અપૂર્ણાંક વાસ્તવિક અપૂર્ણાંકની નજીક છે, ઉચ્ચ મૂલ્યનો અર્થ એ છે કે અપૂર્ણાંક વાસ્તવિક અપૂર્ણાંકથી નોંધપાત્ર રીતે અલગ છે.
પરીક્ષણ આંકડા (t)પરીક્ષણ આંકડા. પ્રમાણભૂત વિચલનોની સંખ્યા જેના દ્વારા આપેલ મૂલ્ય સરેરાશથી અલગ પડે છે.
આંકડાકીય મહત્વજો પરીક્ષણ આંકડાનું સંપૂર્ણ મૂલ્ય સરેરાશથી 1.96* પ્રમાણભૂત વિચલનો કરતાં વધારે હોય, તો તે આંકડાકીય રીતે નોંધપાત્ર તફાવત માનવામાં આવે છે.

*1.96 એ 95% આત્મવિશ્વાસ સ્તર માટે વપરાતું મૂલ્ય છે કારણ કે વિદ્યાર્થીના ટી-વિતરણ કાર્ય દ્વારા નિયંત્રિત શ્રેણીના 95% સરેરાશના 1.96 પ્રમાણભૂત વિચલનોની અંદર આવેલું છે.

ગણતરીનું ઉદાહરણ

ઉપર વપરાયેલ ઉદાહરણ સાથે ચાલુ રાખીને, ચાલો જોઈએ કે શું પુરુષોની ટકાવારી જે કહે છે કે તેઓ તમારા ઉત્પાદનથી સંતુષ્ટ છે તે સ્ત્રીઓની ટકાવારી કરતા નોંધપાત્ર રીતે વધારે છે.

ચાલો કહીએ કે તમારા સર્વેક્ષણમાં 1,000 પુરૂષો અને 1,000 સ્ત્રીઓએ ભાગ લીધો હતો, અને સર્વેક્ષણના પરિણામો દર્શાવે છે કે 70% પુરુષો અને 65% સ્ત્રીઓ કહે છે કે તેઓ તમારા ઉત્પાદનથી સંતુષ્ટ છે. શું 70% સ્તર 65% સ્તર કરતા નોંધપાત્ર રીતે વધારે છે?

સર્વેમાંથી નીચેના ડેટાને આપેલ ફોર્મ્યુલામાં બદલો:

  • p1 (ઉત્પાદનથી સંતુષ્ટ પુરુષોના %) = 0.7
  • p2 (ઉત્પાદનથી સંતુષ્ટ મહિલાઓનો %) = 0.65
  • n1 (સર્વે કરેલ પુરુષોની સંખ્યા) = 1000
  • n2 (મુલાકાત લીધેલ મહિલાઓની સંખ્યા) = 1000

પરીક્ષણ આંકડાનું સંપૂર્ણ મૂલ્ય 1.96 કરતા વધારે હોવાથી, તેનો અર્થ એ છે કે પુરુષો અને સ્ત્રીઓ વચ્ચેનો તફાવત નોંધપાત્ર છે. સ્ત્રીઓની તુલનામાં, પુરુષો તમારા ઉત્પાદનથી સંતુષ્ટ થવાની શક્યતા વધારે છે.

આંકડાકીય મહત્વ છુપાવી રહ્યું છે

બધા પ્રશ્નો માટે આંકડાકીય મહત્વ કેવી રીતે છુપાવવું

  1. ડાબી સાઇડબારમાં સરખામણી નિયમની જમણી બાજુના ડાઉન એરો પર ક્લિક કરો.
  2. એક આઇટમ પસંદ કરો નિયમ સંપાદિત કરો.
  3. સુવિધાને અક્ષમ કરો આંકડાકીય મહત્વ બતાવોસ્વીચનો ઉપયોગ કરીને.
  4. બટન પર ક્લિક કરો અરજી કરો.

એક પ્રશ્ન માટે આંકડાકીય મહત્વ છુપાવવા માટે, તમારે આ કરવાની જરૂર છે:

  1. બટન પર ક્લિક કરો ટ્યુનઆ મુદ્દાની રેખાકૃતિ ઉપર.
  2. ટેબ ખોલો ડિસ્પ્લે વિકલ્પો.
  3. બાજુના બોક્સને અનચેક કરો આંકડાકીય મહત્વ.
  4. બટન પર ક્લિક કરો સાચવો.

જ્યારે આંકડાકીય મહત્વ પ્રદર્શન સક્ષમ હોય ત્યારે પ્રદર્શન વિકલ્પ આપમેળે સક્ષમ થાય છે. જો તમે આ ડિસ્પ્લે વિકલ્પ સાફ કરો છો, તો આંકડાકીય મહત્વ પ્રદર્શન પણ અક્ષમ થઈ જશે.

તમારા સર્વેક્ષણમાં કોઈ પ્રશ્નમાં સરખામણીનો નિયમ ઉમેરતી વખતે આંકડાકીય મહત્વની સુવિધા ચાલુ કરો. ઉત્તરદાતાઓના વિવિધ જૂથો તરફથી મળેલા પ્રતિસાદોમાં આંકડાકીય રીતે નોંધપાત્ર તફાવત છે કે કેમ તે નિર્ધારિત કરવા માટે તમારા સર્વેક્ષણ પ્રશ્નો માટેના ડેટા કોષ્ટકોનું પરીક્ષણ કરો.

તમને શું લાગે છે કે તમારા "અન્ય અડધા" ને વિશેષ અને અર્થપૂર્ણ બનાવે છે? શું તે તેના/તેના વ્યક્તિત્વ સાથે અથવા આ વ્યક્તિ પ્રત્યેની તમારી લાગણીઓ સાથે સંબંધિત છે? અથવા કદાચ સરળ હકીકત સાથે કે તમારી સહાનુભૂતિની અવ્યવસ્થિતતા વિશેની પૂર્વધારણા, અભ્યાસો બતાવે છે, 5% કરતા ઓછી સંભાવના છે? જો આપણે છેલ્લા નિવેદનને વિશ્વસનીય માનીએ, તો સફળ ડેટિંગ સાઇટ્સ સિદ્ધાંતમાં અસ્તિત્વમાં નથી:

જ્યારે તમે તમારી વેબસાઇટનું વિભાજન પરીક્ષણ અથવા અન્ય કોઈપણ વિશ્લેષણ કરો છો, ત્યારે ગેરસમજ "આંકડાકીય મહત્વ" પરિણામોના ખોટા અર્થઘટન તરફ દોરી શકે છે અને તેથી, રૂપાંતરણ ઑપ્ટિમાઇઝેશન પ્રક્રિયામાં ખોટી ક્રિયાઓ થઈ શકે છે. દરેક વર્તમાન ઉદ્યોગમાં દરરોજ કરવામાં આવતા હજારો અન્ય આંકડાકીય પરીક્ષણો માટે આ સાચું છે.

"આંકડાકીય મહત્વ" શું છે તે સમજવા માટે, તમારે શબ્દના ઇતિહાસમાં ડૂબકી મારવાની જરૂર છે, તેનો સાચો અર્થ શીખવો અને સમજવું કે આ "નવી" જૂની સમજણ તમને તમારા સંશોધનનાં પરિણામોનું યોગ્ય અર્થઘટન કરવામાં કેવી રીતે મદદ કરશે.

થોડો ઇતિહાસ

જો કે માનવતા ઘણી સદીઓથી વિવિધ સમસ્યાઓના ઉકેલ માટે આંકડાઓનો ઉપયોગ કરી રહી છે, તેમ છતાં આંકડાકીય મહત્વ, પૂર્વધારણા પરીક્ષણ, રેન્ડમાઇઝેશન અને પ્રયોગોની ડિઝાઇન (DOE) ની આધુનિક સમજ 20મી સદીની શરૂઆતમાં જ આકાર લેવાનું શરૂ થયું હતું અને તે અસ્પષ્ટ રીતે જોડાયેલું છે. સર રોનાલ્ડ ફિશરનું નામ (સર રોનાલ્ડ ફિશર, 1890-1962):

રોનાલ્ડ ફિશર એક ઉત્ક્રાંતિવાદી જીવવિજ્ઞાની અને આંકડાશાસ્ત્રી હતા જેમને પ્રાણી અને છોડના સામ્રાજ્યમાં ઉત્ક્રાંતિ અને કુદરતી પસંદગીના અભ્યાસ માટે વિશેષ જુસ્સો હતો. તેમની પ્રખ્યાત કારકિર્દી દરમિયાન, તેમણે ઘણા ઉપયોગી આંકડાકીય સાધનો વિકસાવ્યા અને લોકપ્રિય બનાવ્યા જેનો આપણે આજે પણ ઉપયોગ કરીએ છીએ.

ફિશરે જીવવિજ્ઞાનમાં પ્રભુત્વ, પરિવર્તન અને આનુવંશિક વિચલનો જેવી પ્રક્રિયાઓને સમજાવવા માટે વિકસાવેલી તકનીકોનો ઉપયોગ કર્યો. અમે વેબ સંસાધનોની સામગ્રીને ઑપ્ટિમાઇઝ કરવા અને સુધારવા માટે આજે સમાન સાધનોનો ઉપયોગ કરી શકીએ છીએ. હકીકત એ છે કે આ વિશ્લેષણ સાધનોનો ઉપયોગ એવા પદાર્થો સાથે કામ કરવા માટે થઈ શકે છે જે તેમની બનાવટ સમયે અસ્તિત્વમાં ન હતા તે ખૂબ જ આશ્ચર્યજનક લાગે છે. તે એટલું જ આશ્ચર્યજનક છે કે લોકો કેલ્ક્યુલેટર અથવા કમ્પ્યુટર વિના જટિલ ગણતરીઓ કરતા હતા.

આંકડાકીય પ્રયોગના પરિણામોને સાચા હોવાની ઉચ્ચ સંભાવના તરીકે વર્ણવવા માટે, ફિશરે "મહત્વ" શબ્દનો ઉપયોગ કર્યો.

ઉપરાંત, ફિશરના સૌથી રસપ્રદ વિકાસમાંના એકને "સેક્સી પુત્ર" પૂર્વધારણા કહી શકાય. આ થિયરી અનુસાર, સ્ત્રીઓ સેક્સ્યુઅલી પ્રોમિસ્ક્યુઅસ પુરુષો (પ્રોમિસ્ક્યુઅસ) પસંદ કરે છે કારણ કે આનાથી આ પુરુષોને જન્મેલા પુત્રો સમાન વલણ ધરાવતા અને વધુ સંતાનો પેદા કરવા દેશે (નોંધ કરો કે આ માત્ર એક સિદ્ધાંત છે).

પરંતુ કોઈ પણ વ્યક્તિ, તેજસ્વી વૈજ્ઞાનિકો પણ, ભૂલો કરવાથી મુક્ત નથી. ફિશરની ભૂલો હજુ પણ પ્લેગ નિષ્ણાતોને આજ સુધી. પરંતુ આલ્બર્ટ આઈન્સ્ટાઈનના શબ્દો યાદ રાખો: "જેણે ક્યારેય ભૂલ કરી નથી તેણે ક્યારેય કંઈપણ નવું બનાવ્યું નથી."

આગલા મુદ્દા પર આગળ વધતા પહેલા, યાદ રાખો: આંકડાકીય મહત્વ એ છે કે જ્યારે પરીક્ષણ પરિણામોમાં તફાવત એટલો મોટો હોય કે તફાવત રેન્ડમ પરિબળો દ્વારા સમજાવી શકાતો નથી.

તમારી પૂર્વધારણા શું છે?

"આંકડાકીય મહત્વ" નો અર્થ શું છે તે સમજવા માટે, તમારે પહેલા "પૂર્તિકલ્પના પરીક્ષણ" શું છે તે સમજવાની જરૂર છે, કારણ કે બે શબ્દો નજીકથી જોડાયેલા છે.
પૂર્વધારણા માત્ર એક સિદ્ધાંત છે. એકવાર તમે સિદ્ધાંત વિકસાવી લો, તમારે પૂરતા પુરાવા એકત્ર કરવા અને ખરેખર તે પુરાવા એકત્રિત કરવા માટેની પ્રક્રિયા સ્થાપિત કરવાની જરૂર પડશે. ત્યાં બે પ્રકારની પૂર્વધારણાઓ છે.

સફરજન અથવા નારંગી - જે વધુ સારું છે?

શૂન્ય પૂર્વધારણા

એક નિયમ તરીકે, આ તે છે જ્યાં ઘણા લોકો મુશ્કેલીઓ અનુભવે છે. ધ્યાનમાં રાખવાની એક વાત એ છે કે નલ પૂર્વધારણા એવી વસ્તુ નથી જેને સાબિત કરવાની જરૂર છે, જેમ કે તમે સાબિત કરો છો કે વેબસાઇટ પરના ચોક્કસ ફેરફારથી રૂપાંતરણમાં વધારો થશે, પરંતુ તેનાથી ઊલટું. શૂન્ય પૂર્વધારણા એ એક સિદ્ધાંત છે જે જણાવે છે કે જો તમે સાઇટમાં કોઈ ફેરફાર કરો છો, તો કંઈ થશે નહીં. અને સંશોધકનું ધ્યેય આ સિદ્ધાંતનું ખંડન કરવાનું છે, તેને સાબિત કરવું નહીં.

જો આપણે ગુનાઓને ઉકેલવાના અનુભવને જોઈએ તો, જ્યાં તપાસકર્તાઓ પણ ગુનેગાર કોણ છે તે અંગેની પૂર્વધારણાઓ રચે છે, શૂન્ય પૂર્વધારણા નિર્દોષતાની કહેવાતી ધારણાનું સ્વરૂપ લે છે, જે ખ્યાલ મુજબ આરોપી દોષિત સાબિત ન થાય ત્યાં સુધી નિર્દોષ માનવામાં આવે છે. કાયદાની અદાલતમાં.

જો શૂન્ય પૂર્વધારણા એ છે કે બે ઑબ્જેક્ટ તેમના ગુણધર્મોમાં સમાન છે, અને તમે સાબિત કરવાનો પ્રયાસ કરી રહ્યાં છો કે એક વધુ સારી છે (ઉદાહરણ તરીકે, A B કરતાં વધુ સારી છે), તો તમારે વિકલ્પની તરફેણમાં નલ પૂર્વધારણાને નકારી કાઢવાની જરૂર છે. ઉદાહરણ તરીકે, તમે એક અથવા બીજા કન્વર્ઝન ઑપ્ટિમાઇઝેશન ટૂલની સરખામણી કરી રહ્યાં છો. શૂન્ય પૂર્વધારણામાં, તેઓ બંને લક્ષ્ય પર સમાન અસર (અથવા કોઈ અસર નથી) ધરાવે છે. વૈકલ્પિક રીતે, તેમાંથી એકની અસર વધુ સારી છે.

તમારી વૈકલ્પિક પૂર્વધારણામાં સંખ્યાત્મક મૂલ્ય હોઈ શકે છે, જેમ કે B - A > 20%. આ કિસ્સામાં, નલ પૂર્વધારણા અને વૈકલ્પિક નીચેનું સ્વરૂપ લઈ શકે છે:

વૈકલ્પિક પૂર્વધારણાનું બીજું નામ સંશોધન પૂર્વધારણા છે કારણ કે સંશોધક હંમેશા આ ચોક્કસ પૂર્વધારણાને સાબિત કરવામાં રસ ધરાવે છે.

આંકડાકીય મહત્વ અને p મૂલ્ય

ચાલો ફરીથી રોનાલ્ડ ફિશર અને આંકડાકીય મહત્વના તેમના ખ્યાલ પર પાછા ફરીએ.

હવે જ્યારે તમારી પાસે એક શૂન્ય પૂર્વધારણા અને વિકલ્પ છે, તો તમે એકને કેવી રીતે સાબિત કરી શકો અને બીજાને ખોટા સાબિત કરી શકો?

આંકડાઓ, તેમના સ્વભાવથી, ચોક્કસ વસ્તી (નમૂનો) ના અભ્યાસને સામેલ કરે છે, તેથી તમે પ્રાપ્ત પરિણામો વિશે ક્યારેય 100% ખાતરી ન હોઈ શકો. એક સારું ઉદાહરણ: ચૂંટણીના પરિણામો મોટાભાગે પ્રારંભિક મતદાન અને એક્ઝિટ પૂલના પરિણામોથી અલગ હોય છે.

ડૉ. ફિશર એક વિભાજન રેખા બનાવવા માગે છે જે તમને જણાવશે કે તમારો પ્રયોગ સફળ થયો કે નહીં. આ રીતે વિશ્વસનીયતા સૂચકાંક દેખાયો. વિશ્વસનીયતા એ સ્તર છે જે આપણે કહેવા માટે લઈએ છીએ કે આપણે શું "નોંધપાત્ર" માનીએ છીએ અને શું નથી. જો "p", મહત્વ સૂચકાંક, 0.05 અથવા તેનાથી ઓછું છે, તો પરિણામો વિશ્વસનીય છે.

ચિંતા કરશો નહીં, તે વાસ્તવમાં તેટલું ગૂંચવણભર્યું નથી જેટલું લાગે છે.

ગૌસીયન સંભાવના વિતરણ. કિનારીઓ સાથે ચલના ઓછા સંભવિત મૂલ્યો છે, કેન્દ્રમાં સૌથી વધુ સંભવિત છે. પી-સ્કોર (લીલો છાંયો વિસ્તાર) એ અવલોકન કરેલ પરિણામની સંભાવના છે.

સામાન્ય સંભાવના વિતરણ (ગૌસીયન વિતરણ) એ ગ્રાફ (ઉપરની આકૃતિમાં) અને તેમની ફ્રીક્વન્સીઝ પર ચોક્કસ ચલના તમામ સંભવિત મૂલ્યોનું પ્રતિનિધિત્વ છે. જો તમે તમારું સંશોધન યોગ્ય રીતે કરો અને પછી તમારા બધા જવાબોને ગ્રાફ પર લખો, તો તમને બરાબર આ વિતરણ મળશે. સામાન્ય વિતરણ મુજબ, તમને સમાન જવાબોની મોટી ટકાવારી પ્રાપ્ત થશે, અને બાકીના વિકલ્પો ગ્રાફની ધાર પર સ્થિત હશે (કહેવાતા "પૂંછડીઓ"). મૂલ્યોનું આ વિતરણ ઘણીવાર પ્રકૃતિમાં જોવા મળે છે, તેથી જ તેને "સામાન્ય" કહેવામાં આવે છે.

તમારા નમૂના અને પરીક્ષણ પરિણામો પર આધારિત સમીકરણનો ઉપયોગ કરીને, તમે "પરીક્ષણ આંકડા" તરીકે ઓળખાતી ગણતરી કરી શકો છો, જે સૂચવે છે કે તમારા પરિણામો કેટલા વિચલિત થાય છે. તે તમને એ પણ કહેશે કે તમે શૂન્ય પૂર્વધારણા સાચી હોવાની કેટલી નજીક છો.

તેની આસપાસ તમારું માથું મેળવવામાં મદદ કરવા માટે, આંકડાકીય મહત્વની ગણતરી કરવા માટે ઑનલાઇન કેલ્ક્યુલેટરનો ઉપયોગ કરો:

આવા કેલ્ક્યુલેટરનું એક ઉદાહરણ

અક્ષર "p" સંભાવના દર્શાવે છે કે શૂન્ય પૂર્વધારણા સાચી છે. જો સંખ્યા નાની હોય, તો તે પરીક્ષણ જૂથો વચ્ચેનો તફાવત સૂચવે છે, જ્યારે શૂન્ય પૂર્વધારણા એ હશે કે તેઓ સમાન છે. ગ્રાફિકલી, એવું લાગશે કે તમારા પરીક્ષણના આંકડા તમારા ઘંટડીના આકારના વિતરણની પૂંછડીઓમાંથી એકની નજીક હશે.

ડૉ. ફિશરે p ≤ 0.05 પર મહત્વની મર્યાદા નક્કી કરવાનું નક્કી કર્યું. જો કે, આ નિવેદન વિવાદાસ્પદ છે, કારણ કે તે બે મુશ્કેલીઓ તરફ દોરી જાય છે:

1. પ્રથમ, હકીકત એ છે કે તમે નલ પૂર્વધારણાને ખોટી સાબિત કરી છે તેનો અર્થ એ નથી કે તમે વૈકલ્પિક પૂર્વધારણા સાબિત કરી છે. આ તમામ મહત્વનો અર્થ એ છે કે તમે A અથવા B બંનેમાંથી એકને સાબિત કરી શકતા નથી.

2. બીજું, જો p-સ્કોર 0.049 છે, તો તેનો અર્થ એ થશે કે નલ પૂર્વધારણાની સંભાવના 4.9% હશે. આનો અર્થ એ થઈ શકે છે કે તમારા પરીક્ષણ પરિણામો એક જ સમયે સાચા અને ખોટા બંને હોઈ શકે છે.

તમે પી-સ્કોરનો ઉપયોગ કરી શકો કે ન પણ કરી શકો, પરંતુ તે પછી તમારે કેસ-બાય-કેસ આધારે શૂન્ય પૂર્વધારણાની સંભાવનાની ગણતરી કરવી પડશે અને નક્કી કરવું પડશે કે શું તે તમને આયોજિત અને પરીક્ષણ કરેલ ફેરફારો કરવાથી અટકાવી શકે તેટલું મોટું છે. .

આજે આંકડાકીય કસોટી હાથ ધરવા માટેનું સૌથી સામાન્ય દૃશ્ય એ છે કે પરીક્ષણ પોતે ચલાવતા પહેલા p ≤ 0.05 ની મહત્વની થ્રેશોલ્ડ સેટ કરવી. તમારા પરિણામો તપાસતી વખતે ફક્ત p-મૂલ્યને નજીકથી જોવાની ખાતરી કરો.

ભૂલો 1 અને 2

એટલો સમય વીતી ગયો છે કે આંકડાકીય મહત્વના મેટ્રિકનો ઉપયોગ કરતી વખતે જે ભૂલો થઈ શકે છે તેને તેમના પોતાના નામ પણ આપવામાં આવ્યા છે.

પ્રકાર 1 ભૂલો

ઉપર સૂચવ્યા મુજબ, 0.05 ની p-વેલ્યુનો અર્થ છે કે 5% સંભાવના છે કે નલ પૂર્વધારણા સાચી છે. જો તમે નહીં કરો, તો તમે ભૂલ નંબર 1 કરશો. પરિણામો કહે છે કે તમારી નવી વેબસાઇટે તમારા રૂપાંતરણ દરમાં વધારો કર્યો છે, પરંતુ 5% શક્યતા છે કે તે ન થયું.

પ્રકાર 2 ભૂલો

આ ભૂલ ભૂલ 1 ની વિરુદ્ધ છે: જ્યારે તે ખોટી હોય ત્યારે તમે નલ પૂર્વધારણા સ્વીકારો છો. ઉદાહરણ તરીકે, પરીક્ષણ પરિણામો તમને જણાવે છે કે સાઇટ પર કરવામાં આવેલા ફેરફારોમાં કોઈ સુધારો થયો નથી, જ્યારે ફેરફારો હતા. પરિણામે, તમે તમારું પ્રદર્શન સુધારવાની તક ગુમાવો છો.

અપર્યાપ્ત નમૂનાના કદ સાથેના પરીક્ષણોમાં આ ભૂલ સામાન્ય છે, તેથી યાદ રાખો: નમૂના જેટલો મોટો, તેટલું વધુ વિશ્વસનીય પરિણામ.

નિષ્કર્ષ

સંશોધકોમાં આંકડાકીય મહત્વ જેટલો લોકપ્રિય કદાચ કોઈ શબ્દ નથી. જ્યારે પરીક્ષણ પરિણામો આંકડાકીય રીતે નોંધપાત્ર ન જણાય, ત્યારે પરિણામ રૂપાંતરણ દરમાં વધારાથી લઈને કંપનીના પતન સુધીની શ્રેણીમાં હોય છે.

અને કારણ કે માર્કેટર્સ તેમના સંસાધનોને ઑપ્ટિમાઇઝ કરતી વખતે આ શબ્દનો ઉપયોગ કરે છે, તમારે તેનો ખરેખર અર્થ શું છે તે જાણવાની જરૂર છે. કસોટીની શરતો બદલાઈ શકે છે, પરંતુ નમૂનાનું કદ અને સફળતાના માપદંડ હંમેશા મહત્વપૂર્ણ છે. આ યાદ રાખો.

આંકડાકીય મહત્વ અથવા મહત્વનું p-સ્તર એ પરીક્ષણનું મુખ્ય પરિણામ છે

આંકડાકીય પૂર્વધારણા. તકનીકી દ્રષ્ટિએ, આ આપેલ પ્રાપ્ત કરવાની સંભાવના છે

નમૂના અભ્યાસનું પરિણામ, જો કે સામાન્ય માટે હકીકતમાં

એકંદરમાં, નલ આંકડાકીય પૂર્વધારણા સાચી છે - એટલે કે, ત્યાં કોઈ જોડાણ નથી. બીજા શબ્દોમાં કહીએ તો, આ

સંભવિતતા કે શોધાયેલ સંબંધ રેન્ડમ છે અને મિલકત નથી

સંપૂર્ણતા તે આંકડાકીય મહત્વ છે, મહત્વનું p-સ્તર, એટલે કે

સંદેશાવ્યવહારની વિશ્વસનીયતાનું જથ્થાત્મક મૂલ્યાંકન: આ સંભાવના જેટલી ઓછી છે, કનેક્શન વધુ વિશ્વસનીય છે.

ધારો કે, બે નમૂનાના માધ્યમની સરખામણી કરતી વખતે, એક સ્તર મૂલ્ય પ્રાપ્ત થયું હતું

આંકડાકીય મહત્વ p=0.05. આનો અર્થ એ છે કે આંકડાકીય પૂર્વધારણાનું પરીક્ષણ કરવું

વસ્તીમાં અર્થની સમાનતા દર્શાવે છે કે જો તે સાચું છે, તો સંભાવના

શોધાયેલ તફાવતોની રેન્ડમ ઘટના 5% થી વધુ નથી. બીજા શબ્દોમાં કહીએ તો, જો

એક જ વસ્તીમાંથી બે નમૂનાઓ વારંવાર લેવામાં આવ્યા હતા, પછી 1 માં

20 કેસ, આ નમૂનાઓના માધ્યમો વચ્ચે સમાન અથવા વધુ તફાવત જોવા મળશે.

એટલે કે, ત્યાં 5% તક છે કે તફાવતો તકને કારણે છે.

પાત્ર, અને એકંદરની મિલકત નથી.

વૈજ્ઞાનિક પૂર્વધારણાના સંબંધમાં, આંકડાકીય મહત્વનું સ્તર માત્રાત્મક છે

કનેક્શનના અસ્તિત્વ વિશેના નિષ્કર્ષમાં અવિશ્વાસની ડિગ્રીનું સૂચક, પરિણામોમાંથી ગણવામાં આવે છે

આ પૂર્વધારણાનું પસંદગીયુક્ત, પ્રયોગમૂલક પરીક્ષણ. પી-લેવલ મૂલ્ય જેટલું ઓછું, તેટલું વધારે

વૈજ્ઞાનિક પૂર્વધારણાની પુષ્ટિ કરતા સંશોધન પરિણામનું આંકડાકીય મહત્વ.

મહત્વના સ્તરને શું અસર કરે છે તે જાણવું ઉપયોગી છે. મહત્વ સ્તર, અન્ય વસ્તુઓ સમાન છે

શરતો વધારે છે (p-સ્તરનું મૂલ્ય ઓછું છે) જો:

જોડાણની તીવ્રતા (તફાવત) વધારે છે;

લક્ષણ(ઓ) ની પરિવર્તનક્ષમતા ઓછી છે;

નમૂનાનું કદ(ઓ) મોટું છે.

એકપક્ષીયદ્વિ-પક્ષીય મહત્વ પરીક્ષણો

જો અભ્યાસનો હેતુ બે સામાન્યના પરિમાણોમાં તફાવતોને ઓળખવાનો છે

એકંદર કે જે તેની વિવિધ કુદરતી પરિસ્થિતિઓને અનુરૂપ છે (જીવંત પરિસ્થિતિઓ,

વિષયોની ઉંમર, વગેરે), તો તે ઘણીવાર અજ્ઞાત હોય છે કે આમાંથી કયા પરિમાણો વધુ હશે, અને

કયું નાનું છે?

ઉદાહરણ તરીકે, જો તમે પરીક્ષણમાં પરિણામોની પરિવર્તનશીલતામાં રસ ધરાવો છો અને

પ્રાયોગિક જૂથો, પછી, એક નિયમ તરીકે, ભિન્નતામાં તફાવતના સંકેતમાં કોઈ વિશ્વાસ નથી અથવા

પરિણામોના પ્રમાણભૂત વિચલનો કે જેના દ્વારા પરિવર્તનશીલતાનું મૂલ્યાંકન કરવામાં આવે છે. આ કિસ્સામાં

નલ પૂર્વધારણા એ છે કે તફાવતો સમાન છે, અને અભ્યાસનો હેતુ છે

વિરુદ્ધ સાબિત કરો, એટલે કે. ભિન્નતા વચ્ચેના તફાવતોની હાજરી. તે માન્ય છે

તફાવત કોઈપણ નિશાનીનો હોઈ શકે છે. આવી પૂર્વધારણાઓને દ્વિપક્ષીય કહેવામાં આવે છે.

પરંતુ કેટલીકવાર પરિમાણમાં વધારો અથવા ઘટાડો સાબિત કરવાનો પડકાર હોય છે;

ઉદાહરણ તરીકે, પ્રાયોગિક જૂથમાં સરેરાશ પરિણામ નિયંત્રણ જૂથ કરતા વધારે છે. તે જ સમયે

તે હવે મંજૂર નથી કે તફાવત અલગ ચિહ્નનો હોઈ શકે છે. આવી પૂર્વધારણાઓ કહેવામાં આવે છે

એકતરફી.

બે-બાજુની પૂર્વધારણાઓને ચકાસવા માટે વપરાતા મહત્વના પરીક્ષણો કહેવામાં આવે છે

ડબલ-બાજુવાળા, અને એકતરફી માટે - એકપક્ષીય.

પ્રશ્ન એ ઊભો થાય છે કે આપેલ કિસ્સામાં કયો માપદંડ પસંદ કરવો જોઈએ. જવાબ આપો

આ પ્રશ્ન ઔપચારિક આંકડાકીય પદ્ધતિઓના અવકાશની બહાર છે અને સંપૂર્ણપણે છે

અભ્યાસના લક્ષ્યો પર આધાર રાખે છે. કોઈ પણ સંજોગોમાં તમારે પછી એક અથવા અન્ય માપદંડ પસંદ કરવો જોઈએ નહીં

પ્રાયોગિક ડેટાના પૃથ્થકરણના આધારે પ્રયોગ હાથ ધરવો, કારણ કે આ થઈ શકે છે

ખોટા તારણો તરફ દોરી જાય છે. જો, પ્રયોગ હાથ ધરતા પહેલા, એવું માનવામાં આવે છે કે તફાવત

તુલનાત્મક પરિમાણો કાં તો હકારાત્મક અથવા નકારાત્મક હોઈ શકે છે, પછી તમારે જોઈએ

ચલો વચ્ચેના કોઈપણ સંબંધની મુખ્ય લાક્ષણિકતાઓ.

આપણે ચલો વચ્ચેના સંબંધના બે સરળ ગુણધર્મોને નોંધી શકીએ છીએ: (a) સંબંધની તીવ્રતા અને (b) સંબંધની વિશ્વસનીયતા.

- તીવ્રતા . વિશ્વસનીયતા કરતાં નિર્ભરતાની તીવ્રતા સમજવા અને માપવામાં સરળ છે. ઉદાહરણ તરીકે, જો સેમ્પલમાં કોઈ પણ પુરૂષમાં શ્વેત રક્તકણોની સંખ્યા (WCC) મૂલ્ય કોઈપણ સ્ત્રી કરતા વધારે હોય, તો તમે કહી શકો કે બે ચલો (લિંગ અને WCC) વચ્ચેનો સંબંધ ઘણો વધારે છે. બીજા શબ્દોમાં કહીએ તો, તમે બીજાના મૂલ્યોમાંથી એક ચલના મૂલ્યોની આગાહી કરી શકો છો.

- વિશ્વસનીયતા ("સત્ય"). પરસ્પર નિર્ભરતાની વિશ્વસનીયતા પરાધીનતાની તીવ્રતા કરતાં ઓછી સાહજિક ખ્યાલ છે, પરંતુ તે અત્યંત મહત્વપૂર્ણ છે. સંબંધની વિશ્વસનીયતા ચોક્કસ નમૂનાની પ્રતિનિધિત્વ સાથે સીધી રીતે સંબંધિત છે જેના આધારે તારણો કાઢવામાં આવે છે. બીજા શબ્દોમાં કહીએ તો, વિશ્વસનીયતા એ સંદર્ભ આપે છે કે તે જ વસ્તીમાંથી દોરવામાં આવેલા અન્ય નમૂનામાંથી ડેટાનો ઉપયોગ કરીને સંબંધની પુનઃશોધ (બીજા શબ્દોમાં, પુષ્ટિ) કરવામાં આવશે.

તે યાદ રાખવું જોઈએ કે અંતિમ ધ્યેય લગભગ ક્યારેય મૂલ્યોના આ વિશિષ્ટ નમૂનાનો અભ્યાસ કરવાનું નથી; એક નમૂનો માત્ર એટલું જ રસ ધરાવે છે કારણ કે તે સમગ્ર વસ્તી વિશે માહિતી પ્રદાન કરે છે. જો અભ્યાસ ચોક્કસ ચોક્કસ માપદંડોને સંતોષે છે, તો નમૂનાના ચલો વચ્ચેના સંબંધોની વિશ્વસનીયતા પ્રમાણભૂત આંકડાકીય માપનો ઉપયોગ કરીને પ્રમાણિત કરી શકાય છે અને રજૂ કરી શકાય છે.

અવલંબન તીવ્રતા અને વિશ્વસનીયતા ચલો વચ્ચેની નિર્ભરતાની બે અલગ અલગ લાક્ષણિકતાઓનું પ્રતિનિધિત્વ કરે છે. જો કે, એવું ન કહી શકાય કે તેઓ સંપૂર્ણપણે સ્વતંત્ર છે. સામાન્ય કદના નમૂનામાં ચલો વચ્ચેના સંબંધ (કનેક્શન) ની તીવ્રતા જેટલી વધારે છે, તે વધુ વિશ્વસનીય છે (આગળનો વિભાગ જુઓ).

પરિણામનું આંકડાકીય મહત્વ (p-સ્તર) એ તેના "સત્ય" ("નમૂનાની પ્રતિનિધિત્વ" ના અર્થમાં) માં વિશ્વાસનું અંદાજિત માપ છે. વધુ તકનીકી રીતે કહીએ તો, p-સ્તર એ એક માપ છે જે પરિણામની વિશ્વસનીયતા સાથે તીવ્રતાના ઘટતા ક્રમમાં બદલાય છે. ઉચ્ચ પી-સ્તર નમૂનામાં જોવા મળતા ચલો વચ્ચેના સંબંધમાં આત્મવિશ્વાસના નીચલા સ્તરને અનુરૂપ છે. જેમ કે, p-સ્તર સમગ્ર વસ્તીને અવલોકન કરેલ પરિણામના વિતરણ સાથે સંકળાયેલ ભૂલની સંભાવના દર્શાવે છે.

ઉદાહરણ તરીકે, p-સ્તર = 0.05(એટલે ​​​​કે 1/20) સૂચવે છે કે 5% તક છે કે નમૂનામાં જોવા મળતા ચલો વચ્ચેનો સંબંધ માત્ર નમૂનાની રેન્ડમ વિશેષતા છે. ઘણા અભ્યાસોમાં, 0.05 ના પી-લેવલને ભૂલના સ્તર માટે "સ્વીકાર્ય માર્જિન" ગણવામાં આવે છે.

મહત્વના કયા સ્તરને ખરેખર "નોંધપાત્ર" ગણવું જોઈએ તે નક્કી કરવામાં મનસ્વીતાને ટાળવાનો કોઈ રસ્તો નથી. ચોક્કસ મહત્વના સ્તરની પસંદગી કે જેના ઉપર પરિણામો ખોટા તરીકે નકારવામાં આવે તે તદ્દન મનસ્વી છે.



વ્યવહારમાં, અંતિમ નિર્ણય સામાન્ય રીતે તેના પર આધાર રાખે છે કે શું પરિણામની પૂર્વાનુમાન પ્રાયોરી (એટલે ​​​​કે, પ્રયોગ હાથ ધરવામાં આવે તે પહેલાં) અથવા વિવિધ ડેટા પર કરવામાં આવેલા ઘણા વિશ્લેષણો અને સરખામણીઓના પરિણામે પોસ્ટરીઓરી શોધ્યું હતું. અભ્યાસ ક્ષેત્રની પરંપરા.

સામાન્ય રીતે, ઘણા ક્ષેત્રોમાં, p.05 નું પરિણામ એ આંકડાકીય મહત્વ માટે સ્વીકાર્ય કટઓફ છે, પરંતુ ધ્યાનમાં રાખો કે આ સ્તરમાં હજુ પણ ભૂલના એકદમ મોટા માર્જિન (5%)નો સમાવેશ થાય છે.

p.01 સ્તરે નોંધપાત્ર પરિણામોને સામાન્ય રીતે આંકડાકીય રીતે મહત્ત્વપૂર્ણ ગણવામાં આવે છે, જ્યારે p.005 અથવા p.00 સ્તરે પરિણામોને સામાન્ય રીતે આંકડાકીય રીતે મહત્ત્વપૂર્ણ ગણવામાં આવે છે. 001 અત્યંત નોંધપાત્ર તરીકે. જો કે, તે સમજવું જોઈએ કે મહત્વના સ્તરોનું આ વર્ગીકરણ તદ્દન મનસ્વી છે અને તે માત્ર વ્યવહારુ અનુભવના આધારે અપનાવવામાં આવેલ અનૌપચારિક કરાર છે. અભ્યાસના ચોક્કસ ક્ષેત્રમાં.

તે સ્પષ્ટ છે કે એકત્રિત ડેટાની સંપૂર્ણતા પર જેટલા વધુ વિશ્લેષણ કરવામાં આવે છે, તેટલી મોટી સંખ્યામાં નોંધપાત્ર (પસંદ કરેલા સ્તરે) પરિણામો સંપૂર્ણ રીતે તક દ્વારા શોધવામાં આવશે.

કેટલીક આંકડાકીય પદ્ધતિઓ કે જેમાં ઘણી સરખામણીઓ સામેલ હોય છે, અને આ રીતે આ પ્રકારની ભૂલને પુનરાવર્તિત કરવાની નોંધપાત્ર તક હોય છે, કુલ સરખામણીઓની સંખ્યા માટે વિશેષ ગોઠવણ અથવા સુધારણા કરે છે. જો કે, ઘણી આંકડાકીય પદ્ધતિઓ (ખાસ કરીને સરળ સંશોધનાત્મક ડેટા વિશ્લેષણ પદ્ધતિઓ) આ સમસ્યાને હલ કરવાની કોઈ રીત પ્રદાન કરતી નથી.

જો ચલો વચ્ચેનો સંબંધ "ઉદ્દેશાત્મક રીતે" નબળો હોય, તો મોટા નમૂનાનો અભ્યાસ કરવા સિવાય આવા સંબંધને ચકાસવાનો બીજો કોઈ રસ્તો નથી. જો નમૂનો સંપૂર્ણ રીતે પ્રતિનિધિત્વ ધરાવતું હોય તો પણ, જો નમૂનો નાનો હોય તો અસર આંકડાકીય રીતે નોંધપાત્ર રહેશે નહીં. તેવી જ રીતે, જો કોઈ સંબંધ "ઉદ્દેશાત્મક રીતે" ખૂબ જ મજબૂત હોય, તો તે ખૂબ જ નાના નમૂનામાં પણ ઉચ્ચ ડિગ્રીના મહત્વ સાથે શોધી શકાય છે.

ચલો વચ્ચેનો સંબંધ જેટલો નબળો હશે, તેને અર્થપૂર્ણ રીતે શોધવા માટે જરૂરી નમૂનાનું કદ જેટલું મોટું છે.

ઘણા વિવિધ સંબંધનાં પગલાં ચલો વચ્ચે. ચોક્કસ અભ્યાસમાં ચોક્કસ માપની પસંદગી ચલોની સંખ્યા, વપરાયેલ માપન સ્કેલ, સંબંધોની પ્રકૃતિ વગેરે પર આધાર રાખે છે.

જો કે, આમાંના મોટા ભાગના પગલાં સામાન્ય સિદ્ધાંતને અનુસરે છે: તેઓ પ્રશ્નમાં રહેલા ચલો વચ્ચેના "મહત્તમ કલ્પનાશીલ સંબંધ" સાથે સરખામણી કરીને અવલોકન કરેલ સંબંધનો અંદાજ કાઢવાનો પ્રયાસ કરે છે. તકનીકી રીતે કહીએ તો, આવા અંદાજો બનાવવાની સામાન્ય રીત એ છે કે ચલોની કિંમતો કેવી રીતે બદલાય છે તે જોવાની અને પછી ગણતરી કરવી કે ઉપલબ્ધ કુલ ભિન્નતામાંથી કેટલી "સામાન્ય" ("સંયુક્ત") વિવિધતાની હાજરી દ્વારા સમજાવી શકાય. બે (અથવા વધુ) ચલો.

મહત્વ મુખ્યત્વે નમૂનાના કદ પર આધારિત છે. પહેલેથી જ સમજાવ્યું છે તેમ, ખૂબ મોટા નમૂનાઓમાં પણ ચલો વચ્ચેના ખૂબ નબળા સંબંધો નોંધપાત્ર હશે, જ્યારે નાના નમૂનાઓમાં પણ ખૂબ મજબૂત સંબંધો વિશ્વસનીય નથી.

આમ, આંકડાકીય મહત્વના સ્તરને નિર્ધારિત કરવા માટે, એક કાર્યની જરૂર છે જે દરેક નમૂનાના કદ માટેના ચલો વચ્ચેના સંબંધના "વિશિષ્ટતા" અને "મહત્વ" વચ્ચેના સંબંધને રજૂ કરે.

આવા કાર્ય બરાબર સૂચવે છે કે "વસ્તીમાં આવી કોઈ અવલંબન નથી એમ માનીને આપેલ કદના નમૂનામાં આપેલ મૂલ્ય (અથવા વધુ) ની અવલંબન મેળવવાની કેટલી સંભાવના છે." બીજા શબ્દોમાં કહીએ તો, આ કાર્ય એક મહત્વ સ્તર આપશે
(p-સ્તર), અને તેથી, વસ્તીમાં આ અવલંબનની ગેરહાજરીની ધારણાને ભૂલથી નકારી કાઢવાની સંભાવના.

આ "વૈકલ્પિક" પૂર્વધારણા (કે વસ્તીમાં કોઈ સંબંધ નથી) સામાન્ય રીતે કહેવાય છે નલ પૂર્વધારણા.

તે આદર્શ હશે જો ભૂલની સંભાવનાની ગણતરી કરતું કાર્ય રેખીય હોય અને વિવિધ નમૂનાના કદ માટે માત્ર અલગ ઢોળાવ ધરાવતા હોય. કમનસીબે, આ કાર્ય વધુ જટિલ છે અને હંમેશા બરાબર એકસરખું હોતું નથી. જો કે, મોટાભાગના કિસ્સાઓમાં તેનું સ્વરૂપ જાણીતું છે અને આપેલ કદના નમૂનાઓના અભ્યાસમાં મહત્વના સ્તરો નક્કી કરવા માટે તેનો ઉપયોગ કરી શકાય છે. આમાંના મોટા ભાગના ફંક્શન્સ નામના વિતરણના વર્ગ સાથે સંકળાયેલા છે સામાન્ય .



શું તમને લેખ ગમ્યો? તમારા મિત્રો સાથે શેર કરો!
પણ વાંચો