રીગ્રેસન અને સહસંબંધ વિશ્લેષણ એ આંકડાકીય સંશોધન પદ્ધતિઓ છે. એક અથવા વધુ સ્વતંત્ર ચલો પર પરિમાણની અવલંબન દર્શાવવાની આ સૌથી સામાન્ય રીતો છે.
નીચે, ચોક્કસ વ્યવહારુ ઉદાહરણોનો ઉપયોગ કરીને, અમે અર્થશાસ્ત્રીઓમાં આ બે ખૂબ જ લોકપ્રિય વિશ્લેષણોને ધ્યાનમાં લઈશું. અમે તેમને સંયોજિત કરતી વખતે પરિણામો મેળવવાનું ઉદાહરણ પણ આપીશું.
એક્સેલમાં રીગ્રેશન એનાલિસિસ
આશ્રિત ચલ પર કેટલાક મૂલ્યો (સ્વતંત્ર, સ્વતંત્ર) નો પ્રભાવ દર્શાવે છે. ઉદાહરણ તરીકે, આર્થિક રીતે સક્રિય વસ્તીની સંખ્યા એન્ટરપ્રાઇઝની સંખ્યા, વેતન અને અન્ય પરિમાણો પર કેવી રીતે આધાર રાખે છે. અથવા: વિદેશી રોકાણો, ઉર્જાના ભાવો, વગેરે જીડીપીના સ્તરને કેવી રીતે અસર કરે છે.
વિશ્લેષણનું પરિણામ તમને પ્રાથમિકતાઓને પ્રકાશિત કરવાની મંજૂરી આપે છે. અને મુખ્ય પરિબળોના આધારે, આગાહી કરો, અગ્રતા ક્ષેત્રોના વિકાસની યોજના બનાવો અને મેનેજમેન્ટ નિર્ણયો લો.
રીગ્રેશન થાય છે:
- રેખીય (y = a + bx);
- પેરાબોલિક (y = a + bx + cx 2);
- ઘાતાંકીય (y = a * exp(bx));
- શક્તિ (y = a*x^b);
- હાયપરબોલિક (y = b/x + a);
- લઘુગણક (y = b * 1n(x) + a);
- ઘાતાંકીય (y = a * b^x).
ચાલો Excel માં રીગ્રેસન મોડેલ બનાવવા અને પરિણામોનું અર્થઘટન કરવાનું ઉદાહરણ જોઈએ. ચાલો રેખીય પ્રકારનું રીગ્રેસન લઈએ.
કાર્ય. 6 સાહસોમાં, સરેરાશ માસિક પગાર અને નોકરી છોડનારા કર્મચારીઓની સંખ્યાનું વિશ્લેષણ કરવામાં આવ્યું હતું. સરેરાશ પગાર પર છોડનારા કર્મચારીઓની સંખ્યાની અવલંબન નક્કી કરવી જરૂરી છે.
રેખીય રીગ્રેસન મોડેલ આના જેવું દેખાય છે:
Y = a 0 + a 1 x 1 +…+a k x k.
જ્યાં a રીગ્રેસન ગુણાંક છે, x એ ચલોને પ્રભાવિત કરે છે, k એ પરિબળોની સંખ્યા છે.
અમારા ઉદાહરણમાં, Y એ કર્મચારીઓને છોડવાનું સૂચક છે. અસરકર્તા પરિબળ વેતન (x) છે.
Excel માં બિલ્ટ-ઇન ફંક્શન્સ છે જે તમને રેખીય રીગ્રેશન મોડલના પરિમાણોની ગણતરી કરવામાં મદદ કરી શકે છે. પરંતુ "વિશ્લેષણ પેકેજ" એડ-ઓન આ ઝડપથી કરશે.
અમે એક શક્તિશાળી વિશ્લેષણાત્મક સાધનને સક્રિય કરીએ છીએ:
એકવાર સક્રિય થયા પછી, એડ-ઓન ડેટા ટેબમાં ઉપલબ્ધ થશે.
હવે રીગ્રેશન એનાલિસિસ પોતે જ કરીએ.
સૌ પ્રથમ, અમે આર-સ્ક્વેર્ડ અને ગુણાંક પર ધ્યાન આપીએ છીએ.
R-ચોરસ એ નિર્ધારણનો ગુણાંક છે. અમારા ઉદાહરણમાં - 0.755, અથવા 75.5%. આનો અર્થ એ છે કે મોડેલના ગણતરી કરેલ પરિમાણો અભ્યાસ કરેલ પરિમાણો વચ્ચેના 75.5% સંબંધને સમજાવે છે. નિર્ધારણનું ગુણાંક જેટલું ઊંચું છે, તેટલું સારું મોડેલ. સારું - 0.8 થી ઉપર. ખરાબ - 0.5 કરતા ઓછું (આવા વિશ્લેષણને ભાગ્યે જ વાજબી ગણી શકાય). અમારા ઉદાહરણમાં - "ખરાબ નથી".
ગુણાંક 64.1428 બતાવે છે કે જો વિચારણા હેઠળના મોડેલના તમામ ચલ 0 ની બરાબર હોય તો Y શું હશે. એટલે કે, વિશ્લેષણ કરેલ પરિમાણનું મૂલ્ય મોડેલમાં વર્ણવેલ ન હોય તેવા અન્ય પરિબળોથી પણ પ્રભાવિત થાય છે.
ગુણાંક -0.16285 એ Y પર ચલ X નું વજન દર્શાવે છે. એટલે કે, આ મોડેલની અંદર સરેરાશ માસિક પગાર -0.16285 (આ પ્રભાવની થોડી માત્રા છે) સાથે છોડનારાઓની સંખ્યાને અસર કરે છે. "-" ચિહ્ન નકારાત્મક અસર સૂચવે છે: પગાર જેટલો વધારે છે, ઓછા લોકો છોડી દે છે. જે વાજબી છે.
એક્સેલમાં સહસંબંધ વિશ્લેષણ
સહસંબંધ વિશ્લેષણ એ નિર્ધારિત કરવામાં મદદ કરે છે કે એક કે બે નમૂનાઓમાં સૂચકો વચ્ચે સંબંધ છે કે કેમ. ઉદાહરણ તરીકે, મશીનના ઓપરેટિંગ સમય અને સમારકામના ખર્ચ વચ્ચે, સાધનસામગ્રીની કિંમત અને ઓપરેશનનો સમયગાળો, બાળકોની ઊંચાઈ અને વજન વગેરે.
જો ત્યાં કનેક્શન હોય, તો શું એક પરિમાણમાં વધારો થવાથી બીજામાં વધારો (સકારાત્મક સહસંબંધ) અથવા ઘટાડો (નકારાત્મક) થાય છે. સહસંબંધ વિશ્લેષણ વિશ્લેષકને તે નક્કી કરવામાં મદદ કરે છે કે શું એક સૂચકના મૂલ્યનો ઉપયોગ બીજાના સંભવિત મૂલ્યની આગાહી કરવા માટે થઈ શકે છે.
સહસંબંધ ગુણાંક r દ્વારા સૂચવવામાં આવે છે. +1 થી -1 સુધી બદલાય છે. વિવિધ ક્ષેત્રો માટે સહસંબંધોનું વર્ગીકરણ અલગ હશે. જ્યારે ગુણાંક 0 છે, ત્યારે નમૂનાઓ વચ્ચે કોઈ રેખીય સંબંધ નથી.
ચાલો જોઈએ કે એક્સેલનો ઉપયોગ કરીને સહસંબંધ ગુણાંક કેવી રીતે શોધવો.
જોડી કરેલ ગુણાંક શોધવા માટે, CORREL ફંક્શનનો ઉપયોગ થાય છે.
ઉદ્દેશ: લેથના સંચાલનના સમય અને તેની જાળવણીના ખર્ચ વચ્ચે કોઈ સંબંધ છે કે કેમ તે નક્કી કરો.
કર્સરને કોઈપણ સેલમાં મૂકો અને fx બટન દબાવો.
- "આંકડાકીય" શ્રેણીમાં, કોરલ ફંક્શન પસંદ કરો.
- દલીલ "એરે 1" - મૂલ્યોની પ્રથમ શ્રેણી - મશીન ઓપરેટિંગ સમય: A2:A14.
- દલીલ "એરે 2" - મૂલ્યોની બીજી શ્રેણી - સમારકામ ખર્ચ: B2:B14. OK પર ક્લિક કરો.
કનેક્શનનો પ્રકાર નક્કી કરવા માટે, તમારે ગુણાંકની સંપૂર્ણ સંખ્યા જોવાની જરૂર છે (પ્રવૃત્તિના દરેક ક્ષેત્રનું પોતાનું સ્કેલ છે).
કેટલાક પરિમાણો (2 કરતાં વધુ) ના સહસંબંધ વિશ્લેષણ માટે, "ડેટા વિશ્લેષણ" ("વિશ્લેષણ પેકેજ" એડ-ઓન) નો ઉપયોગ કરવો વધુ અનુકૂળ છે. તમારે સૂચિમાંથી સહસંબંધ પસંદ કરવાની અને એરેને નિયુક્ત કરવાની જરૂર છે. બધા.
પરિણામી ગુણાંક સહસંબંધ મેટ્રિક્સમાં દર્શાવવામાં આવશે. આની જેમ:
સહસંબંધ અને રીગ્રેસન વિશ્લેષણ
વ્યવહારમાં, આ બે તકનીકોનો વારંવાર એકસાથે ઉપયોગ થાય છે.
ઉદાહરણ:
હવે રીગ્રેસન વિશ્લેષણ ડેટા દૃશ્યમાન થઈ ગયો છે.
રેન્ડમ ચલો વચ્ચેની અવલંબનના પ્રાયોગિક અભ્યાસ માટે x અને yસંખ્યાબંધ સ્વતંત્ર પ્રયોગો કરો. પરિણામ i- પ્રયોગ મૂલ્યોની જોડી આપે છે (x r, y g), i = 1, 2,..., પી.
પદાર્થોના વિવિધ ગુણધર્મોને દર્શાવતી માત્રા સ્વતંત્ર અથવા પરસ્પર સંબંધિત હોઈ શકે છે. સંબંધોના અભિવ્યક્તિના સ્વરૂપો ખૂબ જ વૈવિધ્યસભર છે. બે સૌથી સામાન્ય પ્રકારો કાર્યાત્મક (સંપૂર્ણ) અને સહસંબંધ (અપૂર્ણ) જોડાણો છે.
જ્યારે બે જથ્થાઓ કાર્યાત્મક રીતે એકના મૂલ્ય પર આધારિત હોય છે -x hઆવશ્યકપણે અન્ય જથ્થાના એક અથવા વધુ ચોક્કસ રીતે વ્યાખ્યાયિત મૂલ્યોને અનુરૂપ -y (.ઘણી વાર, કાર્યાત્મક જોડાણો ભૌતિકશાસ્ત્ર અને રસાયણશાસ્ત્રમાં દેખાય છે. વાસ્તવિક પરિસ્થિતિઓમાં, ઑબ્જેક્ટના પોતે અને બાહ્ય વાતાવરણના ગુણધર્મોની અનંત મોટી સંખ્યા છે જે એકબીજાને પ્રભાવિત કરે છે, તેથી આ પ્રકારનું જોડાણ અસ્તિત્વમાં નથી, બીજા શબ્દોમાં કહીએ તો, કાર્યાત્મક જોડાણો ગાણિતિક અમૂર્ત છે.
સામાન્ય પરિબળોનો પ્રભાવ અને વસ્તુઓની વર્તણૂકમાં ઉદ્દેશ્ય પેટર્નની હાજરી માત્ર આંકડાકીય અવલંબનના અભિવ્યક્તિ તરફ દોરી જાય છે. આંકડાકીય એક અવલંબન છે જેમાં એક જથ્થામાં ફેરફાર અન્ય (બીજા) ના વિતરણમાં ફેરફારનો સમાવેશ કરે છે, અને આ અન્ય જથ્થાઓ ચોક્કસ સંભાવનાઓ સાથે ચોક્કસ મૂલ્યો લે છે. આ કિસ્સામાં, કાર્યાત્મક અવલંબનને આંકડાકીય અવલંબનનો વિશેષ કેસ ગણવો જોઈએ: એક પરિબળનું મૂલ્ય એકની સમાન સંભાવના સાથે અન્ય પરિબળોના મૂલ્યોને અનુરૂપ છે. આંકડાકીય અવલંબનનો વધુ મહત્વનો વિશેષ કેસ એ સહસંબંધ અવલંબન છે, જે કેટલાક રેન્ડમ ચલોના મૂલ્યો અને અન્યના સરેરાશ મૂલ્ય વચ્ચેના સંબંધને લાક્ષણિકતા આપે છે, જોકે દરેક વ્યક્તિગત કિસ્સામાં કોઈપણ આંતરસંબંધિત મૂલ્ય વિવિધ મૂલ્યો પર લઈ શકે છે.
એક સહસંબંધ સંબંધ (જેને અપૂર્ણ અથવા આંકડાકીય પણ કહેવાય છે) સામૂહિક અવલોકનો માટે સરેરાશ દેખાય છે, જ્યારે આશ્રિત ચલના આપેલ મૂલ્યો સ્વતંત્ર ચલના સંભવિત મૂલ્યોની ચોક્કસ સંખ્યાને અનુરૂપ હોય છે. સમજૂતી - વિશ્લેષિત પરિબળો વચ્ચેના સંબંધોની જટિલતા, જેની ક્રિયાપ્રતિક્રિયા બિનહિસાબી રેન્ડમ ચલો દ્વારા પ્રભાવિત થાય છે. તેથી, ચિહ્નો વચ્ચેનું જોડાણ ફક્ત સરેરાશ કેસોમાં જ દેખાય છે. સહસંબંધ જોડાણમાં, દરેક દલીલ મૂલ્ય ચોક્કસ અંતરાલમાં અવ્યવસ્થિત રીતે વિતરિત કાર્ય મૂલ્યોને અનુરૂપ છે.
"સહસંબંધ" શબ્દનો સૌપ્રથમ ઉપયોગ ફ્રેન્ચ પેલિયોન્ટોલોજિસ્ટ જે. કુવિયર દ્વારા કરવામાં આવ્યો હતો, જેમણે "પ્રાણીના ભાગો અને અવયવોના સહસંબંધનો કાયદો" મેળવ્યો હતો (આ કાયદો વ્યક્તિને શરીરના મળેલા અંગોમાંથી સમગ્ર પ્રાણીના દેખાવનું પુનઃનિર્માણ કરવાની મંજૂરી આપે છે). આ શબ્દ અંગ્રેજી જીવવિજ્ઞાની અને આંકડાશાસ્ત્રી એફ. ગાલ્ટન (માત્ર એક સંબંધ નહીં, પરંતુ "એવું જોડાણ" - સહસંબંધ) દ્વારા આંકડાઓમાં દાખલ કરવામાં આવ્યો હતો.
સહસંબંધ અવલંબન દરેક જગ્યાએ જોવા મળે છે. ઉદાહરણ તરીકે, કૃષિમાં, આ ઉપજ અને ખાતરની માત્રા વચ્ચેનો સંબંધ હોઈ શકે છે. દેખીતી રીતે, બાદમાં પાકની રચનામાં સામેલ છે. પરંતુ દરેક ચોક્કસ ક્ષેત્ર અથવા પ્લોટ માટે, સમાન પ્રમાણમાં લાગુ કરાયેલ ખાતર ઉપજમાં અલગ વધારો કરશે, કારણ કે અન્ય સંખ્યાબંધ પરિબળો ક્રિયાપ્રતિક્રિયા કરે છે (હવામાન, જમીનની સ્થિતિ, વગેરે), જે અંતિમ પરિણામ બનાવે છે. જો કે, સરેરાશ, આવા સંબંધ જોવા મળે છે - લાગુ ખાતરોના સમૂહમાં વધારો ઉપજમાં વધારો તરફ દોરી જાય છે.
જે લાક્ષણિકતાઓનો અભ્યાસ કરવામાં આવી રહ્યો છે તે વચ્ચેના જોડાણોને ઓળખવા માટેની સૌથી સરળ પદ્ધતિ સહસંબંધ કોષ્ટકનું નિર્માણ છે; તેની દ્રશ્ય રજૂઆત સહસંબંધ ક્ષેત્ર છે. તે એક ગ્રાફ છે જ્યાં jq મૂલ્યો એબ્સીસા અક્ષ પર અને ઓર્ડિનેટ અક્ષ પર રચાયેલ છે y x.બિંદુઓના સ્થાન અને ચોક્કસ દિશામાં તેમની સાંદ્રતા દ્વારા, વ્યક્તિ જોડાણની હાજરીને ગુણાત્મક રીતે નક્કી કરી શકે છે.
ચોખા. 7.3.
રેન્ડમ ચલો વચ્ચેનો સકારાત્મક સંબંધ, પેરાબોલિક ફંક્શનલની નજીક, ફિગમાં બતાવવામાં આવ્યો છે. 6.1 , એ.ફિગ માં. 6.1, b નબળા નકારાત્મક સહસંબંધનું ઉદાહરણ બતાવે છે અને ફિગમાં. 6.1, વી -વ્યવહારિક રીતે અસંબંધિત રેન્ડમ ચલોનું ઉદાહરણ. જો આલેખ પર સીધી રેખા (સકારાત્મક અથવા નકારાત્મક ઢોળાવ સાથે) દ્વારા નિર્ભરતા "પ્રદર્શિત કરી શકાય" તો સહસંબંધ વધારે છે.
1. કાર્યનો વિષય.
2. સંક્ષિપ્ત સૈદ્ધાંતિક માહિતી.
3. કામનો ક્રમ.
4. ગાણિતિક મોડેલ વિકસાવવા માટેનો પ્રારંભિક ડેટા.
5. ગાણિતિક મોડેલ વિકસાવવાના પરિણામો.
6. મોડેલ અભ્યાસના પરિણામો. આગાહીનું નિર્માણ.
7. તારણો.
કાર્યો 2-4 માં, તમે મોડેલ લાક્ષણિકતાઓની ગણતરી કરવા માટે Excel PPP નો ઉપયોગ કરી શકો છો.
જોબ નંબર 1.
જોડી કરેલ રીગ્રેસન મોડલ્સનું નિર્માણ. હેટરોસેડેસ્ટીસીટી માટે અવશેષો તપાસી રહ્યું છે.
સમાન પ્રકારના ઉત્પાદનનું ઉત્પાદન કરતા 15 સાહસો માટે, બે લાક્ષણિકતાઓના મૂલ્યો જાણીતા છે:
X -ઉત્પાદન આઉટપુટ, હજાર એકમો;
y -ઉત્પાદન ખર્ચ, મિલિયન રુબેલ્સ.
x | y |
5,3 | 18,4 |
15,1 | 22,0 |
24,2 | 32,3 |
7,1 | 16,4 |
11,0 | 22,2 |
8,5 | 21,7 |
14,5 | 23,6 |
10,2 | 18,5 |
18,6 | 26,1 |
19,7 | 30,2 |
21,3 | 28,6 |
22,1 | 34,0 |
4,1 | 14,2 |
12,0 | 22,1 |
18,3 | 28,2 |
આવશ્યક:
1. એક સહસંબંધ ક્ષેત્ર બનાવો અને જોડાણના સ્વરૂપ વિશે એક પૂર્વધારણા બનાવો.
2. બિલ્ડ મોડલ:
લીનિયર જોડી રીગ્રેસન.
સેમીલોગરિધમિક પેરવાઇઝ રીગ્રેશન.
2.3 પાવર પેર રીગ્રેશન.
આ કરવા માટે:
2. ગુણાંક (ઇન્ડેક્સ) નો ઉપયોગ કરીને જોડાણની નિકટતાનું મૂલ્યાંકન કરો
સહસંબંધ
3. ગુણાંક (ઇન્ડેક્સ) નો ઉપયોગ કરીને મોડેલની ગુણવત્તાનું મૂલ્યાંકન કરો
નિર્ધારણ અને અંદાજની સરેરાશ ભૂલ.
4. સરેરાશ સ્થિતિસ્થાપકતા ગુણાંકનો ઉપયોગ કરીને આપો
પરિબળ અને પરિણામ વચ્ચેના સંબંધની મજબૂતાઈનું તુલનાત્મક મૂલ્યાંકન.
5. સાથે એફરીગ્રેશન મોડેલિંગ પરિણામોની આંકડાકીય વિશ્વસનીયતાનું મૂલ્યાંકન કરવા માટે ફિશર માપદંડ.
ફકરા 2-5 માં ગણતરી કરેલ લાક્ષણિકતાઓના મૂલ્યોના આધારે, શ્રેષ્ઠ રીગ્રેસન સમીકરણ પસંદ કરો.
Golfreld-Quandt પદ્ધતિનો ઉપયોગ કરીને, heteroskedasticity માટે અવશેષો તપાસો.
અમે એક સહસંબંધ ક્ષેત્ર બનાવીએ છીએ.
સહસંબંધ ક્ષેત્રના બિંદુઓના સ્થાનનું વિશ્લેષણ કરીને, અમે ધારીએ છીએ કે ચિહ્નો વચ્ચેનો સંબંધ એક્સઅને ખાતેરેખીય હોઈ શકે છે, એટલે કે. y=a+bx, અથવા બિનરેખીય પ્રકાર: y=a+blnx, y = કુહાડી b.
અભ્યાસ કરવામાં આવતા સંબંધોના સિદ્ધાંતના આધારે, અમે સંબંધ મેળવવાનું ધારીએ છીએ ખાતેથી એક્સપ્રકાર y=a+bx,કારણ કે ઉત્પાદન ખર્ચ yબે પ્રકારમાં વિભાજિત કરી શકાય છે: સતત, ઉત્પાદન વોલ્યુમથી સ્વતંત્ર - a, જેમ કે ભાડું, વહીવટ જાળવણી, વગેરે; અને ચલ કે જે આઉટપુટના પ્રમાણમાં બદલાય છે bx,જેમ કે સામગ્રીનો વપરાશ, વીજળી વગેરે.
2.1.લીનિયર જોડી રીગ્રેશન મોડલ.
2.1.1. ચાલો પરિમાણોની ગણતરી કરીએ aઅને bરેખીય રીગ્રેસન y=a+bx.
અમે ગણતરી કોષ્ટક 1 બનાવીએ છીએ.
કોષ્ટક 1
વિકલ્પો aઅને bસમીકરણો
Y x = a + bx
દ્વારા વિભાજિત n b:
રીગ્રેશન સમીકરણ:
=11.591+0.871x
ઉત્પાદનના ઉત્પાદનમાં 1 હજાર રુબેલ્સના વધારા સાથે. ઉત્પાદન ખર્ચમાં 0.871 મિલિયન રુબેલ્સનો વધારો થાય છે. સરેરાશ, નિશ્ચિત ખર્ચ 11.591 મિલિયન રુબેલ્સની બરાબર છે.
2.1.2. અમે રેખીય જોડી સહસંબંધ ગુણાંકનો ઉપયોગ કરીને જોડાણની નિકટતાનું મૂલ્યાંકન કરીશું.
ચાલો પહેલા લાક્ષણિકતાઓના પ્રમાણભૂત વિચલનો નક્કી કરીએ.
માનક વિચલનો:
સહસંબંધ ગુણાંક:
ચિહ્નો વચ્ચે એક્સઅને વાયખૂબ જ ગાઢ રેખીય સહસંબંધ જોવા મળે છે.
2.1.3. ચાલો આપણે બાંધેલા મોડેલની ગુણવત્તાનું મૂલ્યાંકન કરીએ.
એટલે કે આ મોડલ કુલ ભિન્નતાના 90.5% સમજાવે છે ખાતે, ન સમજાય તેવા તફાવતનો હિસ્સો 9.5% છે.
તેથી, મોડેલની ગુણવત્તા ઊંચી છે.
એ i .
પ્રથમ, રીગ્રેસન સમીકરણમાંથી, અમે દરેક પરિબળ મૂલ્ય માટે સૈદ્ધાંતિક મૂલ્યો નક્કી કરીએ છીએ.
અંદાજ ભૂલ એ i, i=1…15:
સરેરાશ અંદાજ ભૂલ:
2.1.4. ચાલો સરેરાશ સ્થિતિસ્થાપકતા ગુણાંક નક્કી કરીએ:
તે દર્શાવે છે કે ઉત્પાદનમાં 1%ના વધારા સાથે ઉત્પાદન ખર્ચ સરેરાશ 0.515% વધે છે.
2.1.5. ચાલો પરિણામી સમીકરણના આંકડાકીય મહત્વનું મૂલ્યાંકન કરીએ.
ચાલો પૂર્વધારણા તપાસીએ H0કે ઓળખાયેલ અવલંબન ખાતેથી એક્સપ્રકૃતિમાં રેન્ડમ છે, એટલે કે પરિણામી સમીકરણ આંકડાકીય રીતે નજીવા છે. ચાલો α=0.05 લઈએ. ચાલો કોષ્ટક (ક્રિટીકલ) મૂલ્ય શોધીએ F-ફિશર ટેસ્ટ:
ચાલો વાસ્તવિક મૂલ્ય શોધીએ એફ- ફિશર માપદંડ:
તેથી પૂર્વધારણા H0 એચ 1 xઅને yઆકસ્મિક નથી.
ચાલો પરિણામી સમીકરણ બનાવીએ.
2.2. અર્ધ-લોગ જોડી પ્રમાણે રીગ્રેસન મોડેલ.
2.2.1. ચાલો પરિમાણોની ગણતરી કરીએ એઅને bરીગ્રેશનમાં:
y x =a +blnх.
ચાલો આ સમીકરણને રેખીય કરીએ, સૂચિત કરીએ:
y=a + bz.
વિકલ્પો aઅને bસમીકરણો
= a+bz
ઓછામાં ઓછા ચોરસ પદ્ધતિ દ્વારા નિર્ધારિત:
અમે કોષ્ટક 2 ની ગણતરી કરીએ છીએ.
કોષ્ટક 2
દ્વારા વિભાજિત nઅને ક્રેમરની પદ્ધતિ દ્વારા ઉકેલવાથી, અમે નક્કી કરવા માટે એક સૂત્ર મેળવીએ છીએ b:
રીગ્રેશન સમીકરણ:
= -1.136 + 9.902z
2.2.2. ચાલો લાક્ષણિકતાઓ વચ્ચેના જોડાણની નિકટતાનું મૂલ્યાંકન કરીએ ખાતેઅને એક્સ.
કારણ કે સમીકરણ y = a + bln xપરિમાણોના સંદર્ભમાં રેખીય એઅને bઅને તેનું રેખીયકરણ આશ્રિત ચલના પરિવર્તન સાથે સંબંધિત ન હતું _ ખાતે, પછી ચલો વચ્ચેના સંબંધની નિકટતા ખાતેઅને એક્સ, જોડી સહસંબંધ અનુક્રમણિકાનો ઉપયોગ કરીને અંદાજિત Rxy, રેખીય જોડી સહસંબંધ ગુણાંકનો ઉપયોગ કરીને પણ નક્કી કરી શકાય છે r yz
પ્રમાણભૂત વિચલન z:
સહસંબંધ ઇન્ડેક્સ મૂલ્ય 1 ની નજીક છે, તેથી, ચલો વચ્ચે ખાતેઅને એક્સપ્રકારનો ખૂબ નજીકનો સંબંધ છે = a + bz.
2.2.3. ચાલો આપણે બાંધેલા મોડેલની ગુણવત્તાનું મૂલ્યાંકન કરીએ.
ચાલો નિર્ધારણનો ગુણાંક નક્કી કરીએ:
એટલે કે આ મોડેલ પરિણામમાં કુલ ભિન્નતાના 83.8% સમજાવે છે ખાતે, અસ્પષ્ટ વિવિધતાનો હિસ્સો 16.2% છે. તેથી, મોડેલની ગુણવત્તા ઊંચી છે.
ચાલો સરેરાશ અંદાજની ભૂલનું મૂલ્ય શોધીએ એ i .
પ્રથમ, રીગ્રેસન સમીકરણમાંથી, અમે દરેક પરિબળ મૂલ્ય માટે સૈદ્ધાંતિક મૂલ્યો નક્કી કરીએ છીએ. અંદાજ ભૂલ એ હું,:
, i=1…15.
સરેરાશ અંદાજ ભૂલ:
.
ભૂલ નાની છે, મોડેલની ગુણવત્તા ઊંચી છે.
2.2.4 ચાલો સરેરાશ સ્થિતિસ્થાપકતા ગુણાંક નક્કી કરીએ:
તે દર્શાવે છે કે ઉત્પાદનમાં 1%ના વધારા સાથે ઉત્પાદન ખર્ચ સરેરાશ 0.414% વધે છે.
2.2.5. ચાલો પરિણામી સમીકરણના આંકડાકીય મહત્વનું મૂલ્યાંકન કરીએ.
ચાલો પૂર્વધારણા તપાસીએ H0કે ઓળખાયેલ અવલંબન ખાતેથી એક્સપ્રકૃતિમાં રેન્ડમ છે, એટલે કે. પરિણામી સમીકરણ આંકડાકીય રીતે નજીવા છે. ચાલો α=0.05 લઈએ.
ચાલો કોષ્ટક (ક્રિટીકલ) મૂલ્ય શોધીએ એફ- માછીમાર માપદંડ:
ચાલો વાસ્તવિક મૂલ્ય શોધીએ એફ- માછીમાર માપદંડ:
તેથી પૂર્વધારણા H0નામંજૂર, વૈકલ્પિક પૂર્વધારણા સ્વીકારવામાં આવી એચ 1: સંભાવના 1-α=0.95 સાથે, પરિણામી સમીકરણ આંકડાકીય રીતે નોંધપાત્ર છે, ચલો વચ્ચેનો સંબંધ xઅને yઆકસ્મિક નથી.
ચાલો સહસંબંધ ક્ષેત્ર પર રીગ્રેસન સમીકરણ બનાવીએ
2.3. પાવર જોડી રીગ્રેશન મોડલ.
2.3.1. ચાલો પરિમાણોની ગણતરી કરીએ એઅને bપાવર રીગ્રેશન:
પરિમાણોની ગણતરી આ સમીકરણના રેખીયકરણની પ્રક્રિયા દ્વારા પહેલા કરવામાં આવે છે:
અને બદલાતા ચલ:
Y=lny, X=lnx, A=lna
સમીકરણ પરિમાણો:
ઓછામાં ઓછા ચોરસ પદ્ધતિ દ્વારા નિર્ધારિત:
અમે કોષ્ટક 3 ની ગણતરી કરીએ છીએ.
અમે વ્યાખ્યાયિત કરીએ છીએ b:
રીગ્રેશન સમીકરણ:
ચાલો સહસંબંધ ક્ષેત્ર પર રીગ્રેસન સમીકરણ બનાવીએ:
2.3.2. ચાલો લાક્ષણિકતાઓ વચ્ચેના જોડાણની નિકટતાનું મૂલ્યાંકન કરીએ ખાતેઅને એક્સજોડી સહસંબંધ ઇન્ડેક્સનો ઉપયોગ કરીને રાયક્સ.
ચાલો પહેલા સૈદ્ધાંતિક મૂલ્યની ગણતરી કરીએ દરેક પરિબળ મૂલ્ય માટે x,અને પછી:
સહસંબંધ ઇન્ડેક્સ મૂલ્ય Rxy 1 ની નજીક, તેથી ચલો વચ્ચે ખાતેઅને એક્સફોર્મનો ખૂબ નજીકનો સંબંધ છે:
2.3.3. ચાલો આપણે બાંધેલા મોડેલની ગુણવત્તાનું મૂલ્યાંકન કરીએ.
ચાલો નિર્ધારણની અનુક્રમણિકા નક્કી કરીએ:
આર 2=0,936 2 =0,878,
એટલે કે આ મોડેલ પરિણામમાં કુલ ભિન્નતાના 87.6% સમજાવે છે y,અને અસ્પષ્ટ તફાવત 12.4% માટે જવાબદાર છે.
મોડેલની ગુણવત્તા ઉચ્ચ છે.
ચાલો સરેરાશ અંદાજની ભૂલનું મૂલ્ય શોધીએ.
અંદાજ ભૂલ એ i, i=1…15:
સરેરાશ અંદાજ ભૂલ:
ભૂલ નાની છે, મોડેલની ગુણવત્તા ઊંચી છે.
2.3.4. ચાલો સરેરાશ સ્થિતિસ્થાપકતા ગુણાંક નક્કી કરીએ:
તે દર્શાવે છે કે ઉત્પાદનમાં 1%ના વધારા સાથે ઉત્પાદન ખર્ચ સરેરાશ 0.438% વધે છે.
2.3.5 ચાલો પરિણામી સમીકરણના આંકડાકીય મહત્વનું મૂલ્યાંકન કરીએ.
ચાલો પૂર્વધારણા તપાસીએ H0કે ઓળખાયેલ અવલંબન ખાતેથી એક્સપ્રકૃતિમાં રેન્ડમ છે, એટલે કે પરિણામી સમીકરણ આંકડાકીય રીતે નજીવા છે. ચાલો α=0.05 લઈએ.
કોષ્ટક (જટિલ) મૂલ્ય એફ- માછીમાર માપદંડ:
વાસ્તવિક મૂલ્ય એફ- માછીમાર માપદંડ:
તેથી પૂર્વધારણા H0નામંજૂર, વૈકલ્પિક પૂર્વધારણા સ્વીકારવામાં આવી એચ 1: સંભાવના 1-α=0.95 સાથે, પરિણામી સમીકરણ આંકડાકીય રીતે નોંધપાત્ર છે, ચલો વચ્ચેનો સંબંધ xઅને yઆકસ્મિક નથી.
કોષ્ટક 3
3. શ્રેષ્ઠ સમીકરણ પસંદ કરી રહ્યા છીએ.
ચાલો પ્રાપ્ત સંશોધન પરિણામોનું કોષ્ટક બનાવીએ.
કોષ્ટક 4
અમે કોષ્ટકનું વિશ્લેષણ કરીએ છીએ અને તારણો દોરીએ છીએ.
ú ત્રણેય સમીકરણો આંકડાકીય રીતે નોંધપાત્ર અને વિશ્વસનીય હોવાનું બહાર આવ્યું છે, સહસંબંધ ગુણાંક (ઇન્ડેક્સ) 1 ની નજીક છે, ઉચ્ચ (1 ની નજીક) નિર્ધારણ ગુણાંક (ઇન્ડેક્સ) અને સ્વીકાર્ય મર્યાદામાં અંદાજિત ભૂલ છે.
ú તે જ સમયે, રેખીય મોડેલની લાક્ષણિકતાઓ સૂચવે છે કે તે અર્ધ-લોગરિધમિક અને પાવર મોડલ્સ કરતાં કંઈક અંશે સારી લાક્ષણિકતાઓ વચ્ચેના સંબંધનું વર્ણન કરે છે. xઅને u
ú તેથી, અમે રીગ્રેશન સમીકરણ તરીકે રેખીય મોડેલ પસંદ કરીએ છીએ.
બે આંકડાકીય લાક્ષણિકતાઓ X અને Y વચ્ચેના સહસંબંધનો પ્રશ્ન ઉઠાવતી વખતે, તેમના મૂલ્યોના સમાંતર રેકોર્ડિંગ સાથે એક પ્રયોગ હાથ ધરવામાં આવે છે.
ઉદાહરણ 8.1.
દોડતી લાંબી કૂદકા (સાઇન X)નું પરિણામ અંતિમ રન-અપ ઝડપ (સાઇન Y) ના મૂલ્ય પર આધારિત છે કે કેમ તે નક્કી કરો. આ પ્રશ્નનો જવાબ આપવા માટે, રમતવીર અથવા રમતવીરોના જૂથના દરેક જમ્પના પરિણામ X રેકોર્ડિંગની સમાંતર, અંતિમ ટેક-ઓફ ગતિ Y નું મૂલ્ય પણ રેકોર્ડ કરવામાં આવે છે. તેમને આના જેવા રહેવા દો:
કોષ્ટક 5
આઈ | ||||||||
xi (સેમી) | ||||||||
yi (m/s) | 10,7 | 10,5 | 10,1 | 9,8 | 10,1 | 10,5 | 9,1 | 9,6 |
ચાલો કોષ્ટક 5 ને લંબચોરસ સંકલન પ્રણાલીમાં ગ્રાફના રૂપમાં રજૂ કરીએ, જ્યાં આપણે આડી અક્ષ પર કૂદકાની લંબાઈ (X) અને આ જમ્પ (Y)માં અંતિમ ટેક-ઓફ ઝડપનું મૂલ્ય દર્શાવીશું. ઊભી ધરી પર.
ફંક્શન PlayMyFlash(cmd)( Corel_.TPlay(cmd); )
№1 !!! №2 !!! №3 !!! №4 !!! №5!!! №6 !!! №7 !!! №8!!!
ચોખા. 8. સહસંબંધ ફીલ્ડ ગ્રાફ.
અમે ગ્રાફ પર આ રીતે મેળવેલા પોઈન્ટના સ્કેટર ઝોનને સહસંબંધ ક્ષેત્ર કહીશું. આકૃતિ 8 માં સહસંબંધ ક્ષેત્રનું દૃષ્ટિપૂર્વક વિશ્લેષણ કરતાં, તમે જોઈ શકો છો કે તે કેટલીક સીધી રેખા સાથે વિસ્તરેલ હોય તેવું લાગે છે. આ ચિત્ર લક્ષણો વચ્ચે કહેવાતા રેખીય સહસંબંધ સંબંધ માટે લાક્ષણિક છે. આ કિસ્સામાં, સામાન્ય રીતે એવું માની શકાય છે કે અંતિમ ટેક-ઓફ ગતિમાં વધારો સાથે, કૂદકાની લંબાઈ પણ વધે છે, અને ઊલટું. તે. વિચારણા હેઠળની લાક્ષણિકતાઓ વચ્ચે સીધો (હકારાત્મક) સંબંધ છે.
આ ઉદાહરણ સાથે, અન્ય ઘણા સંભવિત સહસંબંધ ક્ષેત્રોમાંથી, નીચેનાને ઓળખી શકાય છે (ફિગ. 9-11):
આકૃતિ 9 એક રેખીય સંબંધ પણ દર્શાવે છે, પરંતુ જેમ જેમ એક વિશેષતાના મૂલ્યો વધે છે તેમ, અન્યના મૂલ્યો ઘટે છે, અને ઊલટું, એટલે કે. પ્રતિસાદ અથવા નકારાત્મક. એવું માની શકાય છે કે આકૃતિ 11 માં સહસંબંધ ક્ષેત્રના બિંદુઓ અમુક પ્રકારની વક્ર રેખાની આસપાસ પથરાયેલા છે. આ કિસ્સામાં, તેઓ કહે છે કે લાક્ષણિકતાઓ વચ્ચે વક્રીય સહસંબંધ છે.
આકૃતિ 10 માં દર્શાવેલ સહસંબંધ ક્ષેત્રના સંદર્ભમાં, એવું કહી શકાતું નથી કે બિંદુઓ કેટલીક સીધી અથવા વક્ર રેખા સાથે સ્થિત છે તે ગોળાકાર આકાર ધરાવે છે; આ કિસ્સામાં, તેઓ કહે છે કે X અને Y લાક્ષણિકતાઓ એકબીજા પર આધારિત નથી.
વધુમાં, સહસંબંધ ક્ષેત્રનો ઉપયોગ સહસંબંધ જોડાણની નિકટતાનો અંદાજ કાઢવા માટે થઈ શકે છે, જો આ જોડાણ અસ્તિત્વમાં છે. અહીં તેઓ કહે છે: ઓછા બિંદુઓ કાલ્પનિક સરેરાશ રેખાની આસપાસ વિખરાયેલા છે, વિચારણા હેઠળની લાક્ષણિકતાઓ વચ્ચેનો વધુ નજીકનો સંબંધ.
સહસંબંધ ક્ષેત્રોનું વિઝ્યુઅલ વિશ્લેષણ સહસંબંધ સંબંધના સારને સમજવામાં મદદ કરે છે અને અમને જોડાણની હાજરી, દિશા અને નિકટતા વિશે ધારણાઓ કરવા દે છે. પરંતુ આ પદ્ધતિનો ઉપયોગ કરીને ચિહ્નો વચ્ચે કોઈ જોડાણ છે કે નહીં, રેખીય જોડાણ છે કે વળાંક, નજીકનું જોડાણ (વિશ્વસનીય) અથવા નબળું (અવિશ્વસનીય) છે કે કેમ તે ખાતરીપૂર્વક કહેવું અશક્ય છે. લાક્ષણિકતાઓ વચ્ચેના રેખીય સંબંધને ઓળખવા અને તેનું મૂલ્યાંકન કરવા માટેની સૌથી સચોટ પદ્ધતિ એ આંકડાકીય માહિતીમાંથી વિવિધ સહસંબંધ સૂચકાંકો નક્કી કરવાની પદ્ધતિ છે.
3. સહસંબંધ ગુણાંક અને તેમના ગુણધર્મો
ઘણીવાર બે લાક્ષણિકતાઓ વચ્ચેના સંબંધની વિશ્વસનીયતા નક્કી કરવા માટે (X, Y)ઉપયોગ નોનપેરામેટ્રિક (રેન્ક) સ્પીયરમેન સહસંબંધ ગુણાંક અને પેરામેટ્રિક પીયર્સન સહસંબંધ ગુણાંક . આ સહસંબંધ સૂચકોનું મૂલ્ય નીચેના સૂત્રો દ્વારા નક્કી કરવામાં આવે છે:
(1)
જ્યાં: dx - લાક્ષણિકતા x ની આંકડાકીય માહિતીની રેન્ક;
dy - લાક્ષણિકતા y ના આંકડાકીય માહિતીની રેન્ક.
(2)
ક્યાં: - લાક્ષણિકતા x નો આંકડાકીય ડેટા,
લાક્ષણિકતાની આંકડાકીય માહિતી y.
આ ગુણાંકમાં નીચેના શક્તિશાળી લક્ષણો છે:
1. સહસંબંધ ગુણાંકના આધારે, વ્યક્તિ ફક્ત લાક્ષણિકતાઓ વચ્ચેના રેખીય સહસંબંધને જજ કરી શકે છે. તેમની મદદ સાથે વળાંકવાળા જોડાણ વિશે કંઈ કહી શકાય નહીં.
2. સહસંબંધ ગુણાંકના મૂલ્યો એક પરિમાણહીન જથ્થો છે જે -1 કરતા ઓછો અથવા +1 કરતા વધુ ન હોઈ શકે, એટલે કે.
3.
4. જો સહસંબંધ ગુણાંકના મૂલ્યો શૂન્ય છે, એટલે કે. = 0 અથવા = 0, પછી લાક્ષણિકતાઓ x, y વચ્ચેનું જોડાણ ગેરહાજર
5. જો સહસંબંધ ગુણાંકના મૂલ્યો નકારાત્મક હોય, એટલે કે.< 0 или < 0, то связь между признаками Х и Y વિપરીત.
6. જો સહસંબંધ ગુણાંકના મૂલ્યો હકારાત્મક હોય, એટલે કે. > 0 અથવા y> 0, પછી લક્ષણો X અને Y વચ્ચેનો સંબંધ સીધા(હકારાત્મક).
7. જો સહસંબંધ ગુણાંક મૂલ્યો +1 અથવા -1 લે છે, એટલે કે. = ± 1 અથવા = ± 1, પછી લાક્ષણિકતાઓ X અને Y વચ્ચેનો સંબંધ રેખીય (કાર્યકારી).
8. લાક્ષણિકતાઓ વચ્ચેના સહસંબંધની વિશ્વસનીયતા માત્ર સહસંબંધ ગુણાંકની તીવ્રતા દ્વારા નક્કી કરી શકાતી નથી. આ વિશ્વસનીયતા પણ આધાર રાખે છે સ્વતંત્રતાની ડિગ્રીની સંખ્યા.
જ્યાં: n એ X અને Y લાક્ષણિકતાઓના આંકડાકીય માહિતીની સહસંબંધિત જોડીની સંખ્યા છે.
n જેટલું મોટું, સમાન સહસંબંધ ગુણાંક સાથેના સંબંધની વિશ્વસનીયતા જેટલી વધારે છે.
સૂચિબદ્ધ સામાન્ય ગુણધર્મો ઉપરાંત, વિચારણા હેઠળના સહસંબંધ ગુણાંકમાં પણ તફાવત છે. તેમનો મુખ્ય તફાવત એ છે કે પિયર્સન ગુણાંક ( X અને Y લક્ષણોનું વિતરણ સામાન્ય હોય તો જ ઉપયોગ કરી શકાય છે, સ્પીયરમેન ગુણાંક () નો ઉપયોગ કોઈપણ પ્રકારના વિતરણ સાથેની લાક્ષણિકતાઓ માટે થઈ શકે છે. જો પ્રશ્નમાંની લાક્ષણિકતાઓમાં સામાન્ય વિતરણ હોય, પછી પીયર્સન ગુણાંક () નો ઉપયોગ કરીને સહસંબંધ જોડાણની હાજરી નક્કી કરવી વધુ યોગ્ય છે, કારણ કે આ કિસ્સામાં તેમાં સ્પીયરમેન ગુણાંક () કરતા નાની ભૂલ હશે.
ઉદાહરણ 8.2.
સ્પીયરમેનના ક્રમના સહસંબંધ ગુણાંકનો ઉપયોગ કરીને, દોડવાના લાંબા કૂદકા (X) અને એથ્લેટ્સના જૂથની અંતિમ દોડવાની ગતિ (Y) વચ્ચે કોઈ સંબંધ છે કે કેમ તે નક્કી કરો (ઉદાહરણ 8.1, કોષ્ટક 5 માંથી ડેટા).
ફોર્મ્યુલામાં (1) dx અને dy એ આંકડાકીય માહિતીની રેન્ક છે, એટલે કે. તેમના ક્રમાંકિત સમૂહમાં સ્થાન વિકલ્પ. જો એકંદરમાં ઘણા સમાન ડેટા હોય, તો તેમની રેન્ક સમાન હોય છે અને આ વિકલ્પો દ્વારા કબજે કરેલ સ્થાનોના સરેરાશ મૂલ્ય તરીકે નિર્ધારિત કરવામાં આવે છે. ઉદાહરણ તરીકે,
ડેટા xi | |||||||||
dx રેન્ક | 4,5 | 4,5 | 4,5 | 4,5 | 7,5 | 7,5 |
3 + 4 + 5 + 6 | 7 + 8 | |||
આ નિયમનો ઉપયોગ કરીને, અમે કોષ્ટક 5 માં ડેટાની રેન્ક નક્કી કરીશું. સગવડ માટે, અમે બધું કોષ્ટક 6 ના સ્વરૂપમાં લખીશું.
કોષ્ટક 6
ડીએક્સ | dy | dx-dy | |||
9,1 | 1 - 1 = 0 | 02 = 0 | |||
9,6 | 2 - 2 = 0 | 02 = 0 | |||
9,8 | 3 - 3 = 0 | 02 = 0 | |||
10,1 | 4 - 4 = 0 | 02 = 0 | |||
10,5 | 6,5 | 5 - 6,5 = - 1,5 | (- 1,5)2 = 2,25 | ||
10,5 | 6,5 | 6 - 6,5 = - 0,5 | (- 0,5)2 = 0,25 | ||
10,3 | 7 - 5 = 2 | 22 = 4 | |||
10,7 | 8 - 8 = 0 | 02 = 0 | |||
(dx-dy) = 0 |
આ કિસ્સામાં અમારી પાસે મૂલ્યોની 8 જોડી છે, એટલે કે. 8 સહસંબંધિત જોડી. આનો અર્થ છે n = 8. પરિણામને સૂત્ર (1) માં બદલીને, આપણી પાસે હશે:
નિષ્કર્ષ:
(0,92 > 0) , પછી ચિહ્નો વચ્ચે એક્સ અને વાય યુ એક્સ), અને ઊલટું - ટેક-ઓફ ઝડપમાં ઘટાડા સાથે, જમ્પની લંબાઈ ઘટે છે. સ્પીયરમેન સહસંબંધ ગુણાંકની વિશ્વસનીયતા રેન્ક સહસંબંધ ગુણાંકના નિર્ણાયક મૂલ્યોના કોષ્ટકમાંથી નક્કી કરવામાં આવે છે.
b) કારણ કે સહસંબંધ ગુણાંક = 0.9 નું પરિણામી મૂલ્ય કોષ્ટક મૂલ્ય = 0.88 કરતાં વધુ છે, સ્તર b = 99% ને અનુરૂપ છે, તો પછી નિષ્કર્ષ (a) ની શુદ્ધતામાં વિશ્વાસ 99% કરતાં વધુ છે. આવી વિશ્વસનીયતા આપણને સમગ્ર વસ્તી સુધી નિષ્કર્ષ (એ) વિસ્તારવા દે છે, એટલે કે. બધા લાંબા જમ્પર્સ માટે.
જો વિતરણની સામાન્યતા માટે વિચારણા હેઠળની વસ્તીની પ્રારંભિક તપાસ હાથ ધરવામાં ન આવે, તો, જો પીયર્સન સહસંબંધ ગુણાંક અવિશ્વસનીય હોય, તો સ્પીયરમેન ગુણાંકનો ઉપયોગ કરીને જોડાણની હાજરી પણ તપાસવી જોઈએ.
ઉદાહરણ 8.3.
ક્રમ સહસંબંધ ગુણાંકનો ઉપયોગ કોઈપણ આંકડાકીય વિતરણ ધરાવતા ચલો વચ્ચેના સંબંધોને ઓળખવા માટે થઈ શકે છે. પરંતુ જો આ ચલોમાં સામાન્ય (ગૌસીયન) વિતરણ હોય, તો સામાન્યકૃત (બ્રાવાઈસ-પિયર્સન) સહસંબંધ ગુણાંકનો ઉપયોગ કરીને સંબંધ વધુ ચોક્કસ રીતે સ્થાપિત કરી શકાય છે.
ચાલો ધારીએ કે અમારા ઉદાહરણમાં અને - સામાન્ય વિતરણના કાયદાને અનુરૂપ છે, અને પરીક્ષણ પરિણામો વચ્ચે જોડાણનું અસ્તિત્વ તપાસો. એક્સ અને વાયસામાન્યકૃત સહસંબંધ ગુણાંકની ગણતરીનો ઉપયોગ કરીને.
સૂત્ર (1) થી તે સ્પષ્ટ છે કે ગણતરી માટે લાક્ષણિકતાઓના સરેરાશ મૂલ્યો શોધવા જરૂરી છે એક્સ, વાયઅને દરેક આંકડાકીય માહિતીનું તેના સરેરાશથી વિચલન. આ મૂલ્યોને જાણીને, તમે તે રકમ શોધી શકો છો જેના માટે ગણતરી કરવી મુશ્કેલ નથી
કોષ્ટક 5 માં ડેટાના આધારે, કોષ્ટક 7 ભરો:
કોષ્ટક 7
962 = 9216 | 10,7 | 0,6 | 0,62 = 0,36 | 96 · 0.6 = 57.6 | ||
262 = 676 | 10,5 | 0,4 | 0,42 = 0,16 | 26 · 0.4 = 10.4 | ||
10,3 | 0,2 | 0,04 | 5,4 | |||
- 4 | 9,8 | - 0,3 | 0,09 | 1,2 | ||
10,1 | 0,00 | 1,0 | ||||
10,5 | 0,4 | 0,16 | 3,2 | |||
- 92 | 9,1 | - 1,0 | 1,00 | 9,2 | ||
- 64 | 9,6 | - 0,5 | 0,25 | 32,0 | ||
= 23262 | = 2,06 | = 201 |
કૉલમ 7 ના સરવાળાને ફોર્મ્યુલા (1) ના અંશમાં અને કૉલમ 3 અને 6 ના સરવાળાને છેદમાં બદલીને, અમે મેળવીએ છીએ:
નિષ્કર્ષ:
એ) કારણ કે સહસંબંધ ગુણાંક મૂલ્ય હકારાત્મક છે (0.92>0) , પછી વચ્ચે એક્સ અને વાયસીધું જોડાણ છે, એટલે કે. વધતી જતી ટેક-ઓફ ઝડપ સાથે (ચિહ્ન વાય) કૂદકાની લંબાઈ વધે છે (ચિહ્ન એક્સ) અને ઊલટું - ટેક-ઓફ સ્પીડમાં ઘટાડા સાથે, જમ્પની લંબાઈ ઘટે છે. પ્રાપ્ત નિષ્કર્ષની સાચીતામાં વિશ્વાસ જાણવો ખૂબ જ મહત્વપૂર્ણ છે.
સૈદ્ધાંતિક ભાગ
બીજા પર એક લાક્ષણિકતાના પ્રભાવની દિશાને અલગ પાડવા માટે, હકારાત્મક અને નકારાત્મક જોડાણોની વિભાવનાઓ રજૂ કરવામાં આવી હતી.
જો એક વિશેષતામાં વધારો (ઘટાડો) સાથે, બીજાના મૂલ્યો સામાન્ય રીતે વધે છે (ઘટાડો), તો આવા સહસંબંધને સીધો અથવા સકારાત્મક કહેવામાં આવે છે.
જો એક વિશેષતામાં વધારો (ઘટાડો) સાથે બીજાના મૂલ્યો સામાન્ય રીતે ઘટે છે (વધારો), તો આવા સહસંબંધને વ્યસ્ત અથવા નકારાત્મક કહેવામાં આવે છે.
સહસંબંધ ક્ષેત્રો અને પ્રારંભિક સહસંબંધ વિશ્લેષણમાં તેમનો ઉપયોગ
બે આંકડાકીય લાક્ષણિકતાઓ X અને Y વચ્ચેના સહસંબંધનો પ્રશ્ન ઉઠાવતી વખતે, તેમના મૂલ્યોના સમાંતર રેકોર્ડિંગ સાથે એક પ્રયોગ હાથ ધરવામાં આવે છે.
ઉદાહરણ -
અમે ગ્રાફ પર આ રીતે મેળવેલા પોઈન્ટના સ્કેટર ઝોનને સહસંબંધ ક્ષેત્ર કહીશું. આકૃતિ 8 માં સહસંબંધ ક્ષેત્રનું દૃષ્ટિપૂર્વક વિશ્લેષણ કરતાં, તમે જોઈ શકો છો કે તે કેટલીક સીધી રેખા સાથે વિસ્તરેલ હોય તેવું લાગે છે. આ ચિત્ર લક્ષણો વચ્ચે કહેવાતા રેખીય સહસંબંધ સંબંધ માટે લાક્ષણિક છે. આ કિસ્સામાં, સામાન્ય રીતે એવું માની શકાય છે કે અંતિમ ટેક-ઓફ ગતિમાં વધારો સાથે, કૂદકાની લંબાઈ પણ વધે છે, અને ઊલટું. તે. વિચારણા હેઠળની લાક્ષણિકતાઓ વચ્ચે સીધો (હકારાત્મક) સંબંધ છે.
આ ઉદાહરણ સાથે, અન્ય ઘણા સંભવિત સહસંબંધ ક્ષેત્રોમાંથી, નીચેનાને ઓળખી શકાય છે (ફિગ. 9-11):
આકૃતિ 9 એક રેખીય સંબંધ પણ દર્શાવે છે, પરંતુ જેમ જેમ એક વિશેષતાના મૂલ્યો વધે છે તેમ, અન્યના મૂલ્યો ઘટે છે, અને ઊલટું, એટલે કે. પ્રતિસાદ અથવા નકારાત્મક. એવું માની શકાય છે કે આકૃતિ 11 માં સહસંબંધ ક્ષેત્રના બિંદુઓ અમુક પ્રકારની વક્ર રેખાની આસપાસ પથરાયેલા છે. આ કિસ્સામાં, તેઓ કહે છે કે લાક્ષણિકતાઓ વચ્ચે વક્રીય સહસંબંધ છે.
આકૃતિ 10 માં દર્શાવેલ સહસંબંધ ક્ષેત્રના સંદર્ભમાં, એવું કહી શકાતું નથી કે બિંદુઓ કેટલીક સીધી અથવા વક્ર રેખા સાથે સ્થિત છે તે ગોળાકાર આકાર ધરાવે છે; આ કિસ્સામાં, તેઓ કહે છે કે X અને Y લાક્ષણિકતાઓ એકબીજા પર આધારિત નથી.
વધુમાં, સહસંબંધ ક્ષેત્રનો ઉપયોગ સહસંબંધ જોડાણની નિકટતાનો અંદાજ કાઢવા માટે થઈ શકે છે, જો આ જોડાણ અસ્તિત્વમાં છે. અહીં તેઓ કહે છે: ઓછા બિંદુઓ કાલ્પનિક સરેરાશ રેખાની આસપાસ વિખરાયેલા છે, વિચારણા હેઠળની લાક્ષણિકતાઓ વચ્ચેનો વધુ નજીકનો સંબંધ.
સહસંબંધ ક્ષેત્રોનું વિઝ્યુઅલ વિશ્લેષણ સહસંબંધ સંબંધના સારને સમજવામાં મદદ કરે છે અને અમને જોડાણની હાજરી, દિશા અને નિકટતા વિશે ધારણાઓ કરવા દે છે. પરંતુ આ પદ્ધતિનો ઉપયોગ કરીને ચિહ્નો વચ્ચે કોઈ જોડાણ છે કે નહીં, રેખીય જોડાણ છે કે વળાંક, નજીકનું જોડાણ (વિશ્વસનીય) અથવા નબળું (અવિશ્વસનીય) છે કે કેમ તે ખાતરીપૂર્વક કહેવું અશક્ય છે. લાક્ષણિકતાઓ વચ્ચેના રેખીય સંબંધને ઓળખવા અને તેનું મૂલ્યાંકન કરવા માટેની સૌથી સચોટ પદ્ધતિ એ આંકડાકીય માહિતીમાંથી વિવિધ સહસંબંધ સૂચકાંકો નક્કી કરવાની પદ્ધતિ છે.
3. સહસંબંધ ગુણાંક અને તેમના ગુણધર્મો
ઘણીવાર બે લાક્ષણિકતાઓ વચ્ચેના સંબંધની વિશ્વસનીયતા નક્કી કરવા માટે (X, Y)ઉપયોગ નોનપેરામેટ્રિક (રેન્ક) સ્પીયરમેન સહસંબંધ ગુણાંક અને પેરામેટ્રિક પીયર્સન સહસંબંધ ગુણાંક . આ સહસંબંધ સૂચકોનું મૂલ્ય નીચેના સૂત્રો દ્વારા નક્કી કરવામાં આવે છે:
(1)
જ્યાં: dx - લાક્ષણિકતા x ની આંકડાકીય માહિતીની રેન્ક;
dy - લાક્ષણિકતા y ના આંકડાકીય માહિતીની રેન્ક.
(2)
ક્યાં: - લાક્ષણિકતા x નો આંકડાકીય ડેટા,
લાક્ષણિકતાની આંકડાકીય માહિતી y.
આ ગુણાંકમાં નીચેના શક્તિશાળી લક્ષણો છે:
1. સહસંબંધ ગુણાંકના આધારે, વ્યક્તિ ફક્ત લાક્ષણિકતાઓ વચ્ચેના રેખીય સહસંબંધને જજ કરી શકે છે. તેમની મદદ સાથે વળાંકવાળા જોડાણ વિશે કંઈ કહી શકાય નહીં.
2. સહસંબંધ ગુણાંકના મૂલ્યો એક પરિમાણહીન જથ્થો છે જે -1 કરતા ઓછો અથવા +1 કરતા વધુ ન હોઈ શકે, એટલે કે.
3.
4. જો સહસંબંધ ગુણાંકના મૂલ્યો શૂન્ય છે, એટલે કે. = 0 અથવા = 0, પછી લાક્ષણિકતાઓ x, y વચ્ચેનું જોડાણ ગેરહાજર
5. જો સહસંબંધ ગુણાંકના મૂલ્યો નકારાત્મક હોય, એટલે કે.< 0 или < 0, то связь между признаками Х и Y વિપરીત.
6. જો સહસંબંધ ગુણાંકના મૂલ્યો હકારાત્મક હોય, એટલે કે. > 0 અથવા y> 0, પછી લક્ષણો X અને Y વચ્ચેનો સંબંધ સીધા(હકારાત્મક).
7. જો સહસંબંધ ગુણાંક મૂલ્યો +1 અથવા -1 લે છે, એટલે કે. = ± 1 અથવા = ± 1, પછી લાક્ષણિકતાઓ X અને Y વચ્ચેનો સંબંધ રેખીય (કાર્યકારી).
8. લાક્ષણિકતાઓ વચ્ચેના સહસંબંધની વિશ્વસનીયતા માત્ર સહસંબંધ ગુણાંકની તીવ્રતા દ્વારા નક્કી કરી શકાતી નથી. આ વિશ્વસનીયતા પણ આધાર રાખે છે સ્વતંત્રતાની ડિગ્રીની સંખ્યા.
વ્યવહારુ ભાગ.
શરીરના તાપમાન અને પલ્સ રેટ વચ્ચે સહસંબંધ ગુણાંક નક્કી કરો અને ઓળખાયેલ સંબંધનું મૂલ્યાંકન કરો.