ચલ x માટે રીગ્રેસન ગુણાંક. ડેટા એનાલિસિસ બેઝિક્સ

રીગ્રેસન સમીકરણ ગુણાંકની ગણતરી

ઉપલબ્ધ ED પર આધારિત સમીકરણોની સિસ્ટમ (7.8) અસ્પષ્ટ રીતે ઉકેલી શકાતી નથી, કારણ કે અજાણ્યાઓની સંખ્યા હંમેશા સમીકરણોની સંખ્યા કરતા વધારે હોય છે. આ સમસ્યાને દૂર કરવા માટે, વધારાની ધારણાઓની જરૂર છે. સામાન્ય જ્ઞાન સૂચવે છે: બહુપદીના ગુણાંકને એવી રીતે પસંદ કરવાની સલાહ આપવામાં આવે છે કે ED ના અંદાજમાં ઓછામાં ઓછી ભૂલની ખાતરી કરી શકાય. અંદાજિત ભૂલોનું મૂલ્યાંકન કરવા માટે વિવિધ પગલાંનો ઉપયોગ કરી શકાય છે. રુટ સરેરાશ ચોરસ ભૂલ આવા માપ તરીકે વ્યાપકપણે ઉપયોગમાં લેવાય છે. તેના આધારે, રીગ્રેસન સમીકરણોના ગુણાંકનો અંદાજ કાઢવા માટે એક વિશેષ પદ્ધતિ વિકસાવવામાં આવી છે - લઘુત્તમ ચોરસ પદ્ધતિ (LSM). આ પદ્ધતિ તમને સામાન્ય વિતરણ વિકલ્પ હેઠળ રીગ્રેસન સમીકરણના અજાણ્યા ગુણાંકના મહત્તમ સંભાવના અંદાજો મેળવવા માટે પરવાનગી આપે છે, પરંતુ તેનો ઉપયોગ પરિબળોના અન્ય કોઈપણ વિતરણ માટે થઈ શકે છે.

MNC નીચેની જોગવાઈઓ પર આધારિત છે:

· ભૂલ મૂલ્યો અને પરિબળોના મૂલ્યો સ્વતંત્ર છે, અને તેથી અસંબંધિત છે, એટલે કે. એવું માનવામાં આવે છે કે દખલગીરી પેદા કરવા માટેની પદ્ધતિઓ પરિબળ મૂલ્યો પેદા કરવાની પદ્ધતિ સાથે સંબંધિત નથી;

· ભૂલની ગાણિતિક અપેક્ષા ε શૂન્યની બરાબર હોવી જોઈએ (સતત ઘટક ગુણાંકમાં સમાયેલ છે a 0), બીજા શબ્દોમાં કહીએ તો, ભૂલ એ કેન્દ્રિત જથ્થો છે;

ભૂલ તફાવતનો નમૂના અંદાજ ન્યૂનતમ હોવો જોઈએ.

ચાલો પ્રમાણિત મૂલ્યોના રેખીય રીગ્રેશનના સંબંધમાં OLS ના ઉપયોગને ધ્યાનમાં લઈએ. કેન્દ્રિત જથ્થાઓ માટે u જેગુણાંક a 0શૂન્ય બરાબર છે, પછી રેખીય રીગ્રેશન સમીકરણો

. (7.9)

નિરીક્ષણના પરિણામોમાંથી મેળવેલા મૂલ્યોથી વિપરીત, રીગ્રેસન સમીકરણનો ઉપયોગ કરીને ગણતરી કરાયેલ સૂચક મૂલ્યોને દર્શાવવા માટે અહીં એક વિશિષ્ટ ચિહ્ન "^" રજૂ કરવામાં આવ્યું છે.

લઘુત્તમ ચોરસ પદ્ધતિનો ઉપયોગ કરીને, રીગ્રેસન સમીકરણના ગુણાંકના આવા મૂલ્યો નક્કી કરવામાં આવે છે જે અભિવ્યક્તિને બિનશરતી લઘુત્તમ પ્રદાન કરે છે.

અભિવ્યક્તિના તમામ આંશિક ડેરિવેટિવ્ઝ (7.10) ને શૂન્ય સાથે સમીકરણ કરીને, અજાણ્યા ગુણાંક પર લેવામાં, અને સમીકરણોની સિસ્ટમ હલ કરીને લઘુત્તમ જોવા મળે છે.

(7.11)

સતત પરિવર્તનો હાથ ધરવા અને સહસંબંધ ગુણાંકના અગાઉ રજૂ કરેલા અંદાજોનો ઉપયોગ કરીને

. (7.12)

તેથી, પ્રાપ્ત ટી-1 રેખીય સમીકરણો, જે તમને મૂલ્યોની અનન્ય રીતે ગણતરી કરવા દે છે a 2 , a 3 , …, a t.

જો રેખીય મોડેલ અચોક્કસ છે અથવા પરિમાણો અચોક્કસ રીતે માપવામાં આવે છે, તો આ કિસ્સામાં ઓછામાં ઓછી ચોરસ પદ્ધતિ આપણને ગુણાંકના આવા મૂલ્યો શોધવાની મંજૂરી આપે છે કે જેના પર રેખીય મોડેલ પસંદ કરેલ પ્રમાણભૂત વિચલનના અર્થમાં વાસ્તવિક ઑબ્જેક્ટનું શ્રેષ્ઠ રીતે વર્ણન કરે છે. માપદંડ

જ્યારે માત્ર એક પરિમાણ હોય, ત્યારે રેખીય રીગ્રેસન સમીકરણ બને છે

ગુણાંક a 2સમીકરણ પરથી જોવા મળે છે

પછી, આપેલ છે આર 2.2= 1, જરૂરી ગુણાંક

a 2 = r y ,2 . (7.13)

સંબંધ (7.13) અગાઉ જણાવેલ નિવેદનની પુષ્ટિ કરે છે કે સહસંબંધ ગુણાંક એ બે પ્રમાણિત પરિમાણો વચ્ચેના રેખીય સંબંધનું માપ છે.

ગુણાંકના મળેલા મૂલ્યને બદલીને a 2માટે અભિવ્યક્તિમાં ડબલ્યુ, કેન્દ્રીય અને નોર્મલાઇઝ્ડ જથ્થાના ગુણધર્મોને ધ્યાનમાં લેતા, અમે આ ફંક્શનનું ન્યૂનતમ મૂલ્ય 1- ની બરાબર મેળવીએ છીએ r 2 y,2. મૂલ્ય 1- r 2 y,2રેન્ડમ ચલનો શેષ ભિન્નતા કહેવાય છે yરેન્ડમ ચલને સંબંધિત u 2. તે પરિમાણના ફંક્શન સાથે સૂચકને બદલતી વખતે પ્રાપ્ત થતી ભૂલને દર્શાવે છે υ= a 2 u 2. સાથે જ | r y,2| = 1 શેષ ભિન્નતા શૂન્ય છે, અને તેથી રેખીય કાર્ય સાથે સૂચકને અંદાજિત કરતી વખતે કોઈ ભૂલ નથી.

કેન્દ્રિય અને સામાન્યકૃત સૂચક અને પરિમાણ મૂલ્યોમાંથી આગળ વધવું

મૂળ મૂલ્યો માટે મેળવી શકાય છે

આ સમીકરણ સહસંબંધ ગુણાંકના સંદર્ભમાં પણ રેખીય છે. તે જોવાનું સરળ છે કે રેખીય રીગ્રેસન માટે કેન્દ્રીકરણ અને સામાન્યકરણ સમીકરણોની સિસ્ટમના પરિમાણને એક દ્વારા ઘટાડવાનું શક્ય બનાવે છે, એટલે કે. ગુણાંક નક્કી કરવાની સમસ્યાના ઉકેલને સરળ બનાવો, અને ગુણાંકનો સ્પષ્ટ અર્થ આપો.

બિનરેખીય કાર્યો માટે ઓછામાં ઓછા ચોરસનો ઉપયોગ વ્યવહારીક રીતે ધ્યાનમાં લેવામાં આવતી યોજનાથી અલગ નથી (મૂળ સમીકરણમાં માત્ર a0 ગુણાંક શૂન્યની બરાબર નથી).

ઉદાહરણ તરીકે, ધારો કે પેરાબોલિક રીગ્રેસન ગુણાંક નક્કી કરવા જરૂરી છે

નમૂના ભૂલ તફાવત

તેના આધારે, આપણે સમીકરણોની નીચેની સિસ્ટમ મેળવી શકીએ છીએ

પરિવર્તન પછી, સમીકરણોની સિસ્ટમ સ્વરૂપ લેશે

પ્રમાણિત જથ્થાના ક્ષણોના ગુણધર્મોને ધ્યાનમાં લેતા, અમે લખીએ છીએ

બિનરેખીય રીગ્રેસન ગુણાંકનું નિર્ધારણ રેખીય સમીકરણોની સિસ્ટમને ઉકેલવા પર આધારિત છે. આ કરવા માટે, તમે આંકડાકીય માહિતીની પ્રક્રિયા કરવા માટે આંકડાકીય પદ્ધતિઓના સાર્વત્રિક પેકેજો અથવા વિશિષ્ટ પેકેજોનો ઉપયોગ કરી શકો છો.

જેમ જેમ રીગ્રેસન સમીકરણની ડિગ્રી વધે છે, તેમ ગુણાંક નક્કી કરવા માટે વપરાતા પરિમાણોના વિતરણ ક્ષણોની ડિગ્રી પણ વધે છે. આમ, બીજી ડિગ્રીના રીગ્રેસન સમીકરણના ગુણાંકને નિર્ધારિત કરવા માટે, ચોથા ડિગ્રી સહિતના પરિમાણોના વિતરણની ક્ષણોનો ઉપયોગ કરવામાં આવે છે. તે જાણીતું છે કે EDs ના મર્યાદિત નમૂનામાંથી ક્ષણોનો અંદાજ કાઢવાની ચોકસાઈ અને વિશ્વસનીયતા તેમના ઓર્ડરમાં વધારો થતાં તીવ્રપણે ઘટે છે. રીગ્રેશન સમીકરણોમાં બીજા કરતા વધુ ડિગ્રીના બહુપદીનો ઉપયોગ અયોગ્ય છે.

પરિણામી રીગ્રેસન સમીકરણની ગુણવત્તાનું મૂલ્યાંકન સૂચકના અવલોકનોના પરિણામો અને પરિમાણ જગ્યામાં આપેલ બિંદુઓ પર રીગ્રેસન સમીકરણ દ્વારા અનુમાનિત મૂલ્યો વચ્ચેની નિકટતાની ડિગ્રી દ્વારા કરવામાં આવે છે. જો પરિણામો નજીક છે, તો પછી રીગ્રેસન વિશ્લેષણની સમસ્યા હલ થઈ શકે છે. નહિંતર, તમારે રીગ્રેશન સમીકરણ બદલવું જોઈએ (બહુપદીની એક અલગ ડિગ્રી અથવા એકસાથે અલગ પ્રકારનું સમીકરણ પસંદ કરો) અને પરિમાણોનો અંદાજ કાઢવા માટે ગણતરીઓનું પુનરાવર્તન કરો.

જો ત્યાં ઘણા સૂચકાંકો છે, તો તેમાંથી દરેક માટે રીગ્રેસન વિશ્લેષણની સમસ્યા સ્વતંત્ર રીતે ઉકેલવામાં આવે છે.

રીગ્રેસન સમીકરણના સારને વિશ્લેષણ કરતા, નીચેના મુદ્દાઓ નોંધવા જોઈએ. ગણવામાં આવેલ અભિગમ ગુણાંકનું અલગ (સ્વતંત્ર) મૂલ્યાંકન પ્રદાન કરતું નથી - એક ગુણાંકના મૂલ્યમાં ફેરફાર અન્યના મૂલ્યોમાં ફેરફારનો સમાવેશ કરે છે. પ્રાપ્ત ગુણાંકને સૂચકના મૂલ્યમાં અનુરૂપ પરિમાણના યોગદાન તરીકે ગણવામાં આવવો જોઈએ નહીં. રીગ્રેસન સમીકરણ એ હાલના EDનું માત્ર એક સારું વિશ્લેષણાત્મક વર્ણન છે, અને પરિમાણો અને સૂચક વચ્ચેના સંબંધનું વર્ણન કરતો કાયદો નથી. આ સમીકરણનો ઉપયોગ પરિમાણ ફેરફારોની આપેલ શ્રેણીમાં સૂચકના મૂલ્યોની ગણતરી કરવા માટે થાય છે. તે આ શ્રેણીની બહારની ગણતરીઓ માટે મર્યાદિત યોગ્યતા ધરાવે છે, એટલે કે. તેનો ઉપયોગ પ્રક્ષેપણ સમસ્યાઓ હલ કરવા અને મર્યાદિત હદ સુધી એક્સ્ટ્રાપોલેશન માટે થઈ શકે છે.



આગાહીની અચોક્કસતાનું મુખ્ય કારણ રીગ્રેસન લાઇનના એક્સ્ટ્રાપોલેશનની અનિશ્ચિતતા નથી, પરંતુ મોડેલમાં ધ્યાનમાં લેવામાં ન આવતા પરિબળોને કારણે સૂચકમાં નોંધપાત્ર તફાવત છે. આગાહી કરવાની ક્ષમતાની મર્યાદા એ મોડેલમાં ધ્યાનમાં લેવામાં ન આવતા પરિમાણોની સ્થિરતાની સ્થિતિ અને ધ્યાનમાં લેવામાં આવેલા મોડેલ પરિબળોના પ્રભાવની પ્રકૃતિ છે. જો બાહ્ય વાતાવરણમાં તીવ્ર ફેરફાર થાય છે, તો સંકલિત રીગ્રેસન સમીકરણ તેનો અર્થ ગુમાવશે. તમે પરિબળના રીગ્રેસન સમીકરણ મૂલ્યોને બદલી શકતા નથી જે ED માં રજૂ કરેલા કરતાં નોંધપાત્ર રીતે અલગ છે. પરિબળના મહત્તમ અને લઘુત્તમ બંને મૂલ્યો માટે પરિમાણની વિવિધતાની શ્રેણીના ત્રીજા ભાગથી આગળ ન જવાની ભલામણ કરવામાં આવે છે.

રીગ્રેસન સમીકરણમાં પરિમાણના અપેક્ષિત મૂલ્યને બદલીને પ્રાપ્ત થયેલ આગાહી એ એક બિંદુ છે. આવી આગાહી સાકાર થવાની સંભાવના નહિવત છે. આગાહીના વિશ્વાસ અંતરાલને નિર્ધારિત કરવાની સલાહ આપવામાં આવે છે. સૂચકના વ્યક્તિગત મૂલ્યો માટે, અંતરાલને રીગ્રેસન લાઇનની સ્થિતિમાં ભૂલો અને આ રેખામાંથી વ્યક્તિગત મૂલ્યોના વિચલનોને ધ્યાનમાં લેવું જોઈએ. પરિબળ x માટે સૂચક y ની આગાહી કરવામાં સરેરાશ ભૂલ હશે

જ્યાં પર વસ્તીમાં રીગ્રેસન લાઇનની સ્થિતિમાં સરેરાશ ભૂલ છે x = x k;

- વસ્તીમાં રીગ્રેસન લાઇનમાંથી સૂચકના વિચલનના તફાવતનું મૂલ્યાંકન;

x k- પરિબળનું અપેક્ષિત મૂલ્ય.

આગાહીની આત્મવિશ્વાસ મર્યાદા, ઉદાહરણ તરીકે, રીગ્રેસન સમીકરણ (7.14) માટે, અભિવ્યક્તિ દ્વારા નક્કી કરવામાં આવે છે.

નેગેટિવ ફ્રી ટર્મ a 0મૂળ ચલો માટે રીગ્રેસન સમીકરણનો અર્થ એ છે કે સૂચકના અસ્તિત્વના ડોમેનમાં શૂન્ય પરિમાણ મૂલ્યો શામેલ નથી. જો a 0 > 0, પછી સૂચકના અસ્તિત્વના ડોમેનમાં શૂન્ય પરિમાણ મૂલ્યો શામેલ છે, અને ગુણાંક પોતે પરિમાણોના પ્રભાવની ગેરહાજરીમાં સૂચકના સરેરાશ મૂલ્યને દર્શાવે છે.

સમસ્યા 7.2. કોષ્ટકમાં ઉલ્લેખિત નમૂનાના આધારે ચેનલ ક્ષમતા માટે રીગ્રેસન સમીકરણ બનાવો. 7.1.

ઉકેલ. ઉલ્લેખિત નમૂનાના સંબંધમાં, વિશ્લેષણાત્મક અવલંબનનું નિર્માણ મુખ્યત્વે સહસંબંધ વિશ્લેષણના માળખામાં કરવામાં આવ્યું હતું: થ્રુપુટ માત્ર સિગ્નલ-ટુ-અવાજ ગુણોત્તર પરિમાણ પર આધારિત છે. તે અગાઉ ગણતરી કરેલ પરિમાણ મૂલ્યોને અભિવ્યક્તિમાં બદલવાનું બાકી છે (7.14). ક્ષમતા માટેનું સમીકરણ સ્વરૂપ લેશે

ŷ = 26.47–0.93×41.68×5.39/6.04+0.93×5.39/6.03× એક્સ = – 8,121+0,830એક્સ.

ગણતરીના પરિણામો કોષ્ટકમાં રજૂ કરવામાં આવ્યા છે. 7.5.

કોષ્ટક 7.5

એન પીપી ચેનલ ક્ષમતા સિગ્નલથી અવાજ ગુણોત્તર કાર્ય મૂલ્ય ભૂલ
વાય એક્સ ŷ ε
26.37 41.98 26.72 -0.35
28.00 43.83 28.25 -0.25
27/83 42.83 27.42 0.41
31.67 47.28 31.12 0.55
23.50 38.75 24.04 -0.54
21.04 35.12 21.03 0.01
16.94 32.07 18.49 -1.55
37.56 54.25 36.90 0.66
18.84 32.70 19.02 -0.18
25.77 40.51 25.50 0.27
33.52 49.78 33.19 0.33
28.21 43.84 28.26 -0.05
28.76 44.03

સહસંબંધ અવલંબનનો અભ્યાસ ચલો વચ્ચેના આવા જોડાણોના અભ્યાસ પર આધારિત છે જેમાં એક ચલના મૂલ્યો, જેને આશ્રિત ચલ તરીકે લઈ શકાય છે, "સરેરાશ" બીજા દ્વારા લેવામાં આવેલા મૂલ્યોના આધારે બદલાય છે. ચલ, આશ્રિત ચલના સંબંધમાં કારણ તરીકે ગણવામાં આવે છે. આ કારણની ક્રિયા વિવિધ પરિબળોની જટિલ ક્રિયાપ્રતિક્રિયાની પરિસ્થિતિઓ હેઠળ હાથ ધરવામાં આવે છે, જેના પરિણામે પેટર્નનું અભિવ્યક્તિ તકના પ્રભાવ દ્વારા અસ્પષ્ટ છે. વિશેષતા-પરિબળના મૂલ્યોના આપેલ જૂથ માટે અસરકારક વિશેષતાના સરેરાશ મૂલ્યોની ગણતરી કરીને, તકનો પ્રભાવ આંશિક રીતે દૂર થાય છે. સૈદ્ધાંતિક સંદેશાવ્યવહાર રેખાના પરિમાણોની ગણતરી કરીને, તેઓને વધુ દૂર કરવામાં આવે છે અને પરિબળ "x" માં ફેરફાર સાથે "y" માં અસ્પષ્ટ (સ્વરૂપમાં) ફેરફાર પ્રાપ્ત થાય છે.

સ્ટોકેસ્ટિક સંબંધોનો અભ્યાસ કરવા માટે, બે સમાંતર શ્રેણીની તુલના કરવાની પદ્ધતિ, વિશ્લેષણાત્મક જૂથોની પદ્ધતિ, સહસંબંધ વિશ્લેષણ, રીગ્રેસન વિશ્લેષણ અને કેટલીક બિન-પેરામેટ્રિક પદ્ધતિઓનો વ્યાપકપણે ઉપયોગ થાય છે. સામાન્ય રીતે, સંબંધોના અભ્યાસના ક્ષેત્રમાં આંકડાઓનું કાર્ય માત્ર તેમની હાજરી, દિશા અને જોડાણની તાકાતનું પ્રમાણ નક્કી કરવાનું નથી, પરંતુ પરિણામી વ્યક્તિ પર પરિબળની લાક્ષણિકતાઓના પ્રભાવનું સ્વરૂપ (વિશ્લેષણાત્મક અભિવ્યક્તિ) પણ નક્કી કરવાનું છે. તેને ઉકેલવા માટે, સહસંબંધ અને રીગ્રેસન વિશ્લેષણની પદ્ધતિઓનો ઉપયોગ કરવામાં આવે છે.

પ્રકરણ 1. રીગ્રેશન સમીકરણ: સૈદ્ધાંતિક પાયા

1.1. રીગ્રેસન સમીકરણ: સાર અને કાર્યોના પ્રકાર

રીગ્રેસન (લેટ. રીગ્રેસિઓ - રિવર્સ ચળવળ, વિકાસના વધુ જટિલ સ્વરૂપોમાંથી ઓછા જટિલ સ્વરૂપોમાં સંક્રમણ) એ સંભાવના સિદ્ધાંત અને ગાણિતિક આંકડાઓમાં મૂળભૂત ખ્યાલોમાંની એક છે, જે મૂલ્યો પર રેન્ડમ ચલના સરેરાશ મૂલ્યની અવલંબનને વ્યક્ત કરે છે. અન્ય રેન્ડમ ચલ અથવા ઘણા રેન્ડમ વેરિયેબલ. આ ખ્યાલ 1886 માં ફ્રાન્સિસ ગેલ્ટન દ્વારા રજૂ કરવામાં આવ્યો હતો.

સૈદ્ધાંતિક રીગ્રેસન રેખા એ રેખા છે જેની આસપાસ સહસંબંધ ક્ષેત્રના બિંદુઓને જૂથબદ્ધ કરવામાં આવે છે અને જે મુખ્ય દિશા સૂચવે છે, જોડાણની મુખ્ય વૃત્તિ.

સૈદ્ધાંતિક રીગ્રેસન લાઇન અસરકારક વિશેષતા "y" ના સરેરાશ મૂલ્યોમાં ફેરફારને પ્રતિબિંબિત કરતી હોવી જોઈએ કારણ કે પરિબળ વિશેષતા "x" ના મૂલ્યો બદલાય છે, અન્ય તમામ - પરિબળના સંબંધમાં રેન્ડમના સંપૂર્ણ રદને આધિન છે. "x" - કારણો. પરિણામે, આ રેખા દોરવી આવશ્યક છે જેથી સૈદ્ધાંતિક રીગ્રેસન રેખાના અનુરૂપ બિંદુઓમાંથી સહસંબંધ ક્ષેત્રના બિંદુઓના વિચલનોનો સરવાળો શૂન્ય સમાન હોય, અને આ વિચલનોના વર્ગોનો સરવાળો ન્યૂનતમ હોય.

y=f(x) - રીગ્રેસન સમીકરણ એ ચલો વચ્ચેના આંકડાકીય સંબંધ માટેનું સૂત્ર છે.

પ્લેન પર એક સીધી રેખા (દ્વિ-પરિમાણીય અવકાશમાં) સમીકરણ y=a+b*x દ્વારા આપવામાં આવે છે. વધુ વિગતમાં, ચલ y ને સતત (a) અને ઢાળ (b) ચલ x દ્વારા ગુણાકારની દ્રષ્ટિએ વ્યક્ત કરી શકાય છે. અચળને કેટલીકવાર ઇન્ટરસેપ્ટ ટર્મ પણ કહેવામાં આવે છે, અને ઢોળાવને ક્યારેક રીગ્રેસન અથવા બી-ગુણાંક કહેવામાં આવે છે.

રીગ્રેસન વિશ્લેષણનો એક મહત્વપૂર્ણ તબક્કો એ કાર્યના પ્રકારને નિર્ધારિત કરવાનું છે કે જેની સાથે લાક્ષણિકતાઓ વચ્ચેની અવલંબન લાક્ષણિકતા છે. મુખ્ય આધાર અભ્યાસ કરવામાં આવી રહેલા અવલંબનની પ્રકૃતિ અને તેની પદ્ધતિનું અર્થપૂર્ણ વિશ્લેષણ હોવું જોઈએ. તે જ સમયે, દરેક પરિબળો અને પ્રદર્શન સૂચક વચ્ચેના જોડાણના સ્વરૂપને સૈદ્ધાંતિક રીતે સાબિત કરવું હંમેશા શક્ય નથી, કારણ કે અભ્યાસ હેઠળની સામાજિક-આર્થિક ઘટનાઓ ખૂબ જટિલ છે અને તેમના સ્તરને આકાર આપતા પરિબળો નજીકથી જોડાયેલા છે અને ક્રિયાપ્રતિક્રિયા કરે છે. એકબીજા સાથે. તેથી, સૈદ્ધાંતિક વિશ્લેષણના આધારે, સંબંધોની દિશા, અભ્યાસ હેઠળની વસ્તીમાં તેના પરિવર્તનની સંભાવના, રેખીય સંબંધનો ઉપયોગ કરવાની કાયદેસરતા, આત્યંતિક મૂલ્યોની સંભવિત હાજરી, વગેરેને લગતા સૌથી સામાન્ય તારણો ઘણીવાર દોરવામાં આવે છે. વગેરે આવી ધારણાઓ માટે જરૂરી પૂરક ચોક્કસ હકીકતલક્ષી માહિતીનું વિશ્લેષણ હોવું જોઈએ.

પ્રયોગમૂલક રીગ્રેશન લાઇનના આધારે સંબંધ રેખાનો અંદાજિત વિચાર મેળવી શકાય છે. પ્રયોગમૂલક રીગ્રેસન રેખા સામાન્ય રીતે તૂટેલી રેખા હોય છે અને તેમાં વધુ કે ઓછા નોંધપાત્ર વિરામ હોય છે. આ એ હકીકત દ્વારા સમજાવવામાં આવ્યું છે કે પરિણામી લાક્ષણિકતાના ભિન્નતાને પ્રભાવિત કરતા અન્ય બિનહિસાબી પરિબળોનો પ્રભાવ સરેરાશમાં અપૂર્ણ રીતે ઓલવાઈ ગયો છે, અપૂરતા પ્રમાણમાં મોટી સંખ્યામાં અવલોકનોને કારણે, તેથી, સંચારની પ્રયોગમૂલક લાઇન પસંદ કરવા અને પસંદ કરવા માટે ઉપયોગમાં લઈ શકાય છે. સૈદ્ધાંતિક વળાંકના પ્રકારને ન્યાય આપો, જો કે અવલોકનોની સંખ્યા પૂરતી મોટી હોય.

વિશિષ્ટ અભ્યાસોના ઘટકોમાંનું એક એ વિવિધ અવલંબન સમીકરણોની તુલના છે, જે મોડેલોના સ્પર્ધાત્મક સંસ્કરણો દ્વારા અંદાજિત પ્રયોગમૂલક ડેટા માટે ગુણવત્તાના માપદંડોના ઉપયોગ પર આધારિત છે, જે આર્થિક સૂચકોના સંબંધોને દર્શાવવા માટે મોટાભાગે નીચેના પ્રકારનાં કાર્યોનો ઉપયોગ કરવામાં આવે છે:

1. રેખીય:

2. હાયપરબોલિક:

3. પ્રદર્શનાત્મક:

4. પેરાબોલિક:

5. શક્તિ:

6. લઘુગણક:

7. લોજિસ્ટિક્સ:

એક સ્પષ્ટીકરણ અને એક સમજાવાયેલ ચલ સાથેનું મોડેલ એ જોડી કરેલ રીગ્રેસન મોડેલ છે. જો બે અથવા વધુ સ્પષ્ટીકરણ (પરિબળ) ચલોનો ઉપયોગ કરવામાં આવે, તો અમે બહુવિધ રીગ્રેશન મોડલનો ઉપયોગ કરવાની વાત કરીએ છીએ. આ કિસ્સામાં, રેખીય, ઘાતાંકીય, હાયપરબોલિક, ઘાતાંકીય અને આ ચલોને જોડતા અન્ય પ્રકારનાં કાર્યોને વિકલ્પો તરીકે પસંદ કરી શકાય છે.

રીગ્રેસન સમીકરણના પરિમાણો a અને b શોધવા માટે, ઓછામાં ઓછી ચોરસ પદ્ધતિનો ઉપયોગ થાય છે. પ્રયોગમૂલક ડેટાને શ્રેષ્ઠ રીતે બંધબેસતા ફંક્શન શોધવા માટે ઓછામાં ઓછી ચોરસ પદ્ધતિ લાગુ કરતી વખતે, એવું માનવામાં આવે છે કે સૈદ્ધાંતિક રીગ્રેસન રેખામાંથી પ્રાયોગિક બિંદુઓના વિચલનોના વર્ગોની બેગ ન્યૂનતમ મૂલ્ય હોવી જોઈએ.

લઘુત્તમ ચોરસ માપદંડ નીચે પ્રમાણે લખી શકાય છે:

પરિણામે, પ્રાયોગિક ડેટા સાથે શ્રેષ્ઠ મેળ ખાતી રેખાના પરિમાણો a અને b નક્કી કરવા માટે ઓછામાં ઓછી ચોરસ પદ્ધતિનો ઉપયોગ એ આત્યંતિક સમસ્યામાં ઘટાડો થાય છે.

આકારણીઓના સંદર્ભમાં, નીચેના તારણો દોરી શકાય છે:

1. લઘુત્તમ ચોરસ અંદાજકર્તા એ નમૂનાના કાર્યો છે, જે તેમને ગણતરીમાં સરળ બનાવે છે.

2. લઘુત્તમ ચોરસ અંદાજ એ સૈદ્ધાંતિક રીગ્રેસન ગુણાંકના બિંદુ અંદાજ છે.

3. પ્રયોગમૂલક રીગ્રેસન રેખા આવશ્યકપણે બિંદુ x, yમાંથી પસાર થાય છે.

4. પ્રયોગમૂલક રીગ્રેસન સમીકરણ એવી રીતે બાંધવામાં આવે છે કે વિચલનોનો સરવાળો

.

સંચારની પ્રયોગમૂલક અને સૈદ્ધાંતિક રેખાનું ગ્રાફિકલ રજૂઆત આકૃતિ 1 માં પ્રસ્તુત છે.


સમીકરણમાં પરિમાણ b એ રીગ્રેસન ગુણાંક છે. પ્રત્યક્ષ સહસંબંધની હાજરીમાં, રીગ્રેસન ગુણાંક હકારાત્મક હોય છે, અને વ્યસ્ત સહસંબંધના કિસ્સામાં, રીગ્રેસન ગુણાંક નકારાત્મક હોય છે. રીગ્રેસન ગુણાંક બતાવે છે કે જ્યારે પરિબળ એટ્રિબ્યુટ "x" એક દ્વારા બદલાય છે ત્યારે અસરકારક વિશેષતા "y" નું મૂલ્ય સરેરાશ કેટલું બદલાય છે. ભૌમિતિક રીતે, રીગ્રેસન ગુણાંક એ સીધી રેખાનો ઢોળાવ છે જે "x" અક્ષને સંબંધિત સહસંબંધ સમીકરણ દર્શાવે છે.

).

અવલંબન પુનઃપ્રાપ્તિ માટે સમર્પિત મલ્ટિવેરિયેટ આંકડાકીય વિશ્લેષણની શાખાને રીગ્રેસન વિશ્લેષણ કહેવામાં આવે છે. "રેખીય રીગ્રેસન વિશ્લેષણ" શબ્દનો ઉપયોગ ત્યારે થાય છે જ્યારે વિચારણા હેઠળનું કાર્ય રેખીય રીતે અંદાજિત પરિમાણો પર આધાર રાખે છે (સ્વતંત્ર ચલો પરની અવલંબન મનસ્વી હોઈ શકે છે). મૂલ્યાંકન સિદ્ધાંત

અજ્ઞાત પરિમાણો ખાસ કરીને રેખીય રીગ્રેશન વિશ્લેષણના કિસ્સામાં સારી રીતે વિકસિત છે. જો ત્યાં કોઈ રેખીયતા નથી અને રેખીય સમસ્યા તરફ જવાનું અશક્ય છે, તો પછી, એક નિયમ તરીકે, વ્યક્તિ અંદાજોમાંથી સારા ગુણધર્મોની અપેક્ષા રાખી શકતો નથી. અમે વિવિધ પ્રકારની નિર્ભરતાના કિસ્સામાં અભિગમો દર્શાવીશું. જો અવલંબન બહુપદી (બહુપદી) નું સ્વરૂપ ધરાવે છે. જો સહસંબંધની ગણતરી બે ચલો વચ્ચેના સંબંધની મજબૂતાઈને દર્શાવે છે, તો રીગ્રેશન વિશ્લેષણ આ સંબંધના પ્રકારને નિર્ધારિત કરવા માટે સેવા આપે છે અને બીજા (સ્વતંત્ર) ચલના મૂલ્યના આધારે એક (આશ્રિત) ચલના મૂલ્યની આગાહી કરવાનું શક્ય બનાવે છે. . રેખીય રીગ્રેસન વિશ્લેષણ કરવા માટે, આશ્રિત ચલ પાસે અંતરાલ (અથવા ઓર્ડિનલ) સ્કેલ હોવો આવશ્યક છે. તે જ સમયે, દ્વિસંગી લોજિસ્ટિક રીગ્રેસન કોઈપણ સ્કેલથી સંબંધિત કેટલાક અન્ય ચલ પર ડિકોટોમસ ચલની અવલંબનને દર્શાવે છે. સમાન એપ્લિકેશન શરતો પ્રોબિટ વિશ્લેષણ પર લાગુ થાય છે. જો આશ્રિત ચલ વર્ગીકૃત હોય, પરંતુ તેની બે કરતાં વધુ શ્રેણીઓ હોય, તો મલ્ટિનોમીયલ લોજિસ્ટિક રીગ્રેસન એ એક યોગ્ય પદ્ધતિ છે જે અંતરાલ સ્કેલથી સંબંધિત હોય તેવા ચલો વચ્ચેના બિનરેખીય સંબંધોનું વિશ્લેષણ કરી શકાય છે; બિનરેખીય રીગ્રેસન પદ્ધતિ આ હેતુ માટે રચાયેલ છે.

રીગ્રેસન ગુણાંકપ્રભાવ સૂચક પર પરિબળોના પ્રભાવની તીવ્રતા દર્શાવે છે. જો પરિબળ સૂચકાંકોનું પ્રારંભિક માનકીકરણ હાથ ધરવામાં આવે છે, તો b 0 એ એકંદરમાં અસરકારક સૂચકના સરેરાશ મૂલ્યની બરાબર છે. ગુણાંક b 1, b 2, ..., b n પ્રદર્શન સૂચકનું સ્તર તેના સરેરાશ મૂલ્યમાંથી કેટલા એકમો દ્વારા વિચલિત થાય છે તે દર્શાવે છે જો પરિબળ સૂચકના મૂલ્યો એક પ્રમાણભૂત વિચલન દ્વારા શૂન્યની સરેરાશથી વિચલિત થાય છે. આમ, રીગ્રેસન ગુણાંક પ્રદર્શન સૂચકના સ્તરને વધારવા માટે વ્યક્તિગત પરિબળોના મહત્વની ડિગ્રીને લાક્ષણિકતા આપે છે. રીગ્રેસન ગુણાંકના ચોક્કસ મૂલ્યો ઓછામાં ઓછા ચોરસ પદ્ધતિ (સામાન્ય સમીકરણોની સિસ્ટમો ઉકેલવાના પરિણામે) અનુસાર પ્રયોગમૂલક ડેટામાંથી નક્કી કરવામાં આવે છે.

રીગ્રેશન લાઇન- એક રેખા જે સ્કેટર ડાયાગ્રામ પર પ્રાયોગિક બિંદુઓના વિતરણને સૌથી વધુ સચોટપણે પ્રતિબિંબિત કરે છે અને ઢાળની ઢાળને બે અંતરાલ ચલો વચ્ચેના સંબંધને દર્શાવે છે.

રીગ્રેસન લાઇન મોટાભાગે રેખીય કાર્ય (રેખીય રીગ્રેસન) ના સ્વરૂપમાં માંગવામાં આવે છે, જે ઇચ્છિત વળાંકનો શ્રેષ્ઠ અંદાજ આપે છે. આ લઘુત્તમ ચોરસ પદ્ધતિનો ઉપયોગ કરીને કરવામાં આવે છે, જ્યારે તેમના અંદાજોમાંથી વાસ્તવમાં અવલોકન કરાયેલા વર્ગના વિચલનોનો સરવાળો ઓછો કરવામાં આવે છે (એટલે ​​કે સીધી રેખાનો ઉપયોગ કરીને અંદાજો કે જે ઇચ્છિત રીગ્રેસન સંબંધનું પ્રતિનિધિત્વ કરે છે):

(એમ - નમૂનાનું કદ). આ અભિગમ એ જાણીતી હકીકત પર આધારિત છે કે ઉપરોક્ત અભિવ્યક્તિમાં દેખાતી રકમ ચોક્કસ રીતે જ્યારે કેસ માટે ન્યૂનતમ મૂલ્ય લે છે.
57. સહસંબંધ સિદ્ધાંતના મુખ્ય કાર્યો.

સહસંબંધ સિદ્ધાંત એ એક ઉપકરણ છે જે ઘટનાઓ વચ્ચેના જોડાણોની નિકટતાનું મૂલ્યાંકન કરે છે જે માત્ર કારણ-અને-અસર સંબંધોમાં જ નથી. સહસંબંધ સિદ્ધાંતનો ઉપયોગ કરીને, સ્ટોકેસ્ટિક, પરંતુ કારણભૂત નથી, સંબંધોનું મૂલ્યાંકન કરવામાં આવે છે. લેખકે, એમ.એલ. લુકાતસ્કાયા સાથે મળીને, કારણભૂત સંબંધો માટે અંદાજો મેળવવાનો પ્રયાસ કર્યો. જો કે, ઘટનાના કારણ-અને-અસર સંબંધોનો પ્રશ્ન, કારણ અને અસરને કેવી રીતે ઓળખવી, તે ખુલ્લો રહે છે, અને એવું લાગે છે કે ઔપચારિક સ્તરે તે મૂળભૂત રીતે વણઉકેલાયેલ છે.

સહસંબંધનો સિદ્ધાંત અને ઉત્પાદન વિશ્લેષણ માટે તેનો ઉપયોગ.

સહસંબંધ સિદ્ધાંત, જે ગાણિતિક આંકડાશાસ્ત્રની શાખાઓમાંની એક છે, તે સંભવિત મર્યાદાઓ વિશે વાજબી ધારણાઓ કરવા માટે પરવાનગી આપે છે, જેમાં ચોક્કસ અંશે વિશ્વસનીયતા સાથે, અભ્યાસ હેઠળનું પરિમાણ સ્થિત થશે જો આંકડાકીય રીતે સંબંધિત અન્ય પરિમાણો ચોક્કસ મૂલ્યો પ્રાપ્ત કરે છે.

સહસંબંધ સિદ્ધાંતમાં, તેને અલગ પાડવાનો રિવાજ છે બે મુખ્ય કાર્યો.

પ્રથમ કાર્યસહસંબંધ સિદ્ધાંત - સહસંબંધનું સ્વરૂપ સ્થાપિત કરવા માટે, એટલે કે. રીગ્રેશન ફંક્શનનો પ્રકાર (રેખીય, ચતુર્ભુજ, વગેરે).

બીજું કાર્યસહસંબંધ સિદ્ધાંત - સહસંબંધ જોડાણની નિકટતા (તાકાત) નું મૂલ્યાંકન કરો.

X પર Y ના સહસંબંધ જોડાણ (નિર્ભરતા) ની નિકટતાનું મૂલ્યાંકન શરતી સરેરાશની આસપાસ Y મૂલ્યોના વિખેરવાની માત્રા દ્વારા કરવામાં આવે છે. મોટા વિક્ષેપ X પર Y ની નબળી અવલંબન સૂચવે છે, નાનું વિક્ષેપ મજબૂત અવલંબનની હાજરી સૂચવે છે.
58. સહસંબંધ કોષ્ટક અને તેની સંખ્યાત્મક લાક્ષણિકતાઓ.

વ્યવહારમાં, X અને Y ની માત્રાના સ્વતંત્ર અવલોકનોના પરિણામે, એક નિયમ તરીકે, વ્યક્તિ આ જથ્થાના મૂલ્યોના તમામ સંભવિત જોડીના સંપૂર્ણ સેટ સાથે નહીં, પરંતુ સામાન્ય વસ્તીના મર્યાદિત નમૂના સાથે જ વ્યવહાર કરે છે, અને નમૂનાની વસ્તીના વોલ્યુમ n ને નમૂનામાં ઉપલબ્ધ જોડીની સંખ્યા તરીકે વ્યાખ્યાયિત કરવામાં આવે છે.

નમૂનામાં મૂલ્ય X ને x 1, x 2, ....x m મૂલ્યો લેવા દો, જ્યાં આ મૂલ્યના મૂલ્યોની સંખ્યા જે એકબીજાથી અલગ છે, અને સામાન્ય કિસ્સામાં, તેમાંથી દરેક નમૂનામાં પુનરાવર્તન કરો. નમૂનામાં મૂલ્ય Y ને y 1, y 2, ....y k મૂલ્યો લેવા દો, જ્યાં k એ આ મૂલ્યના વિવિધ મૂલ્યોની સંખ્યા છે, અને સામાન્ય કિસ્સામાં, તેમાંથી દરેક પણ હોઈ શકે છે નમૂનામાં પુનરાવર્તિત. આ કિસ્સામાં, ડેટા ઘટનાની આવર્તનને ધ્યાનમાં લેતા કોષ્ટકમાં દાખલ કરવામાં આવે છે. જૂથિત ડેટા સાથેના આવા કોષ્ટકને સહસંબંધ કોષ્ટક કહેવામાં આવે છે.

પરિણામોની આંકડાકીય પ્રક્રિયાનો પ્રથમ તબક્કો એ સહસંબંધ કોષ્ટકનું સંકલન છે.

Y\X x 1 x 2 ... x મી n y
y 1 n 12 n 21 n m1 n y1
y 2 n 22 n m2 n y2
...
y k n 1k n 2k n mk n yk
n x n x1 n x2 n xm n

કોષ્ટકના મુખ્ય ભાગની પ્રથમ પંક્તિ નમૂનામાં મળેલા X જથ્થાના તમામ મૂલ્યોને ચડતા ક્રમમાં સૂચિબદ્ધ કરે છે. અનુરૂપ પંક્તિઓ અને કૉલમ્સના આંતરછેદ પર, આવર્તન n ij (i = 1,2,...,m; j=1,2,...,k) જોડીની ઘટનાઓની સંખ્યા (x i ; y i) નમૂનામાં. ઉદાહરણ તરીકે, આવર્તન n 12 નમૂનામાં જોડી (x 1 ;y 1) ની ઘટનાઓની સંખ્યા દર્શાવે છે.

તેમજ n xi n ij , 1≤i≤m, i-th કૉલમના ઘટકોનો સરવાળો છે, n yj n ij , 1≤j≤k, j-મી પંક્તિ અને n ના ઘટકોનો સરવાળો છે xi = n yj = n

સહસંબંધ કોષ્ટકના ડેટામાંથી મેળવેલા સૂત્રોના એનાલોગનું સ્વરૂપ છે:


59. પ્રયોગમૂલક અને સૈદ્ધાંતિક રીગ્રેસન રેખાઓ.

સૈદ્ધાંતિક રીગ્રેસન રેખાવ્યક્તિગત અવલોકનોના પરિણામો પરથી આ કિસ્સામાં ગણતરી કરી શકાય છે. સામાન્ય સમીકરણોની સિસ્ટમ ઉકેલવા માટે, આપણને સમાન ડેટાની જરૂર છે: x, y, xy અને xr. અમારી પાસે 1958 માં સિમેન્ટ ઉત્પાદનના જથ્થા અને સ્થિર ઉત્પાદન સંપત્તિના જથ્થા પરનો ડેટા છે. કાર્ય સેટ કરવામાં આવ્યું છે: સિમેન્ટ ઉત્પાદનના જથ્થા (ભૌતિક દ્રષ્ટિએ) અને સ્થિર સંપત્તિના જથ્થા વચ્ચેના સંબંધનો અભ્યાસ કરવો. [ 1 ]

સૈદ્ધાંતિક રીગ્રેસન રેખા (સમીકરણમાંથી ગણતરી કરેલ) વાસ્તવિક (અનુભાવિક)માંથી જેટલી ઓછી વિચલિત થાય છે, તેટલી સરેરાશ અંદાજની ભૂલ ઓછી હોય છે.

સૈદ્ધાંતિક રીગ્રેસન લાઇન શોધવાની પ્રક્રિયામાં ઓછામાં ઓછા ચોરસ પદ્ધતિનો ઉપયોગ કરીને પ્રયોગમૂલક રીગ્રેસન રેખાને ફિટ કરવાનો સમાવેશ થાય છે.

સૈદ્ધાંતિક રીગ્રેસન લાઇન શોધવાની પ્રક્રિયાને પ્રયોગમૂલક રીગ્રેસન રેખાનું સંરેખણ કહેવામાં આવે છે અને તેમાં પ્રકારને પસંદ કરવા અને તેને ન્યાયી ઠેરવવાનો સમાવેશ થાય છે; વળાંક અને તેના સમીકરણના પરિમાણોની ગણતરી.

પ્રયોગમૂલક રીગ્રેસન વિશ્લેષણાત્મક અથવા સંયોજન જૂથ ડેટા અનુસાર બનાવવામાં આવે છે અને પરિબળ લક્ષણના જૂથ સરેરાશ મૂલ્યો પર પરિણામ લક્ષણના જૂથ સરેરાશ મૂલ્યોની અવલંબનનું પ્રતિનિધિત્વ કરે છે. પ્રયોગમૂલક રીગ્રેસનની ગ્રાફિકલ રજૂઆત એ બિંદુઓથી બનેલી તૂટેલી રેખા છે, જેમાંથી એબ્સિસાસ એ પરિબળ લક્ષણના જૂથ સરેરાશ મૂલ્યો છે, અને ઓર્ડિનેટ્સ પરિણામ લક્ષણના જૂથ સરેરાશ મૂલ્યો છે. પોઈન્ટની સંખ્યા જૂથમાં જૂથોની સંખ્યા જેટલી છે.

પ્રયોગમૂલક રીગ્રેસન રેખા વિચારણા હેઠળના સંબંધના મુખ્ય વલણને પ્રતિબિંબિત કરે છે. જો પ્રયોગમૂલક રીગ્રેસન રેખા દેખાવમાં સીધી રેખાની નજીક આવે છે, તો પછી આપણે લાક્ષણિકતાઓ વચ્ચે રેખીય સહસંબંધની હાજરી ધારી શકીએ છીએ. અને જો કનેક્શન લાઇન વળાંકની નજીક આવે છે, તો આ એક વક્રીકૃત સહસંબંધ સંબંધની હાજરીને કારણે હોઈ શકે છે.
60. નમૂના સહસંબંધ અને રીગ્રેશન ગુણાંક.

જો ગ્રાફ પરની લાક્ષણિકતાઓ વચ્ચેની અવલંબન રેખીય સહસંબંધ સૂચવે છે, તો ગણતરી કરો સહસંબંધ ગુણાંક આર, જે તમને ચલો વચ્ચેના સંબંધની નિકટતાનું મૂલ્યાંકન કરવાની મંજૂરી આપે છે, અને મુખ્ય લાક્ષણિકતાના પ્રભાવને કારણે લાક્ષણિકતામાં ફેરફારનું પ્રમાણ શું છે અને અન્ય પરિબળોના પ્રભાવને લીધે કયો ભાગ છે તે પણ શોધી શકે છે. ગુણાંક -1 થી +1 સુધી બદલાય છે. જો આર=0, તો પછી લાક્ષણિકતાઓ વચ્ચે કોઈ જોડાણ નથી. સમાનતા આર=0 માત્ર રેખીય સહસંબંધ અવલંબનની ગેરહાજરી સૂચવે છે, પરંતુ સહસંબંધની ગેરહાજરી બિલકુલ નથી, આંકડાકીય અવલંબન ઘણું ઓછું છે. જો આર= ±1, તો આનો અર્થ એ છે કે સંપૂર્ણ (કાર્યકારી) જોડાણની હાજરી. આ કિસ્સામાં, બધા અવલોકન કરેલ મૂલ્યો રીગ્રેશન લાઇન પર સ્થિત છે, જે એક સીધી રેખા છે.
સહસંબંધ ગુણાંકનું વ્યવહારુ મહત્વ તેના વર્ગ મૂલ્ય દ્વારા નક્કી કરવામાં આવે છે, જેને નિર્ધારણના ગુણાંક કહેવાય છે.
રેખીય કાર્ય y = kX + b દ્વારા અંદાજિત રીગ્રેશન (આશરે વર્ણવેલ). X પર Y ના રીગ્રેસન માટે, રીગ્રેશન સમીકરણ છે: `y x = ryx X + b; (1). X પર Y ના પ્રત્યક્ષ રીગ્રેશનના સ્લોપ રાયક્સને X પર Y નો રીગ્રેશન ગુણાંક કહેવામાં આવે છે.

જો નમૂનાના ડેટાનો ઉપયોગ કરીને સમીકરણ (1) જોવા મળે, તો તેને કહેવામાં આવે છે નમૂના રીગ્રેસન સમીકરણ. તદનુસાર, ryx એ X પર Y નો નમૂના રીગ્રેસન ગુણાંક છે, અને b એ સમીકરણનો નમૂનો બનાવટી શબ્દ છે. રીગ્રેશન ગુણાંક X માં એકમ ભિન્નતા દીઠ Y માં ભિન્નતાને માપે છે. રીગ્રેસન સમીકરણના પરિમાણો (ગુણાંકો ryx અને b) ઓછામાં ઓછા ચોરસ પદ્ધતિનો ઉપયોગ કરીને જોવા મળે છે.
61. સામાન્ય વસ્તીમાં સહસંબંધ ગુણાંકના મહત્વ અને સહસંબંધની નિકટતાનું મૂલ્યાંકન

સહસંબંધ ગુણાંકનું મહત્વવિદ્યાર્થીની કસોટીનો ઉપયોગ કરીને ચકાસાયેલ:

જ્યાં - સહસંબંધ ગુણાંકની રુટ સરેરાશ ચોરસ ભૂલ, જે સૂત્ર દ્વારા નક્કી થાય છે:

જો ગણતરી કરેલ મૂલ્ય કોષ્ટક મૂલ્ય કરતા વધારે હોય, તો આપણે તારણ કાઢી શકીએ છીએ કે સહસંબંધ ગુણાંકનું મૂલ્ય કોષ્ટક મૂલ્યો છે tવિદ્યાર્થીના ટી-ટેસ્ટ મૂલ્યોના કોષ્ટકમાંથી મળે છે. આ કિસ્સામાં, સ્વતંત્રતાની ડિગ્રીની સંખ્યા ધ્યાનમાં લેવામાં આવે છે (V = n - 1) અને આત્મવિશ્વાસનું સ્તર (આર્થિક ગણતરીઓમાં, સામાન્ય રીતે 0.05 અથવા 0.01). અમારા ઉદાહરણમાં, સ્વતંત્રતાની ડિગ્રીની સંખ્યા છે: p - 1 = 40 - 1 = 39. આત્મવિશ્વાસના સ્તરે આર = 0,05; t= 2.02. કારણ કે (તમામ કેસોમાં વાસ્તવિક મૂલ્ય ટી-ટેબ્યુલર કરતા વધારે છે), પરિણામી અને પરિબળ સૂચકાંકો વચ્ચેનો સંબંધ વિશ્વસનીય છે, અને સહસંબંધ ગુણાંકની તીવ્રતા નોંધપાત્ર છે.

સહસંબંધ ગુણાંકનો અંદાજ, મર્યાદિત નમૂનામાંથી ગણવામાં આવે છે, લગભગ હંમેશા શૂન્યથી અલગ પડે છે. પરંતુ આનો અર્થ એ નથી કે સહસંબંધ ગુણાંક વસ્તીશૂન્યથી પણ અલગ છે. સહસંબંધ ગુણાંક શૂન્યની બરાબર છે તે પૂર્વધારણાને ચકાસવા માટે, ગુણાંકના નમૂના મૂલ્યના મહત્વનું મૂલ્યાંકન કરવું જરૂરી છે અથવા, આંકડાકીય પૂર્વધારણાઓનું પરીક્ષણ કરવાના કાર્યોની રચના અનુસાર. જો પૂર્વધારણા એન 0 કે સહસંબંધ ગુણાંક શૂન્ય સમાન છે તે નકારવામાં આવશે, પછી નમૂના ગુણાંક નોંધપાત્ર છે, અને અનુરૂપ મૂલ્યો રેખીય સંબંધ દ્વારા સંબંધિત છે. જો પૂર્વધારણા એન 0 સ્વીકારવામાં આવશે, પછી ગુણાંક અંદાજ નોંધપાત્ર નથી, અને મૂલ્યો એકબીજા સાથે રેખીય રીતે સંબંધિત નથી (જો, ભૌતિક કારણોસર, પરિબળો સંબંધિત હોઈ શકે છે, તો તે કહેવું વધુ સારું છે કે આ સંબંધ નથી ઉપલબ્ધ ED ના આધારે સ્થાપિત). સહસંબંધ ગુણાંક અંદાજના મહત્વ વિશેની પૂર્વધારણાનું પરીક્ષણ કરવા માટે આ રેન્ડમ ચલના વિતરણનું જ્ઞાન જરૂરી છે.  મૂલ્યનું વિતરણ ikજ્યારે રેન્ડમ વેરિયેબલ હોય ત્યારે માત્ર ખાસ કેસ માટે જ અભ્યાસ કર્યો હતો ઉજઅને યુ.કેસામાન્ય કાયદા અનુસાર વિતરિત.

નલ પૂર્વધારણાને ચકાસવા માટેના માપદંડ તરીકે એન 0 રેન્ડમ ચલ લાગુ કરો . જો સહસંબંધ ગુણાંકનું મોડ્યુલસ પ્રમાણમાં એકતાથી દૂર હોય, તો મૂલ્ય tજો શૂન્ય પૂર્વધારણા સાચી હોય, તો તે વિદ્યાર્થીના કાયદા અનુસાર વિતરિત કરવામાં આવે છે n- સ્વતંત્રતાની 2 ડિગ્રી. સ્પર્ધાત્મક પૂર્વધારણા એન 1 એ વિધાનને અનુલક્ષે છે કે મૂલ્ય  ikશૂન્યની બરાબર નથી (શૂન્ય કરતાં વધુ અથવા ઓછું). તેથી, નિર્ણાયક પ્રદેશ બે બાજુ છે.
62. નમૂનાના સહસંબંધ ગુણાંકની ગણતરી અને નમૂના સીધી રેખા રીગ્રેસન સમીકરણનું નિર્માણ.

નમૂના સહસંબંધ ગુણાંકસૂત્ર દ્વારા જોવા મળે છે

મૂલ્યોના નમૂના પ્રમાણભૂત વિચલનો ક્યાં છે અને .

નમૂના સહસંબંધ ગુણાંક અને વચ્ચેના રેખીય સંબંધની નિકટતા દર્શાવે છે: એકતાની નજીક, અને વચ્ચેના રેખીય સંબંધ વધુ મજબૂત.

સરળ રેખીય રીગ્રેસન એક ઇનપુટ ચલ અને એક આઉટપુટ ચલ વચ્ચે રેખીય સંબંધ શોધે છે. આ કરવા માટે, રીગ્રેસન સમીકરણ નક્કી કરવામાં આવે છે - આ એક મોડેલ છે જે Y ના મૂલ્યોની અવલંબનને પ્રતિબિંબિત કરે છે, x ના મૂલ્યો પર Y નું નિર્ભર મૂલ્ય, સ્વતંત્ર ચલ x અને વસ્તી, સ્તરીકરણ દ્વારા વર્ણવેલ છે. :

જ્યાં A0- રીગ્રેસન સમીકરણની મુક્ત મુદત;

A1- રીગ્રેસન સમીકરણ ગુણાંક

પછી અનુરૂપ સીધી રેખા બનાવવામાં આવે છે, જેને રીગ્રેસન લાઇન કહેવાય છે. ગુણાંક A0 અને A1, જેને મોડેલ પેરામીટર્સ પણ કહેવાય છે, તે એવી રીતે પસંદ કરવામાં આવે છે કે રીગ્રેસન લાઇનમાંથી વાસ્તવિક ડેટા અવલોકનોને અનુરૂપ બિંદુઓના વર્ગ વિચલનોનો સરવાળો ન્યૂનતમ હોય. લઘુત્તમ ચોરસ પદ્ધતિનો ઉપયોગ કરીને ગુણાંક પસંદ કરવામાં આવે છે. બીજા શબ્દોમાં કહીએ તો, સરળ રેખીય રીગ્રેસન એક રેખીય મોડેલનું વર્ણન કરે છે જે એક ઇનપુટ ચલ અને એક આઉટપુટ ચલ વચ્ચેના સંબંધને શ્રેષ્ઠ અંદાજ આપે છે.

રીગ્રેશનનો ખ્યાલ. ચલો વચ્ચે અવલંબન xઅને yવિવિધ રીતે વર્ણવી શકાય છે. ખાસ કરીને, જોડાણના કોઈપણ સ્વરૂપને સામાન્ય સમીકરણ દ્વારા વ્યક્ત કરી શકાય છે, જ્યાં yઆશ્રિત ચલ તરીકે ગણવામાં આવે છે, અથવા કાર્યોબીજામાંથી - સ્વતંત્ર ચલ x, કહેવાય છે દલીલ. દલીલ અને કાર્ય વચ્ચેના પત્રવ્યવહારને કોષ્ટક, સૂત્ર, ગ્રાફ વગેરે દ્વારા સ્પષ્ટ કરી શકાય છે. એક અથવા વધુ દલીલોમાં ફેરફારના આધારે ફંક્શનમાં ફેરફાર કહેવામાં આવે છે રીગ્રેશન. સહસંબંધોનું વર્ણન કરવા માટે વપરાતા તમામ માધ્યમો સામગ્રીની રચના કરે છે રીગ્રેસન વિશ્લેષણ.

રીગ્રેસન, સહસંબંધ સમીકરણો, અથવા રીગ્રેસન સમીકરણો, પ્રયોગમૂલક અને સૈદ્ધાંતિક રીતે ગણતરી કરેલ રીગ્રેસન શ્રેણી, તેમના ગ્રાફ, જેને રીગ્રેસન રેખાઓ કહેવાય છે, તેમજ રેખીય અને બિનરેખીય રીગ્રેસન ગુણાંકનો ઉપયોગ કરવામાં આવે છે.

રીગ્રેસન સૂચકાંકો લાક્ષણિકતાના સરેરાશ મૂલ્યોમાં થતા ફેરફારોને ધ્યાનમાં લેતા, દ્વિપક્ષીય રીતે સહસંબંધ સંબંધ વ્યક્ત કરે છે. વાયજ્યારે મૂલ્યો બદલાય છે x iચિહ્ન એક્સ, અને, તેનાથી વિપરીત, લાક્ષણિકતાના સરેરાશ મૂલ્યોમાં ફેરફાર દર્શાવે છે એક્સબદલાયેલ મૂલ્યો અનુસાર y iચિહ્ન વાય. અપવાદ સમય શ્રેણી, અથવા સમય શ્રેણી છે, જે સમયાંતરે લાક્ષણિકતાઓમાં ફેરફાર દર્શાવે છે. આવી શ્રેણીનું રીગ્રેશન એકતરફી છે.

સહસંબંધોના ઘણાં વિવિધ સ્વરૂપો અને પ્રકારો છે. કાર્ય દરેક ચોક્કસ કેસમાં જોડાણના સ્વરૂપને ઓળખવા અને તેને યોગ્ય સહસંબંધ સમીકરણ સાથે વ્યક્ત કરવા માટે નીચે આવે છે, જે આપણને એક લાક્ષણિકતામાં સંભવિત ફેરફારોની અપેક્ષા કરવા દે છે. વાયબીજામાં જાણીતા ફેરફારો પર આધારિત એક્સ, પ્રથમ સહસંબંધ સાથે સંબંધિત.

12.1 લીનિયર રીગ્રેશન

રીગ્રેસન સમીકરણ.સહસંબંધિત લાક્ષણિકતાઓના આધારે ચોક્કસ જૈવિક પદાર્થ પર હાથ ધરવામાં આવેલા અવલોકનોનાં પરિણામો xઅને y, લંબચોરસ કોઓર્ડિનેટ્સની સિસ્ટમ બનાવીને પ્લેન પરના બિંદુઓ દ્વારા રજૂ કરી શકાય છે. પરિણામ એ એક પ્રકારનું સ્કેટર ડાયાગ્રામ છે જે વ્યક્તિને વિવિધ લાક્ષણિકતાઓ વચ્ચેના સંબંધના સ્વરૂપ અને નિકટતાને નક્કી કરવા દે છે. ઘણી વાર આ સંબંધ સીધી રેખા જેવો દેખાય છે અથવા સીધી રેખા દ્વારા અંદાજિત કરી શકાય છે.

ચલો વચ્ચે રેખીય સંબંધ xઅને yસામાન્ય સમીકરણ દ્વારા વર્ણવવામાં આવે છે, જ્યાં a, b, c, d,... – સમીકરણના પરિમાણો જે દલીલો વચ્ચેના સંબંધોને નિર્ધારિત કરે છે x 1 , x 2 , x 3 , …, x mઅને કાર્યો.

વ્યવહારમાં, તમામ સંભવિત દલીલોને ધ્યાનમાં લેવામાં આવતી નથી, પરંતુ સરળ કિસ્સામાં માત્ર એક જ દલીલો;

રેખીય રીગ્રેશન સમીકરણમાં (1) aમુક્ત શબ્દ અને પરિમાણ છે bલંબચોરસ સંકલન અક્ષોની તુલનામાં રીગ્રેસન રેખાનો ઢોળાવ નક્કી કરે છે. વિશ્લેષણાત્મક ભૂમિતિમાં આ પરિમાણ કહેવામાં આવે છે ઢાળ, અને બાયોમેટ્રિક્સમાં - રીગ્રેસન ગુણાંક. આ પરિમાણ અને રીગ્રેસન રેખાઓની સ્થિતિનું દ્રશ્ય રજૂઆત વાયદ્વારા એક્સઅને એક્સદ્વારા વાયલંબચોરસ સંકલન પ્રણાલીમાં આકૃતિ 1 આપે છે.

ચોખા. સિસ્ટમમાં X દ્વારા Y અને X દ્વારા Y ની 1 રીગ્રેસન રેખાઓ

લંબચોરસ કોઓર્ડિનેટ્સ

આકૃતિ 1 માં બતાવ્યા પ્રમાણે રીગ્રેસન રેખાઓ, બિંદુ O (,) પર છેદે છે, જે એકબીજા સાથે સહસંબંધિત લાક્ષણિકતાઓના અંકગણિત સરેરાશ મૂલ્યોને અનુરૂપ છે. વાયઅને એક્સ. રીગ્રેશન આલેખ બનાવતી વખતે, સ્વતંત્ર ચલ X ના મૂલ્યો એબ્સીસા અક્ષ સાથે રચવામાં આવે છે, અને આશ્રિત ચલ અથવા ફંક્શન Y ના મૂલ્યો ઓર્ડિનેટ અક્ષ (, ) ચલો વચ્ચેના સંપૂર્ણ (કાર્યકારી) સંબંધને અનુરૂપ છે વાયઅને એક્સ, જ્યારે સહસંબંધ ગુણાંક. વચ્ચે મજબૂત જોડાણ વાયઅને એક્સ, રીગ્રેસન રેખાઓ AB ની જેટલી નજીક છે, અને તેનાથી વિપરીત, આ જથ્થાઓ વચ્ચેનું જોડાણ નબળું છે, રીગ્રેશન રેખાઓ AB થી વધુ દૂર છે. જો લાક્ષણિકતાઓ વચ્ચે કોઈ જોડાણ ન હોય, તો રીગ્રેસન રેખાઓ એકબીજાના જમણા ખૂણા પર હોય છે અને .

રીગ્રેસન સૂચકો દ્વિપક્ષીય રીતે સહસંબંધ સંબંધને વ્યક્ત કરતા હોવાથી, રીગ્રેસન સમીકરણ (1) નીચે પ્રમાણે લખવું જોઈએ:

જ્યારે લાક્ષણિકતા બદલાય છે ત્યારે પ્રથમ સૂત્ર સરેરાશ મૂલ્યો નક્કી કરે છે એક્સમાપના એકમ દીઠ, બીજા માટે - સરેરાશ મૂલ્યો જ્યારે લક્ષણના માપના એક એકમ દ્વારા બદલાય છે વાય.

રીગ્રેસન ગુણાંક.રીગ્રેસન ગુણાંક દર્શાવે છે કે એક લાક્ષણિકતાનું સરેરાશ મૂલ્ય કેટલું છે yફેરફાર થાય છે જ્યારે બીજાનું માપ, તેની સાથે સહસંબંધિત, એક દ્વારા બદલાય છે વાયચિહ્ન એક્સ. આ સૂચક સૂત્ર દ્વારા નક્કી કરવામાં આવે છે

અહીં મૂલ્યો છે sવર્ગ અંતરાલોના કદ દ્વારા ગુણાકાર λ , જો તેઓ વિવિધતા શ્રેણી અથવા સહસંબંધ કોષ્ટકોમાંથી મળી આવ્યા હોય.

પ્રમાણભૂત વિચલનોની ગણતરી કર્યા વિના રીગ્રેસન ગુણાંકની ગણતરી કરી શકાય છે s yઅને s xસૂત્ર અનુસાર

જો સહસંબંધ ગુણાંક અજાણ્યો હોય, તો રીગ્રેસન ગુણાંક નીચે પ્રમાણે નક્કી કરવામાં આવે છે:

રીગ્રેસન અને સહસંબંધ ગુણાંક વચ્ચેનો સંબંધ.સૂત્રો (11.1) (વિષય 11) અને (12.5) ની સરખામણી કરતા, આપણે જોઈએ છીએ: તેમના અંશ સમાન મૂલ્ય ધરાવે છે, જે આ સૂચકો વચ્ચે જોડાણ સૂચવે છે. આ સંબંધ સમાનતા દ્વારા વ્યક્ત થાય છે

આમ, સહસંબંધ ગુણાંક ગુણાંકના ભૌમિતિક સરેરાશ સમાન છે b yxઅને b xy. ફોર્મ્યુલા (6) પરવાનગી આપે છે, પ્રથમ, રીગ્રેસન ગુણાંકના જાણીતા મૂલ્યોના આધારે b yxઅને b xyરીગ્રેસન ગુણાંક નક્કી કરો આર xy, અને બીજું, આ સહસંબંધ સૂચકની ગણતરીની શુદ્ધતા તપાસો આર xyવિવિધ લાક્ષણિકતાઓ વચ્ચે એક્સઅને વાય.

સહસંબંધ ગુણાંકની જેમ, રીગ્રેસન ગુણાંક માત્ર એક રેખીય સંબંધને દર્શાવે છે અને તેની સાથે સકારાત્મક સંબંધ માટે વત્તા ચિહ્ન અને નકારાત્મક સંબંધ માટે માઈનસ ચિહ્ન હોય છે.

રેખીય રીગ્રેસન પરિમાણોનું નિર્ધારણ.તે જાણીતું છે કે ચોરસ વિચલનોનો સરવાળો એક પ્રકાર છે x iસરેરાશથી સૌથી નાનું મૂલ્ય છે, એટલે કે આ પ્રમેય ઓછામાં ઓછા ચોરસ પદ્ધતિનો આધાર બનાવે છે. રેખીય રીગ્રેસન વિશે [જુઓ સૂત્ર (1)] આ પ્રમેયની જરૂરિયાત સમીકરણોની ચોક્કસ સિસ્ટમ દ્વારા સંતોષાય છે જેને કહેવાય છે સામાન્ય:

પરિમાણોના સંદર્ભમાં આ સમીકરણોનો સંયુક્ત ઉકેલ aઅને bનીચેના પરિણામો તરફ દોરી જાય છે:

;

;

, ક્યાંથી અને.

ચલો વચ્ચેના સંબંધની બે-માર્ગી પ્રકૃતિને ધ્યાનમાં લેતા વાયઅને એક્સ, પરિમાણ નક્કી કરવા માટેનું સૂત્ર આ રીતે વ્યક્ત થવું જોઈએ:

અને . (7)

પરિમાણ b, અથવા રીગ્રેસન ગુણાંક, નીચેના સૂત્રો દ્વારા નક્કી કરવામાં આવે છે:

પ્રયોગમૂલક રીગ્રેસન શ્રેણીનું નિર્માણ.જો ત્યાં મોટી સંખ્યામાં અવલોકનો હોય, તો રીગ્રેશન વિશ્લેષણ પ્રયોગમૂલક રીગ્રેસન શ્રેણીના નિર્માણ સાથે શરૂ થાય છે. પ્રયોગમૂલક રીગ્રેસન શ્રેણીએક અલગ-અલગ લાક્ષણિકતાના મૂલ્યોમાંથી ગણતરી કરીને રચાય છે એક્સબીજાના સરેરાશ મૂલ્યો, સાથે સહસંબંધિત એક્સચિહ્ન વાય. બીજા શબ્દોમાં કહીએ તો, પ્રયોગમૂલક રીગ્રેસન શ્રેણીનું નિર્માણ Y અને X લાક્ષણિકતાઓના અનુરૂપ મૂલ્યોમાંથી જૂથ સરેરાશ શોધવા માટે નીચે આવે છે.

પ્રયોગમૂલક રીગ્રેસન શ્રેણી એ સંખ્યાઓની બેવડી શ્રેણી છે જે પ્લેન પરના બિંદુઓ દ્વારા રજૂ કરી શકાય છે, અને પછી, આ બિંદુઓને સીધી રેખાના ભાગો સાથે જોડીને, પ્રયોગમૂલક રીગ્રેસન રેખા મેળવી શકાય છે. પ્રયોગમૂલક રીગ્રેસન શ્રેણી, ખાસ કરીને તેમના આલેખ કહેવાય છે રીગ્રેસન રેખાઓ, વિવિધ લાક્ષણિકતાઓ વચ્ચેના સહસંબંધના સ્વરૂપ અને નિકટતાનો સ્પષ્ટ ખ્યાલ આપો.

પ્રયોગમૂલક રીગ્રેસન શ્રેણીનું સંરેખણ.પ્રયોગમૂલક રીગ્રેસન શ્રેણીના ગ્રાફ, એક નિયમ તરીકે, સરળ નહીં, પરંતુ તૂટેલી રેખાઓ બહાર આવે છે. આ હકીકત દ્વારા સમજાવવામાં આવે છે કે, મુખ્ય કારણો સાથે જે સહસંબંધિત લાક્ષણિકતાઓની પરિવર્તનશીલતામાં સામાન્ય પેટર્ન નક્કી કરે છે, તેમની તીવ્રતા અસંખ્ય ગૌણ કારણોના પ્રભાવથી પ્રભાવિત થાય છે જે રીગ્રેશનના નોડલ બિંદુઓમાં રેન્ડમ વધઘટનું કારણ બને છે. સહસંબંધિત લાક્ષણિકતાઓના જોડાણની વિવિધતાના મુખ્ય વલણ (વૃત્તિ) ને ઓળખવા માટે, તૂટેલી રેખાઓને સરળ, સરળ રીતે ચાલતી રીગ્રેસન રેખાઓ સાથે બદલવી જરૂરી છે. તૂટેલી રેખાઓને સરળ સાથે બદલવાની પ્રક્રિયા કહેવામાં આવે છે પ્રયોગમૂલક શ્રેણીનું સંરેખણઅને રીગ્રેસન રેખાઓ.

ગ્રાફિકલ સંરેખણ પદ્ધતિ.આ સૌથી સરળ પદ્ધતિ છે અને તેમાં કોઈ ગણતરીત્મક કાર્યની જરૂર નથી. તેનો સાર નીચે મુજબ ઉકળે છે. પ્રયોગમૂલક રીગ્રેસન શ્રેણીને લંબચોરસ સંકલન પ્રણાલીમાં ગ્રાફ તરીકે દર્શાવવામાં આવી છે. પછી રીગ્રેશનના મધ્યબિંદુઓ દૃષ્ટિની રીતે દર્શાવેલ છે, જેની સાથે શાસક અથવા પેટર્નનો ઉપયોગ કરીને નક્કર રેખા દોરવામાં આવે છે. આ પદ્ધતિનો ગેરલાભ સ્પષ્ટ છે: તે પ્રયોગમૂલક રીગ્રેસન રેખાઓના સંરેખણના પરિણામો પર સંશોધકના વ્યક્તિગત ગુણધર્મોના પ્રભાવને બાકાત રાખતું નથી. તેથી, એવા કિસ્સાઓમાં જ્યાં તૂટેલી રીગ્રેસન રેખાઓને સરળ સાથે બદલતી વખતે ઉચ્ચ ચોકસાઈની જરૂર હોય, પ્રયોગમૂલક શ્રેણીને સંરેખિત કરવાની અન્ય પદ્ધતિઓનો ઉપયોગ કરવામાં આવે છે.

મૂવિંગ એવરેજ પદ્ધતિ.આ પદ્ધતિનો સાર પ્રયોગમૂલક શ્રેણીના બે અથવા ત્રણ સંલગ્ન શબ્દોમાંથી અંકગણિત સરેરાશની અનુક્રમિક ગણતરીમાં આવે છે. આ પદ્ધતિ ખાસ કરીને એવા કિસ્સાઓમાં અનુકૂળ છે કે જ્યાં પ્રયોગમૂલક શ્રેણીને મોટી સંખ્યામાં શબ્દો દ્વારા રજૂ કરવામાં આવે છે, જેથી તેમાંથી બેનું નુકસાન - આત્યંતિક, જે આ ગોઠવણીની પદ્ધતિ સાથે અનિવાર્ય છે, તેની રચનાને નોંધપાત્ર રીતે અસર કરશે નહીં.

ઓછામાં ઓછા ચોરસ પદ્ધતિ.આ પદ્ધતિ 19મી સદીની શરૂઆતમાં એ.એમ. દ્વારા પ્રસ્તાવિત કરવામાં આવી હતી. દંતકથા અને, તેમનાથી સ્વતંત્ર રીતે, કે. ગૌસ. તે તમને પ્રયોગમૂલક શ્રેણીને સૌથી સચોટ રીતે સંરેખિત કરવાની મંજૂરી આપે છે. આ પદ્ધતિ, ઉપર બતાવ્યા પ્રમાણે, એ ધારણા પર આધારિત છે કે વર્ગ વિચલનોનો સરવાળો એક વિકલ્પ છે. x i તેમની સરેરાશથી ત્યાં લઘુત્તમ મૂલ્ય છે, એટલે કે પદ્ધતિનું નામ, જેનો ઉપયોગ માત્ર ઇકોલોજીમાં જ નહીં, પણ ટેકનોલોજીમાં પણ થાય છે. ન્યૂનતમ ચોરસ પદ્ધતિ ઉદ્દેશ્ય અને સાર્વત્રિક છે; રીગ્રેસન શ્રેણી માટે પ્રયોગમૂલક સમીકરણો શોધવા અને તેમના પરિમાણો નક્કી કરતી વખતે તેનો ઉપયોગ વિવિધ કેસોમાં થાય છે.

ઓછામાં ઓછા ચોરસ પદ્ધતિની આવશ્યકતા એ છે કે રીગ્રેસન લાઇનના સૈદ્ધાંતિક બિંદુઓ એવી રીતે મેળવવામાં આવે છે કે પ્રયોગમૂલક અવલોકનો માટે આ બિંદુઓમાંથી ચોરસ વિચલનોનો સરવાળો y iન્યૂનતમ હતું, એટલે કે

ગાણિતિક વિશ્લેષણના સિદ્ધાંતો અનુસાર આ અભિવ્યક્તિની ન્યૂનતમ ગણતરી કરીને અને તેને ચોક્કસ રીતે રૂપાંતરિત કરીને, વ્યક્તિ કહેવાતી સિસ્ટમ મેળવી શકે છે. સામાન્ય સમીકરણો, જેમાં અજ્ઞાત મૂલ્યો રીગ્રેસન સમીકરણના જરૂરી પરિમાણો છે, અને જાણીતા ગુણાંક લાક્ષણિકતાઓના પ્રયોગમૂલક મૂલ્યો દ્વારા નક્કી કરવામાં આવે છે, સામાન્ય રીતે તેમના મૂલ્યોના સરવાળો અને તેમના ક્રોસ ઉત્પાદનો.

બહુવિધ રેખીય રીગ્રેસન.કેટલાક ચલો વચ્ચેનો સંબંધ સામાન્ય રીતે બહુવિધ રીગ્રેશન સમીકરણ દ્વારા વ્યક્ત કરવામાં આવે છે, જે હોઈ શકે છે રેખીયઅને બિનરેખીય. તેના સરળ સ્વરૂપમાં, બહુવિધ રીગ્રેસનને બે સ્વતંત્ર ચલો સાથે સમીકરણ તરીકે દર્શાવવામાં આવે છે ( x, z):

જ્યાં a- સમીકરણનો મફત શબ્દ; bઅને c- સમીકરણના પરિમાણો. સમીકરણ (10) (ઓછામાં ઓછા ચોરસ પદ્ધતિનો ઉપયોગ કરીને) ના પરિમાણો શોધવા માટે, સામાન્ય સમીકરણોની નીચેની સિસ્ટમનો ઉપયોગ કરવામાં આવે છે:

ગતિશીલ શ્રેણી. પંક્તિઓનું સંરેખણ.સમય જતાં લાક્ષણિકતાઓમાં ફેરફાર કહેવાતા રચના કરે છે સમય શ્રેણીઅથવા ડાયનેમિક્સ શ્રેણી. આવી શ્રેણીની લાક્ષણિકતા એ છે કે અહીં સ્વતંત્ર ચલ X હંમેશા સમયનું પરિબળ છે અને આશ્રિત ચલ Y એ બદલાતી વિશેષતા છે. રીગ્રેસન શ્રેણીના આધારે, X અને Y ચલો વચ્ચેનો સંબંધ એકતરફી છે, કારણ કે સમય પરિબળ લાક્ષણિકતાઓની પરિવર્તનશીલતા પર આધારિત નથી. આ લક્ષણો હોવા છતાં, ડાયનેમિક્સ શ્રેણીને રીગ્રેસન શ્રેણી સાથે સરખાવી શકાય છે અને સમાન પદ્ધતિઓનો ઉપયોગ કરીને પ્રક્રિયા કરી શકાય છે.

રીગ્રેસન શ્રેણીની જેમ, ગતિશાસ્ત્રની પ્રયોગમૂલક શ્રેણી માત્ર મુખ્ય જ નહીં, પરંતુ અસંખ્ય ગૌણ (રેન્ડમ) પરિબળોનો પ્રભાવ પણ ધરાવે છે જે લાક્ષણિકતાઓની પરિવર્તનશીલતામાં મુખ્ય વલણને અસ્પષ્ટ કરે છે, જેને આંકડાઓની ભાષામાં કહેવામાં આવે છે. વલણ.

સમય શ્રેણીનું વિશ્લેષણ વલણના આકારને ઓળખવા સાથે શરૂ થાય છે. આ કરવા માટે, સમય શ્રેણીને લંબચોરસ સંકલન પ્રણાલીમાં રેખા ગ્રાફ તરીકે દર્શાવવામાં આવે છે. આ કિસ્સામાં, સમય બિંદુઓ (વર્ષો, મહિનાઓ અને સમયના અન્ય એકમો) એબ્સીસા અક્ષ સાથે રચવામાં આવે છે, અને આશ્રિત ચલ Y ના મૂલ્યો ઓર્ડિનેટ અક્ષ સાથે રચવામાં આવે છે જો ત્યાં ચલ X વચ્ચે રેખીય સંબંધ હોય અને Y (રેખીય વલણ), સમય શ્રેણીને સંરેખિત કરવા માટે ઓછામાં ઓછી ચોરસ પદ્ધતિ સૌથી યોગ્ય છે એ સ્વતંત્ર શ્રેણીના અંકગણિત સરેરાશમાંથી નિર્ભર ચલ Y ની શ્રેણીની શરતોના વિચલનોના સ્વરૂપમાં રીગ્રેસન સમીકરણ છે. ચલ X:

અહીં રેખીય રીગ્રેસન પરિમાણ છે.

ડાયનેમિક્સ શ્રેણીની સંખ્યાત્મક લાક્ષણિકતાઓ.ડાયનેમિક્સ શ્રેણીની મુખ્ય સામાન્યીકરણ સંખ્યાત્મક લાક્ષણિકતાઓમાં સમાવેશ થાય છે ભૌમિતિક સરેરાશઅને અંકગણિતનો અર્થ તેની નજીક છે. તેઓ સરેરાશ દરને દર્શાવે છે કે જેના પર નિર્ભર ચલનું મૂલ્ય ચોક્કસ સમયગાળા દરમિયાન બદલાય છે:

ડાયનેમિક્સ શ્રેણીના સભ્યોની પરિવર્તનશીલતાનું મૂલ્યાંકન છે પ્રમાણભૂત વિચલન. સમય શ્રેણીનું વર્ણન કરવા માટે રીગ્રેશન સમીકરણો પસંદ કરતી વખતે, વલણના આકારને ધ્યાનમાં લેવામાં આવે છે, જે રેખીય (અથવા રેખીય સુધી ઘટાડીને) અને બિનરેખીય હોઈ શકે છે. રીગ્રેસન સમીકરણની પસંદગીની શુદ્ધતા સામાન્ય રીતે આશ્રિત ચલના અનુભવપૂર્વક અવલોકન કરેલ અને ગણતરી કરેલ મૂલ્યોની સમાનતા દ્વારા નક્કી કરવામાં આવે છે. આ સમસ્યાનો વધુ સચોટ ઉકેલ એ વિચલન પદ્ધતિનું રીગ્રેસન વિશ્લેષણ છે (વિષય 12, ફકરો 4).

સમય શ્રેણીનો સહસંબંધ.ચોક્કસ સામાન્ય પરિસ્થિતિઓ દ્વારા એકબીજા સાથે સંબંધિત સમાંતર સમય શ્રેણીની ગતિશીલતાની તુલના કરવી ઘણીવાર જરૂરી છે, ઉદાહરણ તરીકે, ચોક્કસ સમયગાળા દરમિયાન કૃષિ ઉત્પાદન અને પશુધનની સંખ્યાની વૃદ્ધિ વચ્ચેનો સંબંધ શોધવા માટે. આવા કિસ્સાઓમાં, X અને Y ચલ વચ્ચેના સંબંધની લાક્ષણિકતા છે સહસંબંધ ગુણાંક R xy (રેખીય વલણની હાજરીમાં).

તે જાણીતું છે કે સમય શ્રેણીનું વલણ, એક નિયમ તરીકે, આશ્રિત ચલ Y ની શ્રેણીની શરતોમાં વધઘટ દ્વારા અસ્પષ્ટ છે. આ બે ગણી સમસ્યાને જન્મ આપે છે: વલણને બાકાત રાખ્યા વિના, તુલનાત્મક શ્રેણી વચ્ચેની અવલંબનને માપવા, અને વલણને બાદ કરતાં, સમાન શ્રેણીના પડોશી સભ્યો વચ્ચેની અવલંબનનું માપન. પ્રથમ કિસ્સામાં, તુલનાત્મક સમય શ્રેણી વચ્ચેના જોડાણની નિકટતાનું સૂચક છે સહસંબંધ ગુણાંક(જો સંબંધ રેખીય હોય), બીજામાં - સ્વતઃસંબંધ ગુણાંક. આ સૂચકોના જુદા જુદા અર્થો છે, જો કે તે સમાન સૂત્રોનો ઉપયોગ કરીને ગણવામાં આવે છે (વિષય 11 જુઓ).

તે જોવાનું સરળ છે કે સ્વતઃસંબંધ ગુણાંકનું મૂલ્ય નિર્ભર ચલના શ્રેણીના સભ્યોની પરિવર્તનશીલતા દ્વારા પ્રભાવિત થાય છે: શ્રેણીના સભ્યો ઓછા વલણથી વિચલિત થાય છે, સ્વતઃસંબંધ ગુણાંક વધારે છે અને ઊલટું.

અભ્યાસ કરવામાં આવતી બે લાક્ષણિકતાઓ વચ્ચેના રેખીય પ્રકારના સંબંધ સાથે, સહસંબંધોની ગણતરી કરવા ઉપરાંત, રીગ્રેસન ગુણાંકની ગણતરીનો ઉપયોગ થાય છે.

રેખીય સહસંબંધના કિસ્સામાં, એક લાક્ષણિકતામાં દરેક ફેરફાર અન્ય લાક્ષણિકતામાં ખૂબ ચોક્કસ ફેરફારને અનુરૂપ છે. જો કે, સહસંબંધ ગુણાંક આ સંબંધને માત્ર સંબંધિત જથ્થામાં દર્શાવે છે - એકતાના અપૂર્ણાંકમાં. રીગ્રેસન વિશ્લેષણની મદદથી, આ સંબંધ મૂલ્ય નામિત એકમોમાં મેળવવામાં આવે છે. માપના એકમ દ્વારા જ્યારે બીજી લાક્ષણિકતા બદલાય ત્યારે સરેરાશ પ્રથમ લાક્ષણિકતા બદલાય તે રકમને રીગ્રેસન ગુણાંક કહેવામાં આવે છે.

સહસંબંધ રીગ્રેશન વિશ્લેષણથી વિપરીત, તે વ્યાપક માહિતી પ્રદાન કરે છે, કારણ કે બે રીગ્રેસન ગુણાંકની ગણતરી કરીને Rx/yઅને Rу/хબીજા પર પ્રથમ સંકેતની અવલંબન, અને પ્રથમ પર બીજાની નિર્ભરતા બંને નક્કી કરવાનું શક્ય છે. સમીકરણનો ઉપયોગ કરીને રીગ્રેસન સંબંધ વ્યક્ત કરવાથી એક લાક્ષણિકતાના ચોક્કસ મૂલ્યના આધારે અન્ય લાક્ષણિકતાનું મૂલ્ય નક્કી કરવામાં મદદ મળે છે.

રીગ્રેસન ગુણાંક R એ સહસંબંધ ગુણાંક અને દરેક લાક્ષણિકતા માટે ગણતરી કરેલ ચોરસ વિચલનોના ગુણોત્તરનું ઉત્પાદન છે. તે સૂત્ર અનુસાર ગણવામાં આવે છે

જ્યાં, આર - રીગ્રેસન ગુણાંક; એસએચ એ પ્રથમ લાક્ષણિકતાનું પ્રમાણભૂત વિચલન છે, જે બીજામાં ફેરફારને કારણે બદલાય છે; SУ - ફેરફાર સાથે જોડાણમાં બીજી લાક્ષણિકતાનું પ્રમાણભૂત વિચલન જેમાં પ્રથમ લાક્ષણિકતા બદલાય છે; r એ આ લાક્ષણિકતાઓ વચ્ચેનો સહસંબંધ ગુણાંક છે; x - કાર્ય; y એક દલીલ છે.

આ સૂત્ર x ની કિંમત નક્કી કરે છે જ્યારે y માપનના એકમ દ્વારા બદલાય છે. જો વિપરીત ગણતરી જરૂરી હોય, તો તમે સૂત્રનો ઉપયોગ કરીને માપના એકમ દ્વારા x બદલાય ત્યારે y ની કિંમત શોધી શકો છો:


આ કિસ્સામાં, અગાઉના સૂત્રની તુલનામાં અન્ય ફેરફારોના સંબંધમાં એક લાક્ષણિકતાને બદલવામાં સક્રિય ભૂમિકા, દલીલ કાર્ય બની જાય છે અને ઊલટું. SX અને SY ની કિંમતો નામવાળી અભિવ્યક્તિમાં લેવામાં આવે છે.

r અને R ના મૂલ્યો વચ્ચે સ્પષ્ટ સંબંધ છે, જે એ હકીકતમાં વ્યક્ત થાય છે કે x પર y ના રીગ્રેસન દ્વારા y પર x ના રીગ્રેસનનું ઉત્પાદન સહસંબંધ ગુણાંકના વર્ગની બરાબર છે, એટલે કે.

Rx/y * Ry/x = r2

આ સૂચવે છે કે સહસંબંધ ગુણાંક આપેલ નમૂનાના રીગ્રેસન ગુણાંકના બંને મૂલ્યોના ભૌમિતિક સરેરાશને રજૂ કરે છે. આ સૂત્રનો ઉપયોગ ગણતરીઓની ચોકસાઈ ચકાસવા માટે થઈ શકે છે.

ગણતરી મશીનો પર ડિજિટલ સામગ્રીની પ્રક્રિયા કરતી વખતે, વિગતવાર રીગ્રેસન ગુણાંક સૂત્રોનો ઉપયોગ કરી શકાય છે:

આર અથવા


રીગ્રેસન ગુણાંક માટે, તેની પ્રતિનિધિત્વ ભૂલની ગણતરી કરી શકાય છે. રીગ્રેસન ગુણાંકની ભૂલ ચતુર્ભુજ ગુણોત્તરના ગુણોત્તર દ્વારા ગુણાકાર કરેલ સહસંબંધ ગુણાંકની ભૂલ જેટલી છે:

રીગ્રેસન ગુણાંક વિશ્વસનીયતા માપદંડની ગણતરી સામાન્ય સૂત્રનો ઉપયોગ કરીને કરવામાં આવે છે:

પરિણામે, તે સહસંબંધ ગુણાંકના વિશ્વસનીયતા માપદંડની સમાન છે:

ટીઆર મૂલ્યની વિશ્વસનીયતા  = n - 2 પર વિદ્યાર્થીના કોષ્ટકનો ઉપયોગ કરીને સ્થાપિત થાય છે, જ્યાં n એ અવલોકનોની જોડીની સંખ્યા છે.

વક્રીકૃત રીગ્રેશન.

રીગ્રેશન, કર્વિલિનિયર. કોઈપણ બિનરેખીય રીગ્રેસન જેમાં એક ચલ (y) માં બદલાવ માટેનું રીગ્રેસન સમીકરણ બીજા (x) માં t ફેરફારના કાર્ય તરીકે ચતુર્ભુજ, ઘન અથવા ઉચ્ચ ક્રમનું સમીકરણ છે. જો કે વળાંકના દરેક સ્ક્વીગલને બંધબેસતા રીગ્રેસન સમીકરણ મેળવવું હંમેશા ગાણિતિક રીતે શક્ય છે, આમાંના મોટા ભાગના વિક્ષેપો નમૂના અથવા માપન ભૂલોને કારણે પરિણમે છે, અને આવા "સંપૂર્ણ" ફિટ કંઈપણ પ્રાપ્ત કરી શકતા નથી. વક્રીકૃત રીગ્રેસન ડેટા સેટને બંધબેસે છે કે કેમ તે નિર્ધારિત કરવું હંમેશા સરળ નથી, જો કે સમીકરણની દરેક ઉચ્ચ શક્તિ તે ડેટા સેટની ફિટની ડિગ્રીને નોંધપાત્ર રીતે વધારે છે કે કેમ તે નિર્ધારિત કરવા માટે આંકડાકીય પરીક્ષણો છે.

વળાંક ફિટિંગ સીધી રેખા ફિટિંગની જેમ ઓછામાં ઓછા ચોરસમાં કરવામાં આવે છે. રીગ્રેસન રેખાએ સહસંબંધ ક્ષેત્રના પ્રત્યેક બિંદુના લઘુતમ સરવાળા વર્ગ અંતરની સ્થિતિને સંતોષવી જોઈએ. આ કિસ્સામાં, સમીકરણ (1) માં, y એ x j ના વાસ્તવિક મૂલ્યોના આધારે પસંદ કરેલ વક્ર સંબંધના સમીકરણનો ઉપયોગ કરીને નિર્ધારિત કાર્યના ગણતરી કરેલ મૂલ્યનું પ્રતિનિધિત્વ કરે છે. ઉદાહરણ તરીકે, જો અનુમાનિત જોડાણ માટે સેકન્ડ-ઓર્ડર પેરાબોલાને પસંદ કરવામાં આવે, તો y = a + b x + cx2, (14). દલીલ સમીકરણ (3) yj = yj (a + bx + cx2) સ્વરૂપમાં સમાન રીતે લખી શકાય છે (15) આ કિસ્સામાં, આ કિસ્સામાં, કેસમાં નવી રીગ્રેસન રેખાના સહસંબંધ ક્ષેત્રના દરેક બિંદુથી વર્ગીય અંતરનો સરવાળો બીજા ક્રમના પેરાબોલાના સ્વરૂપમાં હશે: S 2 = yj 2 = 2 (16) આ રકમની ન્યૂનતમ સ્થિતિના આધારે, a, b અને cના સંદર્ભમાં S 2 ના આંશિક વ્યુત્પન્ન શૂન્ય સમાન છે. જરૂરી પરિવર્તનો કર્યા પછી, અમે a, b અને c નક્કી કરવા માટે ત્રણ અજાણ્યાઓ સાથે ત્રણ સમીકરણોની સિસ્ટમ મેળવીએ છીએ. , y = m a + b x + c x 2 yx = a x + b x 2 + c x 2. yx2 = a x 2 + b x 3 + c x4. (17). a, b અને c માટે સમીકરણોની સિસ્ટમને હલ કરીને, આપણે રીગ્રેસન ગુણાંકના સંખ્યાત્મક મૂલ્યો શોધીએ છીએ. y, x, x2, yx, yx2, x3, x4 ના મૂલ્યો ઉત્પાદન માપન ડેટામાંથી સીધા જ જોવા મળે છે. વક્રીય અવલંબન માટે જોડાણની નિકટતાનું મૂલ્યાંકન એ સૈદ્ધાંતિક સહસંબંધ ગુણોત્તર xy છે, જે બે વિક્ષેપોના ગુણોત્તરનું વર્ગમૂળ છે: કાર્યના ગણતરી કરેલ મૂલ્યો y" j ના વિચલનોનો સરેરાશ ચોરસ p2 અંકગણિત સરેરાશ મૂલ્ય Y માંથી મૂલ્ય y ની સરેરાશ ચોરસ વિચલનો y2 થી ફંક્શન y j ના વાસ્તવિક મૂલ્યોના તેના અંકગણિત સરેરાશ મૂલ્યમાંથી મળેલ રીગ્રેશન સમીકરણ અનુસાર: xу = ( р2 / y2 ) 1/2 = ( (y" j - Y)2 / (y j - Y)2 ) 1/2 (18) સહસંબંધ ગુણોત્તર xy2 નો વર્ગ દલીલ x ની પરિવર્તનશીલતાને કારણે આશ્રિત ચલ y ની કુલ પરિવર્તનશીલતાનો હિસ્સો દર્શાવે છે. . આ સૂચકને નિર્ધારણનો ગુણાંક કહેવામાં આવે છે. સહસંબંધ ગુણાંકથી વિપરીત, સહસંબંધ ગુણોત્તરનું મૂલ્ય માત્ર 0 થી 1 સુધીના હકારાત્મક મૂલ્યો લઈ શકે છે. જોડાણની સંપૂર્ણ ગેરહાજરીમાં, સહસંબંધ ગુણોત્તર શૂન્યની બરાબર છે, કાર્યાત્મક જોડાણની હાજરીમાં તે એકની બરાબર, અને વિવિધ નિકટતાના રીગ્રેસન કનેક્શનની હાજરીમાં, સહસંબંધ ગુણોત્તર શૂન્ય અને એક વચ્ચેના મૂલ્યો લે છે. વળાંકના પ્રકારની પસંદગી રીગ્રેસન વિશ્લેષણમાં ખૂબ મહત્વ ધરાવે છે, કારણ કે સંબંધની નજીકના અંદાજ અને આંકડાકીય અંદાજોની ચોકસાઈ પસંદ કરેલ સંબંધના પ્રકાર પર આધારિત છે. વળાંકના પ્રકારને પસંદ કરવા માટેની સૌથી સરળ પદ્ધતિ એ છે કે સહસંબંધ ક્ષેત્રોનું નિર્માણ કરવું અને આ ક્ષેત્રો પરના બિંદુઓના સ્થાનના આધારે યોગ્ય પ્રકારના રીગ્રેસન સમીકરણો પસંદ કરવા. રીગ્રેસન વિશ્લેષણ પદ્ધતિઓ પરિમાણો વચ્ચેના જટિલ પ્રકારના સંબંધો માટે રીગ્રેસન ગુણાંકના આંકડાકીય મૂલ્યો શોધવાનું શક્ય બનાવે છે, ઉદાહરણ તરીકે, ઉચ્ચ ડિગ્રીના બહુપદી દ્વારા વર્ણવેલ. ઘણીવાર વળાંકનો આકાર પ્રક્રિયાની ભૌતિક પ્રકૃતિ અથવા વિચારણા હેઠળની ઘટનાના આધારે નક્કી કરી શકાય છે. જો આ પ્રક્રિયાઓના પરિમાણોની વધઘટની મર્યાદા નોંધપાત્ર હોય તો ઝડપથી બદલાતી પ્રક્રિયાઓનું વર્ણન કરવા માટે ઉચ્ચ ડિગ્રીના બહુપદીનો ઉપયોગ કરવો તે અર્થપૂર્ણ છે. ધાતુશાસ્ત્રની પ્રક્રિયાના અભ્યાસના સંબંધમાં, તે નીચલા-ક્રમના વળાંકોનો ઉપયોગ કરવા માટે પૂરતો છે, ઉદાહરણ તરીકે, બીજા ક્રમના પેરાબોલા. આ વળાંકમાં એક છેડો હોઈ શકે છે, જે પ્રેક્ટિસ બતાવે છે તેમ, ધાતુશાસ્ત્રની પ્રક્રિયાની વિવિધ લાક્ષણિકતાઓનું વર્ણન કરવા માટે પૂરતું છે. જોડી કરેલ સહસંબંધ સંબંધના પરિમાણોની ગણતરીના પરિણામો વિશ્વસનીય હશે અને વ્યવહારુ મૂલ્ય હશે જો વપરાયેલી માહિતી દલીલની વધઘટની વિશાળ મર્યાદાની શરતો માટે મેળવવામાં આવી હોય અને અન્ય તમામ પ્રક્રિયા પરિમાણો સ્થિર હોય. પરિણામે, પરિમાણના જોડીવાર સહસંબંધનો અભ્યાસ કરવા માટેની પદ્ધતિઓનો ઉપયોગ વ્યવહારિક સમસ્યાઓના ઉકેલ માટે ત્યારે જ થઈ શકે છે જ્યારે વિશ્લેષિત દલીલ સિવાયના કાર્ય પર અન્ય ગંભીર પ્રભાવોની ગેરહાજરીમાં વિશ્વાસ હોય. ઉત્પાદનની શરતો હેઠળ, લાંબા સમય સુધી આ રીતે પ્રક્રિયા હાથ ધરવી અશક્ય છે. જો કે, જો અમારી પાસે પ્રક્રિયાના મુખ્ય પરિમાણો વિશે માહિતી હોય કે જે તેના પરિણામોને પ્રભાવિત કરે છે, તો પછી ગાણિતિક રીતે આપણે આ પરિમાણોના પ્રભાવને બાકાત રાખી શકીએ છીએ અને કાર્ય અને દલીલ વચ્ચેના સંબંધને "શુદ્ધ સ્વરૂપ" માં અલગ કરી શકીએ છીએ જે અમને રસ છે. આવા જોડાણને ખાનગી અથવા વ્યક્તિગત કહેવામાં આવે છે. તે નક્કી કરવા માટે, બહુવિધ રીગ્રેસન પદ્ધતિનો ઉપયોગ થાય છે.

સહસંબંધ સંબંધ.

સહસંબંધ ગુણોત્તર અને સહસંબંધ અનુક્રમણિકા એ સંખ્યાત્મક લાક્ષણિકતાઓ છે જે રેન્ડમ ચલની વિભાવના સાથે અથવા તેના બદલે રેન્ડમ ચલોની સિસ્ટમ સાથે નજીકથી સંબંધિત છે. તેથી, તેમના અર્થ અને ભૂમિકાને રજૂ કરવા અને વ્યાખ્યાયિત કરવા માટે, રેન્ડમ ચલોની સિસ્ટમ અને તેમાં રહેલા કેટલાક ગુણધર્મોની વિભાવના સમજાવવી જરૂરી છે.

બે અથવા વધુ રેન્ડમ ચલ જે ચોક્કસ ઘટનાનું વર્ણન કરે છે તેને સિસ્ટમ અથવા રેન્ડમ ચલોનું સંકુલ કહેવામાં આવે છે.

ઘણા રેન્ડમ ચલોની સિસ્ટમ X, Y, Z, …, W સામાન્ય રીતે (X, Y, Z, …, W) દ્વારા સૂચવવામાં આવે છે.

ઉદાહરણ તરીકે, પ્લેન પરના બિંદુને એક સંકલન દ્વારા નહીં, પરંતુ બે દ્વારા, અને અવકાશમાં - ત્રણ દ્વારા પણ વર્ણવવામાં આવે છે.

કેટલાક રેન્ડમ ચલોની સિસ્ટમના ગુણધર્મો સિસ્ટમમાં સમાવિષ્ટ વ્યક્તિગત રેન્ડમ ચલોના ગુણધર્મો સુધી મર્યાદિત નથી, પરંતુ તેમાં રેન્ડમ ચલો વચ્ચેના પરસ્પર જોડાણો (નિર્ભરતાઓ)નો પણ સમાવેશ થાય છે. તેથી, રેન્ડમ ચલોની સિસ્ટમનો અભ્યાસ કરતી વખતે, વ્યક્તિએ અવલંબનની પ્રકૃતિ અને ડિગ્રી પર ધ્યાન આપવું જોઈએ. આ અવલંબન વધુ કે ઓછું સ્પષ્ટ, વધુ કે ઓછું નજીક હોઈ શકે છે. અને અન્ય કિસ્સાઓમાં, રેન્ડમ ચલો વ્યવહારીક રીતે સ્વતંત્ર હોવાનું બહાર આવે છે.

રેન્ડમ ચલ Y એ રેન્ડમ ચલ X થી સ્વતંત્ર હોવાનું કહેવાય છે જો રેન્ડમ ચલ Y નો વિતરણ કાયદો X ના મૂલ્ય પર આધાર રાખતો નથી.

એ નોંધવું જોઈએ કે રેન્ડમ ચલોની અવલંબન અને સ્વતંત્રતા હંમેશા પરસ્પર ઘટના છે: જો Y X પર નિર્ભર નથી, તો X મૂલ્ય Y પર આધારિત નથી. આને ધ્યાનમાં લેતા, અમે સ્વતંત્રતાની નીચેની વ્યાખ્યા આપી શકીએ છીએ. રેન્ડમ ચલોની.

રેન્ડમ ચલ X અને Y ને સ્વતંત્ર કહેવામાં આવે છે જો તેમાંના દરેકના વિતરણનો કાયદો અન્ય શું મૂલ્ય લે છે તેના પર નિર્ભર ન હોય. નહિંતર, X અને Yની માત્રાને આશ્રિત કહેવામાં આવે છે.

રેન્ડમ ચલનો વિતરણ કાયદો એ કોઈપણ સંબંધ છે જે રેન્ડમ ચલના સંભવિત મૂલ્યો અને તેમની અનુરૂપ સંભાવનાઓ વચ્ચે જોડાણ સ્થાપિત કરે છે.

રેન્ડમ ચલોની "નિર્ભરતા" ની વિભાવના, જેનો ઉપયોગ સંભાવના સિદ્ધાંતમાં થાય છે, તે ચલોના "નિર્ભરતા" ના સામાન્ય ખ્યાલથી કંઈક અંશે અલગ છે, જેનો ઉપયોગ ગણિતમાં થાય છે. આમ, "નિર્ભરતા" દ્વારા ગણિતશાસ્ત્રીનો અર્થ માત્ર એક પ્રકારની અવલંબન છે - સંપૂર્ણ, કઠોર, કહેવાતા કાર્યાત્મક અવલંબન. બે જથ્થા X અને Y ને કાર્યાત્મક રીતે નિર્ભર કહેવામાં આવે છે જો, તેમાંથી એકનું મૂલ્ય જાણીને, તમે બીજાનું મૂલ્ય ચોક્કસ રીતે નક્કી કરી શકો.

સંભાવના સિદ્ધાંતમાં, આપણે થોડી અલગ પ્રકારની અવલંબનનો સામનો કરીએ છીએ - એક સંભવિત અવલંબન. જો મૂલ્ય Y એ સંભવિત અવલંબન દ્વારા મૂલ્ય X સાથે સંબંધિત છે, તો પછી, X નું મૂલ્ય જાણીને, Y નું મૂલ્ય ચોક્કસપણે સૂચવવું અશક્ય છે, પરંતુ તમે X નું મૂલ્ય શું છે તેના આધારે તમે તેના વિતરણ કાયદાને સૂચવી શકો છો. લીધેલ.

સંભવિત સંબંધ વધુ કે ઓછા ગાઢ હોઈ શકે છે; જેમ જેમ સંભવિત અવલંબનની નિકટતા વધે છે, તેમ તેમ તે કાર્યાત્મક એકની નજીક અને નજીક બને છે. આમ, કાર્યાત્મક અવલંબનને આત્યંતિક, નજીકના સંભવિત પરાધીનતાના મર્યાદિત કેસ તરીકે ગણી શકાય. અન્ય આત્યંતિક કેસ રેન્ડમ ચલોની સંપૂર્ણ સ્વતંત્રતા છે. આ બે આત્યંતિક કિસ્સાઓ વચ્ચે સંભવિત પરાધીનતાના તમામ ગ્રેડેશન આવેલા છે - સૌથી મજબૂતથી નબળા સુધી.

રેન્ડમ ચલો વચ્ચે સંભવિત અવલંબન ઘણીવાર વ્યવહારમાં જોવા મળે છે. જો રેન્ડમ ચલ X અને Y સંભવિત સંબંધમાં હોય, તો તેનો અર્થ એ નથી કે X ના મૂલ્યમાં ફેરફાર સાથે, Y નું મૂલ્ય ખૂબ જ ચોક્કસ રીતે બદલાય છે; આનો અર્થ એ થાય છે કે જેમ X નું મૂલ્ય બદલાય છે, Y નું મૂલ્ય પણ બદલાય છે (X વધે છે તેમ વધારો અથવા ઘટાડો). આ વલણ ફક્ત સામાન્ય શબ્દોમાં જ જોવા મળે છે, અને દરેક વ્યક્તિગત કેસમાં તેમાંથી વિચલનો શક્ય છે.



શું તમને લેખ ગમ્યો? તમારા મિત્રો સાથે શેર કરો!
પણ વાંચો