સહસંબંધ કોષ્ટકનો ઉપયોગ કરીને સીધી રેખાના નમૂનાનું સમીકરણ. લીનિયર રીગ્રેશન બેઝિક્સ

લેબોરેટરી વર્ક નંબર 4

નમૂનાના સહસંબંધ ગુણાંકની ગણતરી અને પ્રયોગમૂલક અને સૈદ્ધાંતિક રીગ્રેશન લાઇનનું નિર્માણ

કાર્યનો હેતુ : રેખીય સહસંબંધ સાથે પરિચિતતા; સૈદ્ધાંતિક રીગ્રેસન રેખાઓના સહસંબંધ ગુણાંક અને સંકલન સમીકરણોની ગણતરી અને નમૂના લેવાની ક્ષમતા વિકસાવવી.

કાર્યની સામગ્રી : પ્રાયોગિક ડેટાના આધારે, નમૂનાના સહસંબંધ ગુણાંકની ગણતરી કરો, વિશ્વસનીયતા સાથે તેના માટે વિશ્વાસ અંતરાલ બનાવો, પ્રાપ્ત પરિણામનું અર્થપૂર્ણ વર્ણન આપો, પ્રયોગમૂલક અને સૈદ્ધાંતિક રીગ્રેસન રેખાઓ બનાવો પર
ઉપરોક્ત પૂર્વનિર્ધારણ પદ્ધતિ અનુસાર.

સહસંબંધ પદ્ધતિ

ગાણિતિક આંકડાઓમાં સહસંબંધ પદ્ધતિનો ઉપયોગ કરીને, ઘટનાઓ વચ્ચેનો સંબંધ નક્કી કરવામાં આવે છે. આ સંબંધનો અભ્યાસ કરવાની વિશિષ્ટતા એ છે કે બાહ્ય પરિબળોના પ્રભાવને અલગ પાડવું અશક્ય છે. તેથી, પરિબળના બાહ્ય પ્રભાવોની જટિલ ક્રિયાપ્રતિક્રિયાના કિસ્સામાં, જો બાહ્ય પરિબળો બદલાયા ન હોય તો લાક્ષણિકતાઓ વચ્ચેનો સંબંધ શું હશે તે નક્કી કરવા માટે સહસંબંધ પદ્ધતિનો ઉપયોગ કરવામાં આવે છે, એટલે કે, પ્રયોગની શરતો પર્યાપ્ત હતી. .

સહસંબંધ સિદ્ધાંત બે સમસ્યાઓને ધ્યાનમાં લે છે:

1) તપાસેલ લાક્ષણિકતાઓ વચ્ચેના સહસંબંધ પરિમાણનું નિર્ધારણ;

2) આ જોડાણની નિકટતા નક્કી કરવી. લાક્ષણિકતાઓ વચ્ચેના સંબંધની પ્રકૃતિ પર
અને કોઓર્ડિનેટ સિસ્ટમ (સહસંબંધ ક્ષેત્ર) માં બિંદુઓના સ્થાન દ્વારા નક્કી કરી શકાય છે. જો આ બિંદુઓ સીધી રેખાની નજીક સ્થિત છે, તો એવું માનવામાં આવે છે કે શરતી સરેરાશ વચ્ચે અને
એક રેખીય સંબંધ છે. સમીકરણ
પર
.

સમીકરણ
રીગ્રેશન લાઇન સમીકરણ કહેવાય છે
પર . જો બંને રીગ્રેસન રેખાઓ સીધી હોય, તો રેખીય સહસંબંધ છે.

રીગ્રેસન લાઇન સમીકરણો

અને
સહસંબંધ કોષ્ટકમાં આપેલા નમૂનાના ડેટાના આધારે સંકલિત કરવામાં આવે છે.

- અનુરૂપ લાક્ષણિકતાઓના સરેરાશ મૂલ્યો;

- રીગ્રેસન ગુણાંક પર
અને
પર - સૂત્રોનો ઉપયોગ કરીને ગણતરી

જ્યાં
- ઉત્પાદનનું સરેરાશ મૂલ્ય
પર ;

અને
- લક્ષણ ભિન્નતા
અને .

સીધી-રેખા સહસંબંધમાં, લાક્ષણિકતાઓ વચ્ચેના સંબંધની નિકટતા નમૂનાના સહસંબંધ ગુણાંક દ્વારા દર્શાવવામાં આવે છે. , જે “-1” થી “+1” સુધીના મૂલ્યો લે છે.

જો સહસંબંધ ગુણાંકનું મૂલ્ય નકારાત્મક હોય, તો આ અભ્યાસ કરવામાં આવી રહેલી લાક્ષણિકતાઓ વચ્ચેનો વ્યસ્ત રેખીય સંબંધ સૂચવે છે; જો તે સકારાત્મક છે - એક રેક્ટિલિનિયર કનેક્શન વિશે. જો સહસંબંધ ગુણાંક 0 છે, તો પછી લાક્ષણિકતાઓ વચ્ચે કોઈ રેખીય સંબંધ નથી.

નમૂનાના સહસંબંધ ગુણાંકની ગણતરી સૂત્રનો ઉપયોગ કરીને કરવામાં આવે છે:

આર માં
(1)

જ્યાં - ઉત્પાદનોનું સરેરાશ મૂલ્ય
પર

અને - અનુરૂપ લાક્ષણિકતાઓના સરેરાશ મૂલ્યો;

અને - લાક્ષણિકતા માટે પ્રમાણભૂત વિચલનો જોવા મળે છે
અને નિશાની માટે .

કાર્યની કામગીરીની પદ્ધતિ

કારના પાછળના એક્સેલના લુબ્રિકેટિંગ તેલના તાપમાન પર આંકડાકીય માહિતી આપવામાં આવી છે. આસપાસના તાપમાન પર આધાર રાખીને
.

1. નમૂના સહસંબંધ ગુણાંકની ગણતરી

અમે સહસંબંધ કોષ્ટકમાં આ શરતોનો સારાંશ આપીશું

કોષ્ટક 1.

n y(લાક્ષણિકતાની આવર્તન y)

n x (લાક્ષણિકતા xની આવર્તન)

ચાલો નમૂનાની સંખ્યાત્મક લાક્ષણિકતાઓ શોધીએ

1.1. ચાલો X અને Y લાક્ષણિકતાઓના સરેરાશ મૂલ્યો શોધીએ

,

1.2. ચાલો નમૂના ભિન્નતા શોધીએ

1513-1281,64=231,36

1.3. નમૂના પ્રમાણભૂત વિચલન

,

,

1.4. નમૂના સહસંબંધ ક્ષણ

1/50(40 + 120+720+480+200+800+900+4200+1120+2160+4500+5280+4400+1320+1560) – 497,62=

1/50(27800) – 497,62 = 556 – 497,62 = 58,38

1.5. નમૂના સહસંબંધ ગુણાંક


0,77

2. ચાલો આ કરવા માટે સહસંબંધ ગુણાંકનું મહત્વ તપાસીએ, ચાલો આંકડા તપાસીએ:

=
≈ 8,3

અમે શોધીશું
ટેકનોલોજીમાં સૌથી વધુ ઉપયોગમાં લેવાતા મહત્વના સ્તર અનુસાર વિદ્યાર્થી વિતરણ કોષ્ટક (પરિશિષ્ટ)માંથી
અને
વાય– સ્વતંત્રતાની ડિગ્રીની સંખ્યા K= n – 2 = 50 – 2 = 48,
2,02

કારણ કે
= 8.3 > 2.02, પછી મળેલ સહસંબંધ ગુણાંક શૂન્યથી નોંધપાત્ર રીતે અલગ પડે છે. આનો અર્થ એ છે કે X અને Y ચલો ફોર્મના રેખીય રીગ્રેસન સંબંધ દ્વારા સંબંધિત છે

આમ, સહસંબંધ ગુણાંક એ નજીકના રેખીય સંબંધને દર્શાવે છે જે પાછળના એક્સલ લુબ્રિકેટિંગ ઓઇલ તાપમાન અને આસપાસના હવાના તાપમાન વચ્ચે અસ્તિત્વ ધરાવે છે.

3. પ્રયોગમૂલક રેખીય રીગ્રેસન સમીકરણો દોરવાવાયપરએક્સઅનેએક્સપરવાય.

3.1. X પર Y નું પ્રયોગમૂલક રેખીય રીગ્રેશન સમીકરણ.

,

3.2. એક્સ ઓનનું પ્રયોગમૂલક રેખીય રીગ્રેસન સમીકરણવાય.

,

=35.8+2.34(y-13.9)

4. એક પ્રયોગમૂલક રીગ્રેશન લાઇનનું નિર્માણવાયચાલુએક્સ.

પ્રયોગમૂલક રીગ્રેસન લાઇન બનાવવા માટે, ચાલો કોષ્ટક 2 દોરીએ.

કોષ્ટક 2

- લાક્ષણિકતા મૂલ્યોની શરતી સરેરાશ તે પ્રદાન કર્યું ચોક્કસ મૂલ્ય લે છે, એટલે કે.

;

;

;

સંખ્યાઓની જોડી લેવી
પોઈન્ટના કોઓર્ડિનેટ્સ માટે, તેમને કોઓર્ડિનેટ સિસ્ટમમાં બનાવો અને તેમને સીધી રેખાના ભાગો સાથે જોડો. પરિણામી તૂટેલી રેખા એ પ્રયોગમૂલક રીગ્રેસન રેખા હશે.

X પર Y ની સૈદ્ધાંતિક સીધી રેખા રીગ્રેસનનું સમીકરણ છે:

;
, ક્યાં - એટ્રિબ્યુટનો નમૂનો સરેરાશ ;

- એટ્રિબ્યુટનો નમૂનો સરેરાશ .

;
;
;
;
.

X પર Y નું પ્રત્યક્ષ રીગ્રેસન સમીકરણ નીચે પ્રમાણે લખવામાં આવશે:

અથવા છેલ્લે

ચાલો બંને રીગ્રેસન રેખાઓ બનાવીએ (ફિગ. 1)

ચોખા. 1. પ્રયોગમૂલક અને સૈદ્ધાંતિક રીગ્રેસન રેખાઓ

ખાતે
;

5. અમે વિશ્લેષણ પરિણામોનું અર્થપૂર્ણ અર્થઘટન કરીશું.

વાહનના પાછળના એક્સેલના લુબ્રિકેટિંગ તેલના તાપમાન અને આસપાસના હવાના તાપમાન વચ્ચે સીધો સીધો રેખીય સંબંધ છે ( આર વી=0.77). આ 0.95 ની સંભાવના સાથે કહી શકાય.

સમીકરણ
લાક્ષણિકતા દર્શાવે છે કે, સરેરાશ, કારના પાછળના એક્સેલના લુબ્રિકેટિંગ તેલનું તાપમાન આસપાસના તાપમાન પર કેવી રીતે આધાર રાખે છે.

લીનિયર રીગ્રેશન ગુણાંક (
) સૂચવે છે કે જો આસપાસના તાપમાનમાં સરેરાશ 1 ડિગ્રીનો વધારો થાય છે, તો કારના પાછળના એક્સલના લ્યુબ્રિકેટિંગ તેલનું તાપમાન સરેરાશ 0.25 ડિગ્રી વધશે.

સમીકરણ
વાહનના પાછળના ધરીના લુબ્રિકેટિંગ તેલનું તાપમાન આસપાસના તાપમાન પર કેવી રીતે આધાર રાખે છે તે દર્શાવે છે. જો કારના પાછળના એક્સલના લુબ્રિકેટિંગ ઓઇલનું તાપમાન સરેરાશ 1 ડિગ્રી વધારવું જરૂરી છે, તો આસપાસના હવાના તાપમાનમાં સરેરાશ 2.34 ડિગ્રી વધારો કરવાની જરૂર છે(
)

વ્યક્તિગત કાર્યો માટેના વિકલ્પો

1. X નું વિતરણ - નિશ્ચિત ઉત્પાદન સંપત્તિની કિંમત (મિલિયન રુબેલ્સ) અને Y - કામદાર દીઠ સરેરાશ માસિક આઉટપુટ

2. લંબાઈ X (સે.મી.માં) અને વજન Y (કિલોમાં) દ્વારા 200 નળાકાર લેમ્પ પોસ્ટનું વિતરણ નીચેના કોષ્ટકમાં આપવામાં આવ્યું છે:

3. ઉત્પાદન X (નાણાકીય એકમોમાં) અને દૈનિક આઉટપુટ Y (ટનમાં) દ્વારા 100 કંપનીઓનું વિતરણ નીચેના કોષ્ટકમાં આપવામાં આવ્યું છે:

મોટી સંખ્યામાં અજમાયશ સાથે, સમાન મૂલ્ય X nx વખત આવી શકે છે, સમાન મૂલ્ય Y ny વખત આવી શકે છે, અને સંખ્યાઓની સમાન જોડી (x; y) nxy વખત આવી શકે છે,

અને સામાન્ય રીતે નમૂનાનું કદ.

તેથી, અવલોકન ડેટા જૂથબદ્ધ છે, એટલે કે, nx, ny, nxy ની ગણતરી કરવામાં આવે છે. તમામ જૂથબદ્ધ ડેટા કોષ્ટકના રૂપમાં રેકોર્ડ કરવામાં આવે છે, જેને સહસંબંધ કોષ્ટક કહેવામાં આવે છે.

જો X પર Y ની બંને રીગ્રેશન રેખાઓ અને Y પર X સીધી હોય, તો સહસંબંધ રેખીય છે.

X પર સીધી રીગ્રેશન લાઇન Y ના નમૂના સમીકરણનું સ્વરૂપ છે:

pyx અને B પરિમાણો, જે ઓછામાં ઓછા ચોરસ પદ્ધતિ દ્વારા નક્કી કરવામાં આવે છે, તેનું સ્વરૂપ છે:

જ્યાં yx એ શરતી સરેરાશ છે; XВ અને Ув એ X અને Y લાક્ષણિકતાઓના નમૂના સરેરાશ છે; -x અને -y નમૂના પ્રમાણભૂત વિચલનો છે; gV એ નમૂના સહસંબંધ ગુણાંક છે.

Y પર X ની સીધી રેખા રીગ્રેસનના નમૂના સમીકરણનું સ્વરૂપ છે:

અમે ધારીએ છીએ કે X અને Y લક્ષણો પરના અવલોકન ડેટા સમાન અંતરવાળા વિકલ્પો સાથે સહસંબંધ કોષ્ટકના સ્વરૂપમાં આપવામાં આવ્યા છે.

પછી અમે શરતી વિકલ્પો પર આગળ વધીએ છીએ:

જ્યાં C1 એ લક્ષણ Xનું ચલ છે જે સૌથી વધુ આવર્તન ધરાવે છે; C 2 - લક્ષણ Y નું ચલ, જે સૌથી વધુ આવર્તન ધરાવે છે; h1 — પગલું (બે અડીને આવેલા વિકલ્પો X વચ્ચેનો તફાવત); h2 - પગલું (બે અડીને આવેલા વિકલ્પો Y વચ્ચેનો તફાવત).

પછી નમૂના સહસંબંધ ગુણાંક

જથ્થાઓ u, v, su, sv ઉત્પાદન પદ્ધતિ દ્વારા અથવા સીધા સૂત્રોનો ઉપયોગ કરીને શોધી શકાય છે.

આ જથ્થાઓને જાણીને, અમે સૂત્રોનો ઉપયોગ કરીને રીગ્રેસન સમીકરણોમાં સમાવિષ્ટ પરિમાણો શોધીશું.

વિભાગ 6 હેઠળ સામાન્ય તપાસ કાર્ય. 12.1. રેન્ડમ ઇવેન્ટ્સ

12.1. રેન્ડમ ઇવેન્ટ્સ

12.1.1. બોક્સમાં કાળા મોજાની 6 સમાન જોડી અને બેજ મોજાની 4 સમાન જોડી છે. અવ્યવસ્થિત રીતે દોરેલા બે મોજા એક જોડી બનાવે છે તેવી સંભાવના શોધો.

ઘટના A ને ધ્યાનમાં લો - અવ્યવસ્થિત રીતે દોરેલા બે મોજા એક જોડી બનાવે છે; અને પૂર્વધારણાઓ: B1 - કાળા મોજાની જોડી કાઢવામાં આવી હતી, B2 - ન રંગેલું ઊની કાપડ મોજાની જોડી કાઢવામાં આવી હતી, B3 - કાઢવામાં આવેલા મોજા એક જોડી બનાવતા નથી.

ગુણાકાર પ્રમેય દ્વારા પૂર્વધારણા B1 ની સંભાવના એ સંભાવનાઓના ઉત્પાદન જેટલી છે કે પ્રથમ ગ્લોવ કાળો છે અને બીજો ગ્લોવ કાળો છે, એટલે કે.

તેવી જ રીતે, પૂર્વધારણા Bi ની સંભાવના છે:

પૂર્વધારણાઓ B1, B2 અને B3 ઘટનાઓના સંપૂર્ણ જૂથની રચના કરતી હોવાથી, પૂર્વધારણા B3 ની સંભાવના સમાન છે:

કુલ સંભાવના સૂત્ર મુજબ, અમારી પાસે છે:

જ્યાં Pb (A) એ સંભાવના છે કે એક જોડી બે કાળા મોજા અને Pb1 (A) = 1 દ્વારા રચાય છે; pB1 (A) એ સંભાવના છે કે બે ન રંગેલું ઊની કાપડ મોજા એક જોડી બનાવે છે અને Pb2 (A) = 1; અને, છેવટે, РВз(A) - વિવિધ રંગોના મોજાઓ દ્વારા જોડી બને તેવી સંભાવના અને

આમ, રેન્ડમ પર દોરેલા બે મોજા એક જોડી બનાવે તેવી સંભાવના બરાબર છે

12.1.2. ભઠ્ઠીમાં 3 સફેદ દડા અને 5 કાળા દડા હોય છે. 3 બોલ રેન્ડમ દોરવામાં આવે છે, એક સમયે એક, અને દરેક નિષ્કર્ષણ પછી તેઓ કલશમાં પાછા ફરે છે. સંભવિતતા શોધો કે દોરેલા બોલમાં ત્યાં હશે:

a) બરાબર બે સફેદ દડા, b) ઓછામાં ઓછા બે સફેદ દડા.

ઉકેલ. અમારી પાસે વળતર સાથેની યોજના છે, એટલે કે દરેક વખતે બોલની રચના બદલાતી નથી:

a) જ્યારે ત્રણ બોલ દોરવામાં આવે છે, તેમાંથી બે સફેદ અને એક કાળો હોવા જોઈએ. આ કિસ્સામાં, કાળો કાં તો પ્રથમ, અથવા બીજો, અથવા ત્રીજો હોઈ શકે છે. સંભાવનાઓના ઉમેરા અને ગુણાકારના પ્રમેયને એકસાથે લાગુ કરીને, અમારી પાસે છે:

b) ઓછામાં ઓછા બે સફેદ બોલ લેવાનો અર્થ એ છે કે ત્યાં બે અથવા ત્રણ સફેદ બોલ હોવા જોઈએ:

12.1.3. કલરમાં 6 સફેદ અને 5 કાળા દડા હોય છે. કલગીમાં પાછા ફર્યા વિના ત્રણ દડા એક પછી એક રેન્ડમ દોરવામાં આવે છે. સળંગ ત્રીજો બોલ સફેદ હશે તેવી સંભાવના શોધો.

ઉકેલ. જો ત્રીજો બોલ સફેદ હોવો જોઈએ, તો પ્રથમ બે દડા સફેદ, અથવા સફેદ અને કાળો, અથવા કાળો અને સફેદ, અથવા કાળો હોઈ શકે છે, એટલે કે બિન-ના ચાર જૂથો છે.

સંયુક્ત ઘટનાઓ. તેમના પર સંભાવના ગુણાકાર પ્રમેય લાગુ કરવાથી, અમને મળે છે:

P = P1(5. P2(5. P3(5 + (P1(5. P2ch. P3(5 + P14 . P2(5 . P3(5)) + P1ch. P2ch. P3(5 =

A A 4 A A 5 A A 5 A A A 6=540 = A

પૃષ્ઠ 10. 9 + I. 10. 9 + I. 10. 9 + I. 10. 9 = 990 = IT

રીગ્રેશન શું છે?

બે સતત ચલો ધ્યાનમાં લો x=(x 1 , x 2 , .., x n), y=(y 1 , y 2 , ..., y n).

ચાલો બિંદુઓને દ્વિ-પરિમાણીય સ્કેટર પ્લોટ પર મૂકીએ અને કહીએ કે અમારી પાસે છે રેખીય સંબંધ, જો ડેટા સીધી રેખા દ્વારા અંદાજે છે.

જો આપણે એવું માનીએ yપર આધાર રાખે છે x, અને માં ફેરફારો yમાં ફેરફારોને કારણે ચોક્કસપણે થાય છે x, અમે રીગ્રેસન લાઇન નક્કી કરી શકીએ છીએ (રીગ્રેશન yપર x), જે આ બે ચલો વચ્ચેના રેખીય સંબંધને શ્રેષ્ઠ રીતે વર્ણવે છે.

રીગ્રેસન શબ્દનો આંકડાકીય ઉપયોગ સર ફ્રાન્સિસ ગાલ્ટન (1889)ને આભારી, સરેરાશ માટે રીગ્રેશન તરીકે ઓળખાતી ઘટનામાંથી આવ્યો છે.

તેમણે બતાવ્યું કે જો કે ઉંચા પિતાના પુત્રો ઊંચા હોય છે, તેમ છતાં પુત્રોની સરેરાશ ઊંચાઈ તેમના ઊંચા પિતા કરતા ઓછી હોય છે. પુત્રોની સરેરાશ ઊંચાઈ વસ્તીના તમામ પિતાની સરેરાશ ઊંચાઈ તરફ "પાછળ થઈ" અને "પછાત" થઈ. આમ, સરેરાશ, ઊંચા પિતાના પુત્રો ટૂંકા (પરંતુ હજુ પણ તદ્દન ઊંચા) પુત્રો હોય છે, અને ટૂંકા પિતાના પુત્રો ઊંચા (પરંતુ હજુ પણ તદ્દન ટૂંકા) હોય છે.

રીગ્રેશન લાઇન

એક ગાણિતિક સમીકરણ જે એક સરળ (જોડી પ્રમાણે) રેખીય રીગ્રેસન રેખાનો અંદાજ કાઢે છે:

xસ્વતંત્ર ચલ અથવા આગાહી કરનાર કહેવાય છે.

વાય- આશ્રિત ચલ અથવા પ્રતિભાવ ચલ. આ તે મૂલ્ય છે જેની આપણે અપેક્ષા રાખીએ છીએ y(સરેરાશ) જો આપણે મૂલ્ય જાણીએ x, એટલે કે "અનુમાનિત મૂલ્ય" છે y»

  • a- મૂલ્યાંકન રેખાના મફત સભ્ય (છેદન); આ અર્થ છે વાય, જ્યારે x=0(ફિગ.1).
  • b- અંદાજિત રેખાની ઢાળ અથવા ઢાળ; તે જે રકમ દ્વારા રજૂ કરે છે વાયજો આપણે વધારો કરીએ તો સરેરાશ વધે છે xએક યુનિટ માટે.
  • aઅને bઅનુમાનિત રેખાના રીગ્રેસન ગુણાંક કહેવામાં આવે છે, જો કે આ શબ્દ ઘણીવાર ફક્ત માટે જ વપરાય છે b.

પેરવાઇઝ રેખીય રીગ્રેશનને એક કરતાં વધુ સ્વતંત્ર ચલનો સમાવેશ કરવા માટે વિસ્તૃત કરી શકાય છે; આ કિસ્સામાં તે તરીકે ઓળખાય છે બહુવિધ રીગ્રેશન.

ફિગ.1. ઇન્ટરસેપ્ટ a અને સ્લોપ b દર્શાવતી રેખીય રીગ્રેશન લાઇન (એક એકમ દ્વારા x વધે તેમ Y રકમ વધે છે)

ઓછામાં ઓછા ચોરસ પદ્ધતિ

અમે અવલોકનોના નમૂનાનો ઉપયોગ કરીને રીગ્રેશન વિશ્લેષણ કરીએ છીએ જ્યાં aઅને b- સાચા (સામાન્ય) પરિમાણોના નમૂના અંદાજો, α અને β, જે વસ્તી (સામાન્ય વસ્તી) માં રેખીય રીગ્રેસન રેખા નક્કી કરે છે.

ગુણાંક નક્કી કરવા માટેની સૌથી સરળ પદ્ધતિ aઅને bછે ઓછામાં ઓછા ચોરસ પદ્ધતિ(MNC).

અવશેષોને જોઈને ફિટનું મૂલ્યાંકન કરવામાં આવે છે (રેખાથી દરેક બિંદુનું ઊભી અંતર, દા.ત. શેષ = અવલોકન y- આગાહી y, ચોખા. 2).

શ્રેષ્ઠ ફિટની રેખા પસંદ કરવામાં આવે છે જેથી કરીને અવશેષોના ચોરસનો સરવાળો ન્યૂનતમ હોય.

ચોખા. 2. દરેક બિંદુ માટે ચિત્રિત અવશેષો (ઊભી ડોટેડ રેખાઓ) સાથે રેખીય રીગ્રેસન રેખા.

લીનિયર રીગ્રેસન ધારણાઓ

તેથી, દરેક અવલોકન કરેલ મૂલ્ય માટે, બાકીના તફાવત સમાન છે અને અનુરૂપ અનુમાનિત મૂલ્ય દરેક શેષ હકારાત્મક અથવા નકારાત્મક હોઈ શકે છે.

રેખીય રીગ્રેસન પાછળ નીચેની ધારણાઓને ચકાસવા માટે તમે અવશેષોનો ઉપયોગ કરી શકો છો:

  • અવશેષો સામાન્ય રીતે શૂન્યના સરેરાશ સાથે વિતરિત કરવામાં આવે છે;

જો રેખીયતા, સામાન્યતા અને/અથવા સતત ભિન્નતાની ધારણાઓ શંકાસ્પદ હોય, તો અમે એક નવી રીગ્રેસન રેખાને બદલી શકીએ છીએ અથવા અને ગણતરી કરી શકીએ છીએ જેના માટે આ ધારણાઓ સંતુષ્ટ છે (ઉદાહરણ તરીકે, લઘુગણક પરિવર્તનનો ઉપયોગ કરો, વગેરે).

વિસંગત મૂલ્યો (બહાર) અને પ્રભાવ બિંદુઓ

"પ્રભાવશાળી" અવલોકન, જો અવગણવામાં આવે તો, એક અથવા વધુ મોડેલ પેરામીટર અંદાજો (એટલે ​​કે, ઢાળ અથવા અવરોધ) બદલે છે.

આઉટલીયર (એક અવલોકન કે જે ડેટા સેટમાં મોટા ભાગના મૂલ્યો સાથે અસંગત છે) એ "પ્રભાવશાળી" અવલોકન હોઈ શકે છે અને બાયવેરિયેટ સ્કેટરપ્લોટ અથવા શેષ પ્લોટનું નિરીક્ષણ કરીને સરળતાથી દૃષ્ટિની રીતે શોધી શકાય છે.

આઉટલાયર્સ માટે અને "પ્રભાવશાળી" અવલોકનો (પોઇન્ટ્સ) માટે, મોડલનો ઉપયોગ, તેમના સમાવેશ સાથે અને વગર બંને થાય છે, અને અંદાજ (રીગ્રેસન ગુણાંક) માં ફેરફારો પર ધ્યાન આપવામાં આવે છે.

વિશ્લેષણ હાથ ધરતી વખતે, તમારે આઉટલીયર અથવા પ્રભાવના મુદ્દાઓને આપમેળે કાઢી નાખવું જોઈએ નહીં, કારણ કે તેમને ફક્ત અવગણવાથી પ્રાપ્ત પરિણામોને અસર થઈ શકે છે. હંમેશા આ આઉટલીયરના કારણોનો અભ્યાસ કરો અને તેનું વિશ્લેષણ કરો.

લીનિયર રીગ્રેસન પૂર્વધારણા

રેખીય રીગ્રેસન બનાવતી વખતે, શૂન્ય પૂર્વધારણાનું પરીક્ષણ કરવામાં આવે છે કે રીગ્રેસન રેખા β નો સામાન્ય ઢોળાવ શૂન્ય બરાબર છે.

જો રેખાનો ઢોળાવ શૂન્ય હોય, તો અને વચ્ચે કોઈ રેખીય સંબંધ નથી: ફેરફાર અસર કરતું નથી

સાચી ઢાળ શૂન્ય છે તે નલ પૂર્વધારણાને ચકાસવા માટે, તમે નીચેના અલ્ગોરિધમનો ઉપયોગ કરી શકો છો:

ગુણોત્તર સમાન પરીક્ષણ આંકડાની ગણતરી કરો, જે સ્વતંત્રતાની ડિગ્રી સાથેના વિતરણને આધીન છે, જ્યાં ગુણાંકની પ્રમાણભૂત ભૂલ


,

- અવશેષોના વિક્ષેપનો અંદાજ.

સામાન્ય રીતે, જો મહત્વના સ્તરે પહોંચી જાય, તો નલ પૂર્વધારણાને નકારી કાઢવામાં આવે છે.


સ્વતંત્રતાની ડિગ્રી સાથે વિતરણનો ટકાવારી બિંદુ ક્યાં છે, જે બે બાજુની કસોટીની સંભાવના આપે છે

આ તે અંતરાલ છે જે 95% ની સંભાવના સાથે સામાન્ય ઢોળાવ ધરાવે છે.

મોટા નમૂનાઓ માટે, કહો, અમે 1.96 ની કિંમત સાથે અંદાજિત કરી શકીએ છીએ (એટલે ​​​​કે, પરીક્ષણ આંકડા સામાન્ય રીતે વિતરિત કરવામાં આવશે)

રેખીય રીગ્રેશનની ગુણવત્તાનું મૂલ્યાંકન: નિર્ધારણના ગુણાંક R 2

રેખીય સંબંધને કારણે અને અમે અપેક્ષા રાખીએ છીએ કે તે જેમ બદલાય છે , અને તેને તે ભિન્નતા કહે છે જે રીગ્રેસનને કારણે છે અથવા તેના દ્વારા સમજાવવામાં આવે છે. શેષ ભિન્નતા શક્ય તેટલી નાની હોવી જોઈએ.

જો આ સાચું હોય, તો મોટાભાગની વિવિધતા રીગ્રેસન દ્વારા સમજાવવામાં આવશે, અને પોઈન્ટ રીગ્રેસન રેખાની નજીક હશે, એટલે કે. રેખા ડેટાને સારી રીતે બંધબેસે છે.

રીગ્રેશન દ્વારા સમજાવાયેલ કુલ વિચલનનું પ્રમાણ કહેવાય છે નિર્ધારણ ગુણાંક, સામાન્ય રીતે ટકાવારી તરીકે દર્શાવવામાં આવે છે અને સૂચવવામાં આવે છે આર 2(જોડી રેખીય રીગ્રેશનમાં આ જથ્થો છે આર 2, સહસંબંધ ગુણાંકનો વર્ગ), તમને રીગ્રેસન સમીકરણની ગુણવત્તાનું વ્યક્તિલક્ષી મૂલ્યાંકન કરવાની મંજૂરી આપે છે.

તફાવત એ વિભિન્નતાની ટકાવારી દર્શાવે છે જે રીગ્રેસન દ્વારા સમજાવી શકાતી નથી.

મૂલ્યાંકન કરવા માટે કોઈ ઔપચારિક પરીક્ષણ નથી; રીગ્રેશન લાઇનની યોગ્યતા નક્કી કરવા માટે આપણે વ્યક્તિલક્ષી નિર્ણય પર આધાર રાખવો જોઈએ.

આગાહી માટે રીગ્રેસન લાઇન લાગુ કરવી

તમે અવલોકન કરેલ શ્રેણીના આત્યંતિક છેડા પરના મૂલ્યમાંથી મૂલ્યની આગાહી કરવા માટે રીગ્રેસન લાઇનનો ઉપયોગ કરી શકો છો (આ મર્યાદાઓથી આગળ વધશો નહીં).

અમે અવલોકનક્ષમના સરેરાશની આગાહી કરીએ છીએ કે જેનું ચોક્કસ મૂલ્ય છે તે મૂલ્યને રીગ્રેશન લાઇનના સમીકરણમાં પ્લગ કરીને.

તેથી, જો આપણે અનુમાન કરીએ તો આ અનુમાનિત મૂલ્યનો ઉપયોગ કરો અને સાચી વસ્તી માટે વિશ્વાસ અંતરાલનો અંદાજ કાઢવા માટે તેની પ્રમાણભૂત ભૂલનો અર્થ કરો.

વિવિધ મૂલ્યો માટે આ પ્રક્રિયાને પુનરાવર્તિત કરવાથી તમે આ રેખા માટે આત્મવિશ્વાસની મર્યાદા બાંધી શકો છો. આ તે બેન્ડ અથવા વિસ્તાર છે જેમાં સાચી લાઇન હોય છે, ઉદાહરણ તરીકે 95% આત્મવિશ્વાસ સ્તર પર.

સરળ રીગ્રેશન યોજનાઓ

સરળ રીગ્રેશન ડિઝાઇનમાં એક સતત આગાહી કરનાર હોય છે. જો 7, 4, અને 9 જેવા અનુમાનિત મૂલ્યો P સાથે 3 અવલોકનો હોય અને ડિઝાઇનમાં પ્રથમ-ક્રમની અસર P શામેલ હોય, તો ડિઝાઇન મેટ્રિક્સ X હશે

અને X1 માટે P નો ઉપયોગ કરીને રીગ્રેસન સમીકરણ છે

Y = b0 + b1 P

જો સાદી રીગ્રેસન ડિઝાઇનમાં P પર ઉચ્ચ ક્રમની અસર હોય છે, જેમ કે ચતુર્ભુજ અસર, તો ડિઝાઇન મેટ્રિક્સમાં કૉલમ X1 માંના મૂલ્યો બીજા પાવરમાં વધારવામાં આવશે:

અને સમીકરણ ફોર્મ લેશે

Y = b0 + b1 P2

સિગ્મા-અવરોધિત અને ઓવરપેરામીટરાઇઝ્ડ કોડિંગ પદ્ધતિઓ સાદી રીગ્રેશન ડિઝાઇન અને અન્ય ડિઝાઇનને લાગુ પડતી નથી જેમાં માત્ર સતત અનુમાનો હોય છે (કારણ કે ત્યાં ફક્ત કોઈ સ્પષ્ટ આગાહી કરનારા નથી). પસંદ કરેલ એન્કોડિંગ પદ્ધતિને ધ્યાનમાં લીધા વિના, સતત ચલોના મૂલ્યો તે મુજબ વધે છે અને X ચલો માટે મૂલ્યો તરીકે ઉપયોગમાં લેવાય છે. આ કિસ્સામાં, કોઈ રીકોડિંગ કરવામાં આવતું નથી. વધુમાં, રીગ્રેશન યોજનાઓનું વર્ણન કરતી વખતે, તમે ડિઝાઇન મેટ્રિક્સ Xની વિચારણાને છોડી શકો છો અને માત્ર રીગ્રેસન સમીકરણ સાથે કામ કરી શકો છો.

ઉદાહરણ: સરળ રીગ્રેસન વિશ્લેષણ

આ ઉદાહરણ કોષ્ટકમાં પ્રસ્તુત ડેટાનો ઉપયોગ કરે છે:

ચોખા. 3. પ્રારંભિક ડેટાનું કોષ્ટક.

અવ્યવસ્થિત રીતે પસંદ કરેલ 30 કાઉન્ટીઓમાં 1960 અને 1970 ની વસ્તી ગણતરીની તુલનામાંથી સંકલિત ડેટા. કાઉન્ટીના નામો અવલોકન નામો તરીકે રજૂ કરવામાં આવે છે. દરેક ચલ સંબંધિત માહિતી નીચે પ્રસ્તુત છે:

ચોખા. 4. ચલ વિશિષ્ટતાઓનું કોષ્ટક.

સંશોધન સમસ્યા

આ ઉદાહરણ માટે, ગરીબી દર અને ડિગ્રી વચ્ચેના સહસંબંધનું વિશ્લેષણ કરવામાં આવશે જે ગરીબી રેખા નીચે રહેતા પરિવારોની ટકાવારીની આગાહી કરે છે. તેથી, અમે ચલ 3 (Pt_Poor) ને આશ્રિત ચલ તરીકે ગણીશું.

અમે એક પૂર્વધારણા આગળ મૂકી શકીએ છીએ: વસ્તીના કદમાં ફેરફાર અને ગરીબી રેખા નીચે રહેતા પરિવારોની ટકાવારી સંબંધિત છે. એવી અપેક્ષા રાખવી વાજબી લાગે છે કે ગરીબી બહારના સ્થળાંતર તરફ દોરી જાય છે, તેથી ગરીબી રેખા નીચેની ટકાવારી અને વસ્તી પરિવર્તન વચ્ચે નકારાત્મક સંબંધ હશે. તેથી, અમે ચલ 1 (Pop_Chng) ને આગાહી કરનાર ચલ તરીકે ગણીશું.

પરિણામો જુઓ

રીગ્રેસન ગુણાંક

ચોખા. 5. Pop_Chng પર Pt_Poor ના રીગ્રેસન ગુણાંક.

Pop_Chng પંક્તિ અને પરમ કૉલમના આંતરછેદ પર.<.05 . Обратите внимание на не стандартизованный коэффициент, который также является коэффициентом корреляции Пирсона для простых регрессионных планов, равен -.65, который означает, что для каждого уменьшения стандартного отклонения численности населения происходит увеличение стандартного отклонения уровня бедности на.65.

Pop_Chng પર Pt_Poor ના રીગ્રેસન માટે અપ્રમાણિત ગુણાંક -0.40374 છે. આનો અર્થ એ થયો કે વસ્તીમાં દરેક એક એકમના ઘટાડાને કારણે .40374ના ગરીબી દરમાં વધારો થયો છે. આ અપ્રમાણિત ગુણાંક માટે ઉપલા અને નીચલા (મૂળભૂત) 95% વિશ્વાસ મર્યાદામાં શૂન્યનો સમાવેશ થતો નથી, તેથી રીગ્રેશન ગુણાંક p સ્તરે નોંધપાત્ર છે

સહસંબંધ ગુણાંક નોંધપાત્ર રીતે વધુ પડતો અંદાજ અથવા ઓછો અંદાજ બની શકે છે જો ડેટામાં મોટા આઉટલાયર હાજર હોય. ચાલો જીલ્લા દ્વારા આશ્રિત ચલ Pt_Poor ના વિતરણનો અભ્યાસ કરીએ. આ કરવા માટે, ચાલો Pt_Poor ચલનો હિસ્ટોગ્રામ બનાવીએ.

ચોખા. 6. Pt_Poor ચલનો હિસ્ટોગ્રામ.

જેમ તમે જોઈ શકો છો, આ ચલનું વિતરણ સામાન્ય વિતરણ કરતા સ્પષ્ટ રીતે અલગ છે. જો કે, બે કાઉન્ટીઓ (બે જમણી સ્તંભો) પણ સામાન્ય વિતરણ હેઠળ અપેક્ષિત કરતાં ગરીબી રેખાની નીચે હોય તેવા પરિવારોની ઊંચી ટકાવારી ધરાવતા હોવા છતાં, તેઓ "મર્યાદાની અંદર" હોવાનું જણાય છે.

ચોખા. 7. Pt_Poor ચલનો હિસ્ટોગ્રામ.

આ ચુકાદો કંઈક અંશે વ્યક્તિલક્ષી છે. અંગૂઠાનો નિયમ એ છે કે જો અવલોકન (અથવા અવલોકનો) અંતરાલની અંદર ન આવે તો આઉટલીયરને ધ્યાનમાં લેવું જોઈએ (એટલે ​​કે પ્રમાણભૂત વિચલનના ± 3 ગણા). આ કિસ્સામાં, વસ્તીના સભ્યો વચ્ચેના સહસંબંધ પર તેમની મોટી અસર ન થાય તેની ખાતરી કરવા માટે બહારના લોકો સાથે અને વિના વિશ્લેષણનું પુનરાવર્તન કરવું યોગ્ય છે.

સ્કેટરપ્લોટ

જો પૂર્વધારણાઓમાંની એક આપેલ ચલો વચ્ચેના સંબંધ વિશે પ્રાથમિકતા છે, તો તેને સંબંધિત સ્કેટરપ્લોટના ગ્રાફ પર ચકાસવા માટે તે ઉપયોગી છે.

ચોખા. 8. સ્કેટર ડાયાગ્રામ.

સ્કેટરપ્લોટ બે ચલો વચ્ચે સ્પષ્ટ નકારાત્મક સહસંબંધ (-.65) દર્શાવે છે. તે રીગ્રેસન લાઇન માટે 95% વિશ્વાસ અંતરાલ પણ દર્શાવે છે, એટલે કે, રીગ્રેસન રેખા બે ડોટેડ વણાંકો વચ્ચેની 95% સંભાવના છે.

મહત્વના માપદંડ

ચોખા. 9. મહત્વના માપદંડો ધરાવતું કોષ્ટક.

Pop_Chng રીગ્રેશન ગુણાંક માટેનું પરીક્ષણ પુષ્ટિ કરે છે કે Pop_Chng એ Pt_Poor સાથે મજબૂત રીતે સંબંધિત છે, p<.001 .

બોટમ લાઇન

આ ઉદાહરણ બતાવે છે કે કેવી રીતે સરળ રીગ્રેશન ડિઝાઇનનું વિશ્લેષણ કરવું. અપ્રમાણિત અને પ્રમાણિત રીગ્રેશન ગુણાંકના અર્થઘટન પણ રજૂ કરવામાં આવ્યા હતા. આશ્રિત ચલના પ્રતિભાવ વિતરણના અભ્યાસના મહત્વની ચર્ચા કરવામાં આવી છે, અને આગાહી કરનાર અને આશ્રિત ચલ વચ્ચેના સંબંધની દિશા અને તાકાત નક્કી કરવા માટેની તકનીક દર્શાવવામાં આવી છે.

પદ્ધતિસરના ફોર્મનું કવર પેજ

કઝાકિસ્તાન પ્રજાસત્તાકના શિક્ષણ અને વિજ્ઞાન મંત્રાલય

«

UMC ના અધ્યક્ષ _______________ « __"___________20__

મંજૂર:

OPiMOUP ના વડા _________________ « __"___________20__

યુનિવર્સિટીની શૈક્ષણિક અને પદ્ધતિસરની કાઉન્સિલ દ્વારા મંજૂર

« __"___________20 __ પ્રોટોકોલ નંબર____

વિષયનો અભ્યાસ કરતી વખતે "સંભાવના સિદ્ધાંત અને ગાણિતિક આંકડાઓમાંથી માહિતી", આંકડાકીય માહિતી પ્રસ્તુત કરવા અને પ્રક્રિયા કરવાની પદ્ધતિઓ પર વિશેષ ધ્યાન આપવું જોઈએ. સૈદ્ધાંતિક અને પસંદગીયુક્ત લાક્ષણિકતાઓ. પૂર્વધારણાઓનું પરીક્ષણ કરવા માટેની સામાન્ય યોજના. 1 લી અને 2 જી પ્રકારની ભૂલો. બિંદુ અને અંતરાલ અંદાજ. અંદાજના આંકડાકીય ગુણધર્મો. બે રેન્ડમ ચલોની અવલંબનનું વિશ્લેષણ.

વિષય. ઓછામાં ઓછા ચોરસ પદ્ધતિ.

h1, h2 - પગલાંઓ, એટલે કે બે પડોશી વિકલ્પો વચ્ચેનો તફાવત.

આ કિસ્સામાં, નમૂના સહસંબંધ ગુણાંક

,

વધુમાં, આ શબ્દ ગણતરી કોષ્ટક 1 નો ઉપયોગ કરીને ગણતરી કરવા માટે અનુકૂળ છે.

સૂત્રોનો ઉપયોગ કરીને મૂલ્યો શોધી શકાય છે

વિપરીત સંક્રમણ માટે, સમીકરણોનો ઉપયોગ થાય છે

ઉદાહરણસહસંબંધ કોષ્ટકના આધારે X પર Y ના નમૂના રેખીય રીગ્રેસન સમીકરણ શોધો.

ઉકેલ.ગણતરીઓને સરળ બનાવવા માટે, ચાલો શરતી વિકલ્પો તરફ આગળ વધીએ, જે સૂત્રોનો ઉપયોગ કરીને ગણતરી કરવામાં આવે છે.

,

અને શરતી વિકલ્પો સાથે રૂપાંતરિત સહસંબંધ કોષ્ટક બનાવો

પછી આપણે એક નવું ટેબલ કંપોઝ કરીશું જેમાં આપણે ભરેલા કોષના ઉપરના જમણા ખૂણામાં અને નીચલા ડાબા ખૂણામાં ગણતરી કરેલ મૂલ્યો દાખલ કરીશું, ત્યારબાદ આપણે મૂલ્યો મેળવવા માટે પંક્તિઓમાં ઉપલા મૂલ્યોનો સરવાળો કરીશું. Ui માટે કૉલમમાં Vj અને નીચલા મૂલ્યો અને મૂલ્યોની ગણતરી કરો અને .

vjVj

બે અવ્યવસ્થિત ચલો વિધેયાત્મક અવલંબન, અથવા આંકડાકીય અવલંબન દ્વારા સંબંધિત હોઈ શકે છે અથવા સ્વતંત્ર હોઈ શકે છે. સખત કાર્યાત્મક અવલંબન ભાગ્યે જ અનુભવાય છે, કારણ કે બંને અથવા બેમાંથી એક માત્રા પણ રેન્ડમ પરિબળોના પ્રભાવને આધિન છે. તદુપરાંત, આ પરિબળોમાં બંને જથ્થામાં કેટલાક સામાન્ય હોઈ શકે છે, એટલે કે. બંને રેન્ડમ ચલોને અસર કરે છે. આ કિસ્સાઓમાં, આંકડાકીય અવલંબન ઊભી થાય છે.

આંકડાકીયએક અવલંબન છે જેમાં એક જથ્થામાં ફેરફાર અન્યના વિતરણમાં ફેરફારનો સમાવેશ કરે છે. ખાસ કરીને, એક જથ્થામાં ફેરફાર અન્યના સરેરાશ મૂલ્યમાં ફેરફારનું કારણ બને છે. આ કિસ્સામાં, આંકડાકીય અવલંબન કહેવામાં આવે છે સહસંબંધઉદાહરણ તરીકે, ખાતરની રકમ અને લણણી વચ્ચેનો સંબંધ, રોકાણ કરેલ ભંડોળ અને નફો વચ્ચે.

X=x મૂલ્યને અનુરૂપ રેન્ડમ ચલ Y ના અવલોકન કરેલ મૂલ્યોના અંકગણિત સરેરાશ કહેવામાં આવે છે શરતી સરેરાશ xઅને ગાણિતિક અપેક્ષાનો પોઈન્ટ અંદાજ છે . શરતી સરેરાશ y એ જ રીતે નક્કી કરવામાં આવે છે.

શરતી ગાણિતિક અપેક્ષા M(Y|x)નું કાર્ય છે x,તેથી, તેનું મૂલ્યાંકન, એટલે કે. શરતી સરેરાશ x, x નું કાર્ય પણ:

x = f*(x).

આ સમીકરણ કહેવાય છે X પર Y ના નમૂના રીગ્રેસન સમીકરણ. કાર્ય f*(x)કહેવાય છે નમૂના રીગ્રેસન, અને તેનો આલેખ છે X પર Y ની સેમ્પલ રીગ્રેસન લાઇન.એ જ રીતે, Eq.

વાય = φ * (y),

કાર્ય φ * (y)અને તેણીનું શેડ્યૂલ કહેવામાં આવે છે સેમ્પલ રીગ્રેસન સમીકરણ, સેમ્પલ રીગ્રેસન અને સેમ્પલ રીગ્રેશન લાઇન વાય પર X.

કાર્ય પરિમાણો શોધવી f*(x)અને φ * (y), જો તેમનો પ્રકાર જાણીતો હોય, તો X અને Y જથ્થાઓ વચ્ચેના સંબંધની નિકટતાનું મૂલ્યાંકન કરવું એ એક સમસ્યા છે. સહસંબંધ વિશ્લેષણ.રીગ્રેસન વિશ્લેષણનું કાર્ય રીગ્રેશન ફંક્શન β i અને શેષ વિચલન σ ost 2 ના પરિમાણોનો અંદાજ કાઢવાનો છે.

શેષ વિચલન એ વિક્ષેપ Y નો તે ભાગ છે જે X ની ક્રિયા દ્વારા સમજાવી શકાતો નથી. σ અવશેષ 2 રીગ્રેસન કાર્યની પસંદગીની ચોકસાઈ અને વિશ્લેષણમાં સમાવિષ્ટ લક્ષણોના સમૂહની સંપૂર્ણતાનું મૂલ્યાંકન કરવા માટે સેવા આપી શકે છે. પરાધીનતાનો પ્રકાર g(x) સહસંબંધ ક્ષેત્રની પ્રકૃતિ અને પ્રક્રિયાની પ્રકૃતિના આધારે પસંદ કરવામાં આવે છે.



રેખીય રીગ્રેસન ગુણાંક β નો અંદાજ છે X r yx પર Y નો નમૂનો રીગ્રેશન ગુણાંક. પરિમાણ મૂલ્યો આર yxઅને પરિમાણ bસીધી રેખા રીગ્રેસન સમીકરણો

Y = r yx x + b

એવી રીતે પસંદ કરવામાં આવે છે કે બિંદુઓ (x 1 ,y 1), (x 2 ,y 2),…,(x n ,y n), અવલોકનાત્મક ડેટામાંથી બનાવવામાં આવે છે, xOy પ્લેન પર સીધાની શક્ય તેટલી નજીક હોય છે. રીગ્રેસન રેખા. y i માંથી ફંક્શન Y(x i) ના સ્ક્વેર વિચલનોનો સરવાળો ન્યૂનતમ હોવો જરૂરી છે તે સમકક્ષ છે. આ MNCsનો સાર છે.

X પર Y ની સીધી રીગ્રેશન લાઇનના નમૂનાનું સમીકરણ નીચે પ્રમાણે લખી શકાય છે:

x -= r માં s y /s x (x – ) ,

જ્યાં s x અને s y એ X અને Y ના નમૂના પ્રમાણભૂત વિચલનો છે, અને

r માં =

સમૂહિત ડેટામાંથી ગણતરી કરેલ નમૂના સહસંબંધ ગુણાંક. અહીં n xy એ ચલ જોડી (x,y) ની આવર્તન છે. એ જ રીતે, Y પર સીધી રીગ્રેસન રેખા Xનું નમૂના સમીકરણ શોધો:

Y – = s x /s y માં r (y –)

નમૂનામાં મળેલ Y અને X વચ્ચેના સંબંધનું ગાણિતિક મોડલ આંકડાકીય માહિતીને અનુરૂપ છે કે કેમ તે નિર્ધારિત કરવા માટે, વ્યક્તિએ રીગ્રેસન ગુણાંકના મહત્વ અને રીગ્રેસન સમીકરણના મહત્વનું મૂલ્યાંકન કરવું જોઈએ.

રીગ્રેસન ગુણાંકના મહત્વની ચકાસણી કરવાનો અર્થ એ છે કે રીગ્રેસન ગુણાંક શૂન્યથી અલગ હોવાના વાજબી નિષ્કર્ષને સમર્થન આપવા માટે અંદાજની તીવ્રતા પર્યાપ્ત છે કે કેમ તે નક્કી કરવું. પૂર્વધારણા H 0 આગળ મૂકવામાં આવે છે: રીગ્રેશન ગુણાંક શૂન્ય β =0 બરાબર છે. વિદ્યાર્થીના કાયદા અનુસાર વિતરિત આંકડાઓનો ઉપયોગ કરીને પૂર્વધારણા H0 નું પરીક્ષણ કરવામાં આવે છે

t = │b/s b │

જ્યાં bરીગ્રેશન ગુણાંક અંદાજ છે, અને s b- તેના પ્રમાણભૂત વિચલનનો અંદાજ, બીજા શબ્દોમાં કહીએ તો, અંદાજની પ્રમાણભૂત ભૂલ. જો │t │≥ t cr (α, k), રીગ્રેશન ગુણાંક શૂન્ય બરાબર છે તેવી નલ પૂર્વધારણાને નકારી કાઢવામાં આવે છે, અને ગુણાંકને નોંધપાત્ર ગણવામાં આવે છે. │t │ પર< t кр нет оснований отвергать нулевую гипотезу.



શું તમને લેખ ગમ્યો? તમારા મિત્રો સાથે શેર કરો!