બહુવિધ સહસંબંધ ગુણાંક શું મૂલ્ય લઈ શકે છે? બહુવિધ રેખીય સહસંબંધ

7.1. લીનિયર રીગ્રેશન એનાલિસિસઓછામાં ઓછા ચોરસ પદ્ધતિનો ઉપયોગ કરીને અવલોકનોના સમૂહમાં ગ્રાફ ફિટ કરવાનો સમાવેશ થાય છે. રીગ્રેશન વિશ્લેષણ અમને ચોક્કસ રેન્ડમ ચલ વચ્ચે કાર્યાત્મક સંબંધ સ્થાપિત કરવાની મંજૂરી આપે છે વાયઅને કેટલાક પ્રભાવિત કરે છે વાયમૂલ્યો એક્સ. આ અવલંબનને રીગ્રેસન સમીકરણ કહેવામાં આવે છે. ત્યાં સરળ છે ( y=m*x+b) અને બહુવચન ( y=m 1 *x 1 +m 2 *x 2 +... + m k *x k +b) રેખીય અને બિનરેખીય પ્રકારનું રીગ્રેશન.
જથ્થાઓ વચ્ચે જોડાણની ડિગ્રીનું મૂલ્યાંકન કરવા માટે, તેનો ઉપયોગ થાય છે પીયર્સન આર બહુવિધ સહસંબંધ ગુણાંક(સહસંબંધ ગુણોત્તર), જે 0 થી 1 સુધીના મૂલ્યો લઈ શકે છે. આર=0 જો જથ્થાઓ વચ્ચે કોઈ સંબંધ નથી, અને આરજો જથ્થાઓ વચ્ચે કાર્યાત્મક જોડાણ હોય તો =1. મોટા ભાગના કિસ્સાઓમાં, R 0 થી 1 સુધીના મધ્યવર્તી મૂલ્યો લે છે. મૂલ્ય આર 2કહેવાય છે નિર્ધારણ ગુણાંક.
રીગ્રેસન અવલંબન બનાવવાનું કાર્ય ગુણાંકના વેક્ટરને શોધવાનું છે એમબહુવિધ રેખીય રીગ્રેશન મોડલ, જેમાં ગુણાંક આરમહત્તમ મૂલ્ય લે છે.
મહત્વનું મૂલ્યાંકન કરવું આરલાગુ પડે છે ફિશરની એફ ટેસ્ટ, સૂત્ર દ્વારા ગણતરી:

જ્યાં n- પ્રયોગોની સંખ્યા; k- મોડેલ ગુણાંકની સંખ્યા. જો એફડેટા માટે કેટલાક નિર્ણાયક મૂલ્યને ઓળંગે છે nઅને kઅને સ્વીકૃત વિશ્વાસની સંભાવના, પછી મૂલ્ય આરનોંધપાત્ર ગણવામાં આવે છે.

7.2. સાધન રીગ્રેશનથી વિશ્લેષણ પેકેજતમને નીચેના ડેટાની ગણતરી કરવાની મંજૂરી આપે છે:

· રેખીય રીગ્રેસન કાર્ય ગુણાંક- ઓછામાં ઓછા ચોરસ પદ્ધતિ; રીગ્રેશન ફંક્શનનો પ્રકાર સ્રોત ડેટાની રચના દ્વારા નક્કી કરવામાં આવે છે;

· નિર્ધારણ અને સંબંધિત જથ્થાના ગુણાંક(કોષ્ટક રીગ્રેસન આંકડા);

· રીગ્રેશનના મહત્વને ચકાસવા માટે વિચલન કોષ્ટક અને માપદંડના આંકડા(કોષ્ટક વિભિન્નતાનું વિશ્લેષણ);

· દરેક રીગ્રેસન ગુણાંક માટે પ્રમાણભૂત વિચલન અને તેની અન્ય આંકડાકીય લાક્ષણિકતાઓ, જે તમને આ ગુણાંકના મહત્વને તપાસવા અને તેના માટે આત્મવિશ્વાસ અંતરાલ બનાવવાની મંજૂરી આપે છે;

· રીગ્રેસન કાર્ય મૂલ્યો અને અવશેષો- ચલના પ્રારંભિક મૂલ્યો વચ્ચેનો તફાવત વાયઅને રીગ્રેશન ફંક્શનના ગણતરી કરેલ મૂલ્યો (કોષ્ટક સંતુલન ઉપાડ);

· ચડતા ક્રમમાં ક્રમાંકિત ચલ Y ના મૂલ્યોને અનુરૂપ સંભાવનાઓ(કોષ્ટક સંભાવના આઉટપુટ).

7.3. દ્વારા પસંદગી સાધનને કૉલ કરો ડેટા > ડેટા એનાલિસિસ > રીગ્રેશન.

7.4. ક્ષેત્રમાં ઇનપુટ અંતરાલ Yઆશ્રિત ચલ Y ના મૂલ્યો ધરાવતી શ્રેણીનું સરનામું દાખલ કરો. શ્રેણીમાં એક કૉલમ હોવી આવશ્યક છે.
ક્ષેત્રમાં ઇનપુટ અંતરાલ Xચલ X ના મૂલ્યો ધરાવતી શ્રેણીનું સરનામું દાખલ કરો. શ્રેણીમાં એક અથવા વધુ કૉલમ હોવા જોઈએ, પરંતુ 16 કૉલમ કરતાં વધુ નહીં. જો ક્ષેત્રોમાં ઉલ્લેખિત છે ઇનપુટ અંતરાલ Yઅને ઇનપુટ અંતરાલ Xરેન્જમાં કૉલમ હેડરનો સમાવેશ થાય છે, પછી તમારે વિકલ્પ બૉક્સને ચેક કરવાની જરૂર છે ટૅગ્સ- આ હેડરોનો ઉપયોગ ટૂલ દ્વારા જનરેટ કરાયેલ આઉટપુટ કોષ્ટકોમાં કરવામાં આવશે રીગ્રેશન.
વિકલ્પ ચેકબોક્સ સતત - શૂન્યજો રીગ્રેસન સમીકરણ સ્થિર હોય તો તે સ્થાપિત કરવું જોઈએ bશૂન્યની બરાબર ફરજ પાડવામાં આવે છે.
વિકલ્પ વિશ્વસનીયતા સ્તરજ્યારે 0.95 સિવાયના આત્મવિશ્વાસ સ્તર સાથે રીગ્રેસન ગુણાંક માટે આત્મવિશ્વાસ અંતરાલ બાંધવા જરૂરી હોય ત્યારે સેટ કરવામાં આવે છે, જેનો ઉપયોગ મૂળભૂત રીતે થાય છે. વિકલ્પ બોક્સ ચેક કર્યા પછી વિશ્વસનીયતા સ્તરએક ઇનપુટ ફીલ્ડ ઉપલબ્ધ થાય છે જેમાં એક નવું કોન્ફિડન્સ લેવલ વેલ્યુ દાખલ કરવામાં આવે છે.
વિસ્તારમાં બાકીત્યાં ચાર વિકલ્પો છે: બાકી, પ્રમાણિત બેલેન્સ, બેલેન્સ ચાર્ટઅને પસંદગી શેડ્યૂલ. જો તેમાંથી ઓછામાં ઓછું એક ઇન્સ્ટોલ કરેલું હોય, તો ટેબલ આઉટપુટ પરિણામોમાં દેખાશે સંતુલન ઉપાડ, જે રીગ્રેસન ફંક્શનના મૂલ્યો અને અવશેષો પ્રદર્શિત કરશે - ચલ Y ના પ્રારંભિક મૂલ્યો અને રીગ્રેસન કાર્યના ગણતરી કરેલ મૂલ્યો વચ્ચેનો તફાવત. વિસ્તારમાં સામાન્ય સંભાવનાત્યાં એક વિકલ્પ છે - ; તેનું સ્થાપન આઉટપુટ પરિણામોમાં કોષ્ટક બનાવે છે સંભાવના આઉટપુટઅને અનુરૂપ ગ્રાફના નિર્માણ તરફ દોરી જાય છે.


7.5. ચિત્ર અનુસાર પરિમાણો સેટ કરો. ખાતરી કરો કે Y મૂલ્ય એ પ્રથમ ચલ છે (નામ સાથેના કોષ સહિત), અને X મૂલ્ય એ અન્ય બે ચલો છે (નામવાળા કોષો સહિત). ક્લિક કરો ઠીક છે.

7.6. કોષ્ટકમાં રીગ્રેસન આંકડાનીચેનો ડેટા આપવામાં આવે છે.

બહુવચન આર– આગળની લીટીમાં આપેલ R 2 ના નિર્ધારણના ગુણાંકનું મૂળ. આ સૂચકનું બીજું નામ સહસંબંધ અનુક્રમણિકા અથવા બહુવિધ સહસંબંધ ગુણાંક છે.

આર-ચોરસ- નિર્ધારણનો ગુણાંક R 2 ; ગુણોત્તર તરીકે ગણવામાં આવે છે ચોરસનો રીગ્રેશન સરવાળો(સેલ C12) થી ચોરસનો કુલ સરવાળો(સેલ C14).

સામાન્યકૃત R-ચોરસસૂત્ર દ્વારા ગણતરી

જ્યાં n એ ચલ Y ના મૂલ્યોની સંખ્યા છે, k એ ચલ X ના ઇનપુટ અંતરાલમાં કૉલમની સંખ્યા છે.

માનક ભૂલ– શેષ વિચલનનું મૂળ (સેલ D13).

અવલોકનો- ચલ Y ના મૂલ્યોની સંખ્યા.

7.7. IN વિક્ષેપ ટેબલકૉલમમાં એસ.એસચોરસનો સરવાળો કૉલમમાં આપેલ છે ડીએફ- સ્વતંત્રતાની ડિગ્રીની સંખ્યા. કૉલમમાં એમ.એસ- વિખેરવું. લાઇનમાં રીગ્રેશનકૉલમમાં fરીગ્રેશનના મહત્વને ચકાસવા માટે માપદંડના આંકડાઓની કિંમતની ગણતરી કરવામાં આવી હતી. આ મૂલ્યની ગણતરી રીગ્રેસન વેરિઅન્સ અને રેસિડ્યુઅલ વેરિઅન્સ (કોષો D12 અને D13) ના ગુણોત્તર તરીકે કરવામાં આવે છે. કૉલમમાં મહત્વ એફમાપદંડના આંકડાઓના પ્રાપ્ત મૂલ્યની સંભાવનાની ગણતરી કરવામાં આવે છે. જો આ સંભાવના, ઉદાહરણ તરીકે, 0.05 (આપેલ મહત્વનું સ્તર) કરતાં ઓછી હોય, તો રીગ્રેશનની તુચ્છતા વિશેની પૂર્વધારણા (એટલે ​​​​કે, પૂર્વધારણા કે રીગ્રેસન કાર્યના તમામ ગુણાંક શૂન્ય સમાન છે) નકારવામાં આવે છે અને રીગ્રેસન નોંધપાત્ર ગણવામાં આવે છે. આ ઉદાહરણમાં, રીગ્રેશન નોંધપાત્ર નથી.

7.8. નીચેના કોષ્ટકમાં, કૉલમમાં મતભેદ, રીગ્રેશન ફંક્શનના ગુણાંકના ગણતરી કરેલ મૂલ્યો લખવામાં આવે છે, જ્યારે લીટીમાં હોય છે Y-છેદનમફત શબ્દનું મૂલ્ય લખેલું છે b. કૉલમમાં માનક ભૂલગુણાંકના પ્રમાણભૂત વિચલનોની ગણતરી કરવામાં આવી હતી.
કૉલમમાં t-આંકડાગુણાંકના મૂલ્યોના તેમના પ્રમાણભૂત વિચલનોનો ગુણોત્તર રેકોર્ડ કરવામાં આવે છે. આ રીગ્રેસન ગુણાંકના મહત્વ વિશેની પૂર્વધારણાઓનું પરીક્ષણ કરવા માટે માપદંડના આંકડાઓના મૂલ્યો છે.
કૉલમમાં પી-વેલ્યુમાપદંડના આંકડાઓના મૂલ્યોને અનુરૂપ મહત્વના સ્તરોની ગણતરી કરવામાં આવે છે. જો ગણતરી કરેલ મહત્વ સ્તર નિર્દિષ્ટ મહત્વ સ્તર કરતા ઓછું હોય (ઉદાહરણ તરીકે, 0.05). પછી પૂર્વધારણા કે ગુણાંક શૂન્યથી નોંધપાત્ર રીતે અલગ છે તે સ્વીકારવામાં આવે છે; અન્યથા, અનુમાન કે ગુણાંક શૂન્યથી મામૂલી રીતે અલગ છે તે સ્વીકારવામાં આવે છે. આ ઉદાહરણમાં, માત્ર ગુણાંક bશૂન્યથી નોંધપાત્ર રીતે અલગ, બાકીનું - નજીવું.
કૉલમમાં નીચે 95%અને ટોચના 95% 0.95 ના આત્મવિશ્વાસ સ્તર સાથે આત્મવિશ્વાસ અંતરાલની સીમાઓ આપવામાં આવી છે. આ સીમાઓ સૂત્રોનો ઉપયોગ કરીને ગણવામાં આવે છે
નીચું 95% = ગુણાંક - પ્રમાણભૂત ભૂલ * t α;
અપર 95% = ગુણાંક + માનક ભૂલ * t α.
અહીં t α- ઓર્ડરનો જથ્થો α સ્વતંત્રતાની (n-k-1) ડિગ્રી સાથે વિદ્યાર્થી t વિતરણ. આ કિસ્સામાં α = 0.95. કૉલમમાં વિશ્વાસ અંતરાલોની સીમાઓ એ જ રીતે ગણવામાં આવે છે નીચે 90.0%અને ટોચના 90.0%.

7.9. ટેબલ ધ્યાનમાં લો સંતુલન ઉપાડઆઉટપુટ પરિણામોમાંથી. આ કોષ્ટક આઉટપુટ પરિણામોમાં ત્યારે જ દેખાય છે જ્યારે વિસ્તારમાં ઓછામાં ઓછો એક વિકલ્પ સેટ કરેલ હોય બાકીસંવાદ બોક્સ રીગ્રેશન.

કૉલમમાં અવલોકનચલ મૂલ્યોના સીરીયલ નંબરો આપવામાં આવે છે વાય.
કૉલમમાં આગાહી વાયરીગ્રેશન ફંક્શન y i = f(x i) ના મૂલ્યો ચલના તે મૂલ્યો માટે ગણવામાં આવે છે એક્સ, જે સીરીયલ નંબરને અનુરૂપ છે i કૉલમમાં અવલોકન.
કૉલમમાં બાકીતફાવતો (અવશેષો) ε i =Y-y i , અને કૉલમ સમાવે છે પ્રમાણભૂત બેલેન્સ– સામાન્યકૃત અવશેષો, જેની ગણતરી ε i/s ε રેશિયો તરીકે કરવામાં આવે છે. જ્યાં s ε એ અવશેષોનું પ્રમાણભૂત વિચલન છે. સૂત્રનો ઉપયોગ કરીને s ε મૂલ્યના વર્ગની ગણતરી કરવામાં આવે છે

અવશેષોની સરેરાશ ક્યાં છે. મૂલ્યની ગણતરી વિક્ષેપ કોષ્ટકમાંથી બે મૂલ્યોના ગુણોત્તર તરીકે કરી શકાય છે: ચોરસ અવશેષોનો સરવાળો (સેલ C13) અને પંક્તિમાંથી સ્વતંત્રતાની ડિગ્રી કુલ(સેલ B14).

7.10. કોષ્ટક મૂલ્યો દ્વારા સંતુલન ઉપાડબે પ્રકારના ગ્રાફ બનાવવામાં આવ્યા છે: શેષ ચાર્ટઅને પસંદગીના સમયપત્રક(જો વિસ્તારમાં યોગ્ય વિકલ્પો સેટ કરેલ હોય બાકીસંવાદ બોક્સ રીગ્રેશન). તેઓ દરેક ચલ ઘટક માટે બાંધવામાં આવે છે એક્સઅલગથી

ચાલુ સંતુલન ચાર્ટબેલેન્સ પ્રદર્શિત થાય છે, એટલે કે. મૂળ મૂલ્યો વચ્ચેનો તફાવત વાયઅને ચલ ઘટકના દરેક મૂલ્ય માટે રીગ્રેશન ફંક્શનમાંથી ગણતરી કરવામાં આવે છે એક્સ.

ચાલુ પસંદગીના સમયપત્રકદરેક ચલ ઘટક મૂલ્ય માટે મૂળ Y મૂલ્યો અને ગણતરી કરેલ રીગ્રેશન ફંક્શન મૂલ્યો બંને દર્શાવે છે એક્સ.

7.11. આઉટપુટ પરિણામોનું છેલ્લું કોષ્ટક એ ટેબલ છે સંભાવના આઉટપુટ. જો સંવાદ બોક્સમાં હોય તો તે દેખાય છે રીગ્રેશનવિકલ્પ સ્થાપિત સામાન્ય સંભાવના પ્લોટ.
કૉલમ મૂલ્યો ટકાવારીનીચે પ્રમાણે ગણતરી કરવામાં આવે છે. પગલાની ગણતરી કરવામાં આવે છે h = (1/n)*100%, પ્રથમ મૂલ્ય છે h/2, બાદમાં સમાન છે 100-h/2. બીજા મૂલ્યથી શરૂ કરીને, દરેક અનુગામી મૂલ્ય અગાઉના મૂલ્યની બરાબર છે, જેમાં એક પગલું ઉમેરવામાં આવે છે h.
કૉલમમાં વાયચલ મૂલ્યો આપવામાં આવે છે વાય, ચડતા ક્રમમાં સૉર્ટ કરેલ. આ કોષ્ટકમાંના ડેટાના આધારે, કહેવાતા સામાન્ય વિતરણ ગ્રાફ. તે તમને ચલો વચ્ચેના સંબંધની રેખીયતાની ડિગ્રીનું દૃષ્ટિની આકારણી કરવાની મંજૂરી આપે છે એક્સઅને વાય.


8. ડી વિચલનનું વિશ્લેષણ

8.1. વિશ્લેષણ પેકેજવિભિન્નતાના ત્રણ પ્રકારના વિશ્લેષણ માટે પરવાનગી આપે છે. ચોક્કસ સાધનની પસંદગીનો અભ્યાસ કરવામાં આવતા ડેટા સેટમાં પરિબળોની સંખ્યા અને નમૂનાઓની સંખ્યા દ્વારા નક્કી કરવામાં આવે છે.
પૂર્વધારણાને ચકાસવા માટે વપરાય છે કે સમાન વસ્તીના બે અથવા વધુ નમૂનાઓના માધ્યમ સમાન છે.
પુનરાવર્તનો સાથે દ્વિ-માર્ગી ANOVAઅવિભાજ્ય વિશ્લેષણનું વધુ જટિલ સંસ્કરણ છે જેમાં ડેટાના દરેક જૂથ માટે એક કરતાં વધુ નમૂનાનો સમાવેશ થાય છે.
પુનરાવર્તન વિના દ્વિ-માર્ગી ANOVAવિભિન્નતાનું દ્વિ-માર્ગી વિશ્લેષણ છે જેમાં જૂથ દીઠ એક કરતાં વધુ નમૂનાનો સમાવેશ થતો નથી. તેનો ઉપયોગ પૂર્વધારણાને ચકાસવા માટે થાય છે કે બે અથવા વધુ નમૂનાઓનું માધ્યમ સમાન છે (નમુનાઓ સમાન વસ્તીના છે).

8.2. વન-વે ANOVA

8.2.1. ચાલો વિશ્લેષણ માટે ડેટા તૈયાર કરીએ. એક નવી શીટ બનાવો અને તેમાં કૉલમ કૉપિ કરો A, B, C, D. પ્રથમ બે લીટીઓ દૂર કરો. તૈયાર ડેટાનો ઉપયોગ આચાર કરવા માટે કરી શકાય છે વિભિન્નતાનું એક-માર્ગી વિશ્લેષણ.

8.2.2. દ્વારા પસંદગી સાધનને કૉલ કરો ડેટા > ડેટા એનાલિસિસ > વન-વે એનોવા.ચિત્ર મુજબ ભરો. ક્લિક કરો ઠીક છે.

8.2.3. ટેબલ ધ્યાનમાં લો પરિણામો: તપાસો- પુનરાવર્તનોની સંખ્યા, સરવાળો- પંક્તિ દ્વારા સૂચક મૂલ્યોનો સરવાળો, વિખેરી નાખવું- સૂચકનો આંશિક તફાવત.

8.2.4. ટેબલ વિભિન્નતાનું વિશ્લેષણ: પ્રથમ કૉલમ વિવિધતાનો સ્ત્રોતવિખેરવાનું નામ ધરાવે છે, એસ.એસ- વર્ગ વિચલનોનો સરવાળો, ડીએફ- સ્વતંત્રતાની ડિગ્રી, એમ.એસ- સરેરાશ ચોરસ, એફ-ટેસ્ટવાસ્તવિક F વિતરણ. પી-મૂલ્ય- સમીકરણ દ્વારા પુનઃઉત્પાદિત ભિન્નતા અવશેષોના ભિન્નતા સમાન છે તેવી સંભાવના. તે સંભવિતતા સ્થાપિત કરે છે કે પરિબળો અને પરિણામ વચ્ચેના સંબંધના મેળવેલ માત્રાત્મક નિર્ધારણને રેન્ડમ ગણી શકાય. F- જટિલસૈદ્ધાંતિક F મૂલ્ય છે, જે પછીથી વાસ્તવિક F સાથે સરખામણી કરવામાં આવે છે.

8.2.5. જો અસમાનતા એફ-ટેસ્ટ < F- જટિલ. આ પૂર્વધારણાને નકારવી જોઈએ. આ કિસ્સામાં, નમૂનાઓની સરેરાશ કિંમતો નોંધપાત્ર રીતે અલગ પડે છે.

રીગ્રેસન વિશ્લેષણ એ આંકડાકીય સંશોધન પદ્ધતિ છે જે તમને એક અથવા વધુ સ્વતંત્ર ચલો પર ચોક્કસ પરિમાણની અવલંબન બતાવવાની મંજૂરી આપે છે. પૂર્વ-કમ્પ્યુટર યુગમાં, તેનો ઉપયોગ ખૂબ જ મુશ્કેલ હતો, ખાસ કરીને જ્યારે તે ડેટાના મોટા જથ્થામાં આવે છે. આજે, એક્સેલમાં રીગ્રેસન કેવી રીતે બનાવવું તે શીખ્યા પછી, તમે માત્ર થોડી મિનિટોમાં જટિલ આંકડાકીય સમસ્યાઓ હલ કરી શકો છો. નીચે અર્થશાસ્ત્રના ક્ષેત્રના વિશિષ્ટ ઉદાહરણો છે.

રીગ્રેશનના પ્રકાર

આ ખ્યાલ પોતે 1886 માં ગણિતમાં રજૂ કરવામાં આવ્યો હતો. રીગ્રેશન થાય છે:

  • રેખીય
  • પેરાબોલિક
  • શામક;
  • ઘાતાંકીય;
  • અતિશય
  • પ્રદર્શનકારી
  • લઘુગણક

ઉદાહરણ 1

ચાલો 6 ઔદ્યોગિક સાહસોમાં સરેરાશ પગાર પર છોડનારા ટીમના સભ્યોની સંખ્યાની નિર્ભરતા નક્કી કરવાની સમસ્યાને ધ્યાનમાં લઈએ.

કાર્ય. છ સાહસો પર, સરેરાશ માસિક પગાર અને સ્વૈચ્છિક રીતે છોડી દેનારા કર્મચારીઓની સંખ્યાનું વિશ્લેષણ કરવામાં આવ્યું હતું. ટેબ્યુલર સ્વરૂપમાં અમારી પાસે છે:

છોડનારા લોકોની સંખ્યા

પગાર

30,000 રુબેલ્સ

35,000 રુબેલ્સ

40,000 રુબેલ્સ

45,000 રુબેલ્સ

50,000 રુબેલ્સ

55,000 રુબેલ્સ

60,000 રુબેલ્સ

6 એન્ટરપ્રાઈઝમાં સરેરાશ વેતન પર કામ છોડનારા કામદારોની સંખ્યાની અવલંબન નક્કી કરવાના કાર્ય માટે, રીગ્રેસન મોડેલમાં સમીકરણ Y = a 0 + a 1 x 1 + ... a k x k છે, જ્યાં x i છે ચલોને પ્રભાવિત કરતા, a i એ રીગ્રેશન ગુણાંક છે, અને k એ પરિબળોની સંખ્યા છે.

આ સમસ્યા માટે, Y એ કર્મચારીઓને છોડવાનું સૂચક છે, અને પ્રભાવિત પરિબળ એ પગાર છે, જેને આપણે X દ્વારા દર્શાવીએ છીએ.

એક્સેલ સ્પ્રેડશીટ પ્રોસેસરની ક્ષમતાઓનો ઉપયોગ કરવો

એક્સેલમાં રીગ્રેસન વિશ્લેષણ વર્તમાન ટેબ્યુલર ડેટામાં બિલ્ટ-ઇન ફંક્શન્સ લાગુ કરીને પહેલા હોવું આવશ્યક છે. જો કે, આ હેતુઓ માટે ખૂબ જ ઉપયોગી "વિશ્લેષણ પેકેજ" એડ-ઓનનો ઉપયોગ કરવો વધુ સારું છે. તેને સક્રિય કરવા માટે તમારે આની જરૂર પડશે:

  • "ફાઇલ" ટૅબમાંથી "વિકલ્પો" વિભાગ પર જાઓ;
  • ખુલતી વિંડોમાં, "ઍડ-ઑન્સ" લાઇન પસંદ કરો;
  • "મેનેજમેન્ટ" લાઇનની જમણી બાજુએ, નીચે સ્થિત "ગો" બટન પર ક્લિક કરો;
  • "વિશ્લેષણ પેકેજ" નામની બાજુના બોક્સને ચેક કરો અને "ઓકે" પર ક્લિક કરીને તમારી ક્રિયાઓની પુષ્ટિ કરો.

જો બધું યોગ્ય રીતે કરવામાં આવ્યું હોય, તો એક્સેલ વર્કશીટની ઉપર સ્થિત "ડેટા" ટેબની જમણી બાજુએ આવશ્યક બટન દેખાશે.

એક્સેલ માં

હવે જ્યારે આપણી પાસે ઇકોનોમેટ્રિક ગણતરીઓ હાથ ધરવા માટે તમામ જરૂરી વર્ચ્યુઅલ ટૂલ્સ છે, અમે અમારી સમસ્યા હલ કરવાનું શરૂ કરી શકીએ છીએ. આ કરવા માટે:

  • "ડેટા વિશ્લેષણ" બટન પર ક્લિક કરો;
  • ખુલતી વિંડોમાં, "રીગ્રેશન" બટન પર ક્લિક કરો;
  • દેખાતા ટેબમાં, Y (છોડનારા કર્મચારીઓની સંખ્યા) અને X (તેમના પગાર) માટે મૂલ્યોની શ્રેણી દાખલ કરો;
  • અમે "ઓકે" બટન દબાવીને અમારી ક્રિયાઓની પુષ્ટિ કરીએ છીએ.

પરિણામે, પ્રોગ્રામ રીગ્રેશન વિશ્લેષણ ડેટા સાથે આપમેળે નવી સ્પ્રેડશીટ ભરી દેશે. ધ્યાન આપો! એક્સેલ તમને આ હેતુ માટે તમે જે સ્થાન પસંદ કરો છો તે મેન્યુઅલી સેટ કરવાની પરવાનગી આપે છે. ઉદાહરણ તરીકે, આ એ જ શીટ હોઈ શકે છે જ્યાં Y અને X મૂલ્યો સ્થિત છે, અથવા તો આવા ડેટાને સંગ્રહિત કરવા માટે ખાસ રચાયેલ નવી વર્કબુક પણ હોઈ શકે છે.

R-squared માટે રીગ્રેસન પરિણામોનું વિશ્લેષણ

એક્સેલમાં, વિચારણા હેઠળના ઉદાહરણમાં ડેટાની પ્રક્રિયા દરમિયાન મેળવેલ ડેટા ફોર્મ ધરાવે છે:

સૌ પ્રથમ, તમારે આર-સ્ક્વેર મૂલ્ય પર ધ્યાન આપવું જોઈએ. તે નિર્ધારણના ગુણાંકનું પ્રતિનિધિત્વ કરે છે. આ ઉદાહરણમાં, R-square = 0.755 (75.5%), એટલે કે, મોડેલના ગણતરી કરેલ પરિમાણો 75.5% દ્વારા વિચારણા હેઠળના પરિમાણો વચ્ચેના સંબંધને સમજાવે છે. નિર્ધારણના ગુણાંકનું મૂલ્ય જેટલું ઊંચું છે, પસંદ કરેલ મોડેલ ચોક્કસ કાર્ય માટે વધુ યોગ્ય છે. જ્યારે આર-સ્ક્વેર મૂલ્ય 0.8 થી ઉપર હોય ત્યારે વાસ્તવિક પરિસ્થિતિનું યોગ્ય રીતે વર્ણન કરવાનું માનવામાં આવે છે. જો R-ચોરસ<0,5, то такой анализа регрессии в Excel нельзя считать резонным.

ઓડ્સ વિશ્લેષણ

નંબર 64.1428 બતાવે છે કે જો આપણે વિચારી રહ્યા છીએ તે મોડેલમાં તમામ વેરિયેબલ્સ xi શૂન્ય પર ફરીથી સેટ કરવામાં આવે તો Y ની કિંમત શું હશે. બીજા શબ્દોમાં કહીએ તો, એવી દલીલ કરી શકાય છે કે વિશ્લેષિત પરિમાણનું મૂલ્ય અન્ય પરિબળોથી પણ પ્રભાવિત છે જે ચોક્કસ મોડેલમાં વર્ણવેલ નથી.

સેલ B18 માં સ્થિત આગામી ગુણાંક -0.16285, Y પર ચલ X ના પ્રભાવનું વજન દર્શાવે છે. આનો અર્થ એ છે કે વિચારણા હેઠળના મોડેલની અંદર કર્મચારીઓનો સરેરાશ માસિક પગાર -0.16285 ના વજન સાથે છોડનારાઓની સંખ્યાને અસર કરે છે, એટલે કે. તેના પ્રભાવની ડિગ્રી સંપૂર્ણપણે નાની છે. "-" ચિહ્ન સૂચવે છે કે ગુણાંક નકારાત્મક છે. આ સ્પષ્ટ છે, કારણ કે દરેક જણ જાણે છે કે એન્ટરપ્રાઇઝમાં પગાર જેટલો વધારે છે, ઓછા લોકો રોજગાર કરાર સમાપ્ત કરવાની અથવા છોડવાની ઇચ્છા વ્યક્ત કરે છે.

બહુવિધ રીગ્રેશન

આ શબ્દ ફોર્મના કેટલાક સ્વતંત્ર ચલો સાથેના સંબંધ સમીકરણનો સંદર્ભ આપે છે:

y=f(x 1 +x 2 +…x m) + ε, જ્યાં y પરિણામી લાક્ષણિકતા છે (આશ્રિત ચલ), અને x 1, x 2, …x m એ પરિબળ લાક્ષણિકતાઓ છે (સ્વતંત્ર ચલો).

પરિમાણ અંદાજ

બહુવિધ રીગ્રેશન (MR) માટે, તે ઓછામાં ઓછા ચોરસ પદ્ધતિ (OLS) નો ઉપયોગ કરીને હાથ ધરવામાં આવે છે. Y = a + b 1 x 1 +…+b m x m + ε ફોર્મના રેખીય સમીકરણો માટે આપણે સામાન્ય સમીકરણોની સિસ્ટમ બનાવીએ છીએ (નીચે જુઓ)

પદ્ધતિના સિદ્ધાંતને સમજવા માટે, બે-પરિબળના કેસને ધ્યાનમાં લો. પછી અમારી પાસે સૂત્ર દ્વારા વર્ણવેલ પરિસ્થિતિ છે

અહીંથી આપણને મળે છે:

જ્યાં σ અનુક્રમણિકામાં પ્રતિબિંબિત અનુરૂપ લક્ષણનું વિચલન છે.

OLS પ્રમાણિત સ્કેલ પર MR સમીકરણને લાગુ પડે છે. આ કિસ્સામાં, અમને સમીકરણ મળે છે:

જેમાં t y, t x 1, ... t xm પ્રમાણિત ચલો છે, જેના માટે સરેરાશ મૂલ્યો 0 ની બરાબર છે; β i એ પ્રમાણિત રીગ્રેશન ગુણાંક છે, અને પ્રમાણભૂત વિચલન 1 છે.

મહેરબાની કરીને નોંધ કરો કે આ કિસ્સામાં તમામ β i નોર્મલાઇઝ્ડ અને સેન્ટ્રલાઇઝ્ડ તરીકે ઉલ્લેખિત છે, તેથી તેમની એકબીજા સાથેની સરખામણી સાચી અને સ્વીકાર્ય માનવામાં આવે છે. વધુમાં, સૌથી નીચા βi મૂલ્યો ધરાવતાં પરિબળોને છોડીને પરિબળોને તપાસવાનો રિવાજ છે.

લીનિયર રીગ્રેસન સમીકરણનો ઉપયોગ કરવામાં સમસ્યા

ધારો કે અમારી પાસે છેલ્લા 8 મહિનામાં ચોક્કસ ઉત્પાદન N માટે કિંમતની ગતિશીલતાનું કોષ્ટક છે. 1850 રુબેલ્સ/ટીની કિંમતે તેનો બેચ ખરીદવાની સલાહ પર નિર્ણય લેવો જરૂરી છે.

મહિનાની સંખ્યા

મહિનાનું નામ

ઉત્પાદન કિંમત એન

1750 રુબેલ્સ પ્રતિ ટન

1755 રુબેલ્સ પ્રતિ ટન

1767 રુબેલ્સ પ્રતિ ટન

1760 રુબેલ્સ પ્રતિ ટન

1770 રુબેલ્સ પ્રતિ ટન

1790 રુબેલ્સ પ્રતિ ટન

1810 રુબેલ્સ પ્રતિ ટન

1840 રુબેલ્સ પ્રતિ ટન

એક્સેલ સ્પ્રેડશીટ પ્રોસેસરમાં આ સમસ્યાને ઉકેલવા માટે, તમારે "ડેટા એનાલિસિસ" ટૂલનો ઉપયોગ કરવાની જરૂર છે, જે ઉપર પ્રસ્તુત ઉદાહરણથી પહેલેથી જ જાણીતું છે. આગળ, "રીગ્રેશન" વિભાગ પસંદ કરો અને પરિમાણો સેટ કરો. તે યાદ રાખવું આવશ્યક છે કે "ઇનપુટ અંતરાલ Y" ફીલ્ડમાં આશ્રિત ચલ માટે મૂલ્યોની શ્રેણી દાખલ કરવી આવશ્યક છે (આ કિસ્સામાં, વર્ષના ચોક્કસ મહિનામાં માલની કિંમતો), અને "ઇનપુટ અંતરાલ X" માં - સ્વતંત્ર ચલ (મહિનો નંબર) માટે. "ઓકે" પર ક્લિક કરીને ક્રિયાની પુષ્ટિ કરો. નવી શીટ પર (જો એવું સૂચવવામાં આવ્યું હોય તો) અમે રીગ્રેશન માટે ડેટા મેળવીએ છીએ.

તેનો ઉપયોગ કરીને, અમે y=ax+b ફોર્મનું એક રેખીય સમીકરણ બનાવીએ છીએ, જ્યાં પરિમાણો a અને b એ મહિનાની સંખ્યાના નામ સાથેની રેખાના ગુણાંક છે અને શીટમાંથી ગુણાંક અને રેખાઓ "વાય-છેદન" છે. રીગ્રેસન વિશ્લેષણના પરિણામો. આમ, કાર્ય 3 માટે રેખીય રીગ્રેશન સમીકરણ (LR) આ રીતે લખાયેલ છે:

ઉત્પાદન કિંમત N = 11.714* મહિનાની સંખ્યા + 1727.54.

અથવા બીજગણિતીય સંકેતમાં

y = 11.714 x + 1727.54

પરિણામોનું વિશ્લેષણ

પરિણામી રેખીય રીગ્રેસન સમીકરણ પર્યાપ્ત છે કે કેમ તે નક્કી કરવા માટે, બહુવિધ સહસંબંધ (MCC) અને નિર્ધારણના ગુણાંક તેમજ ફિશર ટેસ્ટ અને સ્ટુડન્ટ ટી ટેસ્ટનો ઉપયોગ કરવામાં આવે છે. રીગ્રેસન પરિણામો સાથે એક્સેલ સ્પ્રેડશીટમાં, તેમને અનુક્રમે બહુવિધ R, R-squared, F-statistic અને t-statistic કહેવામાં આવે છે.

KMC R સ્વતંત્ર અને આશ્રિત ચલો વચ્ચેના સંભવિત સંબંધની નિકટતાનું મૂલ્યાંકન કરવાનું શક્ય બનાવે છે. તેનું ઊંચું મૂલ્ય "મહિનાની સંખ્યા" અને "1 ટન દીઠ રુબેલ્સમાં ઉત્પાદન N ની કિંમત" ચલ વચ્ચે એકદમ મજબૂત જોડાણ સૂચવે છે. જો કે, આ સંબંધનું સ્વરૂપ અજ્ઞાત રહે છે.

નિર્ધારણના ગુણાંક R2 (RI) નો વર્ગ કુલ સ્કેટરના પ્રમાણની સંખ્યાત્મક લાક્ષણિકતા છે અને પ્રાયોગિક ડેટાના કયા ભાગનો સ્કેટર દર્શાવે છે, એટલે કે. આશ્રિત ચલના મૂલ્યો રેખીય રીગ્રેસન સમીકરણને અનુરૂપ છે. વિચારણા હેઠળની સમસ્યામાં, આ મૂલ્ય 84.8% ની બરાબર છે, એટલે કે, પરિણામી SD દ્વારા આંકડાકીય માહિતીનું ઉચ્ચ સ્તરની ચોકસાઈ સાથે વર્ણન કરવામાં આવ્યું છે.

F-આંકડા, જેને ફિશર ટેસ્ટ પણ કહેવાય છે, તેનો ઉપયોગ રેખીય સંબંધના મહત્વનું મૂલ્યાંકન કરવા, તેના અસ્તિત્વની પૂર્વધારણાને રદિયો આપવા અથવા પુષ્ટિ કરવા માટે થાય છે.

(વિદ્યાર્થીઓની કસોટી) રેખીય સંબંધના અજાણ્યા અથવા મુક્ત શબ્દ માટે ગુણાંકના મહત્વનું મૂલ્યાંકન કરવામાં મદદ કરે છે. જો t-test > tcr નું મૂલ્ય હોય, તો રેખીય સમીકરણના મુક્ત પદની તુચ્છતા વિશેની પૂર્વધારણાને નકારી કાઢવામાં આવે છે.

ફ્રી ટર્મ માટે વિચારણા હેઠળની સમસ્યામાં, એક્સેલ ટૂલ્સનો ઉપયોગ કરીને, તે પ્રાપ્ત થયું હતું કે t = 169.20903, અને p = 2.89E-12, એટલે કે, અમારી પાસે શૂન્ય સંભાવના છે કે મુક્ત શબ્દની તુચ્છતા વિશેની સાચી પૂર્વધારણાને નકારી કાઢવામાં આવશે. . અજ્ઞાત t=5.79405, અને p=0.001158 માટે ગુણાંક માટે. બીજા શબ્દોમાં કહીએ તો, અજ્ઞાત માટે ગુણાંકની તુચ્છતા વિશેની સાચી પૂર્વધારણાને નકારી કાઢવામાં આવશે તેવી સંભાવના 0.12% છે.

આમ, એવી દલીલ કરી શકાય છે કે પરિણામી રેખીય રીગ્રેસન સમીકરણ પર્યાપ્ત છે.

શેરના બ્લોક ખરીદવાની શક્યતાની સમસ્યા

એક્સેલમાં બહુવિધ રીગ્રેસન સમાન ડેટા વિશ્લેષણ સાધનનો ઉપયોગ કરીને કરવામાં આવે છે. ચાલો ચોક્કસ એપ્લિકેશન સમસ્યાને ધ્યાનમાં લઈએ.

NNN કંપનીના મેનેજમેન્ટે MMM JSCમાં 20% હિસ્સો ખરીદવાની સલાહ પર નિર્ણય લેવો જોઈએ. પેકેજની કિંમત (SP) 70 મિલિયન યુએસ ડોલર છે. NNN નિષ્ણાતોએ સમાન વ્યવહારો પર ડેટા એકત્રિત કર્યો છે. આવા પરિમાણો અનુસાર શેરના બ્લોકની કિંમતનું મૂલ્યાંકન કરવાનો નિર્ણય લેવામાં આવ્યો હતો, જે લાખો યુએસ ડોલરમાં વ્યક્ત કરવામાં આવ્યો હતો, જેમ કે:

  • ચૂકવવાપાત્ર એકાઉન્ટ્સ (VK);
  • વાર્ષિક ટર્નઓવર વોલ્યુમ (VO);
  • પ્રાપ્તિપાત્ર એકાઉન્ટ્સ (VD);
  • સ્થિર સંપત્તિની કિંમત (COF).

વધુમાં, હજારો યુએસ ડોલરમાં એન્ટરપ્રાઇઝના વેતન બાકી (V3 P) ના પરિમાણનો ઉપયોગ થાય છે.

એક્સેલ સ્પ્રેડશીટ પ્રોસેસરનો ઉપયોગ કરીને ઉકેલ

સૌ પ્રથમ, તમારે સ્રોત ડેટાનું કોષ્ટક બનાવવાની જરૂર છે. તે આના જેવું દેખાય છે:

  • "ડેટા એનાલિસિસ" વિન્ડોને કૉલ કરો;
  • "રીગ્રેશન" વિભાગ પસંદ કરો;
  • "ઇનપુટ અંતરાલ Y" બૉક્સમાં, કૉલમ Gમાંથી આશ્રિત ચલોના મૂલ્યોની શ્રેણી દાખલ કરો;
  • “ઇનપુટ ઇન્ટરવલ X” વિન્ડોની જમણી બાજુએ લાલ તીર સાથેના આઇકન પર ક્લિક કરો અને શીટ પર કૉલમ B, C, D, Fમાંથી તમામ મૂલ્યોની શ્રેણીને હાઇલાઇટ કરો.

"નવી વર્કશીટ" આઇટમને ચિહ્નિત કરો અને "ઓકે" ક્લિક કરો.

આપેલ સમસ્યા માટે રીગ્રેસન વિશ્લેષણ મેળવો.

પરિણામો અને તારણોનો અભ્યાસ

અમે એક્સેલ સ્પ્રેડશીટ પર ઉપર રજૂ કરેલા ગોળાકાર ડેટામાંથી રીગ્રેસન સમીકરણ "એકત્ર" કરીએ છીએ:

SP = 0.103*SOF + 0.541*VO - 0.031*VK +0.405*VD +0.691*VZP - 265.844.

વધુ પરિચિત ગાણિતિક સ્વરૂપમાં, તે આ રીતે લખી શકાય છે:

y = 0.103*x1 + 0.541*x2 - 0.031*x3 +0.405*x4 +0.691*x5 - 265.844

MMM JSC માટેનો ડેટા કોષ્ટકમાં પ્રસ્તુત છે:

તેમને રીગ્રેશન સમીકરણમાં બદલીને, અમને 64.72 મિલિયન યુએસ ડોલરનો આંકડો મળે છે. આનો અર્થ એ થયો કે MMM JSC ના શેર ખરીદવા યોગ્ય નથી, કારણ કે તેમની કિંમત 70 મિલિયન યુએસ ડૉલર ખૂબ જ ફૂલેલી છે.

જેમ તમે જોઈ શકો છો, એક્સેલ સ્પ્રેડશીટ પ્રોસેસરનો ઉપયોગ અને રીગ્રેસન સમીકરણે ખૂબ જ ચોક્કસ વ્યવહારની શક્યતા અંગે જાણકાર નિર્ણય લેવાનું શક્ય બનાવ્યું છે.

હવે તમે જાણો છો કે રીગ્રેશન શું છે. ઉપર ચર્ચા કરેલ એક્સેલ ઉદાહરણો તમને અર્થશાસ્ત્રના ક્ષેત્રમાં વ્યવહારુ સમસ્યાઓ ઉકેલવામાં મદદ કરશે.

એક્સેલ વિશ્લેષણ પેકેજ (રીગ્રેશન) નો ઉપયોગ કરતી વખતે રેખીય રીગ્રેસનનું નિર્માણ, તેના પરિમાણોનું મૂલ્યાંકન અને તેનું મહત્વ વધુ ઝડપથી કરી શકાય છે. ચાલો સામાન્ય કિસ્સામાં પ્રાપ્ત પરિણામોના અર્થઘટનને ધ્યાનમાં લઈએ ( kસમજૂતીત્મક ચલો) ઉદાહરણ અનુસાર 3.6.

કોષ્ટકમાં રીગ્રેસન આંકડાનીચેના મૂલ્યો આપવામાં આવે છે:

બહુવિધ આર - બહુવિધ સહસંબંધ ગુણાંક;

આર- ચોરસ- નિર્ધારણ ગુણાંક આર 2 ;

નોર્મલાઇઝ્ડ આર - ચોરસ- સમાયોજિત આર 2 સ્વતંત્રતાની ડિગ્રીની સંખ્યા માટે સમાયોજિત;

માનક ભૂલ- રીગ્રેસન માનક ભૂલ એસ;

અવલોકનો -અવલોકનોની સંખ્યા n.

કોષ્ટકમાં વિભિન્નતાનું વિશ્લેષણઆપવામાં આવે છે:

1. કૉલમ ડીએફ - સમાન સ્વતંત્રતાની ડિગ્રીની સંખ્યા

શબ્દમાળા માટે રીગ્રેશન ડીએફ = k;

શબ્દમાળા માટે બાકીડીએફ = nk – 1;

શબ્દમાળા માટે કુલડીએફ = n– 1.

2. કૉલમ એસએસ -સમાન વર્ગના વિચલનોનો સરવાળો

શબ્દમાળા માટે રીગ્રેશન ;

શબ્દમાળા માટે બાકી ;

શબ્દમાળા માટે કુલ .

3. કૉલમ એમ.એસફોર્મ્યુલા દ્વારા નિર્ધારિત ભિન્નતા એમ.એસ = એસ.એસ/ડીએફ:

શબ્દમાળા માટે રીગ્રેશન- પરિબળ વિક્ષેપ;

શબ્દમાળા માટે બાકી- શેષ તફાવત.

4. કૉલમ એફ - ગણતરી કરેલ મૂલ્ય એફ-સૂત્રનો ઉપયોગ કરીને ગણતરી કરેલ માપદંડ

એફ = એમ.એસ(રીગ્રેશન)/ એમ.એસ(બાકી).

5. કૉલમ મહત્વ એફ - ગણતરીને અનુરૂપ મહત્વ સ્તરનું મૂલ્ય એફ- આંકડા .

મહત્વ એફ= FDIST( F-આંકડા ડીએફ(રીગ્રેશન), ડીએફ(બાકી)).

જો મહત્વ એફ < стандартного уровня значимости, то આર 2 આંકડાકીય રીતે નોંધપાત્ર છે.

મતભેદ માનક ભૂલ t-આંકડા પી-મૂલ્ય નીચે 95% ટોચના 95%
વાય 65,92 11,74 5,61 0,00080 38,16 93,68
એક્સ 0,107 0,014 7,32 0,00016 0,0728 0,142

આ કોષ્ટક બતાવે છે:

1. મતભેદ- ગુણાંક મૂલ્યો a, b.

2. માનક ભૂલ- રીગ્રેસન ગુણાંકની પ્રમાણભૂત ભૂલો એસ એ, એસ.બી.



3. ટી-આંકડા- ગણતરી કરેલ મૂલ્યો t - સૂત્ર દ્વારા ગણતરી કરાયેલ માપદંડ:

t-statistic = ગુણાંક/માનક ભૂલ.

4.આર-મૂલ્ય (મહત્વ t) ગણતરીને અનુરૂપ મહત્વ સ્તરનું મૂલ્ય છે ટી-આંકડા

આર-મૂલ્ય = વિદ્યાર્થી(t- આંકડા, ડીએફ(બાકી)).

જો આર- અર્થ< стандартного уровня значимости, то соответствующий коэффициент статистически значим.

5. બોટમ 95% અને ટોપ 95%- સૈદ્ધાંતિક રેખીય રીગ્રેશન સમીકરણના ગુણાંક માટે 95% આત્મવિશ્વાસ અંતરાલની નીચલી અને ઉપલી મર્યાદા.

બાકીના પાછા ખેંચવા
અવલોકન આગાહી વાય અવશેષો ઇ
72,70 -29,70
82,91 -20,91
94,53 -4,53
105,72 5,27
117,56 12,44
129,70 19,29
144,22 20,77
166,49 24,50
268,13 -27,13

કોષ્ટકમાં બાકીના પાછા ખેંચવાસૂચવ્યું:

કૉલમમાં અવલોકન- અવલોકન નંબર;

કૉલમમાં ભાખ્યું y - આશ્રિત ચલના ગણતરી કરેલ મૂલ્યો;

કૉલમમાં બાકી - આશ્રિત ચલના અવલોકન કરેલ અને ગણતરી કરેલ મૂલ્યો વચ્ચેનો તફાવત.

ઉદાહરણ 3.6.ખોરાકના ખર્ચ પર ડેટા (પરંપરાગત એકમો) છે yઅને માથાદીઠ આવક xપરિવારોના નવ જૂથો માટે:

x
y

એક્સેલ વિશ્લેષણ પેકેજ (રીગ્રેશન) ના પરિણામોનો ઉપયોગ કરીને, અમે માથાદીઠ આવક પર ખાદ્ય ખર્ચની નિર્ભરતાનું વિશ્લેષણ કરીશું.

રીગ્રેસન વિશ્લેષણના પરિણામો સામાન્ય રીતે ફોર્મમાં લખવામાં આવે છે:

જ્યાં રીગ્રેસન ગુણાંકની પ્રમાણભૂત ભૂલો કૌંસમાં દર્શાવેલ છે.

રીગ્રેસન ગુણાંક = 65,92 અને બી= 0.107. વચ્ચે સંચારની દિશા yઅને xરીગ્રેસન ગુણાંકની નિશાની નક્કી કરે છે b= 0.107, એટલે કે. જોડાણ સીધું અને સકારાત્મક છે. ગુણાંક b= 0.107 દર્શાવે છે કે 1 પરંપરાગત દ્વારા માથાદીઠ આવકમાં વધારો સાથે. એકમો ખોરાકના ખર્ચમાં 0.107 પરંપરાગત એકમોનો વધારો થાય છે. એકમો

ચાલો પરિણામી મોડેલના ગુણાંકના મહત્વનું મૂલ્યાંકન કરીએ. ગુણાંકનું મહત્વ ( a, b) દ્વારા તપાસવામાં આવે છે t-પરીક્ષણ:

P-મૂલ્ય ( a) = 0,00080 < 0,01 < 0,05

P-મૂલ્ય ( b) = 0,00016 < 0,01 < 0,05,

તેથી, ગુણાંક ( a, b) 1% સ્તરે નોંધપાત્ર છે, અને તેથી પણ વધુ 5% મહત્વના સ્તરે. આમ, રીગ્રેસન ગુણાંક નોંધપાત્ર છે અને મોડેલ મૂળ ડેટા માટે પર્યાપ્ત છે.

રીગ્રેસન અંદાજ પરિણામો માત્ર રીગ્રેસન ગુણાંકના પ્રાપ્ત મૂલ્યો સાથે જ નહીં, પરંતુ તેમના ચોક્કસ સમૂહ (વિશ્વાસ અંતરાલ) સાથે પણ સુસંગત છે. 95% સંભાવના સાથે, ગુણાંક માટે આત્મવિશ્વાસ અંતરાલ (38.16 – 93.68) છે aઅને (0.0728 – 0.142) માટે b

મોડેલની ગુણવત્તાનું મૂલ્યાંકન નિર્ધારણના ગુણાંક દ્વારા કરવામાં આવે છે આર 2 .

તીવ્રતા આર 2 = 0.884 નો અર્થ છે કે માથાદીઠ આવકનું પરિબળ ખોરાક ખર્ચમાં 88.4% વિવિધતા (સ્કેટર) સમજાવી શકે છે.

મહત્વ આર 2 દ્વારા ચકાસાયેલ છે F-પરીક્ષણ: મહત્વ એફ = 0,00016 < 0,01 < 0,05, следовательно, આર 2 એ 1% સ્તરે નોંધપાત્ર છે, અને તેથી પણ વધુ 5% મહત્વના સ્તરે.

જોડી પ્રમાણે રેખીય રીગ્રેશનના કિસ્સામાં, સહસંબંધ ગુણાંકને આ રીતે વ્યાખ્યાયિત કરી શકાય છે . સહસંબંધ ગુણાંકનું પ્રાપ્ત મૂલ્ય સૂચવે છે કે ખાદ્ય ખર્ચ અને માથાદીઠ આવક વચ્ચેનો સંબંધ ખૂબ નજીકનો છે.

જટિલ ઘટનાઓનો અભ્યાસ કરતી વખતે, બે કરતાં વધુ રેન્ડમ પરિબળો ધ્યાનમાં લેવા જરૂરી છે. આ પરિબળો વચ્ચેના સંબંધની પ્રકૃતિનો સાચો ખ્યાલ ત્યારે જ મેળવી શકાય છે જો વિચારણા હેઠળના તમામ રેન્ડમ પરિબળોને એકસાથે તપાસવામાં આવે. ત્રણ અથવા વધુ અવ્યવસ્થિત પરિબળોનો સંયુક્ત અભ્યાસ સંશોધકને અભ્યાસ કરવામાં આવી રહેલી ઘટનાઓ વચ્ચેના કારણભૂત અવલંબન વિશે વધુ કે ઓછા વાજબી ધારણાઓ સ્થાપિત કરવાની મંજૂરી આપશે. બહુવિધ સંબંધોનું એક સરળ સ્વરૂપ એ ત્રણ લાક્ષણિકતાઓ વચ્ચેનો રેખીય સંબંધ છે. રેન્ડમ પરિબળો તરીકે સૂચવવામાં આવે છે એક્સ 1 , એક્સ 2 અને એક્સ 3. વચ્ચે જોડી કરેલ સહસંબંધ ગુણાંક એક્સ 1 અને એક્સ 2 તરીકે સૂચવવામાં આવે છે આર 12, અનુક્રમે વચ્ચે એક્સ 1 અને એક્સ 3 - આર 12, વચ્ચે એક્સ 2 અને એક્સ 3 - આર 23. ત્રણ લાક્ષણિકતાઓ વચ્ચેના રેખીય સંબંધની નિકટતાના માપ તરીકે, બહુવિધ સહસંબંધ ગુણાંકનો ઉપયોગ કરવામાં આવે છે. આર 1 ּ 23, આર 2 ּ 13 , આર 3 ּ 12 અને આંશિક સહસંબંધ ગુણાંક, સૂચિત આર 12.3 , આર 13.2 , આર 23.1 .

ત્રણ પરિબળોનો બહુવિધ સહસંબંધ ગુણાંક R 1.23 એ એક પરિબળ (બિંદુ પહેલાનો અનુક્રમણિકા) અને અન્ય બે પરિબળો (બિંદુ પછીના સૂચકાંકો) ના સંયોજન વચ્ચેના રેખીય સંબંધની નિકટતાનું સૂચક છે.

ગુણાંક R ના મૂલ્યો હંમેશા 0 થી 1 ની રેન્જમાં હોય છે. જેમ જેમ R એકની નજીક આવે છે, ત્રણ લાક્ષણિકતાઓ વચ્ચેના રેખીય સંબંધની ડિગ્રી વધે છે.

બહુવિધ સહસંબંધ ગુણાંક વચ્ચે, દા.ત. આર 2 ּ 13 , અને બે જોડી સહસંબંધ ગુણાંક આર 12 અને આર 23 ત્યાં એક સંબંધ છે: દરેક જોડી કરેલ ગુણાંક સંપૂર્ણ મૂલ્યથી વધી શકતો નથી આર 2 ּ 13 .

જોડી સહસંબંધ ગુણાંક r 12, r 13 અને r 23 ના જાણીતા મૂલ્યો સાથે બહુવિધ સહસંબંધ ગુણાંકની ગણતરી માટેના સૂત્રોનું સ્વરૂપ છે:

ચોરસ બહુવિધ સહસંબંધ ગુણાંક આર 2 કહેવાય છે બહુવિધ નિર્ધારણનો ગુણાંક.તે અભ્યાસ કરવામાં આવતા પરિબળોને કારણે આશ્રિત ચલમાં ભિન્નતાનું પ્રમાણ દર્શાવે છે.

દ્વારા બહુવિધ સહસંબંધનું મહત્વ આંકવામાં આવે છે એફ- માપદંડ:

n -નમૂનાનું કદ; k -પરિબળોની સંખ્યા. અમારા કિસ્સામાં k = 3.

વસ્તીમાં બહુવિધ સહસંબંધ ગુણાંકની સમાનતા વિશે શૂન્ય પૂર્વધારણા ( h o:આર=0) સ્વીકારવામાં આવે છે જો f f<f t, અને જો નકારવામાં આવે છે
f f ³ fટી.

સૈદ્ધાંતિક મૂલ્ય f- માટે માપદંડ નક્કી કરવામાં આવે છે વિ 1 = k- 1 અને વિ 2 = n - kસ્વતંત્રતાની ડિગ્રી અને સ્વીકૃત મહત્વ સ્તર a (પરિશિષ્ટ 1).

બહુવિધ સહસંબંધ ગુણાંકની ગણતરીનું ઉદાહરણ. પરિબળો વચ્ચેના સંબંધનો અભ્યાસ કરતી વખતે, જોડી સહસંબંધ ગુણાંક મેળવવામાં આવ્યા હતા ( n =15): આર 12 ==0.6; g 13 = 0.3; આર 23 = - 0,2.

લક્ષણની અવલંબન શોધવા માટે તે જરૂરી છે એક્સ 2 સાઇન થી એક્સ 1 અને એક્સ 3, એટલે કે બહુવિધ સહસંબંધ ગુણાંકની ગણતરી કરો:

કોષ્ટક મૂલ્ય એફ- n 1 = 2 અને n 2 = 15 – 3 = 12 ડિગ્રી સ્વતંત્રતા સાથે a = 0.05 સાથે માપદંડ એફ 0.05 = 3.89 અને a = 0.01 પર એફ 0,01 = 6,93.

આમ, ચિહ્નો વચ્ચેનો સંબંધ આર 2.13 = 0.74 એ નોંધપાત્ર છે
1% મહત્વ સ્તર એફ f > એફ 0,01 .

બહુવિધ નિર્ધારણના ગુણાંક દ્વારા અભિપ્રાય આર 2 = (0.74) 2 = 0.55, લક્ષણ વિવિધતા એક્સ 2 એ અભ્યાસ કરવામાં આવતા પરિબળોની અસર સાથે 55% સંકળાયેલ છે, અને 45% વિવિધતા (1-R 2) આ ચલોના પ્રભાવ દ્વારા સમજાવી શકાતી નથી.

આંશિક રેખીય સહસંબંધ

આંશિક સહસંબંધ ગુણાંકએક સૂચક છે જે બે લાક્ષણિકતાઓના જોડાણની ડિગ્રીને માપે છે.

ગાણિતિક આંકડા તમને વિશેષ પ્રયોગ કર્યા વિના, પરંતુ જોડી કરેલ સહસંબંધ ગુણાંકનો ઉપયોગ કરીને, ત્રીજાના સ્થિર મૂલ્ય સાથે બે લાક્ષણિકતાઓ વચ્ચે સહસંબંધ સ્થાપિત કરવાની મંજૂરી આપે છે. આર 12 , આર 13 , આર 23 .

આંશિક સહસંબંધ ગુણાંકની ગણતરી સૂત્રોનો ઉપયોગ કરીને કરવામાં આવે છે:

ડોટ પહેલાની સંખ્યા સૂચવે છે કે કઈ વિશેષતાઓ સંબંધનો અભ્યાસ કરવામાં આવી રહ્યો છે, અને બિંદુ પછીની સંખ્યા સૂચવે છે કે કઈ વિશેષતાનો પ્રભાવ બાકાત રાખવામાં આવ્યો છે (નાબૂદ). આંશિક સહસંબંધ માટે ભૂલ અને મહત્વનો માપદંડ જોડી સહસંબંધ માટે સમાન સૂત્રોનો ઉપયોગ કરીને નક્કી કરવામાં આવે છે:

.

સૈદ્ધાંતિક મૂલ્ય ટી-માટે માપદંડ નક્કી કરવામાં આવે છે વિ = n- સ્વતંત્રતાની 2 ડિગ્રી અને સ્વીકૃત મહત્વ સ્તર a (પરિશિષ્ટ 1).

નલ પૂર્વધારણા કે વસ્તીમાં આંશિક સહસંબંધ ગુણાંક શૂન્ય સમાન છે ( એચ ઓ: આર= 0) સ્વીકારવામાં આવે છે જો t f< t t, અને જો નકારવામાં આવે છે
t f ³ tટી.

આંશિક ગુણાંક -1 અને +1 ની વચ્ચેના મૂલ્યો લઈ શકે છે. ખાનગી નિર્ધારણના ગુણાંકઆંશિક સહસંબંધ ગુણાંકના વર્ગીકરણ દ્વારા જોવા મળે છે:

ડી 12.3 = આર 2 12ּ3 ;ડી 13.2 = આર 2 13ּ2 ;ડી 23ּ1 =આર 2 23ּ1 .

અસરકારક લક્ષણ પર વ્યક્તિગત પરિબળોના આંશિક પ્રભાવની ડિગ્રી નક્કી કરવી જ્યારે આ સહસંબંધને વિકૃત કરે છે તેવા અન્ય લક્ષણો સાથેના તેના જોડાણને બાકાત (દૂર કરીને) ઘણી વાર ખૂબ જ રસપ્રદ હોય છે. કેટલીકવાર એવું બને છે કે દૂર કરેલી લાક્ષણિકતાના સતત મૂલ્ય સાથે, અન્ય લાક્ષણિકતાઓની પરિવર્તનશીલતા પર તેના આંકડાકીય પ્રભાવને ધ્યાનમાં લેવું અશક્ય છે. આંશિક સહસંબંધ ગુણાંકની ગણતરી માટેની તકનીકને સમજવા માટે, ઉદાહરણનો વિચાર કરો. ત્રણ વિકલ્પો છે એક્સ, વાયઅને ઝેડ. નમૂનાના કદ માટે n= 180 જોડી સહસંબંધ ગુણાંક નક્કી કરવામાં આવે છે

r xy = 0,799; r xz = 0,57; r yz = 0,507.

ચાલો આંશિક સહસંબંધ ગુણાંક નક્કી કરીએ:

પરિમાણ વચ્ચે આંશિક સહસંબંધ ગુણાંક એક્સઅને વાય ઝેડ (આર xyּz = 0.720) દર્શાવે છે કે એકંદર સહસંબંધમાં આ લાક્ષણિકતાઓ વચ્ચેના સંબંધનો માત્ર એક નાનો ભાગ ( r xy= 0.799) ત્રીજા લાક્ષણિકતાના પ્રભાવને કારણે છે ( ઝેડ). પરિમાણ વચ્ચેના આંશિક સહસંબંધ ગુણાંક અંગે સમાન નિષ્કર્ષ કાઢવો આવશ્યક છે એક્સઅને પરિમાણ ઝેડસતત પરિમાણ મૂલ્ય સાથે વાય (આરએક્સ zּу = 0.318 અને r xz= 0.57). તેનાથી વિપરીત, પરિમાણો વચ્ચેનો આંશિક સહસંબંધ ગુણાંક વાયઅને ઝેડસતત પરિમાણ મૂલ્ય સાથે X r yz ּ x= 0.105 એ એકંદર સહસંબંધ ગુણાંક r y થી નોંધપાત્ર રીતે અલગ છે z = 0.507. આના પરથી તે સ્પષ્ટ છે કે જો તમે સમાન પરિમાણ મૂલ્ય સાથે ઑબ્જેક્ટ્સ પસંદ કરો છો એક્સ, પછી ચિહ્નો વચ્ચેનો સંબંધ વાયઅને ઝેડતેઓ ખૂબ જ નબળા હશે, કારણ કે આ સંબંધનો નોંધપાત્ર ભાગ પરિમાણમાં ભિન્નતાને કારણે છે એક્સ.

કેટલાક સંજોગોમાં, આંશિક સહસંબંધ ગુણાંક જોડી એકના સાઇનથી વિરુદ્ધ હોઈ શકે છે.

ઉદાહરણ તરીકે, લાક્ષણિકતાઓ વચ્ચેના સંબંધનો અભ્યાસ કરતી વખતે એક્સ, વાયઅને ઝેડ- જોડી કરેલ સહસંબંધ ગુણાંક મેળવવામાં આવ્યા હતા (સાથે n = 100): આર xy = 0.6; આરએક્સ z= 0,9;
r y z = 0,4.

ત્રીજા લાક્ષણિકતાના પ્રભાવને બાદ કરતા આંશિક સહસંબંધ ગુણાંક:

ઉદાહરણ બતાવે છે કે જોડી ગુણાંક અને આંશિક સહસંબંધ ગુણાંકના મૂલ્યો ચિહ્નમાં ભિન્ન છે.

આંશિક સહસંબંધ પદ્ધતિ બીજા ક્રમના આંશિક સહસંબંધ ગુણાંકની ગણતરી કરવાનું શક્ય બનાવે છે. આ ગુણાંક ત્રીજા અને ચોથાના સતત મૂલ્ય સાથે પ્રથમ અને બીજી લાક્ષણિકતાઓ વચ્ચેનો સંબંધ સૂચવે છે. બીજા-ક્રમના આંશિક ગુણાંકનું નિર્ધારણ સૂત્રનો ઉપયોગ કરીને પ્રથમ-ક્રમના આંશિક ગુણાંક પર આધારિત છે:

જ્યાં આર 12 . 4 , આર 13-4, આર 23 ּ4 - આંશિક ગુણાંક, જેનું મૂલ્ય આંશિક ગુણાંક સૂત્ર દ્વારા નક્કી કરવામાં આવે છે, જોડી સહસંબંધ ગુણાંકનો ઉપયોગ કરીને આર 12 , આર 13 , આર 14 , આર 23 , આર 24 , આર 34 .

ત્રણ ચલોનો બહુવિધ સહસંબંધ ગુણાંક એ એક લાક્ષણિકતા (ડૅશ પહેલાંનો અનુક્રમણિકા અક્ષર) અને અન્ય બે લાક્ષણિકતાઓ (ડૅશ પછીનો અનુક્રમણિકા અક્ષર) ના સંયોજન વચ્ચેના રેખીય સંબંધની નિકટતાનું સૂચક છે:

; (12.7)

(12.8)

આ સૂત્રો જોડી સહસંબંધ ગુણાંકના જાણીતા મૂલ્યો સાથે બહુવિધ સહસંબંધ ગુણાંકની ગણતરી કરવાનું સરળ બનાવે છે r xy, r xz અને r yz.

ગુણાંક આરનકારાત્મક નથી અને હંમેશા 0 થી 1 સુધીની હોય છે. જેમ જેમ તમે સંપર્ક કરો છો આરએક માટે, ત્રણ લાક્ષણિકતાઓ વચ્ચેના રેખીય જોડાણની ડિગ્રી વધે છે. બહુવિધ સહસંબંધ ગુણાંક વચ્ચે, દા.ત. R y-xz, અને બે જોડી સહસંબંધ ગુણાંક r yxઅને r yzનીચેનો સંબંધ છે: દરેક જોડી કરેલ ગુણાંક સંપૂર્ણ મૂલ્યથી વધી શકતો નથી R y-xz.

ચોરસ બહુવિધ સહસંબંધ ગુણાંક આર 2બહુવિધ નિર્ધારણનો ગુણાંક કહેવાય છે. તે અભ્યાસ કરવામાં આવતા પરિબળોના પ્રભાવ હેઠળ આશ્રિત ચલમાં વિવિધતાનું પ્રમાણ દર્શાવે છે.

દ્વારા બહુવિધ સહસંબંધનું મહત્વ આંકવામાં આવે છે
એફ- માપદંડ:

, (12.9)

n- નમૂનાનું કદ,

k- ચિહ્નોની સંખ્યા; અમારા કિસ્સામાં k = 3.

સૈદ્ધાંતિક મૂલ્ય એફ- માપદંડ માટે અરજી કોષ્ટકમાંથી લેવામાં આવે છે ν 1 = k-1 અને ν 2 = n–kસ્વતંત્રતાની ડિગ્રી અને સ્વીકૃત મહત્વ સ્તર. નલ પૂર્વધારણા કે વસ્તીમાં બહુવિધ સહસંબંધ ગુણાંક શૂન્ય સમાન છે ( H0:R= 0) સ્વીકારવામાં આવે છે જો F હકીકત.< F табл . અને જો નકારવામાં આવે છે F હકીકત. ≥ F ટેબલ.

કામનો અંત -

આ વિષય વિભાગનો છે:

ગાણિતિક આંકડા

શૈક્ષણિક સંસ્થા.. ગોમેલ સ્ટેટ યુનિવર્સિટી.. ફ્રાન્સિસ સ્કેરીના યુ એમ ઝુચેન્કો પછી નામ આપવામાં આવ્યું.

જો તમને આ વિષય પર વધારાની સામગ્રીની જરૂર હોય, અથવા તમે જે શોધી રહ્યા હતા તે તમને મળ્યું નથી, તો અમે અમારા કાર્યોના ડેટાબેઝમાં શોધનો ઉપયોગ કરવાની ભલામણ કરીએ છીએ:

પ્રાપ્ત સામગ્રી સાથે અમે શું કરીશું:

જો આ સામગ્રી તમારા માટે ઉપયોગી હતી, તો તમે તેને સામાજિક નેટવર્ક્સ પર તમારા પૃષ્ઠ પર સાચવી શકો છો:

આ વિભાગના તમામ વિષયો:

ટ્યુટોરીયલ
વિશેષતામાં અભ્યાસ કરતા યુનિવર્સિટીના વિદ્યાર્થીઓ માટે 1-31 01 01 “બાયોલોજી” ગોમેલ 2010

ગાણિતિક આંકડાઓનો વિષય અને પદ્ધતિ
ગાણિતિક આંકડાશાસ્ત્રનો વિષય જીવવિજ્ઞાન, અર્થશાસ્ત્ર, ટેકનોલોજી અને અન્ય ક્ષેત્રોમાં સામૂહિક ઘટનાના ગુણધર્મોનો અભ્યાસ છે. આ ઘટનાઓ સામાન્ય રીતે વિવિધતા (ભિન્નતા)ને કારણે જટિલ તરીકે રજૂ કરવામાં આવે છે.

રેન્ડમ ઇવેન્ટનો ખ્યાલ
સામૂહિક ઘટનાનો અભ્યાસ કરવાની પદ્ધતિના મુખ્ય ઘટક તરીકે આંકડાકીય ઇન્ડક્શન અથવા આંકડાકીય તારણો, તેમની પોતાની વિશિષ્ટ વિશેષતાઓ ધરાવે છે. આંકડાકીય તારણો સંખ્યાત્મક સાથે બનાવવામાં આવે છે

રેન્ડમ ઘટનાની સંભાવના
અવ્યવસ્થિત ઘટનાની સંખ્યાત્મક લાક્ષણિકતા કે જેમાં ગુણધર્મ હોય કે કોઈપણ પર્યાપ્ત મોટી શ્રેણીના પરીક્ષણો માટે ઘટનાની આવર્તન આ લાક્ષણિકતાથી થોડી જ અલગ હોય તેને કહેવાય છે.

સંભાવનાઓની ગણતરી
ઘણીવાર એકસાથે સંભાવનાઓને ઉમેરવા અને ગુણાકાર કરવાની જરૂર હોય છે. ઉદાહરણ તરીકે, તમારે એક જ સમયે 2 ડાઇસ રોલ કરતી વખતે 5 પોઇન્ટ મેળવવાની સંભાવના નક્કી કરવાની જરૂર છે. જરૂરી રકમ સંભવ છે

રેન્ડમ ચલનો ખ્યાલ
સંભાવનાની વિભાવનાને વ્યાખ્યાયિત કર્યા પછી અને તેના મુખ્ય ગુણધર્મોને સ્પષ્ટ કર્યા પછી, ચાલો આપણે સંભાવના સિદ્ધાંતના સૌથી મહત્વપૂર્ણ ખ્યાલોમાંથી એકને ધ્યાનમાં લઈએ - રેન્ડમ ચલનો ખ્યાલ.

ચાલો તેને પરિણામે માની લઈએ
અલગ રેન્ડમ ચલો

રેન્ડમ ચલ અલગ હોય છે જો તેના સંભવિત મૂલ્યોનો સમૂહ મર્યાદિત હોય અથવા ઓછામાં ઓછો ગણી શકાય. ધારો કે રેન્ડમ ચલ X મૂલ્યો x1 લઈ શકે છે
સતત રેન્ડમ ચલો

અગાઉના પેટાવિભાગમાં ચર્ચા કરવામાં આવેલ અલગ રેન્ડમ ચલોથી વિપરીત, સતત રેન્ડમ ચલના સંભવિત મૂલ્યોનો સમૂહ માત્ર મર્યાદિત જ નથી, પણ તેને આધીન પણ નથી.
અપેક્ષા અને ભિન્નતા

ઘણીવાર એક અથવા બે સંખ્યાત્મક સૂચકાંકોનો ઉપયોગ કરીને રેન્ડમ ચલના વિતરણને લાક્ષણિકતા આપવાની જરૂર હોય છે જે આ વિતરણના સૌથી આવશ્યક ગુણધર્મોને વ્યક્ત કરે છે. જેમ કે
પળો

રેન્ડમ ચલના વિતરણની કહેવાતી ક્ષણો ગાણિતિક આંકડાઓમાં ખૂબ મહત્વ ધરાવે છે. ગાણિતિક અપેક્ષામાં, રેન્ડમ ચલના મોટા મૂલ્યોને પૂરતા પ્રમાણમાં ધ્યાનમાં લેવામાં આવતા નથી.
દ્વિપદી વિતરણ અને સંભાવના માપન

આ વિષયમાં આપણે અલગ રેન્ડમ ચલોના વિતરણના મુખ્ય પ્રકારોને ધ્યાનમાં લઈશું. ચાલો ધારીએ કે એક અજમાયશ દરમિયાન કેટલીક રેન્ડમ ઘટના A ની સંભાવના સમાન છે
લંબચોરસ (સમાન) વિતરણ

લંબચોરસ (સમાન) વિતરણ એ સતત વિતરણનો સૌથી સરળ પ્રકાર છે. જો રેન્ડમ ચલ X અંતરાલ (a, b) માં કોઈપણ વાસ્તવિક મૂલ્ય લઈ શકે છે, જ્યાં a અને b વાસ્તવિક છે
સામાન્ય વિતરણ ગાણિતિક આંકડાઓમાં મૂળભૂત ભૂમિકા ભજવે છે. આ સહેજ પણ આકસ્મિક નથી: ઉદ્દેશ્ય વાસ્તવિકતામાં, વિવિધ ચિહ્નોનો વારંવાર સામનો કરવો પડે છે.

સાધારણ વિતરણ
રેન્ડમ ચલ Y નું સામાન્ય વિતરણ μ અને σ સાથે હોય છે જો રેન્ડમ ચલ X = lnY સમાન પરિમાણો સાથે સામાન્ય વિતરણ ધરાવે છે μ અને &

સરેરાશ મૂલ્યો
તમામ જૂથ ગુણધર્મોમાંથી, એટ્રિબ્યુટના સરેરાશ મૂલ્ય દ્વારા માપવામાં આવતા સરેરાશ સ્તરનું સૌથી વધુ સૈદ્ધાંતિક અને વ્યવહારિક મહત્વ છે.

લક્ષણનું સરેરાશ મૂલ્ય એ ખૂબ જ ઊંડો ખ્યાલ છે,
સરેરાશના સામાન્ય ગુણધર્મો

સરેરાશ મૂલ્યોના સાચા ઉપયોગ માટે, આ સૂચકોના ગુણધર્મોને જાણવું જરૂરી છે: મધ્ય સ્થાન, અમૂર્તતા અને કુલ ક્રિયાની એકતા.
તેની સંખ્યાત્મક કિંમત અનુસાર

અંકગણિત સરેરાશ
અંકગણિત સરેરાશ, સરેરાશ મૂલ્યોના સામાન્ય ગુણધર્મો ધરાવતા, તેની પોતાની લાક્ષણિકતાઓ ધરાવે છે, જે નીચેના સૂત્રો દ્વારા વ્યક્ત કરી શકાય છે:

સરેરાશ રેન્ક (બિન-પેરામેટ્રિક સરેરાશ)
સરેરાશ ક્રમ એ લાક્ષણિકતાઓ માટે નક્કી કરવામાં આવે છે કે જેના માટે માત્રાત્મક માપન પદ્ધતિઓ હજુ સુધી મળી નથી. આવા ચિહ્નોના અભિવ્યક્તિની ડિગ્રી અનુસાર, વસ્તુઓને ક્રમાંકિત કરી શકાય છે, એટલે કે સ્થિત

ભારિત અંકગણિત સરેરાશ
સામાન્ય રીતે, અંકગણિત સરેરાશની ગણતરી કરવા માટે, વિશેષતાના તમામ મૂલ્યો ઉમેરવામાં આવે છે અને પરિણામી રકમને વિકલ્પોની સંખ્યા દ્વારા વિભાજિત કરવામાં આવે છે. આ કિસ્સામાં, સરવાળામાં સમાવવામાં આવેલ દરેક મૂલ્ય તેને સંપૂર્ણ રીતે વધારી દે છે

મીન ચોરસ
સરેરાશ વર્ગની ગણતરી સૂત્રનો ઉપયોગ કરીને કરવામાં આવે છે: , (6.5) તે સરવાળાના વર્ગમૂળની બરાબર છે

મધ્યક
મધ્યક એ લાક્ષણિકતાનું મૂલ્ય છે જે સમગ્ર જૂથને બે સમાન ભાગોમાં વિભાજિત કરે છે: એક ભાગનું લાક્ષણિક મૂલ્ય મધ્ય કરતા ઓછું છે, અને બીજાનું મૂલ્ય વધારે છે.

ઉદાહરણ તરીકે, જો તમારી પાસે હોય
ભૌમિતિક સરેરાશ

n ડેટાવાળા જૂથ માટે ભૌમિતિક સરેરાશ મેળવવા માટે, તમારે બધા વિકલ્પોનો ગુણાકાર કરવાની જરૂર છે અને પરિણામી ઉત્પાદનમાંથી nમું મૂળ કાઢવાની જરૂર છે:
હાર્મોનિક સરેરાશ

હાર્મોનિક સરેરાશની ગણતરી સૂત્રનો ઉપયોગ કરીને કરવામાં આવે છે. (6.14) પાંચ વિકલ્પો માટે: 1, 4, 5, 5 બુધવાર
પ્રમાણભૂત વિચલન એ અંકગણિત સરેરાશ તરીકે માપનના સમાન એકમોમાં દર્શાવવામાં આવેલ નામાંકિત મૂલ્ય છે.

તેથી, માંથી વિવિધ એકમોમાં વ્યક્ત કરાયેલ વિવિધ લાક્ષણિકતાઓની તુલના કરવા
મર્યાદાઓ અને અવકાશ

વિવિધતાની ડિગ્રીના ઝડપી અને અંદાજિત મૂલ્યાંકન માટે, સૌથી સરળ સૂચકાંકોનો વારંવાર ઉપયોગ કરવામાં આવે છે: લિમ = (મિનિમ ¸ મહત્તમ) - મર્યાદાઓ, એટલે કે લાક્ષણિકતાના સૌથી નાના અને સૌથી મોટા મૂલ્યો, p =
સામાન્યકૃત વિચલન

લાક્ષણિક રીતે, લક્ષણના વિકાસની ડિગ્રી તેને માપવા દ્વારા નક્કી કરવામાં આવે છે અને ચોક્કસ નામાંકિત સંખ્યા દ્વારા વ્યક્ત કરવામાં આવે છે: 3 કિલો વજન, 15 સેમી લંબાઈ, મધમાખીની પાંખ પર 20 હૂક, દૂધમાં 4% ચરબી, 15 કિલો ક્લિપિંગ
કુલ જૂથની સરેરાશ અને સિગ્મા

કેટલીકવાર કેટલાક વિતરણોથી બનેલા સારાંશ વિતરણ માટે સરેરાશ અને સિગ્મા નક્કી કરવું જરૂરી છે. આ કિસ્સામાં, વિતરણો પોતાને જાણીતા નથી, પરંતુ ફક્ત તેમની સરેરાશ અને સિગ્માસ.
ડિસ્ટ્રિબ્યુશન કર્વની સ્ક્યુનેસ (સ્ક્યુનેસ) અને સ્ટીપનેસ (કર્ટોસિસ).

મોટા નમૂનાઓ માટે (n > 100), વધુ બે આંકડાની ગણતરી કરવામાં આવે છે.
વળાંકની વિકૃતિને અસમપ્રમાણતા કહેવામાં આવે છે:

વિવિધતા શ્રેણી
જેમ જેમ અધ્યયન કરેલ જૂથોની સંખ્યામાં વધારો થાય છે તેમ, વિવિધતાની પેટર્ન જે નાના જૂથોમાં તેના અભિવ્યક્તિના રેન્ડમ સ્વરૂપ દ્વારા છુપાયેલી હતી તે વધુને વધુ સ્પષ્ટ થાય છે.

હિસ્ટોગ્રામ અને વિવિધતા વળાંક
હિસ્ટોગ્રામ એ ડાયાગ્રામના રૂપમાં પ્રસ્તુત વિવિધતા શ્રેણી છે જેમાં વિવિધ આવર્તન મૂલ્યો બારની વિવિધ ઊંચાઈઓ દ્વારા દર્શાવવામાં આવે છે. ડેટા વિતરણનો હિસ્ટોગ્રામ p માં બતાવવામાં આવ્યો છે

વિતરણમાં તફાવતોની વિશ્વસનીયતા
આંકડાકીય પૂર્વધારણા એ ડેટાના અવલોકન કરેલ નમૂના અંતર્ગત સંભવિતતા વિતરણ વિશેની ચોક્કસ ધારણા છે.

આંકડાકીય પૂર્વધારણા પરીક્ષણ એ સ્વીકૃતિની પ્રક્રિયા છે
skewness અને kurtosis માટે માપદંડ

છોડ, પ્રાણીઓ અને સુક્ષ્મસજીવોની કેટલીક લાક્ષણિકતાઓ, જ્યારે વસ્તુઓને જૂથોમાં જોડતી વખતે, વિતરણ આપે છે જે સામાન્ય કરતાં નોંધપાત્ર રીતે અલગ હોય છે.
કિસ્સાઓમાં જ્યાં કોઈપણ

વસ્તી અને નમૂના
નમૂના સૂચકાંકોનો ઉપયોગ કરીને સામાન્ય પરિમાણોનો અંદાજ તેની પોતાની લાક્ષણિકતાઓ ધરાવે છે.

એક ભાગ ક્યારેય સમગ્રને સંપૂર્ણ રીતે દર્શાવી શકતો નથી, તેથી સામાન્ય વસ્તીની લાક્ષણિકતાઓ
ટ્રસ્ટની સીમાઓ

સામાન્ય પરિમાણોના સંભવિત મૂલ્યો શોધવા માટે પણ નમૂના સૂચકાંકોનો ઉપયોગ કરવા માટે પ્રતિનિધિત્વની ભૂલોની તીવ્રતા નક્કી કરવી જરૂરી છે. આ પ્રક્રિયાને ઓ કહેવાય છે
સામાન્ય આકારણી પ્રક્રિયા

સામાન્ય પરિમાણનું મૂલ્યાંકન કરવા માટે જરૂરી ત્રણ જથ્થા - નમૂના સૂચક (), વિશ્વસનીયતા માપદંડ
અંકગણિત સરેરાશનો અંદાજ

સરેરાશ મૂલ્યના અંદાજનો હેતુ ઑબ્જેક્ટ્સની અભ્યાસ કરેલ શ્રેણી માટે સામાન્ય સરેરાશના મૂલ્યને સ્થાપિત કરવાનો છે. આ હેતુ માટે જરૂરી પ્રતિનિધિત્વ ભૂલ સૂત્ર દ્વારા નક્કી કરવામાં આવે છે:
સરેરાશ તફાવતનો અંદાજ

કેટલાક અભ્યાસો પ્રાથમિક ડેટા તરીકે બે માપનો તફાવત લે છે. આ કેસ હોઈ શકે છે જ્યારે નમૂનામાં દરેક વ્યક્તિનો અભ્યાસ બે રાજ્યોમાં કરવામાં આવે છે - ક્યાં તો જુદી જુદી ઉંમરે, અથવા
સરેરાશ તફાવતનો અવિશ્વસનીય અને વિશ્વસનીય અંદાજ

નમૂનાના અભ્યાસના આવા પરિણામો કે જેના માટે સામાન્ય પરિમાણનો કોઈ ચોક્કસ અંદાજ મેળવી શકાતો નથી (અથવા તે શૂન્ય કરતાં વધારે, અથવા શૂન્ય કરતાં ઓછો અથવા શૂન્યથી બરાબર છે) અવિશ્વસનીય કહેવાય છે.
સામાન્ય માધ્યમો વચ્ચેના તફાવતનો અંદાજ

જૈવિક સંશોધનમાં, બે જથ્થા વચ્ચેના તફાવતનું વિશેષ મહત્વ છે. તફાવત દ્વારા, વિવિધ વસ્તી, જાતિઓ, જાતિઓ, જાતો, રેખાઓ, કુટુંબો, પ્રાયોગિક અને નિયંત્રણ જૂથો વચ્ચે સરખામણી કરવામાં આવે છે (gr પદ્ધતિ
તફાવત વિશ્વસનીયતા માપદંડ

સંશોધકો માટે ભરોસાપાત્ર તફાવતો મેળવવાનું જે ખૂબ મહત્વ છે તે જોતાં, પ્રાપ્ત થયેલ પરિણામ વિશ્વસનીય છે કે નહીં તે નિર્ધારિત કરવાનું શક્ય બનાવે તેવી પદ્ધતિઓમાં નિપુણતાની જરૂર છે.
ગુણાત્મક લાક્ષણિકતાઓના અભ્યાસમાં પ્રતિનિધિત્વ

ગુણાત્મક પાત્રોમાં સામાન્ય રીતે અભિવ્યક્તિના ક્રમાંકન હોઈ શકતા નથી: તેઓ કાં તો દરેક વ્યક્તિમાં હાજર હોય છે અથવા હાજર નથી, ઉદાહરણ તરીકે, લિંગ, મતદાન, કેટલાક લક્ષણોની હાજરી અથવા ગેરહાજરી, વિકૃતિ
શેરના તફાવતની વિશ્વસનીયતા

નમૂનાના પ્રમાણના તફાવતની વિશ્વસનીયતા એ જ રીતે નક્કી કરવામાં આવે છે જે રીતે અર્થમાં તફાવત માટે: (10.34)
સહસંબંધ ગુણાંક

ઘણા અભ્યાસોને તેમના આંતરસંબંધોમાં બહુવિધ લક્ષણોની તપાસ કરવાની જરૂર છે. જો તમે બે લાક્ષણિકતાઓના સંબંધમાં આવો અભ્યાસ કરો છો, તો તમે જોશો કે એક લાક્ષણિકતાની પરિવર્તનશીલતા
સહસંબંધ ગુણાંક ભૂલ

નમૂના સહસંબંધ ગુણાંકની વિશ્વસનીયતા
નમૂના સહસંબંધ ગુણાંક માટેનો માપદંડ સૂત્ર દ્વારા નક્કી કરવામાં આવે છે: (11.9) જ્યાં:

સહસંબંધ ગુણાંકની વિશ્વાસ મર્યાદા
સહસંબંધ ગુણાંકના સામાન્ય મૂલ્યની આત્મવિશ્વાસ મર્યાદા સૂત્રનો ઉપયોગ કરીને સામાન્ય રીતે જોવા મળે છે:

બે સહસંબંધ ગુણાંક વચ્ચેના તફાવતની વિશ્વસનીયતા
સહસંબંધ ગુણાંકમાં તફાવતની વિશ્વસનીયતા સામાન્ય સૂત્ર અનુસાર, અર્થમાં તફાવતની વિશ્વસનીયતાની જેમ જ નક્કી કરવામાં આવે છે.

સ્ટ્રેટ રીગ્રેસન સમીકરણ
એક સીધી-રેખા સહસંબંધ અલગ છે કારણ કે જોડાણના આ સ્વરૂપ સાથે, પ્રથમ લાક્ષણિકતામાં દરેક સમાન ફેરફારો સંપૂર્ણપણે નિશ્ચિત અને અન્ય લાક્ષણિકતામાં સરેરાશ ફેરફાર સાથે સમાન હોય છે.

રેખીય રીગ્રેસન સમીકરણ તત્વોમાં ભૂલો
સરળ રેખીય રીગ્રેસન સમીકરણમાં: y = a + bx, પ્રતિનિધિત્વની ત્રણ ભૂલો ઊભી થાય છે.

1 રીગ્રેશન ગુણાંક ભૂલ:
આંશિક સહસંબંધ ગુણાંક

આંશિક સહસંબંધ ગુણાંક એ એક સૂચક છે જે ત્રીજાના સ્થિર મૂલ્ય સાથે બે લાક્ષણિકતાઓના જોડાણની ડિગ્રીને માપે છે.
ગાણિતિક આંકડા અમને સહસંબંધ સ્થાપિત કરવા દે છે

રેખીય બહુવિધ રીગ્રેસન સમીકરણ
ત્રણ ચલો વચ્ચેના સીધા-રેખા સંબંધ માટેના ગાણિતિક સમીકરણને બહુવિધ રેખીય રીગ્રેશન પ્લેન સમીકરણ કહેવામાં આવે છે. તે નીચેના સામાન્ય સ્વરૂપ ધરાવે છે:

સહસંબંધ સંબંધ
જો અભ્યાસ હેઠળની ઘટનાઓ વચ્ચેનો સંબંધ રેખીયથી નોંધપાત્ર રીતે વિચલિત થાય છે, જે ગ્રાફ પરથી સ્થાપિત કરવું સરળ છે, તો જોડાણના માપદંડ તરીકે સહસંબંધ ગુણાંક અયોગ્ય છે. તે ગેરહાજરી દર્શાવી શકે છે

સહસંબંધ સંબંધના ગુણધર્મો
સહસંબંધ ગુણોત્તર કોઈપણ સ્વરૂપમાં સહસંબંધની ડિગ્રીને માપે છે.

વધુમાં, સહસંબંધ સંબંધમાં સંખ્યાબંધ અન્ય ગુણધર્મો છે જે આંકડાશાસ્ત્રમાં ખૂબ રસ ધરાવે છે
સહસંબંધ સંબંધની પ્રતિનિધિત્વની ભૂલ

સહસંબંધ સંબંધની પ્રતિનિધિત્વની ભૂલ માટેનું ચોક્કસ સૂત્ર હજી વિકસિત થયું નથી. સામાન્ય રીતે પાઠ્યપુસ્તકોમાં આપવામાં આવતી ફોર્મ્યુલામાં ગેરફાયદા હોય છે જેને હંમેશા અવગણી શકાય નહીં. આ સૂત્ર શીખવતું નથી
સહસંબંધ રેખીયતા માપદંડ

રેક્ટીલિનિયર પર વક્રીકૃત અવલંબનની આશરે ડિગ્રી નક્કી કરવા માટે, F માપદંડનો ઉપયોગ કરવામાં આવે છે, જે સૂત્ર દ્વારા ગણવામાં આવે છે:
આંકડાકીય પ્રભાવ એ પરિબળની વિવિધતા (તેના ગ્રેડેશન) ના પરિણામી લક્ષણની વિવિધતામાં પ્રતિબિંબ છે જે અભ્યાસમાં ગોઠવવામાં આવે છે.

નિયો પરિબળના પ્રભાવનું મૂલ્યાંકન કરવા
કારણભૂત પ્રભાવ

ફેક્ટોરિયલ પ્રભાવ એ અભ્યાસ કરવામાં આવતા પરિબળોનો એક સરળ અથવા સંયુક્ત આંકડાકીય પ્રભાવ છે.
એકલ-પરિબળ સંકુલમાં, ચોક્કસ સંગઠનાત્મક પરિસ્થિતિઓ હેઠળ એક પરિબળના સરળ પ્રભાવનો અભ્યાસ કરવામાં આવે છે.

એક-પરિબળ વિક્ષેપ સંકુલ
વિક્ષેપ વિશ્લેષણ અંગ્રેજી વૈજ્ઞાનિક આર.એ. ફિશર દ્વારા કૃષિ અને જૈવિક સંશોધનની પ્રેક્ટિસમાં વિકસાવવામાં આવ્યું હતું અને રજૂ કરવામાં આવ્યું હતું, જેમણે સરેરાશ ચોરસના ગુણોત્તરના વિતરણના કાયદાની શોધ કરી હતી.

મલ્ટિફેક્ટર વિક્ષેપ સંકુલ
ભિન્નતા વિશ્લેષણના ગાણિતિક મોડલની સ્પષ્ટ સમજ જરૂરી કોમ્પ્યુટેશનલ કામગીરીની સમજણની સુવિધા આપે છે, ખાસ કરીને જ્યારે મલ્ટિફેક્ટર પ્રયોગોમાંથી ડેટાની પ્રક્રિયા કરતી વખતે જેમાં વધુ

રૂપાંતરણો
પ્રાયોગિક સામગ્રીની પ્રક્રિયા માટે ભિન્નતા વિશ્લેષણનો સાચો ઉપયોગ, વિવિધ પ્રકારો (નમૂનાઓ), સામાન્ય અથવા સામાન્ય વિતરણની નજીકના ભિન્નતાઓની એકરૂપતા ધારે છે.

પ્રભાવની શક્તિના સૂચકાંકો
ભૌતિક અને રાસાયણિક એજન્ટોના ડોઝ માટે, પ્રભાવના સૌથી અસરકારક માધ્યમો પસંદ કરવા માટે જીવવિજ્ઞાન, કૃષિ, દવામાં તેમના પરિણામોના આધારે પ્રભાવોની તાકાત નક્કી કરવી જરૂરી છે - કલા.

પ્રભાવની શક્તિના મુખ્ય સૂચકની પ્રતિનિધિત્વની ભૂલ
પ્રભાવની તાકાતના મુખ્ય સૂચક માટે ચોક્કસ ભૂલ સૂત્ર હજુ સુધી મળી નથી.

એક-પરિબળ સંકુલમાં, જ્યારે પ્રતિનિધિત્વ ભૂલ માત્ર એક કારણદર્શક સૂચક માટે નક્કી કરવામાં આવે છે
પ્રભાવ સૂચકાંકોના મૂલ્યોને મર્યાદિત કરો

પ્રભાવની તાકાતનું મુખ્ય સૂચક કુલ શરતોમાંથી એક પદના હિસ્સા જેટલું છે. વધુમાં, આ સૂચક સહસંબંધ ગુણોત્તરના વર્ગની બરાબર છે. આ બે કારણોસર, પાવર સૂચક
પ્રભાવોની વિશ્વસનીયતા

નમૂનાના અભ્યાસમાં મેળવેલા પ્રભાવની શક્તિનું મુખ્ય સૂચક, સૌ પ્રથમ, પ્રભાવની ડિગ્રી કે જે ખરેખર અભ્યાસ કરેલા પદાર્થોના જૂથમાં પોતાને પ્રગટ કરે છે તે દર્શાવે છે.
ભેદભાવપૂર્ણ વિશ્લેષણ

ભેદભાવપૂર્ણ વિશ્લેષણ એ બહુવિધ આંકડાકીય વિશ્લેષણની પદ્ધતિઓમાંની એક છે. ભેદભાવપૂર્ણ વિશ્લેષણનો હેતુ, વિવિધ લાક્ષણિકતાઓ (સુવિધાઓ, જોડી) ના માપન પર આધારિત છે.
જો સંખ્યાબંધ ધારણાઓ પૂરી થાય તો ભેદભાવપૂર્ણ વિશ્લેષણ "કાર્ય કરે છે".

ધારણા કે અવલોકનક્ષમ જથ્થાઓ-ઓબ્જેક્ટની માપી શકાય તેવી લાક્ષણિકતાઓ-સામાન્ય વિતરણ ધરાવે છે. આ
ભેદભાવ વિશ્લેષણ અલ્ગોરિધમ

ભેદભાવની સમસ્યાઓ (ભેદભાવપૂર્ણ વિશ્લેષણ) ના ઉકેલમાં સમગ્ર નમૂનાની જગ્યા (વિચારણા હેઠળના તમામ બહુપરિમાણીય રેન્ડમ ચલોના અનુભૂતિનો સમૂહ) ને ચોક્કસ સંખ્યામાં વિભાજીત કરવાનો સમાવેશ થાય છે.
ક્લસ્ટર વિશ્લેષણ

ક્લસ્ટર વિશ્લેષણ વર્ગીકરણ કરવા માટે વપરાતી વિવિધ પ્રક્રિયાઓને જોડે છે. આ પ્રક્રિયાઓને લાગુ કરવાના પરિણામે, ઑબ્જેક્ટ્સના પ્રારંભિક સમૂહને ક્લસ્ટરો અથવા જૂથોમાં વિભાજિત કરવામાં આવે છે
ક્લસ્ટર વિશ્લેષણ પદ્ધતિઓ

વ્યવહારમાં, એગ્લોમેરેટિવ ક્લસ્ટરિંગ પદ્ધતિઓ સામાન્ય રીતે લાગુ કરવામાં આવે છે.
સામાન્ય રીતે, વર્ગીકરણ શરૂ થાય તે પહેલાં, ડેટા પ્રમાણિત કરવામાં આવે છે (સરેરાશ બાદબાકી કરવામાં આવે છે અને વર્ગમૂળ દ્વારા વિભાજિત કરવામાં આવે છે.



ક્લસ્ટર વિશ્લેષણ અલ્ગોરિધમનો ક્લસ્ટર વિશ્લેષણ એ ઑબ્જેક્ટ વચ્ચેના અંતરની વિભાવનાને વ્યાખ્યાયિત કરવા અને પછી તેમાંથી જૂથોને ઓળખવા પર આધારિત બહુપરીમાણીય અવલોકનો અથવા ઑબ્જેક્ટનું વર્ગીકરણ કરવા માટેની પદ્ધતિઓનો સમૂહ છે, &