શા માટે ઓછામાં ઓછી ચોરસ પદ્ધતિનો ઉપયોગ કરવામાં આવે છે? બહુપદી મોડેલનો કેસ

ઓછામાં ઓછા ચોરસ પદ્ધતિ

વિષયના અંતિમ પાઠમાં, અમે સૌથી પ્રખ્યાત એપ્લિકેશનથી પરિચિત થઈશું FNP, જે વિજ્ઞાન અને વ્યવહારિક પ્રવૃત્તિના વિવિધ ક્ષેત્રોમાં સૌથી વધુ વ્યાપક ઉપયોગ શોધે છે. આ ભૌતિકશાસ્ત્ર, રસાયણશાસ્ત્ર, જીવવિજ્ઞાન, અર્થશાસ્ત્ર, સમાજશાસ્ત્ર, મનોવિજ્ઞાન અને તેથી વધુ હોઈ શકે છે. ભાગ્યની ઇચ્છાથી, મારે ઘણીવાર અર્થતંત્ર સાથે વ્યવહાર કરવો પડે છે, અને તેથી આજે હું તમારા માટે એક અદ્ભુત દેશની સફર ગોઠવીશ. ઇકોનોમેટ્રિક્સ=) ...તમે તેને કેવી રીતે ન જોઈ શકો?! તે ત્યાં ખૂબ સારું છે - તમારે ફક્ત તમારું મન બનાવવાની જરૂર છે! ...પરંતુ તમે કદાચ ચોક્કસપણે શું ઇચ્છો છો તે શીખવું છે કે સમસ્યાઓ કેવી રીતે હલ કરવી ઓછામાં ઓછા ચોરસ પદ્ધતિ. અને ખાસ કરીને મહેનતું વાચકો તેમને માત્ર ચોક્કસ જ નહીં, પણ ખૂબ જ ઝડપથી હલ કરવાનું શીખશે ;-) પરંતુ પહેલા સમસ્યાનું સામાન્ય નિવેદન+ સાથેનું ઉદાહરણ:

ધારો કે ચોક્કસ વિષય ક્ષેત્રમાં, માત્રાત્મક અભિવ્યક્તિ ધરાવતા સૂચકોનો અભ્યાસ કરવામાં આવે છે. તે જ સમયે, એવું માનવા માટે દરેક કારણ છે કે સૂચક સૂચક પર આધાર રાખે છે. આ ધારણા કાં તો વૈજ્ઞાનિક પૂર્વધારણા હોઈ શકે છે અથવા મૂળભૂત સામાન્ય સમજ પર આધારિત હોઈ શકે છે. જો કે, ચાલો વિજ્ઞાનને બાજુ પર રાખીએ અને વધુ મોહક વિસ્તારોનું અન્વેષણ કરીએ - એટલે કે, કરિયાણાની દુકાનો. ચાલો આના દ્વારા સૂચિત કરીએ:

- કરિયાણાની દુકાનનો છૂટક વિસ્તાર, ચો.મી.,
- કરિયાણાની દુકાનનું વાર્ષિક ટર્નઓવર, મિલિયન રુબેલ્સ.

તે એકદમ સ્પષ્ટ છે કે સ્ટોર વિસ્તાર જેટલો મોટો હશે, મોટા ભાગના કિસ્સાઓમાં તેનું ટર્નઓવર વધારે હશે.

ધારો કે ખંજરી સાથે અવલોકનો/પ્રયોગો/ગણતરીઓ/નૃત્ય કર્યા પછી અમારી પાસે સંખ્યાત્મક ડેટા છે:

કરિયાણાની દુકાનો સાથે, મને લાગે છે કે બધું સ્પષ્ટ છે: - આ 1 લી સ્ટોરનો વિસ્તાર છે, - તેનું વાર્ષિક ટર્નઓવર, - 2 જી સ્ટોરનો વિસ્તાર, - તેનું વાર્ષિક ટર્નઓવર, વગેરે. માર્ગ દ્વારા, વર્ગીકૃત સામગ્રીની ઍક્સેસ હોવી જરૂરી નથી - વેપાર ટર્નઓવરનું એકદમ સચોટ મૂલ્યાંકન આના માધ્યમથી મેળવી શકાય છે. ગાણિતિક આંકડા. જો કે, ચાલો વિચલિત ન થઈએ, વ્યાપારી જાસૂસી કોર્સ પહેલેથી જ ચૂકવવામાં આવે છે =)

ટેબ્યુલર ડેટાને પોઈન્ટના સ્વરૂપમાં પણ લખી શકાય છે અને પરિચિત સ્વરૂપમાં દર્શાવી શકાય છે કાર્ટેશિયન સિસ્ટમ .

ચાલો એક મહત્વપૂર્ણ પ્રશ્નનો જવાબ આપીએ: ગુણાત્મક અભ્યાસ માટે કેટલા મુદ્દા જરૂરી છે?

વધુ સારું. ન્યૂનતમ સ્વીકાર્ય સમૂહમાં 5-6 પોઈન્ટ હોય છે. વધુમાં, જ્યારે ડેટાની માત્રા ઓછી હોય છે, ત્યારે નમૂનામાં "વિસંગત" પરિણામોનો સમાવેશ કરી શકાતો નથી. તેથી, ઉદાહરણ તરીકે, એક નાનો ચુનંદા સ્ટોર "તેના સાથીદારો" કરતાં વધુ તીવ્રતાના ઓર્ડર મેળવી શકે છે, જેનાથી તમારે શોધવાની જરૂર છે તે સામાન્ય પેટર્નને વિકૃત કરી શકે છે!



તેને ખૂબ જ સરળ રીતે કહીએ તો, આપણે એક કાર્ય પસંદ કરવાની જરૂર છે, સમયપત્રકજે પોઈન્ટની શક્ય તેટલી નજીકથી પસાર થાય છે . આ કાર્ય કહેવામાં આવે છે અંદાજિત (અંદાજે - અંદાજ)અથવા સૈદ્ધાંતિક કાર્ય . સામાન્ય રીતે કહીએ તો, એક સ્પષ્ટ "સ્પર્ધક" તરત જ અહીં દેખાય છે - એક ઉચ્ચ-ડિગ્રી બહુપદી, જેનો ગ્રાફ તમામ બિંદુઓમાંથી પસાર થાય છે. પરંતુ આ વિકલ્પ જટિલ છે અને ઘણીવાર ફક્ત ખોટો છે. (કારણ કે ગ્રાફ હંમેશા "લૂપ" કરશે અને મુખ્ય વલણને ખરાબ રીતે પ્રતિબિંબિત કરશે).

આમ, ઇચ્છિત કાર્ય એકદમ સરળ હોવું જોઈએ અને તે જ સમયે પર્યાપ્ત રીતે અવલંબનને પ્રતિબિંબિત કરે છે. જેમ તમે અનુમાન કરી શકો છો, આવા કાર્યોને શોધવા માટેની પદ્ધતિઓમાંથી એક કહેવામાં આવે છે ઓછામાં ઓછા ચોરસ પદ્ધતિ. પ્રથમ, ચાલો તેના સારને સામાન્ય શબ્દોમાં જોઈએ. કેટલાક અંદાજિત પ્રાયોગિક ડેટાને કાર્ય કરવા દો:


આ અંદાજની ચોકસાઈનું મૂલ્યાંકન કેવી રીતે કરવું? ચાલો પ્રાયોગિક અને કાર્યાત્મક મૂલ્યો વચ્ચેના તફાવતો (વિચલનો)ની પણ ગણતરી કરીએ (અમે ચિત્રનો અભ્યાસ કરીએ છીએ). પ્રથમ વિચાર જે મનમાં આવે છે તે એ છે કે સરવાળો કેટલો મોટો છે, પરંતુ સમસ્યા એ છે કે તફાવતો નકારાત્મક હોઈ શકે છે. (ઉદાહરણ તરીકે, ) અને આવા સમીકરણના પરિણામે વિચલનો એકબીજાને રદ કરશે. તેથી, અંદાજની ચોકસાઈના અંદાજ તરીકે, તે સરવાળો લેવા વિનંતી કરે છે મોડ્યુલોવિચલનો:

અથવા સંકુચિત: (જો કોઈને ખબર ન હોય તો: સમ ચિહ્ન છે, અને - એક સહાયક "કાઉન્ટર" ચલ, જે 1 થી મૂલ્યો લે છે ) .

જુદા જુદા કાર્યો સાથે પ્રાયોગિક બિંદુઓને અંદાજિત કરીને, આપણે વિવિધ મૂલ્યો મેળવીશું, અને દેખીતી રીતે, જ્યાં આ સરવાળો નાનો છે, તે કાર્ય વધુ સચોટ છે.

આવી પદ્ધતિ અસ્તિત્વમાં છે અને તેને કહેવામાં આવે છે ઓછામાં ઓછી મોડ્યુલસ પદ્ધતિ. જો કે, વ્યવહારમાં તે વધુ વ્યાપક બન્યું છે ઓછામાં ઓછા ચોરસ પદ્ધતિ, જેમાં સંભવિત નકારાત્મક મૂલ્યો મોડ્યુલ દ્વારા નહીં, પરંતુ વિચલનોના વર્ગીકરણ દ્વારા દૂર કરવામાં આવે છે:



, જે પછી પ્રયત્નોનો ઉદ્દેશ્ય એવા ફંક્શનને પસંદ કરવાનો છે કે જેમ કે વર્ગ વિચલનોનો સરવાળો શક્ય તેટલું નાનું હતું. વાસ્તવમાં, પદ્ધતિનું નામ અહીંથી આવ્યું છે.

અને હવે આપણે બીજા મહત્વના મુદ્દા પર પાછા ફરો: ઉપર નોંધ્યા મુજબ, પસંદ કરેલ કાર્ય એકદમ સરળ હોવું જોઈએ - પરંતુ આવા ઘણા કાર્યો પણ છે: રેખીય , અતિશય , ઘાતાંકીય , લઘુગણક , ચતુર્ભુજ વગેરે અને, અલબત્ત, અહીં હું તરત જ "પ્રવૃત્તિનું ક્ષેત્ર ઘટાડવા" ઈચ્છું છું. સંશોધન માટે મારે કયા વર્ગના કાર્યો પસંદ કરવા જોઈએ? એક આદિમ પરંતુ અસરકારક તકનીક:

- પોઈન્ટનું નિરૂપણ કરવાનો સૌથી સહેલો રસ્તો છે ડ્રોઇંગ પર અને તેમના સ્થાનનું વિશ્લેષણ કરો. જો તેઓ સીધી રેખામાં દોડવાનું વલણ ધરાવે છે, તો તમારે શોધવું જોઈએ રેખાનું સમીકરણ શ્રેષ્ઠ મૂલ્યો સાથે અને . બીજા શબ્દોમાં કહીએ તો, કાર્ય આવા ગુણાંક શોધવાનું છે જેથી વર્ગ વિચલનોનો સરવાળો સૌથી નાનો હોય.

જો બિંદુઓ સ્થિત છે, ઉદાહરણ તરીકે, સાથે અતિશય, તો તે સ્પષ્ટપણે સ્પષ્ટ છે કે રેખીય કાર્ય નબળું અંદાજ આપશે. આ કિસ્સામાં, અમે હાઇપરબોલા સમીકરણ માટે સૌથી વધુ "અનુકૂળ" ગુણાંક શોધી રહ્યા છીએ - તે જે ચોરસનો લઘુત્તમ સરવાળો આપે છે .

હવે નોંધ લો કે બંને કિસ્સાઓમાં અમે વાત કરી રહ્યા છીએ બે ચલોના કાર્યો, જેની દલીલો છે નિર્ભરતા પરિમાણો શોધ્યા:

અને અનિવાર્યપણે આપણે પ્રમાણભૂત સમસ્યા હલ કરવાની જરૂર છે - શોધો બે ચલોનું ન્યૂનતમ કાર્ય.

ચાલો અમારું ઉદાહરણ યાદ રાખો: ધારો કે "સ્ટોર" પોઈન્ટ સીધી રેખામાં સ્થિત હોય છે અને હાજરીને માનવાનું દરેક કારણ છે રેખીય અવલંબનછૂટક જગ્યામાંથી ટર્નઓવર. ચાલો આવા ગુણાંક “a” અને “be” શોધીએ કે વર્ગ વિચલનોનો સરવાળો સૌથી નાનો હતો. બધું હંમેશની જેમ છે - પ્રથમ 1 લી ઓર્ડર આંશિક ડેરિવેટિવ્ઝ. અનુસાર રેખીયતા નિયમતમે સરવાળા આયકન હેઠળ જ તફાવત કરી શકો છો:

જો તમે નિબંધ અથવા ટર્મ પેપર માટે આ માહિતીનો ઉપયોગ કરવા માંગતા હો, તો હું સ્રોતોની સૂચિમાંની લિંક માટે ખૂબ જ આભારી હોઈશ.

ચાલો પ્રમાણભૂત સિસ્ટમ બનાવીએ:

અમે દરેક સમીકરણને "બે" દ્વારા ઘટાડીએ છીએ અને વધુમાં, સરવાળોને "વિભાજિત" કરીએ છીએ:

નોંધ : સ્વતંત્ર રીતે વિશ્લેષણ કરો કે શા માટે "a" અને "be" સરવાળા ચિહ્નની બહાર લઈ શકાય છે. માર્ગ દ્વારા, ઔપચારિક રીતે આ રકમ સાથે કરી શકાય છે

ચાલો સિસ્ટમને "લાગુ કરેલ" સ્વરૂપમાં ફરીથી લખીએ:

જે પછી અમારી સમસ્યા હલ કરવા માટેનું અલ્ગોરિધમ બહાર આવવાનું શરૂ થાય છે:

શું આપણે બિંદુઓના કોઓર્ડિનેટ્સ જાણીએ છીએ? અમે જાણીએ છીએ. રકમો શું આપણે તેને શોધી શકીએ? સરળતાથી. ચાલો સૌથી સરળ બનાવીએ બે અજ્ઞાતમાં બે રેખીય સમીકરણોની સિસ્ટમ("a" અને "be"). અમે સિસ્ટમ હલ કરીએ છીએ, ઉદાહરણ તરીકે, ક્રેમરની પદ્ધતિ, જેના પરિણામે આપણે સ્થિર બિંદુ મેળવીએ છીએ. તપાસી રહ્યું છે એક્સ્ટ્રીમ માટે પૂરતી સ્થિતિ, અમે ચકાસી શકીએ છીએ કે આ બિંદુએ કાર્ય બરાબર પહોંચે છે ન્યૂનતમ. ચેકમાં વધારાની ગણતરીઓનો સમાવેશ થાય છે અને તેથી અમે તેને પડદા પાછળ છોડી દઈશું (જો જરૂરી હોય તો, ખૂટતી ફ્રેમ જોઈ શકાય છેઅહીં ) . અમે અંતિમ નિષ્કર્ષ દોરીએ છીએ:

કાર્ય શ્રેષ્ઠ શક્ય રીતે (ઓછામાં ઓછા કોઈપણ અન્ય રેખીય કાર્યની તુલનામાં)પ્રાયોગિક મુદ્દાઓને નજીક લાવે છે . આશરે કહીએ તો, તેનો ગ્રાફ આ બિંદુઓની શક્ય તેટલી નજીકથી પસાર થાય છે. પરંપરામાં અર્થશાસ્ત્રપરિણામી અંદાજિત કાર્ય પણ કહેવાય છે જોડી રેખીય રીગ્રેસન સમીકરણ .

વિચારણા હેઠળની સમસ્યા ખૂબ જ વ્યવહારુ મહત્વની છે. અમારી ઉદાહરણ પરિસ્થિતિમાં, Eq. તમને વેપાર ટર્નઓવરની આગાહી કરવાની મંજૂરી આપે છે ("ઇગ્રેક")સ્ટોરમાં વેચાણ વિસ્તારની એક અથવા બીજી કિંમત હશે ("x" નો એક અથવા બીજો અર્થ). હા, પરિણામી આગાહી માત્ર એક આગાહી હશે, પરંતુ ઘણા કિસ્સાઓમાં તે તદ્દન સચોટ સાબિત થશે.

હું "વાસ્તવિક" સંખ્યાઓ સાથે ફક્ત એક સમસ્યાનું વિશ્લેષણ કરીશ, કારણ કે તેમાં કોઈ મુશ્કેલીઓ નથી - બધી ગણતરીઓ 7 મી-8 મા ધોરણના શાળા અભ્યાસક્રમના સ્તરે છે. 95 ટકા કિસ્સાઓમાં, તમને માત્ર એક રેખીય કાર્ય શોધવા માટે કહેવામાં આવશે, પરંતુ લેખના ખૂબ જ અંતમાં હું બતાવીશ કે શ્રેષ્ઠ હાઇપરબોલા, ઘાતાંકીય અને કેટલાક અન્ય કાર્યોના સમીકરણો શોધવાનું વધુ મુશ્કેલ નથી.

હકીકતમાં, જે બાકી છે તે વચન આપેલ ગુડીઝનું વિતરણ કરવાનું છે - જેથી તમે આવા ઉદાહરણોને માત્ર સચોટ રીતે જ નહીં, પણ ઝડપથી હલ કરવાનું શીખી શકો. અમે ધોરણનો કાળજીપૂર્વક અભ્યાસ કરીએ છીએ:

કાર્ય

બે સૂચકાંકો વચ્ચેના સંબંધનો અભ્યાસ કરવાના પરિણામે, સંખ્યાઓની નીચેની જોડી પ્રાપ્ત થઈ:

ઓછામાં ઓછી ચોરસ પદ્ધતિનો ઉપયોગ કરીને, પ્રયોગમૂલકને શ્રેષ્ઠ અંદાજ આપતા રેખીય કાર્ય શોધો (અનુભવી)ડેટા કાર્ટેશિયન લંબચોરસ કોઓર્ડિનેટ સિસ્ટમમાં પ્રાયોગિક બિંદુઓ અને અંદાજિત કાર્યનો આલેખ કે જેના પર એક ચિત્ર બનાવો . પ્રયોગમૂલક અને સૈદ્ધાંતિક મૂલ્યો વચ્ચેના વર્ગ વિચલનોનો સરવાળો શોધો. શોધો કે શું સુવિધા વધુ સારી હશે (ઓછામાં ઓછા ચોરસ પદ્ધતિના દૃષ્ટિકોણથી)પ્રાયોગિક મુદ્દાઓને નજીક લાવો.

મહેરબાની કરીને નોંધ કરો કે "x" અર્થો કુદરતી છે, અને આનો એક લાક્ષણિક અર્થપૂર્ણ અર્થ છે, જેના વિશે હું થોડી વાર પછી વાત કરીશ; પરંતુ તેઓ, અલબત્ત, અપૂર્ણાંક પણ હોઈ શકે છે. વધુમાં, ચોક્કસ કાર્યની સામગ્રીના આધારે, "X" અને "ગેમ" બંને મૂલ્યો સંપૂર્ણપણે અથવા આંશિક રીતે નકારાત્મક હોઈ શકે છે. સારું, અમને "ચહેરા વિનાનું" કાર્ય આપવામાં આવ્યું છે, અને અમે તેને શરૂ કરીએ છીએ ઉકેલ:

અમે સિસ્ટમના ઉકેલ તરીકે શ્રેષ્ઠ કાર્યના ગુણાંક શોધીએ છીએ:

વધુ કોમ્પેક્ટ રેકોર્ડિંગના હેતુ માટે, "કાઉન્ટર" ચલને અવગણી શકાય છે, કારણ કે તે પહેલાથી જ સ્પષ્ટ છે કે સરવાળો 1 થી .

ટેબ્યુલર સ્વરૂપમાં જરૂરી રકમની ગણતરી કરવી વધુ અનુકૂળ છે:


ગણતરીઓ માઇક્રોકેલ્ક્યુલેટર પર કરી શકાય છે, પરંતુ એક્સેલનો ઉપયોગ કરવો વધુ સારું છે - બંને ઝડપી અને ભૂલો વિના; ટૂંકી વિડિઓ જુઓ:

આમ, અમને નીચેના મળે છે સિસ્ટમ:

અહીં તમે બીજા સમીકરણને 3 અને વડે ગુણાકાર કરી શકો છો ટર્મ દ્વારા 1લા સમીકરણ પદમાંથી 2જી બાદ કરો. પરંતુ આ નસીબ છે - વ્યવહારમાં, સિસ્ટમો ઘણીવાર ભેટ નથી, અને આવા કિસ્સાઓમાં તે બચાવે છે ક્રેમરની પદ્ધતિ:
, જેનો અર્થ છે કે સિસ્ટમ પાસે એક અનન્ય ઉકેલ છે.

ચાલો તપાસીએ. હું સમજું છું કે તમે ઇચ્છતા નથી, પરંતુ ભૂલોને શા માટે અવગણો જ્યાં તે સંપૂર્ણપણે ચૂકી ન શકાય? ચાલો આપણે સિસ્ટમના દરેક સમીકરણની ડાબી બાજુએ મળેલા ઉકેલને બદલીએ:

અનુરૂપ સમીકરણોની જમણી બાજુઓ મેળવવામાં આવે છે, જેનો અર્થ છે કે સિસ્ટમ યોગ્ય રીતે ઉકેલી છે.

આમ, ઇચ્છિત અંદાજિત કાર્ય: – થી બધા રેખીય કાર્યોતે તે છે જે પ્રાયોગિક ડેટાનું શ્રેષ્ઠ અંદાજ આપે છે.

વિપરીત પ્રત્યક્ષ તેના વિસ્તાર પર સ્ટોરના ટર્નઓવરની અવલંબન, જોવા મળેલી અવલંબન છે વિપરીત (સિદ્ધાંત "વધુ, ઓછું"), અને આ હકીકત તરત જ નકારાત્મક દ્વારા પ્રગટ થાય છે ઢાળ. કાર્ય અમને કહે છે કે ચોક્કસ સૂચકમાં 1 એકમના વધારા સાથે, આશ્રિત સૂચકનું મૂલ્ય ઘટે છે સરેરાશ 0.65 એકમો દ્વારા. જેમ તેઓ કહે છે, બિયાં સાથેનો દાણોની કિંમત જેટલી વધારે છે, તેટલું ઓછું વેચાય છે.

અંદાજિત ફંક્શનને પ્લોટ કરવા માટે, ચાલો તેના બે મૂલ્યો શોધીએ:

અને ડ્રોઇંગ ચલાવો:

બાંધેલી સીધી રેખા કહેવામાં આવે છે વલણ રેખા (એટલે ​​​​કે, એક રેખીય વલણ રેખા, એટલે કે સામાન્ય કિસ્સામાં, વલણ એ જરૂરી નથી કે સીધી રેખા હોય). દરેક વ્યક્તિ "ચલણમાં હોવા" અભિવ્યક્તિથી પરિચિત છે અને મને લાગે છે કે આ શબ્દને વધારાની ટિપ્પણીઓની જરૂર નથી.

ચાલો વર્ગ વિચલનોના સરવાળાની ગણતરી કરીએ પ્રયોગમૂલક અને સૈદ્ધાંતિક મૂલ્યો વચ્ચે. ભૌમિતિક રીતે, આ "રાસ્પબેરી" સેગમેન્ટ્સની લંબાઈના ચોરસનો સરવાળો છે (જેમાંથી બે એટલા નાના છે કે તે દેખાતા પણ નથી).

ચાલો કોષ્ટકમાં ગણતરીઓનો સારાંશ આપીએ:


ફરીથી, તેઓ જાતે જ કરી શકાય છે, હું 1લા મુદ્દા માટે એક ઉદાહરણ આપીશ:

પરંતુ તે પહેલાથી જ જાણીતી રીતે કરવું તે વધુ અસરકારક છે:

અમે ફરી એકવાર પુનરાવર્તન કરીએ છીએ: પ્રાપ્ત પરિણામનો અર્થ શું છે?થી બધા રેખીય કાર્યો y કાર્ય સૂચક સૌથી નાનો છે, એટલે કે, તેના પરિવારમાં તે શ્રેષ્ઠ અંદાજ છે. અને અહીં, માર્ગ દ્વારા, સમસ્યાનો અંતિમ પ્રશ્ન આકસ્મિક નથી: શું જો સૂચિત ઘાતાંકીય કાર્ય પ્રાયોગિક મુદ્દાઓને નજીક લાવવાનું વધુ સારું રહેશે?

ચાલો સ્ક્વેર્ડ વિચલનોનો અનુરૂપ સરવાળો શોધીએ - તફાવત કરવા માટે, હું તેમને "એપ્સીલોન" અક્ષરથી સૂચિત કરીશ. તકનીક બરાબર સમાન છે:


અને ફરીથી, ફક્ત કિસ્સામાં, 1 લી બિંદુ માટે ગણતરીઓ:

એક્સેલમાં આપણે સ્ટાન્ડર્ડ ફંક્શનનો ઉપયોગ કરીએ છીએ EXP (વાક્યરચના એક્સેલ હેલ્પમાં મળી શકે છે).

નિષ્કર્ષ: , જેનો અર્થ છે કે ઘાતાંકીય કાર્ય સીધી રેખા કરતાં વધુ ખરાબ પ્રાયોગિક બિંદુઓને અંદાજે છે .

પરંતુ અહીં એ નોંધવું જોઈએ કે "ખરાબ" છે હજુ સુધી અર્થ નથી, જે ખરાબ છે. હવે મેં આ ઘાતાંકીય કાર્યનો ગ્રાફ બનાવ્યો છે - અને તે પોઈન્ટની નજીકથી પણ પસાર થાય છે - એટલું બધું કે વિશ્લેષણાત્મક સંશોધન વિના કયું કાર્ય વધુ સચોટ છે તે કહેવું મુશ્કેલ છે.

આ ઉકેલને સમાપ્ત કરે છે, અને હું દલીલના કુદરતી મૂલ્યોના પ્રશ્ન પર પાછો ફરું છું. વિવિધ અભ્યાસોમાં, સામાન્ય રીતે આર્થિક અથવા સમાજશાસ્ત્રીય, કુદરતી "X" નો ઉપયોગ મહિનાઓ, વર્ષો અથવા અન્ય સમાન સમય અંતરાલોની સંખ્યા માટે થાય છે. ઉદાહરણ તરીકે, નીચેની સમસ્યાને ધ્યાનમાં લો:

વર્ષના પ્રથમ અર્ધવાર્ષિક ગાળા માટે સ્ટોરના રિટેલ ટર્નઓવર પર નીચેનો ડેટા ઉપલબ્ધ છે:

વિશ્લેષણાત્મક સીધી રેખા ગોઠવણીનો ઉપયોગ કરીને, જુલાઈ માટે ટર્નઓવરનું પ્રમાણ નક્કી કરો.

હા, કોઈ વાંધો નથી: અમે મહિનાઓ 1, 2, 3, 4, 5, 6 ની સંખ્યા કરીએ છીએ અને સામાન્ય અલ્ગોરિધમનો ઉપયોગ કરીએ છીએ, જેના પરિણામે આપણને એક સમીકરણ મળે છે - એકમાત્ર વસ્તુ એ છે કે જ્યારે સમય આવે છે, ત્યારે તેઓ સામાન્ય રીતે ઉપયોગ કરે છે. અક્ષર "તે" (જોકે આ જટિલ નથી). પરિણામી સમીકરણ દર્શાવે છે કે વર્ષના પ્રથમ અર્ધવાર્ષિક ગાળામાં વેપાર ટર્નઓવરમાં સરેરાશ 27.74 એકમોનો વધારો થયો છે. દર મહિને. ચાલો જુલાઈની આગાહી મેળવીએ (મહિનો નંબર 7): ડી.ઇ.

અને આવા અસંખ્ય કાર્યો છે. જેઓ ઈચ્છે છે તેઓ વધારાની સેવાનો ઉપયોગ કરી શકે છે, એટલે કે મારી એક્સેલ કેલ્ક્યુલેટર (ડેમો સંસ્કરણ), જે વિશ્લેષિત સમસ્યા લગભગ તરત જ હલ કરે છે!પ્રોગ્રામનું વર્કિંગ વર્ઝન ઉપલબ્ધ છે વિનિમય પરઅથવા માટે સાંકેતિક ફી.

પાઠના અંતે, કેટલાક અન્ય પ્રકારની નિર્ભરતા શોધવા વિશે સંક્ષિપ્ત માહિતી. વાસ્તવમાં, કહેવા માટે ઘણું બધું નથી, કારણ કે મૂળભૂત અભિગમ અને ઉકેલ એલ્ગોરિધમ સમાન રહે છે.

ચાલો ધારીએ કે પ્રાયોગિક બિંદુઓની ગોઠવણી અતિપરવલય જેવું છે. પછી, શ્રેષ્ઠ હાયપરબોલાના ગુણાંક શોધવા માટે, તમારે લઘુત્તમ કાર્ય શોધવાની જરૂર છે - કોઈપણ વિગતવાર ગણતરીઓ કરી શકે છે અને સમાન સિસ્ટમ પર પહોંચી શકે છે:

ઔપચારિક તકનીકી દૃષ્ટિકોણથી, તે "રેખીય" સિસ્ટમમાંથી મેળવવામાં આવે છે (ચાલો તેને ફૂદડી વડે દર્શાવીએ)સાથે "x" ને બદલીને. સારું, રકમ વિશે શું? ગણતરી કરો, જે પછી શ્રેષ્ઠ ગુણાંક “a” અને “be” હાથ પર બંધ.

જો ત્યાં દરેક કારણ માને છે કે પોઈન્ટ લઘુગણક વળાંક સાથે સ્થિત હોય છે, પછી શ્રેષ્ઠ મૂલ્યો શોધવા માટે આપણે લઘુત્તમ કાર્ય શોધીએ છીએ . ઔપચારિક રીતે, સિસ્ટમમાં (*) ને આની સાથે બદલવાની જરૂર છે:

Excel માં ગણતરીઓ કરતી વખતે, ફંક્શનનો ઉપયોગ કરો એલએન. હું કબૂલ કરું છું કે વિચારણા હેઠળના દરેક કેસ માટે કેલ્ક્યુલેટર બનાવવું મારા માટે ખાસ મુશ્કેલ નથી, પરંતુ જો તમે ગણતરીઓ જાતે "પ્રોગ્રામ" કરો તો તે વધુ સારું રહેશે. મદદ કરવા માટે પાઠ વિડિઓઝ.

ઘાતાંકીય અવલંબન સાથે પરિસ્થિતિ થોડી વધુ જટિલ છે. બાબતને રેખીય કેસમાં ઘટાડવા માટે, અમે ફંક્શન લોગરીધમ લઈએ છીએ અને તેનો ઉપયોગ કરીએ છીએ લઘુગણકના ગુણધર્મો:

હવે, પરિણામી ફંક્શનને રેખીય ફંક્શન સાથે સરખાવીને, આપણે એ નિષ્કર્ષ પર આવીએ છીએ કે સિસ્ટમમાં (*) ને , અને – દ્વારા બદલવું આવશ્યક છે. સગવડ માટે, ચાલો સૂચિત કરીએ:

મહેરબાની કરીને નોંધ કરો કે સિસ્ટમ આદર સાથે ઉકેલાઈ છે અને, અને તેથી, મૂળ શોધ્યા પછી, તમારે ગુણાંક પોતે જ શોધવાનું ભૂલવું જોઈએ નહીં.

પ્રાયોગિક મુદ્દાઓને નજીક લાવવા શ્રેષ્ઠ પેરાબોલા , શોધી કાઢવી જોઈએ ત્રણ ચલોનું ન્યૂનતમ કાર્ય . પ્રમાણભૂત ક્રિયાઓ કર્યા પછી, અમને નીચેની "કાર્યકારી" મળે છે સિસ્ટમ:

હા, અલબત્ત, અહીં વધુ રકમો છે, પરંતુ તમારી મનપસંદ એપ્લિકેશનનો ઉપયોગ કરતી વખતે કોઈ મુશ્કેલીઓ નથી. અને અંતે, હું તમને કહીશ કે એક્સેલનો ઉપયોગ કરીને ઝડપથી ચેક કેવી રીતે કરવું અને ઇચ્છિત ટ્રેન્ડ લાઇન કેવી રીતે બનાવવી: સ્કેટર પ્લોટ બનાવો, માઉસ વડે કોઈપણ પોઈન્ટ પસંદ કરો. અને જમણું ક્લિક કરો વિકલ્પ પસંદ કરો "ટ્રેન્ડ લાઇન ઉમેરો". આગળ, ચાર્ટ પ્રકાર પસંદ કરો અને ટેબ પર "વિકલ્પો"વિકલ્પ સક્રિય કરો "ડાયાગ્રામ પર સમીકરણ બતાવો". ઠીક છે

હંમેશની જેમ, હું લેખને કેટલાક સુંદર શબ્દસમૂહ સાથે સમાપ્ત કરવા માંગુ છું, અને મેં લગભગ ટાઇપ કર્યું છે "ચલણમાં રહો!" પરંતુ સમય જતાં તેણે પોતાનો વિચાર બદલી નાખ્યો. અને એટલા માટે નહીં કે તે સ્ટીરિયોટાઇપ છે. મને ખબર નથી કે તે કોઈના માટે કેવું છે, પરંતુ હું ખરેખર પ્રમોટ કરાયેલ અમેરિકન અને ખાસ કરીને યુરોપિયન વલણને અનુસરવા માંગતો નથી =) તેથી, હું ઈચ્છું છું કે તમારામાંના દરેક તમારી પોતાની લાઇનને વળગી રહે!

http://www.grandars.ru/student/vysshaya-matematika/metod-naimenshih-kvadratov.html

ઓછામાં ઓછી ચોરસ પદ્ધતિ તેના કારણે સૌથી સામાન્ય અને સૌથી વધુ વિકસિત છે રેખીય ઇકોનોમેટ્રિક મોડલ્સના પરિમાણોનો અંદાજ કાઢવા માટેની પદ્ધતિઓની સરળતા અને કાર્યક્ષમતા. તે જ સમયે, તેનો ઉપયોગ કરતી વખતે, કેટલીક સાવચેતી અવલોકન કરવી જોઈએ, કારણ કે તેનો ઉપયોગ કરીને બનાવવામાં આવેલ મોડેલો તેમના પરિમાણોની ગુણવત્તા માટે સંખ્યાબંધ આવશ્યકતાઓને સંતોષી શકતા નથી અને પરિણામે, પ્રક્રિયાના વિકાસની પેટર્નને "સારી રીતે" પ્રતિબિંબિત કરતા નથી. .

ચાલો વધુ વિગતમાં ઓછામાં ઓછા ચોરસ પદ્ધતિનો ઉપયોગ કરીને રેખીય ઇકોનોમેટ્રિક મોડેલના પરિમાણોનો અંદાજ કાઢવા માટેની પ્રક્રિયાને ધ્યાનમાં લઈએ. સામાન્ય રીતે આવા મોડેલને સમીકરણ (1.2) દ્વારા રજૂ કરી શકાય છે:

y t = a 0 + a 1 x 1t +... a n x nt + ε t.

0, a 1,..., a n એ આશ્રિત ચલના મૂલ્યોનું વેક્ટર છે. y= (y 1 , y 2 , ... , y T)" અને સ્વતંત્ર ચલોના મૂલ્યોનું મેટ્રિક્સ

જેમાં પ્રથમ સ્તંભ, જેમાંનો સમાવેશ થાય છે, તે મોડેલ ગુણાંકને અનુરૂપ છે.

લઘુત્તમ ચોરસ પદ્ધતિએ તેનું નામ મૂળભૂત સિદ્ધાંતના આધારે મેળવ્યું છે કે તેના આધારે મેળવેલ પરિમાણ અંદાજ સંતોષવા આવશ્યક છે: મોડેલ ભૂલના ચોરસનો સરવાળો ન્યૂનતમ હોવો જોઈએ.

ઓછામાં ઓછા ચોરસ પદ્ધતિનો ઉપયોગ કરીને સમસ્યાઓ ઉકેલવાના ઉદાહરણો

ઉદાહરણ 2.1.ટ્રેડિંગ એન્ટરપ્રાઇઝમાં 12 સ્ટોર્સનું નેટવર્ક છે, જેની પ્રવૃત્તિઓની માહિતી કોષ્ટકમાં રજૂ કરવામાં આવી છે. 2.1.

એન્ટરપ્રાઇઝનું મેનેજમેન્ટ એ જાણવા માંગે છે કે વાર્ષિક ટર્નઓવરનું કદ સ્ટોરની છૂટક જગ્યા પર કેવી રીતે આધાર રાખે છે.

કોષ્ટક 2.1

સ્ટોર નંબર વાર્ષિક ટર્નઓવર, મિલિયન રુબેલ્સ. છૂટક વિસ્તાર, હજાર m2
19,76 0,24
38,09 0,31
40,95 0,55
41,08 0,48
56,29 0,78
68,51 0,98
75,01 0,94
89,05 1,21
91,13 1,29
91,26 1,12
99,84 1,29
108,55 1,49

ઓછામાં ઓછા ચોરસ ઉકેલ.ચાલો મી સ્ટોરના વાર્ષિક ટર્નઓવરને દર્શાવીએ, મિલિયન રુબેલ્સ; - મી સ્ટોરનો છૂટક વિસ્તાર, હજાર એમ 2.

ફિગ.2.1. ઉદાહરણ માટે સ્કેટરપ્લોટ 2.1

ચલો વચ્ચેના કાર્યાત્મક સંબંધનું સ્વરૂપ નક્કી કરવા અને અમે સ્કેટર ડાયાગ્રામ (ફિગ. 2.1) બનાવીશું.

સ્કેટર ડાયાગ્રામના આધારે, અમે નિષ્કર્ષ પર આવી શકીએ છીએ કે વાર્ષિક ટર્નઓવર રિટેલ સ્પેસ પર હકારાત્મક રીતે આધારિત છે (એટલે ​​​​કે y વધવાની સાથે વધશે). કાર્યાત્મક જોડાણનું સૌથી યોગ્ય સ્વરૂપ છે રેખીય.

વધુ ગણતરીઓ માટેની માહિતી કોષ્ટકમાં રજૂ કરવામાં આવી છે. 2.2. ઓછામાં ઓછી ચોરસ પદ્ધતિનો ઉપયોગ કરીને, અમે રેખીય એક-પરિબળ ઇકોનોમેટ્રિક મોડેલના પરિમાણોનો અંદાજ લગાવીએ છીએ

કોષ્ટક 2.2

t y t x 1t y t 2 x 1t 2 x 1t y t
19,76 0,24 390,4576 0,0576 4,7424
38,09 0,31 1450,8481 0,0961 11,8079
40,95 0,55 1676,9025 0,3025 22,5225
41,08 0,48 1687,5664 0,2304 19,7184
56,29 0,78 3168,5641 0,6084 43,9062
68,51 0,98 4693,6201 0,9604 67,1398
75,01 0,94 5626,5001 0,8836 70,5094
89,05 1,21 7929,9025 1,4641 107,7505
91,13 1,29 8304,6769 1,6641 117,5577
91,26 1,12 8328,3876 1,2544 102,2112
99,84 1,29 9968,0256 1,6641 128,7936
108,55 1,49 11783,1025 2,2201 161,7395
એસ 819,52 10,68 65008,554 11,4058 858,3991
સરેરાશ 68,29 0,89

આમ,

તેથી, છૂટક જગ્યામાં 1 હજાર એમ 2 દ્વારા વધારો સાથે, અન્ય વસ્તુઓ સમાન હોવાને કારણે, સરેરાશ વાર્ષિક ટર્નઓવર 67.8871 મિલિયન રુબેલ્સ વધે છે.

ઉદાહરણ 2.2.કંપનીના મેનેજમેન્ટે નોંધ્યું કે વાર્ષિક ટર્નઓવર માત્ર સ્ટોરના વેચાણ વિસ્તાર પર જ નહીં (ઉદાહરણ 2.1 જુઓ), પણ મુલાકાતીઓની સરેરાશ સંખ્યા પર પણ આધાર રાખે છે. સંબંધિત માહિતી કોષ્ટકમાં રજૂ કરવામાં આવી છે. 2.3.

કોષ્ટક 2.3

ઉકેલ.ચાલો આપણે સૂચિત કરીએ - દિવસ દીઠ મી સ્ટોર પર મુલાકાતીઓની સરેરાશ સંખ્યા, હજાર લોકો.

ચલો વચ્ચેના કાર્યાત્મક સંબંધનું સ્વરૂપ નક્કી કરવા અને અમે સ્કેટર ડાયાગ્રામ (ફિગ. 2.2) બનાવીશું.

સ્કેટરપ્લોટના આધારે, અમે નિષ્કર્ષ પર આવી શકીએ છીએ કે વાર્ષિક ટર્નઓવર દરરોજ મુલાકાતીઓની સરેરાશ સંખ્યા પર હકારાત્મક રીતે નિર્ભર છે (એટલે ​​​​કે, y વધવાની સાથે વધશે). કાર્યાત્મક અવલંબનનું સ્વરૂપ રેખીય છે.

ચોખા. 2.2. ઉદાહરણ માટે સ્કેટરપ્લોટ 2.2

કોષ્ટક 2.4

t x 2t x 2t 2 y t x 2t x 1t x 2t
8,25 68,0625 163,02 1,98
10,24 104,8575 390,0416 3,1744
9,31 86,6761 381,2445 5,1205
11,01 121,2201 452,2908 5,2848
8,54 72,9316 480,7166 6,6612
7,51 56,4001 514,5101 7,3598
12,36 152,7696 927,1236 11,6184
10,81 116,8561 962,6305 13,0801
9,89 97,8121 901,2757 12,7581
13,72 188,2384 1252,0872 15,3664
12,27 150,5529 1225,0368 15,8283
13,92 193,7664 1511,016 20,7408
એસ 127,83 1410,44 9160,9934 118,9728
સરેરાશ 10,65

સામાન્ય રીતે, બે-પરિબળ ઇકોનોમેટ્રિક મોડેલના પરિમાણો નક્કી કરવા માટે જરૂરી છે

y t = a 0 + a 1 x 1t + a 2 x 2t + ε t

વધુ ગણતરીઓ માટે જરૂરી માહિતી કોષ્ટકમાં રજૂ કરવામાં આવી છે. 2.4.

ચાલો ઓછામાં ઓછા ચોરસ પદ્ધતિનો ઉપયોગ કરીને રેખીય બે-પરિબળ ઇકોનોમેટ્રિક મોડેલના પરિમાણોનો અંદાજ લગાવીએ.

આમ,

ગુણાંક =61.6583 નો અંદાજ દર્શાવે છે કે, અન્ય વસ્તુઓ સમાન હોવાથી, છૂટક જગ્યામાં 1 હજાર મીટર 2ના વધારા સાથે, વાર્ષિક ટર્નઓવર સરેરાશ 61.6583 મિલિયન રુબેલ્સથી વધશે.

ગુણાંક અંદાજ = 2.2748 દર્શાવે છે કે, 1 હજાર લોકો દીઠ મુલાકાતીઓની સરેરાશ સંખ્યામાં વધારા સાથે, અન્ય વસ્તુઓ સમાન છે. દરરોજ, વાર્ષિક ટર્નઓવર સરેરાશ 2.2748 મિલિયન રુબેલ્સથી વધશે.

ઉદાહરણ 2.3.કોષ્ટકમાં પ્રસ્તુત માહિતીનો ઉપયોગ કરીને. 2.2 અને 2.4, એક-પરિબળ ઇકોનોમેટ્રિક મોડેલના પરિમાણનો અંદાજ કાઢો

મી સ્ટોરના વાર્ષિક ટર્નઓવરનું કેન્દ્રિત મૂલ્ય ક્યાં છે, મિલિયન રુબેલ્સ; - t-th સ્ટોર પર મુલાકાતીઓની સરેરાશ દૈનિક સંખ્યા, હજાર લોકોનું કેન્દ્રિત મૂલ્ય. (ઉદાહરણો 2.1-2.2 જુઓ).

ઉકેલ.ગણતરીઓ માટે જરૂરી વધારાની માહિતી કોષ્ટકમાં રજૂ કરવામાં આવી છે. 2.5.

કોષ્ટક 2.5

-48,53 -2,40 5,7720 116,6013
-30,20 -0,41 0,1702 12,4589
-27,34 -1,34 1,8023 36,7084
-27,21 0,36 0,1278 -9,7288
-12,00 -2,11 4,4627 25,3570
0,22 -3,14 9,8753 -0,6809
6,72 1,71 2,9156 11,4687
20,76 0,16 0,0348 3,2992
22,84 -0,76 0,5814 -17,413
22,97 3,07 9,4096 70,4503
31,55 1,62 2,6163 51,0267
40,26 3,27 10,6766 131,5387
રકમ 48,4344 431,0566

ફોર્મ્યુલા (2.35) નો ઉપયોગ કરીને, અમે મેળવીએ છીએ

આમ,

http://www.cleverstudents.ru/articles/mnk.html

ઉદાહરણ.

ચલોના મૂલ્યો પર પ્રાયોગિક ડેટા એક્સઅને ખાતેકોષ્ટકમાં આપેલ છે.

તેમના સંરેખણના પરિણામે, કાર્ય પ્રાપ્ત થાય છે

ઉપયોગ કરીને ઓછામાં ઓછા ચોરસ પદ્ધતિ, રેખીય અવલંબન દ્વારા આ ડેટાને અંદાજિત કરો y=ax+b(પરિમાણો શોધો અને b). બે લીટીઓમાંથી કઈ વધુ સારી (ઓછામાં ઓછા ચોરસ પદ્ધતિના અર્થમાં) પ્રાયોગિક ડેટાને સંરેખિત કરે છે તે શોધો. એક ચિત્ર બનાવો.

ઉકેલ.

અમારા ઉદાહરણમાં n=5. જરૂરી ગુણાંકના સૂત્રોમાં સમાવિષ્ટ રકમની ગણતરી કરવાની સુવિધા માટે અમે કોષ્ટક ભરીએ છીએ.

કોષ્ટકની ચોથી પંક્તિના મૂલ્યો 2જી પંક્તિના મૂલ્યોને દરેક સંખ્યા માટે 3જી પંક્તિના મૂલ્યો દ્વારા ગુણાકાર કરીને મેળવવામાં આવે છે. i.

કોષ્ટકની પાંચમી પંક્તિના મૂલ્યો દરેક સંખ્યા માટે 2જી પંક્તિમાંના મૂલ્યોને વર્ગીકરણ કરીને મેળવવામાં આવે છે. i.

કોષ્ટકની છેલ્લી કૉલમમાંના મૂલ્યો એ પંક્તિઓની આજુબાજુના મૂલ્યોનો સરવાળો છે.

ગુણાંક શોધવા માટે અમે ઓછામાં ઓછા ચોરસ પદ્ધતિના સૂત્રોનો ઉપયોગ કરીએ છીએ અને b. અમે કોષ્ટકના છેલ્લા કૉલમમાંથી અનુરૂપ મૂલ્યોને તેમાં બદલીએ છીએ:

આથી, y = 0.165x+2.184- ઇચ્છિત અંદાજિત સીધી રેખા.

તેમાંથી કઈ લીટીઓ છે તે શોધવાનું બાકી છે y = 0.165x+2.184અથવા મૂળ ડેટાનું વધુ સારું અનુમાન કરે છે, એટલે કે, ઓછામાં ઓછા ચોરસ પદ્ધતિનો ઉપયોગ કરીને અંદાજ.

પુરાવો.

જેથી જ્યારે મળે અને bફંક્શન સૌથી નાનું મૂલ્ય લે છે, તે જરૂરી છે કે આ બિંદુએ ફંક્શન માટે બીજા ક્રમના વિભેદકના ચતુર્ભુજ સ્વરૂપનું મેટ્રિક્સ ચોક્કસ હકારાત્મક હતી. ચાલો તે બતાવીએ.

બીજા ક્રમના વિભેદકમાં ફોર્મ છે:

એટલે કે

તેથી, ચતુર્ભુજ સ્વરૂપનું મેટ્રિક્સ ફોર્મ ધરાવે છે

અને તત્વોના મૂલ્યો પર આધાર રાખતા નથી અને b.

ચાલો બતાવીએ કે મેટ્રિક્સ હકારાત્મક ચોક્કસ છે. આ કરવા માટે, કોણીય સગીરો હકારાત્મક હોવા જોઈએ.

પ્રથમ ક્રમનો કોણીય ગૌણ . અસમાનતા કડક છે, કારણ કે પોઈન્ટ

પ્રાયોગિક ડેટાનો અંદાજ એ એક વિશ્લેષણાત્મક કાર્ય સાથે પ્રાયોગિક રીતે મેળવેલા ડેટાને બદલવા પર આધારિત પદ્ધતિ છે જે મૂળ મૂલ્યો (પ્રયોગ અથવા પ્રયોગ દરમિયાન મેળવેલ ડેટા) સાથે નોડલ પોઈન્ટ પર સૌથી વધુ નજીકથી પસાર થાય છે અથવા એકરૂપ થાય છે. હાલમાં, વિશ્લેષણાત્મક કાર્યને વ્યાખ્યાયિત કરવાની બે રીતો છે:

n-ડિગ્રી ઇન્ટરપોલેશન બહુપદી બનાવીને જે પસાર થાય છે સીધા બધા બિંદુઓ દ્વારાઆપેલ ડેટા એરે. આ કિસ્સામાં, અંદાજિત કાર્ય આના સ્વરૂપમાં રજૂ થાય છે: લેગ્રેન્જ સ્વરૂપમાં પ્રક્ષેપ બહુપદી અથવા ન્યૂટન સ્વરૂપમાં પ્રક્ષેપ બહુપદી.

n-ડિગ્રી અંદાજિત બહુપદી બનાવીને જે પસાર થાય છે પોઈન્ટની તાત્કાલિક નજીકમાંઆપેલ ડેટા એરેમાંથી. આમ, અંદાજિત કાર્ય પ્રયોગ દરમિયાન ઉદ્ભવતા તમામ રેન્ડમ અવાજ (અથવા ભૂલો) ને સરળ બનાવે છે: પ્રયોગ દરમિયાન માપેલા મૂલ્યો રેન્ડમ પરિબળો પર આધાર રાખે છે જે તેમના પોતાના રેન્ડમ કાયદાઓ (માપ અથવા સાધનની ભૂલો, અચોક્કસતા અથવા પ્રાયોગિક) અનુસાર વધઘટ થાય છે. ભૂલો). આ કિસ્સામાં, અંદાજિત કાર્ય ઓછામાં ઓછા ચોરસ પદ્ધતિનો ઉપયોગ કરીને નક્કી કરવામાં આવે છે.

ઓછામાં ઓછા ચોરસ પદ્ધતિ(અંગ્રેજી સાહિત્યમાં ઓર્ડિનરી લીસ્ટ સ્ક્વેર્સ, ઓએલએસ) એ અંદાજિત કાર્ય નક્કી કરવા પર આધારિત ગાણિતિક પદ્ધતિ છે, જે પ્રાયોગિક ડેટાના આપેલ એરેમાંથી પોઈન્ટની સૌથી નજીકમાં બનાવવામાં આવે છે. મૂળ અને અંદાજિત કાર્યો F(x) ની નિકટતા સંખ્યાત્મક માપ દ્વારા નક્કી કરવામાં આવે છે, એટલે કે: અંદાજિત વળાંક F(x) માંથી પ્રાયોગિક ડેટાના વર્ગ વિચલનોનો સરવાળો સૌથી નાનો હોવો જોઈએ.

ઓછામાં ઓછા ચોરસ પદ્ધતિનો ઉપયોગ કરીને બાંધવામાં આવેલ અંદાજિત વળાંક

ઓછામાં ઓછી ચોરસ પદ્ધતિનો ઉપયોગ થાય છે:

જ્યારે સમીકરણોની સંખ્યા અજાણ્યાઓની સંખ્યા કરતાં વધી જાય ત્યારે સમીકરણોની અતિનિર્ધારિત પ્રણાલીઓને ઉકેલવા માટે;

સમીકરણોની સામાન્ય (અતિનિર્ધારિત નહીં) બિનરેખીય પ્રણાલીઓના કિસ્સામાં ઉકેલ શોધવા માટે;

કેટલાક અંદાજિત કાર્ય સાથે અંદાજિત બિંદુ મૂલ્યો માટે.

ઓછામાં ઓછા ચોરસ પદ્ધતિનો ઉપયોગ કરીને અંદાજિત કાર્ય પ્રાયોગિક ડેટાના આપેલ એરેમાંથી ગણતરી કરેલ અંદાજિત કાર્યના લઘુત્તમ સરવાળા વર્ગના વિચલનોની સ્થિતિ પરથી નક્કી કરવામાં આવે છે. લઘુત્તમ ચોરસ પદ્ધતિનો આ માપદંડ નીચેની અભિવ્યક્તિ તરીકે લખાયેલ છે:

નોડલ પોઈન્ટ પર ગણતરી કરેલ અંદાજિત કાર્યના મૂલ્યો,

નોડલ પોઈન્ટ પર પ્રાયોગિક ડેટાની આપેલ શ્રેણી.

ચતુર્ભુજ માપદંડમાં સંખ્યાબંધ "સારા" ગુણધર્મો છે, જેમ કે ભિન્નતા, બહુપદી અંદાજિત કાર્યો સાથે અંદાજિત સમસ્યાનો અનન્ય ઉકેલ પૂરો પાડે છે.

સમસ્યાની પરિસ્થિતિઓના આધારે, અંદાજિત કાર્ય એ ડિગ્રી m નું બહુપદી છે

અંદાજિત કાર્યની ડિગ્રી નોડલ બિંદુઓની સંખ્યા પર આધારિત નથી, પરંતુ તેનું પરિમાણ હંમેશા આપેલ પ્રાયોગિક ડેટા એરેના પરિમાણ (બિંદુઓની સંખ્યા) કરતા ઓછું હોવું જોઈએ.

∙ જો અંદાજિત કાર્યની ડિગ્રી m=1 હોય, તો આપણે સીધી રેખા (રેખીય રીગ્રેસન) સાથે ટેબ્યુલર ફંક્શનનું અનુમાન કરીએ છીએ.

∙ જો અંદાજિત ફંક્શનની ડિગ્રી m=2 હોય, તો આપણે ટેબલ ફંક્શનને ચતુર્ભુજ પેરાબોલા (ચતુર્ભુજ અંદાજ) સાથે અંદાજિત કરીએ છીએ.

∙ જો અંદાજિત ફંક્શનની ડિગ્રી m=3 હોય, તો આપણે ક્યુબિક પેરાબોલા (ઘન અંદાજ) વડે ટેબલ ફંક્શનનો અંદાજ લગાવીએ છીએ.

સામાન્ય કિસ્સામાં, જ્યારે આપેલ કોષ્ટક મૂલ્યો માટે ડિગ્રી m ની અંદાજિત બહુપદી બનાવવી જરૂરી હોય, ત્યારે તમામ નોડલ બિંદુઓ પરના વર્ગ વિચલનોના લઘુત્તમ સરવાળા માટેની સ્થિતિ નીચેના સ્વરૂપમાં ફરીથી લખવામાં આવે છે:

- ડિગ્રી m ના અંદાજિત બહુપદીના અજાણ્યા ગુણાંક;

ઉલ્લેખિત કોષ્ટક મૂલ્યોની સંખ્યા.

ન્યૂનતમ ફંક્શનના અસ્તિત્વ માટે જરૂરી શરત એ છે કે અજાણ્યા ચલોના સંદર્ભમાં તેના આંશિક ડેરિવેટિવ્સની શૂન્યની સમાનતા. . પરિણામે, અમે સમીકરણોની નીચેની સિસ્ટમ મેળવીએ છીએ:

ચાલો પરિણામી સમીકરણોની રેખીય પ્રણાલીનું રૂપાંતર કરીએ: કૌંસ ખોલો અને મુક્ત શબ્દોને અભિવ્યક્તિની જમણી બાજુએ ખસેડો. પરિણામે, રેખીય બીજગણિત અભિવ્યક્તિઓની પરિણામી સિસ્ટમ નીચેના સ્વરૂપમાં લખવામાં આવશે:

રેખીય બીજગણિત અભિવ્યક્તિઓની આ સિસ્ટમ મેટ્રિક્સ સ્વરૂપમાં ફરીથી લખી શકાય છે:

પરિણામે, m+1 પરિમાણના રેખીય સમીકરણોની સિસ્ટમ પ્રાપ્ત થઈ, જેમાં m+1 અજ્ઞાતનો સમાવેશ થાય છે. રેખીય બીજગણિત સમીકરણો (ઉદાહરણ તરીકે, ગૌસીયન પદ્ધતિ) ઉકેલવા માટેની કોઈપણ પદ્ધતિનો ઉપયોગ કરીને આ સિસ્ટમ ઉકેલી શકાય છે. સોલ્યુશનના પરિણામે, અંદાજિત ફંક્શનના અજાણ્યા પરિમાણો જોવા મળશે જે મૂળ ડેટામાંથી અંદાજિત કાર્યના વર્ગ વિચલનોનો ન્યૂનતમ સરવાળો પૂરો પાડે છે, એટલે કે. શ્રેષ્ઠ શક્ય ચતુર્ભુજ અંદાજ. તે યાદ રાખવું જોઈએ કે જો સ્રોત ડેટાનું એક મૂલ્ય પણ બદલાય છે, તો બધા ગુણાંક તેમના મૂલ્યો બદલશે, કારણ કે તે સ્રોત ડેટા દ્વારા સંપૂર્ણપણે નિર્ધારિત છે.

રેખીય અવલંબન દ્વારા સ્ત્રોત ડેટાનો અંદાજ

(રેખીય રીગ્રેશન)

ઉદાહરણ તરીકે, ચાલો અંદાજિત કાર્ય નક્કી કરવા માટેની તકનીકને ધ્યાનમાં લઈએ, જે રેખીય અવલંબનના સ્વરૂપમાં ઉલ્લેખિત છે. ન્યૂનતમ ચોરસ પદ્ધતિ અનુસાર, લઘુત્તમ વર્ગ વિચલનોના સરવાળા માટેની શરત નીચેના સ્વરૂપમાં લખાયેલ છે:

કોષ્ટક ગાંઠોના કોઓર્ડિનેટ્સ;

અંદાજિત કાર્યના અજ્ઞાત ગુણાંક, જે રેખીય અવલંબન તરીકે ઉલ્લેખિત છે.

ન્યૂનતમ ફંક્શનના અસ્તિત્વ માટે જરૂરી શરત એ છે કે અજાણ્યા ચલોના સંદર્ભમાં તેના આંશિક ડેરિવેટિવ્સની શૂન્યની સમાનતા. પરિણામે, અમે સમીકરણોની નીચેની સિસ્ટમ મેળવીએ છીએ:

ચાલો પરિણામી સમીકરણોની રેખીય પ્રણાલીનું પરિવર્તન કરીએ.

અમે રેખીય સમીકરણોની પરિણામી સિસ્ટમ હલ કરીએ છીએ. વિશ્લેષણાત્મક સ્વરૂપમાં અંદાજિત કાર્યના ગુણાંક નીચે પ્રમાણે નિર્ધારિત કરવામાં આવે છે (ક્રેમરની પદ્ધતિ):

આ ગુણાંકો આપેલ ટેબ્યુલર મૂલ્યો (પ્રાયોગિક ડેટા) માંથી અંદાજિત કાર્યના ચોરસના સરવાળાને ઘટાડવાના માપદંડ અનુસાર રેખીય અંદાજિત કાર્યનું નિર્માણ સુનિશ્ચિત કરે છે.

ઓછામાં ઓછા ચોરસ પદ્ધતિના અમલ માટે અલ્ગોરિધમ

1. પ્રારંભિક ડેટા:

N ની સંખ્યા સાથે પ્રાયોગિક ડેટાની શ્રેણી ઉલ્લેખિત છે

અંદાજિત બહુપદી (m) ની ડિગ્રી ઉલ્લેખિત છે

2. ગણતરી અલ્ગોરિધમ:

2.1. પરિમાણો સાથે સમીકરણોની સિસ્ટમ બનાવવા માટે ગુણાંક નક્કી કરવામાં આવે છે

સમીકરણોની સિસ્ટમના ગુણાંક (સમીકરણની ડાબી બાજુ)

- સમીકરણોની સિસ્ટમના ચોરસ મેટ્રિક્સના કૉલમ નંબરની અનુક્રમણિકા

રેખીય સમીકરણોની સિસ્ટમની મુક્ત શરતો (સમીકરણની જમણી બાજુ)

- સમીકરણોની સિસ્ટમના ચોરસ મેટ્રિક્સની પંક્તિ સંખ્યાની અનુક્રમણિકા

2.2. પરિમાણ સાથે રેખીય સમીકરણોની સિસ્ટમની રચના.

2.3. ડિગ્રી m ની અંદાજિત બહુપદીના અજાણ્યા ગુણાંક નક્કી કરવા માટે રેખીય સમીકરણોની સિસ્ટમ ઉકેલવી.

2.4 તમામ નોડલ બિંદુઓ પરના મૂળ મૂલ્યોમાંથી અંદાજિત બહુપદીના વર્ગ વિચલનોના સરવાળાનું નિર્ધારણ

ચોરસ વિચલનોના સરવાળાનું મળેલ મૂલ્ય એ ન્યૂનતમ શક્ય છે.

અન્ય કાર્યોનો ઉપયોગ કરીને અંદાજ

એ નોંધવું જોઈએ કે જ્યારે ન્યૂનતમ ચોરસ પદ્ધતિ અનુસાર મૂળ ડેટાનો અંદાજ લગાવવામાં આવે છે, ત્યારે લઘુગણક કાર્ય, ઘાતાંકીય કાર્ય અને પાવર ફંક્શનનો ઉપયોગ કેટલીકવાર અંદાજિત કાર્ય તરીકે થાય છે.

લઘુગણક અંદાજ

ચાલો કેસને ધ્યાનમાં લઈએ જ્યારે અંદાજિત કાર્ય ફોર્મના લઘુગણક કાર્ય દ્વારા આપવામાં આવે છે:

ઓછામાં ઓછા ચોરસ પદ્ધતિરીગ્રેસન સમીકરણના પરિમાણોનો અંદાજ કાઢવા માટે વપરાય છે.
રેખાઓની સંખ્યા (સ્રોત માહિતી)

લાક્ષણિકતાઓ વચ્ચેના સ્ટોકેસ્ટિક સંબંધોનો અભ્યાસ કરવાની પદ્ધતિઓમાંની એક રીગ્રેસન વિશ્લેષણ છે.
રીગ્રેસન વિશ્લેષણ એ રીગ્રેસન સમીકરણની વ્યુત્પત્તિ છે, જેની મદદથી રેન્ડમ ચલ (પરિણામ વિશેષતા) નું સરેરાશ મૂલ્ય જોવા મળે છે જો અન્ય (અથવા અન્ય) ચલોનું મૂલ્ય (પરિબળ-લક્ષણો) જાણીતું હોય. તેમાં નીચેના પગલાં શામેલ છે:

  1. જોડાણના સ્વરૂપની પસંદગી (વિશ્લેષણાત્મક રીગ્રેસન સમીકરણનો પ્રકાર);
  2. સમીકરણ પરિમાણોનો અંદાજ;
  3. વિશ્લેષણાત્મક રીગ્રેસન સમીકરણની ગુણવત્તાનું મૂલ્યાંકન.
મોટેભાગે, લક્ષણોના આંકડાકીય સંબંધનું વર્ણન કરવા માટે રેખીય સ્વરૂપનો ઉપયોગ થાય છે. રેખીય સંબંધો પર ધ્યાન તેના પરિમાણોના સ્પષ્ટ આર્થિક અર્થઘટન, ચલોની મર્યાદિત ભિન્નતા અને હકીકત એ છે કે મોટાભાગના કિસ્સાઓમાં સંબંધોના બિનરેખીય સ્વરૂપો ગણતરી કરવા માટે રેખીય સ્વરૂપમાં રૂપાંતરિત થાય છે. .
રેખીય જોડી પ્રમાણે સંબંધના કિસ્સામાં, રીગ્રેસન સમીકરણ આ સ્વરૂપ લેશે: y i =a+b·x i +u i . આ સમીકરણના પરિમાણો a અને b આંકડાકીય અવલોકન ડેટા x અને y પરથી અંદાજવામાં આવે છે. આવા મૂલ્યાંકનનું પરિણામ એ સમીકરણ છે: , જ્યાં , પરિમાણો a અને b નો અંદાજ છે, તે રીગ્રેસન સમીકરણ (ગણતરી મૂલ્ય) માંથી પ્રાપ્ત પરિણામી વિશેષતા (ચલ) નું મૂલ્ય છે.

મોટે ભાગે પરિમાણો અંદાજ કરવા માટે વપરાય છે ઓછામાં ઓછા ચોરસ પદ્ધતિ (LSM).
ઓછામાં ઓછી ચોરસ પદ્ધતિ રીગ્રેસન સમીકરણના પરિમાણોના શ્રેષ્ઠ (સતત, કાર્યક્ષમ અને નિષ્પક્ષ) અંદાજો પ્રદાન કરે છે. પરંતુ જો રેન્ડમ ટર્મ (u) અને સ્વતંત્ર ચલ (x) સંબંધિત અમુક ધારણાઓ પૂરી થાય તો જ (OLS ધારણાઓ જુઓ).

ઓછામાં ઓછા ચોરસ પદ્ધતિનો ઉપયોગ કરીને રેખીય જોડી સમીકરણના પરિમાણોનો અંદાજ કાઢવાની સમસ્યાનીચે મુજબ છે: પરિમાણોના આવા અંદાજો મેળવવા માટે, , જેના પર પરિણામી લાક્ષણિકતાના વાસ્તવિક મૂલ્યોના વર્ગ વિચલનોનો સરવાળો - ગણતરી કરેલ મૂલ્યોમાંથી y i - ન્યૂનતમ છે.
ઔપચારિક રીતે OLS ટેસ્ટઆ રીતે લખી શકાય છે: .

ઓછામાં ઓછા ચોરસ પદ્ધતિઓનું વર્ગીકરણ

  1. ઓછામાં ઓછા ચોરસ પદ્ધતિ.
  2. મહત્તમ સંભાવના પદ્ધતિ (સામાન્ય શાસ્ત્રીય રેખીય રીગ્રેસન મોડેલ માટે, રીગ્રેસન અવશેષોની સામાન્યતા નક્કી કરવામાં આવે છે).
  3. સામાન્યકૃત લઘુત્તમ ચોરસ OLS પદ્ધતિનો ઉપયોગ ભૂલોના સ્વતઃસંબંધના કિસ્સામાં અને હેટરોસેડેસ્ટીસીટીના કિસ્સામાં થાય છે.
  4. વેઇટેડ ન્યૂનતમ ચોરસ પદ્ધતિ (હેટરોસેડેસ્ટિક અવશેષો સાથે OLS નો વિશિષ્ટ કેસ).

ચાલો મુદ્દો સમજાવીએ ક્લાસિકલ ઓછામાં ઓછા ચોરસ પદ્ધતિ ગ્રાફિકલી. આ કરવા માટે, અમે એક લંબચોરસ કોઓર્ડિનેટ સિસ્ટમમાં ઓબ્ઝર્વેશનલ ડેટા (x i, y i, i=1;n) પર આધારિત સ્કેટર પ્લોટ બનાવીશું (આવા સ્કેટર પ્લોટને સહસંબંધ ક્ષેત્ર કહેવામાં આવે છે). ચાલો એક સીધી રેખા પસંદ કરવાનો પ્રયાસ કરીએ જે સહસંબંધ ક્ષેત્રના બિંદુઓની સૌથી નજીક હોય. ઓછામાં ઓછા ચોરસ પદ્ધતિ અનુસાર, રેખા પસંદ કરવામાં આવે છે જેથી સહસંબંધ ક્ષેત્રના બિંદુઓ અને આ રેખા વચ્ચેના ઊભી અંતરના વર્ગોનો સરવાળો ન્યૂનતમ હોય.

આ સમસ્યા માટે ગાણિતિક સંકેત: .
y i અને x i =1...n ના મૂલ્યો અમને જાણીતા છે આ અવલોકન ડેટા છે. એસ ફંક્શનમાં તેઓ સ્થિરાંકોનું પ્રતિનિધિત્વ કરે છે. આ ફંક્શનમાંના ચલ એ પરિમાણોના જરૂરી અંદાજો છે - , . બે ચલોના ફંક્શનનું ન્યૂનતમ શોધવા માટે, દરેક પેરામીટર માટે આ ફંક્શનના આંશિક ડેરિવેટિવ્સની ગણતરી કરવી જરૂરી છે અને તેને શૂન્ય સાથે સરખાવી જોઈએ, એટલે કે. .
પરિણામે, અમે 2 સામાન્ય રેખીય સમીકરણોની સિસ્ટમ મેળવીએ છીએ:
આ સિસ્ટમને હલ કરીને, અમને જરૂરી પરિમાણ અંદાજ મળે છે:

રીગ્રેસન સમીકરણના પરિમાણોની ગણતરીની શુદ્ધતા રકમની તુલના કરીને ચકાસી શકાય છે (ગણતરીના રાઉન્ડિંગને કારણે કેટલીક વિસંગતતા હોઈ શકે છે).
પરિમાણ અંદાજની ગણતરી કરવા માટે, તમે કોષ્ટક 1 બનાવી શકો છો.
રીગ્રેશન ગુણાંક b નું ચિહ્ન સંબંધની દિશા દર્શાવે છે (જો b >0, સંબંધ સીધો છે, જો b<0, то связь обратная). Величина b показывает на сколько единиц изменится в среднем признак-результат -y при изменении признака-фактора - х на 1 единицу своего измерения.
ઔપચારિક રીતે, પરિમાણ aનું મૂલ્ય એ શૂન્યની બરાબર x સાથે y નું સરેરાશ મૂલ્ય છે. જો લક્ષણ-પરિબળ શૂન્ય મૂલ્ય ધરાવતું નથી અને ન હોઈ શકે, તો પરિમાણ a નું ઉપરોક્ત અર્થઘટન અર્થમાં નથી.

લાક્ષણિકતાઓ વચ્ચેના સંબંધની નિકટતાનું મૂલ્યાંકન રેખીય જોડી સહસંબંધ ગુણાંકનો ઉપયોગ કરીને હાથ ધરવામાં આવે છે - r x,y. તે સૂત્રનો ઉપયોગ કરીને ગણતરી કરી શકાય છે: . વધુમાં, રેખીય જોડી સહસંબંધ ગુણાંકને રીગ્રેસન ગુણાંક b દ્વારા નક્કી કરી શકાય છે: .
રેખીય જોડી સહસંબંધ ગુણાંકના સ્વીકાર્ય મૂલ્યોની શ્રેણી –1 થી +1 સુધીની છે. સહસંબંધ ગુણાંકનું ચિહ્ન સંબંધની દિશા દર્શાવે છે. જો r x, y >0, તો કનેક્શન સીધું છે; જો r x, y<0, то связь обратная.
જો આ ગુણાંક તીવ્રતામાં એકતાની નજીક છે, તો પછી લાક્ષણિકતાઓ વચ્ચેના સંબંધને એકદમ નજીકના રેખીય તરીકે અર્થઘટન કરી શકાય છે. જો તેનું મોડ્યુલ એક ê r x , y ê =1 જેટલું હોય, તો લાક્ષણિકતાઓ વચ્ચેનો સંબંધ કાર્યાત્મક રેખીય છે. જો x અને y લક્ષણો રેખીય રીતે સ્વતંત્ર છે, તો r x,y 0 ની નજીક છે.
r x,y ની ગણતરી કરવા માટે, તમે કોષ્ટક 1 નો પણ ઉપયોગ કરી શકો છો.

કોષ્ટક 1

N અવલોકનોx iy ix i ∙y i
1 x 1y 1x 1 y 1
2 x 2y 2x 2 y 2
...
nx ny nx n y n
કૉલમ સરવાળો∑x∑y∑xy
સરેરાશ મૂલ્ય
પરિણામી રીગ્રેસન સમીકરણની ગુણવત્તાનું મૂલ્યાંકન કરવા માટે, નિર્ધારણના સૈદ્ધાંતિક ગુણાંકની ગણતરી કરો - R 2 yx:

,
જ્યાં d 2 એ રીગ્રેશન સમીકરણ દ્વારા સમજાવાયેલ y નું વિચલન છે;
e 2 - અવશેષ (રીગ્રેસન સમીકરણ દ્વારા ન સમજાવાયેલ) y નું વિચલન;
s 2 y - y નો કુલ (કુલ) વિચલન.
નિર્ધારણનો ગુણાંક કુલ ભિન્નતા (વિક્ષેપ) y માં રીગ્રેસન (અને પરિણામે, પરિબળ x) દ્વારા સમજાવાયેલ પરિણામી લક્ષણ y ના વિવિધતા (વિખેરવું) ના પ્રમાણને દર્શાવે છે. નિર્ધારણનો ગુણાંક R 2 yx 0 થી 1 સુધીના મૂલ્યો લે છે. તદનુસાર, મૂલ્ય 1-R 2 yx એ મોડેલ અને સ્પષ્ટીકરણની ભૂલોમાં ધ્યાનમાં લેવામાં ન આવતા અન્ય પરિબળોના પ્રભાવને કારણે થતા વિચલન y ના પ્રમાણને દર્શાવે છે.
જોડી કરેલ રેખીય રીગ્રેશન સાથે, R 2 yx = r 2 yx.

ઉદાહરણ.

ચલોના મૂલ્યો પર પ્રાયોગિક ડેટા એક્સઅને ખાતેકોષ્ટકમાં આપેલ છે.

તેમના સંરેખણના પરિણામે, કાર્ય પ્રાપ્ત થાય છે

ઉપયોગ કરીને ઓછામાં ઓછા ચોરસ પદ્ધતિ, રેખીય અવલંબન દ્વારા આ ડેટાને અંદાજિત કરો y=ax+b(પરિમાણો શોધો અને b). બે લીટીઓમાંથી કઈ વધુ સારી (ઓછામાં ઓછા ચોરસ પદ્ધતિના અર્થમાં) પ્રાયોગિક ડેટાને સંરેખિત કરે છે તે શોધો. એક ચિત્ર બનાવો.

ન્યૂનતમ ચોરસ પદ્ધતિ (LSM) નો સાર.

કાર્ય એ રેખીય અવલંબન ગુણાંક શોધવાનું છે કે જેના પર બે ચલોનું કાર્ય છે અને b સૌથી નાનું મૂલ્ય લે છે. એટલે કે આપેલ છે અને bમળેલી સીધી રેખામાંથી પ્રાયોગિક ડેટાના ચોરસ વિચલનોનો સરવાળો સૌથી નાનો હશે. આ ન્યૂનતમ ચોરસ પદ્ધતિનો આખો મુદ્દો છે.

આમ, ઉદાહરણને ઉકેલવાથી બે ચલોના ફંક્શનની સીમા શોધવામાં આવે છે.

ગુણાંક શોધવા માટે સૂત્રો મેળવવું.

બે અજ્ઞાત સાથેના બે સમીકરણોની સિસ્ટમ સંકલિત અને હલ કરવામાં આવે છે. ફંક્શનના આંશિક ડેરિવેટિવ્ઝ શોધવી ચલો દ્વારા અને b, અમે આ ડેરિવેટિવ્ઝને શૂન્ય સાથે સરખાવીએ છીએ.

અમે કોઈપણ પદ્ધતિનો ઉપયોગ કરીને સમીકરણોની પરિણામી સિસ્ટમ હલ કરીએ છીએ (ઉદાહરણ તરીકે અવેજી પદ્ધતિ દ્વારાઅથવા ક્રેમરની પદ્ધતિ) અને ઓછામાં ઓછા ચોરસ પદ્ધતિ (LSM) નો ઉપયોગ કરીને ગુણાંક શોધવા માટેના સૂત્રો મેળવો.

આપેલ અને bકાર્ય સૌથી નાનું મૂલ્ય લે છે. આ હકીકતનો પુરાવો આપવામાં આવ્યો છે પૃષ્ઠના અંતે ટેક્સ્ટમાં નીચે.

તે ઓછામાં ઓછા ચોરસની આખી પદ્ધતિ છે. પરિમાણ શોધવા માટેનું સૂત્ર aસરવાળો ,,, અને પરિમાણ સમાવે છે n- પ્રાયોગિક ડેટાનો જથ્થો. અમે આ રકમના મૂલ્યોની અલગથી ગણતરી કરવાની ભલામણ કરીએ છીએ. ગુણાંક bગણતરી બાદ મળી a.

મૂળ ઉદાહરણને યાદ કરવાનો સમય છે.

ઉકેલ.

અમારા ઉદાહરણમાં n=5. જરૂરી ગુણાંકના સૂત્રોમાં સમાવિષ્ટ રકમની ગણતરી કરવાની સુવિધા માટે અમે કોષ્ટક ભરીએ છીએ.

કોષ્ટકની ચોથી પંક્તિના મૂલ્યો 2જી પંક્તિના મૂલ્યોને દરેક સંખ્યા માટે 3જી પંક્તિના મૂલ્યો દ્વારા ગુણાકાર કરીને મેળવવામાં આવે છે. i.

કોષ્ટકની પાંચમી પંક્તિના મૂલ્યો દરેક સંખ્યા માટે 2જી પંક્તિમાંના મૂલ્યોને વર્ગીકરણ કરીને મેળવવામાં આવે છે. i.

કોષ્ટકની છેલ્લી કૉલમમાંના મૂલ્યો એ પંક્તિઓની આજુબાજુના મૂલ્યોનો સરવાળો છે.

ગુણાંક શોધવા માટે અમે ઓછામાં ઓછા ચોરસ પદ્ધતિના સૂત્રોનો ઉપયોગ કરીએ છીએ અને b. અમે કોષ્ટકના છેલ્લા કૉલમમાંથી અનુરૂપ મૂલ્યોને તેમાં બદલીએ છીએ:

આથી, y = 0.165x+2.184- ઇચ્છિત અંદાજિત સીધી રેખા.

તેમાંથી કઈ લીટીઓ છે તે શોધવાનું બાકી છે y = 0.165x+2.184અથવા મૂળ ડેટાનું વધુ સારું અનુમાન કરે છે, એટલે કે, ઓછામાં ઓછા ચોરસ પદ્ધતિનો ઉપયોગ કરીને અંદાજ.

ઓછામાં ઓછા ચોરસ પદ્ધતિના અંદાજમાં ભૂલ.

આ કરવા માટે, તમારે આ રેખાઓમાંથી મૂળ ડેટાના ચોરસ વિચલનોના સરવાળાની ગણતરી કરવાની જરૂર છે. અને , એક નાનું મૂલ્ય એ લાઇનને અનુરૂપ છે જે ઓછામાં ઓછા ચોરસ પદ્ધતિના અર્થમાં મૂળ ડેટાનું વધુ સારી રીતે અનુમાન કરે છે.

ત્યારથી, પછી સીધા y = 0.165x+2.184મૂળ ડેટાનું વધુ સારી રીતે અનુમાન કરે છે.

ઓછામાં ઓછા ચોરસ (LS) પદ્ધતિનું ગ્રાફિક ચિત્ર.

આલેખ પર બધું સ્પષ્ટ દેખાય છે. લાલ રેખા એ મળેલી સીધી રેખા છે y = 0.165x+2.184, વાદળી રેખા છે , ગુલાબી બિંદુઓ મૂળ ડેટા છે.

વ્યવહારમાં, વિવિધ પ્રક્રિયાઓનું મોડેલિંગ કરતી વખતે - ખાસ કરીને, આર્થિક, ભૌતિક, તકનીકી, સામાજિક - ચોક્કસ નિશ્ચિત બિંદુઓ પર તેમના જાણીતા મૂલ્યોમાંથી કાર્યોના અંદાજિત મૂલ્યોની ગણતરી કરવાની એક અથવા બીજી પદ્ધતિનો વ્યાપકપણે ઉપયોગ થાય છે.

આ પ્રકારની કાર્ય અંદાજીત સમસ્યા વારંવાર ઊભી થાય છે:

    પ્રયોગના પરિણામે મેળવેલા ટેબ્યુલર ડેટાનો ઉપયોગ કરીને અભ્યાસ હેઠળની પ્રક્રિયાના લાક્ષણિક જથ્થાના મૂલ્યોની ગણતરી માટે અંદાજિત સૂત્રોનું નિર્માણ કરતી વખતે;

    સંખ્યાત્મક એકીકરણ, ભિન્નતા, વિભેદક સમીકરણો ઉકેલવા વગેરેમાં;

    જો ધ્યાનમાં લેવાયેલા અંતરાલના મધ્યવર્તી બિંદુઓ પર કાર્યોના મૂલ્યોની ગણતરી કરવી જરૂરી હોય તો;

    જ્યારે માનવામાં આવેલા અંતરાલની બહાર પ્રક્રિયાના લાક્ષણિક જથ્થાના મૂલ્યો નક્કી કરવામાં આવે છે, ખાસ કરીને જ્યારે આગાહી કરવામાં આવે છે.

જો, કોષ્ટક દ્વારા નિર્દિષ્ટ કરેલ ચોક્કસ પ્રક્રિયાને મોડેલ કરવા માટે, અમે એક કાર્યનું નિર્માણ કરીએ છીએ જે આ પ્રક્રિયાને ઓછામાં ઓછા ચોરસ પદ્ધતિના આધારે લગભગ વર્ણવે છે, તો તેને અંદાજિત કાર્ય (રીગ્રેસન) કહેવામાં આવશે, અને અંદાજિત વિધેયોના નિર્માણની સમસ્યા કહેવામાં આવશે. એક અંદાજ સમસ્યા.

આ લેખ આ પ્રકારની સમસ્યાને ઉકેલવા માટે MS Excel પેકેજની ક્ષમતાઓની ચર્ચા કરે છે, વધુમાં, તે ટેબ્યુલેટેડ કાર્યો (જે રીગ્રેસન વિશ્લેષણનો આધાર છે) માટે રીગ્રેસન બનાવવા (બનાવવા) માટેની પદ્ધતિઓ અને તકનીકો પ્રદાન કરે છે.

એક્સેલમાં રીગ્રેશન બનાવવા માટેના બે વિકલ્પો છે.

    અભ્યાસ હેઠળની પ્રક્રિયાની લાક્ષણિકતા માટે ડેટા ટેબલના આધારે બનાવેલ ડાયાગ્રામમાં પસંદ કરેલ રીગ્રેસન (ટ્રેન્ડલાઈન) ઉમેરવા (જો ડાયાગ્રામ બનાવવામાં આવ્યો હોય તો જ ઉપલબ્ધ);

    એક્સેલ વર્કશીટના બિલ્ટ-ઇન આંકડાકીય કાર્યોનો ઉપયોગ કરીને, તમને સ્રોત ડેટા કોષ્ટકના આધારે સીધા જ રીગ્રેશન્સ (ટ્રેન્ડ લાઇન્સ) મેળવવાની મંજૂરી આપે છે.

ચાર્ટમાં વલણ રેખાઓ ઉમેરી રહ્યા છીએ

ડેટાના કોષ્ટક માટે જે પ્રક્રિયાનું વર્ણન કરે છે અને ડાયાગ્રામ દ્વારા દર્શાવવામાં આવે છે, એક્સેલ પાસે અસરકારક રીગ્રેસન વિશ્લેષણ સાધન છે જે તમને આની મંજૂરી આપે છે:

    ઓછામાં ઓછા ચોરસ પદ્ધતિના આધારે બનાવો અને ડાયાગ્રામમાં પાંચ પ્રકારના રીગ્રેશન ઉમેરો, જે અભ્યાસ હેઠળની પ્રક્રિયાને ચોકસાઈના વિવિધ ડિગ્રી સાથે મોડેલ કરે છે;

    આકૃતિમાં રચાયેલ રીગ્રેસન સમીકરણ ઉમેરો;

    ચાર્ટ પર પ્રદર્શિત ડેટા માટે પસંદ કરેલ રીગ્રેશનના પત્રવ્યવહારની ડિગ્રી નક્કી કરો.

ચાર્ટ ડેટાના આધારે, એક્સેલ તમને રેખીય, બહુપદી, લઘુગણક, પાવર, ઘાતાંકીય પ્રકારના રીગ્રેસન મેળવવાની મંજૂરી આપે છે, જે સમીકરણ દ્વારા નિર્દિષ્ટ છે:

y = y(x)

જ્યાં x એ એક સ્વતંત્ર ચલ છે જે ઘણીવાર કુદરતી સંખ્યાઓના ક્રમ (1; 2; 3; ...) ના મૂલ્યો લે છે અને ઉત્પન્ન કરે છે, ઉદાહરણ તરીકે, અભ્યાસ હેઠળની પ્રક્રિયાના સમયની ગણતરી (લાક્ષણિકતાઓ).

1 . લીનિયર રીગ્રેશન મોડેલિંગ લાક્ષણિકતાઓ માટે સારું છે જેના મૂલ્યો સતત દરે વધે છે અથવા ઘટે છે. અભ્યાસ હેઠળની પ્રક્રિયા માટે આ સૌથી સરળ મોડલ છે. તે સમીકરણ અનુસાર બનાવવામાં આવે છે:

y = mx + b

જ્યાં m એ x-અક્ષ તરફના રેખીય રીગ્રેશન સ્લોપની સ્પર્શક છે; b - ઓર્ડિનેટ અક્ષ સાથે રેખીય રીગ્રેશનના આંતરછેદના બિંદુનું સંકલન.

2 . બહુપદી વલણ રેખા એવી લાક્ષણિકતાઓનું વર્ણન કરવા માટે ઉપયોગી છે કે જેમાં ઘણી અલગ ચરમસીમાઓ (મેક્સિમા અને મિનિમા) હોય છે. બહુપદી ડિગ્રીની પસંદગી અભ્યાસ હેઠળની લાક્ષણિકતાના અંતિમ ભાગની સંખ્યા દ્વારા નક્કી કરવામાં આવે છે. આમ, સેકન્ડ-ડિગ્રી બહુપદી એવી પ્રક્રિયાને સારી રીતે વર્ણવી શકે છે જેમાં માત્ર એક મહત્તમ અથવા લઘુત્તમ હોય છે; ત્રીજી ડિગ્રીનું બહુપદી - બે કરતાં વધુ અંતિમ નથી; ચોથી ડિગ્રીનો બહુપદી - ત્રણ કરતાં વધુ અંતિમો નહીં, વગેરે.

આ કિસ્સામાં, વલણ રેખા સમીકરણ અનુસાર બનાવવામાં આવી છે:

y = c0 + c1x + c2x2 + c3x3 + c4x4 + c5x5 + c6x6

જ્યાં સહગુણાંકો c0, c1, c2,... c6 એ સ્થિરાંકો છે જેની કિંમતો બાંધકામ દરમિયાન નક્કી થાય છે.

3 . લૉગરિધમિક ટ્રેન્ડ લાઇનનો સફળતાપૂર્વક ઉપયોગ કરવામાં આવે છે જ્યારે મોડેલિંગ લાક્ષણિકતાઓ કે જેના મૂલ્યો શરૂઆતમાં ઝડપથી બદલાય છે અને પછી ધીમે ધીમે સ્થિર થાય છે.

y = c ln(x) + b

4 . જો અભ્યાસ હેઠળના સંબંધોના મૂલ્યો વૃદ્ધિ દરમાં સતત ફેરફાર દ્વારા દર્શાવવામાં આવે તો પાવર-લો ટ્રેન્ડ લાઇન સારા પરિણામો આપે છે. આવી અવલંબનનું ઉદાહરણ એ કારની એકસરખી પ્રવેગિત ગતિનો ગ્રાફ છે. જો ડેટામાં શૂન્ય અથવા નકારાત્મક મૂલ્યો હોય, તો તમે પાવર ટ્રેન્ડ લાઇનનો ઉપયોગ કરી શકતા નથી.

સમીકરણ અનુસાર બાંધવામાં આવે છે:

y = c xb

જ્યાં સહગુણાંકો b, c સ્થિર છે.

5 . જ્યારે ડેટામાં ફેરફારનો દર સતત વધી રહ્યો હોય ત્યારે ઘાતાંકીય વલણ રેખાનો ઉપયોગ કરવો જોઈએ. શૂન્ય અથવા નકારાત્મક મૂલ્યો ધરાવતા ડેટા માટે, આ પ્રકારનો અંદાજ પણ લાગુ પડતો નથી.

સમીકરણ અનુસાર બાંધવામાં આવે છે:

y = c ebx

જ્યાં સહગુણાંકો b, c સ્થિર છે.

ટ્રેન્ડ લાઇન પસંદ કરતી વખતે, એક્સેલ આપમેળે R2 ના મૂલ્યની ગણતરી કરે છે, જે અંદાજની વિશ્વસનીયતા દર્શાવે છે: R2 મૂલ્ય એકતાની જેટલી નજીક છે, ટ્રેન્ડ લાઇન અભ્યાસ હેઠળની પ્રક્રિયાને વધુ વિશ્વસનીય રીતે અંદાજે છે. જો જરૂરી હોય તો, R2 મૂલ્ય હંમેશા ચાર્ટ પર પ્રદર્શિત કરી શકાય છે.

સૂત્ર દ્વારા નિર્ધારિત:

ડેટા શ્રેણીમાં વલણ રેખા ઉમેરવા માટે:

    ડેટાની શ્રેણીના આધારે ચાર્ટને સક્રિય કરો, એટલે કે ચાર્ટ વિસ્તારની અંદર ક્લિક કરો. ડાયાગ્રામ આઇટમ મુખ્ય મેનુમાં દેખાશે;

    આ આઇટમ પર ક્લિક કર્યા પછી, સ્ક્રીન પર એક મેનૂ દેખાશે જેમાં તમારે એડ ટ્રેન્ડ લાઇન આદેશ પસંદ કરવો જોઈએ.

સમાન ક્રિયાઓ ડેટા શ્રેણીમાંથી એકને અનુરૂપ ગ્રાફ પર માઉસ પોઇન્ટરને ખસેડીને અને જમણું-ક્લિક કરીને સરળતાથી અમલ કરી શકાય છે; દેખાતા સંદર્ભ મેનૂમાં, ટ્રેન્ડ લાઇન ઉમેરો આદેશ પસંદ કરો. ટ્રેન્ડલાઈન ડાયલોગ બોક્સ સ્ક્રીન પર ટાઈપ ટેબ સાથે દેખાશે (ફિગ. 1).

આ પછી તમારે જરૂર છે:

પ્રકાર ટેબ પર જરૂરી ટ્રેન્ડ લાઇન પ્રકાર પસંદ કરો (રેખીય પ્રકાર મૂળભૂત રીતે પસંદ થયેલ છે). બહુપદી પ્રકાર માટે, ડિગ્રી ક્ષેત્રમાં, પસંદ કરેલ બહુપદીની ડિગ્રી સ્પષ્ટ કરો.

1 . બિલ્ટ ઓન સીરીઝ ફીલ્ડ પ્રશ્નમાં રહેલા ચાર્ટમાં તમામ ડેટા સીરીઝની યાદી આપે છે. ચોક્કસ ડેટા સીરીઝમાં ટ્રેન્ડ લાઇન ઉમેરવા માટે, બિલ્ટ ઓન સીરીઝ ફીલ્ડમાં તેનું નામ પસંદ કરો.

જો જરૂરી હોય તો, પેરામીટર્સ ટેબ (ફિગ. 2) પર જઈને, તમે ટ્રેન્ડ લાઇન માટે નીચેના પરિમાણો સેટ કરી શકો છો:

    અંદાજિત (સરળ) વળાંક ક્ષેત્રના નામમાં વલણ રેખાનું નામ બદલો.

    ફોરકાસ્ટ ફીલ્ડમાં આગાહી માટે સમયગાળાની સંખ્યા (આગળ અથવા પાછળ) સેટ કરો;

    ચાર્ટ વિસ્તારમાં ટ્રેન્ડ લાઇનનું સમીકરણ પ્રદર્શિત કરો, જેના માટે તમારે "ચાર્ટ પર સમીકરણ બતાવો" ચેકબોક્સ સક્ષમ કરવું જોઈએ;

    ડાયાગ્રામ વિસ્તારમાં અંદાજિત વિશ્વસનીયતા મૂલ્ય R2 પ્રદર્શિત કરો, જેના માટે તમારે ડાયાગ્રામ (R^2) ચેકબોક્સ પર અંદાજિત વિશ્વસનીયતા મૂલ્ય મૂકોને સક્ષમ કરવું જોઈએ;

    Y અક્ષ સાથે વલણ રેખાના આંતરછેદ બિંદુને સેટ કરો, જેના માટે તમારે એક બિંદુ પર Y અક્ષ સાથે વળાંકના આંતરછેદ માટે ચેકબોક્સને સક્ષમ કરવું જોઈએ;

    સંવાદ બોક્સ બંધ કરવા માટે ઓકે બટન પર ક્લિક કરો.

પહેલેથી દોરેલી ટ્રેન્ડ લાઇનને સંપાદિત કરવાનું શરૂ કરવા માટે, ત્યાં ત્રણ રીતો છે:

    ફોર્મેટ મેનૂમાંથી સિલેક્ટેડ ટ્રેન્ડ લાઇન કમાન્ડનો ઉપયોગ કરો, અગાઉ ટ્રેન્ડ લાઇન પસંદ કર્યા પછી;

    સંદર્ભ મેનૂમાંથી ફોર્મેટ ટ્રેન્ડ લાઇન આદેશ પસંદ કરો, જેને ટ્રેન્ડ લાઇન પર જમણું-ક્લિક કરીને બોલાવવામાં આવે છે;

    ટ્રેન્ડ લાઇન પર ડબલ ક્લિક કરો.

ટ્રેન્ડ લાઈન ફોર્મેટ ડાયલોગ બોક્સ સ્ક્રીન પર દેખાશે (ફિગ. 3), જેમાં ત્રણ ટેબ હશે: વ્યૂ, ટાઈપ, પેરામીટર્સ અને છેલ્લી બેની સામગ્રીઓ ટ્રેન્ડ લાઈન ડાયલોગ બોક્સ (ફિગ. 1) ની સમાન ટેબ સાથે સંપૂર્ણ રીતે મેળ ખાય છે. -2). વ્યૂ ટેબ પર, તમે લાઇનનો પ્રકાર, તેનો રંગ અને જાડાઈ સેટ કરી શકો છો.

પહેલેથી દોરેલી ટ્રેન્ડ લાઇન કાઢી નાખવા માટે, કાઢી નાખવાની ટ્રેન્ડ લાઇન પસંદ કરો અને Delete કી દબાવો.

માનવામાં આવતા રીગ્રેશન એનાલિસિસ ટૂલના ફાયદા છે:

    તેના માટે ડેટા ટેબલ બનાવ્યા વિના ચાર્ટ પર ટ્રેન્ડ લાઇન બનાવવાની સંબંધિત સરળતા;

    સૂચિત વલણ રેખાઓના પ્રકારોની એકદમ વિશાળ સૂચિ, અને આ સૂચિમાં સૌથી વધુ ઉપયોગમાં લેવાતા રીગ્રેસન પ્રકારોનો સમાવેશ થાય છે;

    મનસ્વી (સામાન્ય બુદ્ધિની મર્યાદામાં) દ્વારા અભ્યાસ હેઠળની પ્રક્રિયાની વર્તણૂકની આગાહી કરવાની ક્ષમતા આગળ અને પાછળના પગલાઓની સંખ્યા;

    વિશ્લેષણાત્મક સ્વરૂપમાં વલણ રેખા સમીકરણ મેળવવાની ક્ષમતા;

    સંભાવના, જો જરૂરી હોય તો, અંદાજની વિશ્વસનીયતાનું મૂલ્યાંકન મેળવવાની.

ગેરફાયદામાં નીચેનાનો સમાવેશ થાય છે:

    ટ્રેન્ડ લાઇનનું નિર્માણ ફક્ત ત્યારે જ હાથ ધરવામાં આવે છે જો ડેટાની શ્રેણી પર કોઈ આકૃતિ બનાવવામાં આવી હોય;

    તેના માટે મેળવેલ ટ્રેન્ડ લાઇન સમીકરણોના આધારે અભ્યાસ હેઠળની લાક્ષણિકતા માટે ડેટા શ્રેણી બનાવવાની પ્રક્રિયા કંઈક અંશે અવ્યવસ્થિત છે: આવશ્યક રીગ્રેશન સમીકરણો મૂળ ડેટા શ્રેણીના મૂલ્યોમાં દરેક ફેરફાર સાથે અપડેટ કરવામાં આવે છે, પરંતુ ફક્ત ચાર્ટ વિસ્તારની અંદર , જ્યારે જૂની રેખા સમીકરણ વલણના આધારે રચાયેલી ડેટા શ્રેણી યથાવત રહે છે;

    PivotChart રિપોર્ટ્સમાં, ચાર્ટના દૃશ્યને બદલવાથી અથવા સંબંધિત PivotTable રિપોર્ટ હાલની ટ્રેન્ડલાઈનને સાચવી શકતું નથી, એટલે કે તમે ટ્રેન્ડલાઈન દોરો કે અન્યથા PivotChart રિપોર્ટને ફોર્મેટ કરો તે પહેલાં, તમારે ખાતરી કરવી જોઈએ કે રિપોર્ટ લેઆઉટ જરૂરી જરૂરિયાતોને પૂર્ણ કરે છે.

ગ્રાફ, હિસ્ટોગ્રામ, ફ્લેટ નોન-સ્ટાન્ડર્ડ એરિયા ચાર્ટ, બાર ચાર્ટ, સ્કેટર ચાર્ટ, બબલ ચાર્ટ અને સ્ટોક ચાર્ટ જેવા ચાર્ટ પર પ્રસ્તુત ડેટા શ્રેણીને પૂરક બનાવવા માટે ટ્રેન્ડ લાઇનનો ઉપયોગ કરી શકાય છે.

તમે 3D, નોર્મલાઇઝ્ડ, રડાર, પાઇ અને ડોનટ ચાર્ટમાં ડેટા શ્રેણીમાં ટ્રેન્ડ લાઇન ઉમેરી શકતા નથી.

એક્સેલના બિલ્ટ-ઇન કાર્યોનો ઉપયોગ કરીને

ચાર્ટ વિસ્તારની બહાર ટ્રેન્ડ લાઇન્સ બનાવવા માટે એક્સેલ પાસે રીગ્રેશન એનાલિસિસ ટૂલ પણ છે. સંખ્યાબંધ આંકડાકીય કાર્યપત્રક કાર્યો છે જેનો આ હેતુ માટે ઉપયોગ કરી શકાય છે, પરંતુ તે બધા માત્ર રેખીય અથવા ઘાતાંકીય રીગ્રેસન માટે પરવાનગી આપે છે.

એક્સેલમાં રેખીય રીગ્રેસન બનાવવા માટે ઘણા કાર્યો છે, ખાસ કરીને:

    વલણ;

  • ઢોળાવ અને કાપો.

તેમજ ઘાતાંકીય વલણ રેખા બનાવવા માટેના કેટલાક કાર્યો, ખાસ કરીને:

    LGRFPRIBL.

એ નોંધવું જોઈએ કે TREND અને GROWTH કાર્યોનો ઉપયોગ કરીને રીગ્રેસન બનાવવા માટેની તકનીકો લગભગ સમાન છે. LINEST અને LGRFPRIBL ની જોડી વિશે પણ એવું જ કહી શકાય. આ ચાર કાર્યો માટે, મૂલ્યોનું કોષ્ટક બનાવવા એરે ફોર્મ્યુલા જેવી એક્સેલ સુવિધાઓનો ઉપયોગ કરે છે, જે કંઈક અંશે રીગ્રેશન બનાવવાની પ્રક્રિયાને અવ્યવસ્થિત કરે છે. એ પણ નોંધ કરો કે રેખીય રીગ્રેસનનું નિર્માણ, અમારા મતે, સ્લોપ અને ઈન્ટરસેપ્ટ ફંક્શનનો ઉપયોગ કરીને સૌથી સહેલાઈથી પરિપૂર્ણ થાય છે, જ્યાં તેમાંથી પ્રથમ રેખીય રીગ્રેસનનો ઢોળાવ નક્કી કરે છે, અને બીજું y પર રીગ્રેસન દ્વારા અટકાવાયેલ સેગમેન્ટને નિર્ધારિત કરે છે. -અક્ષ.

રીગ્રેસન વિશ્લેષણ માટે બિલ્ટ-ઇન ફંક્શન ટૂલના ફાયદા છે:

    વલણ રેખાઓને વ્યાખ્યાયિત કરતા તમામ બિલ્ટ-ઇન આંકડાકીય કાર્યો માટે અભ્યાસ હેઠળની લાક્ષણિકતાની ડેટા શ્રેણી બનાવવા માટે એકદમ સરળ, સમાન પ્રક્રિયા;

    જનરેટેડ ડેટા સિરીઝના આધારે ટ્રેન્ડ લાઇન બનાવવા માટેની માનક પદ્ધતિ;

    આગળ અથવા પાછળના પગલાઓની આવશ્યક સંખ્યા દ્વારા અભ્યાસ હેઠળની પ્રક્રિયાના વર્તનની આગાહી કરવાની ક્ષમતા.

ગેરફાયદામાં એ હકીકતનો સમાવેશ થાય છે કે એક્સેલમાં અન્ય (રેખીય અને ઘાતાંકીય સિવાય) પ્રકારની ટ્રેન્ડ લાઇન બનાવવા માટે બિલ્ટ-ઇન ફંક્શન્સ નથી. આ સંજોગો ઘણીવાર અભ્યાસ હેઠળની પ્રક્રિયાનું પૂરતું સચોટ મોડલ પસંદ કરવાની તેમજ વાસ્તવિકતાની નજીક હોય તેવી આગાહીઓ મેળવવાની મંજૂરી આપતું નથી. વધુમાં, TREND અને GROWTH ફંક્શનનો ઉપયોગ કરતી વખતે, વલણ રેખાઓના સમીકરણો જાણતા નથી.

એ નોંધવું જોઇએ કે લેખકોએ રીગ્રેસન વિશ્લેષણના અભ્યાસક્રમને પૂર્ણતાની કોઈપણ ડિગ્રી સાથે રજૂ કરવાનું નક્કી કર્યું નથી. તેનું મુખ્ય કાર્ય, વિશિષ્ટ ઉદાહરણોનો ઉપયોગ કરીને, એક્સેલ પેકેજની ક્ષમતાઓ બતાવવાનું છે જ્યારે અંદાજિત સમસ્યાઓ હલ કરવામાં આવે છે; એક્સેલમાં રીગ્રેશન અને આગાહી બનાવવા માટે કયા અસરકારક સાધનો છે તે દર્શાવો; રીગ્રેશન એનાલિસિસનું વ્યાપક જ્ઞાન ન ધરાવતા વપરાશકર્તા દ્વારા પણ આવી સમસ્યાઓને પ્રમાણમાં સરળતાથી કેવી રીતે ઉકેલી શકાય તે સમજાવો.

ચોક્કસ સમસ્યાઓ ઉકેલવાના ઉદાહરણો

ચાલો લિસ્ટેડ એક્સેલ ટૂલ્સનો ઉપયોગ કરીને ચોક્કસ સમસ્યાઓ ઉકેલવા જોઈએ.

સમસ્યા 1

1995-2002 માટે મોટર ટ્રાન્સપોર્ટ એન્ટરપ્રાઇઝના નફા પરના ડેટાના કોષ્ટક સાથે. તમારે નીચેના કરવાની જરૂર છે:

    એક આકૃતિ બનાવો.

    ચાર્ટમાં રેખીય અને બહુપદી (ચતુર્ભુજ અને ઘન) વલણ રેખાઓ ઉમેરો.

    ટ્રેન્ડ લાઇનના સમીકરણોનો ઉપયોગ કરીને, 1995-2004 માટે દરેક ટ્રેન્ડ લાઇન માટે એન્ટરપ્રાઇઝના નફા પર ટેબ્યુલર ડેટા મેળવો.

    2003 અને 2004 માટે એન્ટરપ્રાઇઝના નફાની આગાહી કરો.

સમસ્યાનું સમાધાન

    એક્સેલ વર્કશીટના સેલ A4:C11 ની શ્રેણીમાં, ફિગમાં બતાવેલ વર્કશીટ દાખલ કરો. 4.

    સેલ B4:C11 ની શ્રેણી પસંદ કર્યા પછી, અમે એક આકૃતિ બનાવીએ છીએ.

    અમે બનાવેલ રેખાકૃતિને સક્રિય કરીએ છીએ અને ઉપર વર્ણવેલ પદ્ધતિ અનુસાર, ટ્રેન્ડ લાઇન ડાયલોગ બોક્સમાં ટ્રેન્ડ લાઇનનો પ્રકાર પસંદ કર્યા પછી (ફિગ. 1 જુઓ), અમે વૈકલ્પિક રીતે રેખાકૃતિમાં રેખીય, ચતુર્ભુજ અને ઘન વલણ રેખાઓ ઉમેરીએ છીએ. એ જ સંવાદ બોક્સમાં, પેરામીટર્સ ટેબ ખોલો (જુઓ. આકૃતિ 2), અંદાજિત (સરળ) વળાંક ફીલ્ડના નામમાં, જે વલણ ઉમેરવામાં આવી રહ્યું છે તેનું નામ દાખલ કરો અને ફોરકાસ્ટ ફોરવર્ડ ફોર: પીરિયડ્સ ફીલ્ડમાં, સેટ કરો. મૂલ્ય 2, કારણ કે તે આગળના બે વર્ષ માટે નફાની આગાહી કરવાનું આયોજન છે. ડાયાગ્રામ વિસ્તારમાં રીગ્રેસન સમીકરણ અને અંદાજિત વિશ્વસનીયતા મૂલ્ય R2 પ્રદર્શિત કરવા માટે, સ્ક્રીન ચેકબોક્સ પર શો સમીકરણને સક્ષમ કરો અને ડાયાગ્રામ પર અંદાજિત વિશ્વસનીયતા મૂલ્ય (R^2) મૂકો. સારી વિઝ્યુઅલ ધારણા માટે, અમે બાંધવામાં આવેલી ટ્રેન્ડ લાઇનનો પ્રકાર, રંગ અને જાડાઈ બદલીએ છીએ, જેના માટે અમે ટ્રેન્ડ લાઇન ફોર્મેટ ડાયલોગ બોક્સની વ્યૂ ટેબનો ઉપયોગ કરીએ છીએ (ફિગ. 3 જુઓ). ઉમેરાયેલ વલણ રેખાઓ સાથે પરિણામી રેખાકૃતિ ફિગમાં બતાવવામાં આવી છે. 5.

    1995-2004 માટે દરેક ટ્રેન્ડ લાઇન માટે એન્ટરપ્રાઇઝના નફા પર ટેબ્યુલર ડેટા મેળવવા માટે.

ચાલો ફિગમાં પ્રસ્તુત વલણ રેખા સમીકરણોનો ઉપયોગ કરીએ. 5. આ કરવા માટે, D3:F3 શ્રેણીના કોષોમાં, પસંદ કરેલ ટ્રેન્ડ લાઇનના પ્રકાર વિશેની ટેક્સ્ટ માહિતી દાખલ કરો: લીનિયર ટ્રેન્ડ, ક્વાડ્રેટિક ટ્રેન્ડ, ક્યુબિક ટ્રેન્ડ. આગળ, સેલ D4 માં રેખીય રીગ્રેસન ફોર્મ્યુલા દાખલ કરો અને, ફિલ માર્કરનો ઉપયોગ કરીને, સેલ શ્રેણી D5:D13 ના સંબંધિત સંદર્ભો સાથે આ સૂત્રની નકલ કરો. એ નોંધવું જોઈએ કે કોષો D4:D13 ની શ્રેણીમાંથી રેખીય રીગ્રેસન સૂત્ર સાથેના દરેક કોષમાં A4:A13 શ્રેણીમાંથી અનુરૂપ કોષ દલીલ તરીકે છે. એ જ રીતે, ચતુર્ભુજ રીગ્રેસન માટે, કોષોની શ્રેણી E4:E13 ભરો, અને ક્યુબિક રીગ્રેસન માટે, કોષોની શ્રેણી F4:F13 ભરો. આમ, 2003 અને 2004 માટે એન્ટરપ્રાઇઝના નફા માટેનું અનુમાન સંકલિત કરવામાં આવ્યું છે. ત્રણ વલણોનો ઉપયોગ કરીને. મૂલ્યોનું પરિણામી કોષ્ટક ફિગમાં બતાવવામાં આવ્યું છે. 6.

    એક આકૃતિ બનાવો.

    સમસ્યા 2

    ચાર્ટમાં લઘુગણક, શક્તિ અને ઘાતાંકીય વલણ રેખાઓ ઉમેરો.

    પ્રાપ્ત વલણ રેખાઓના સમીકરણો, તેમજ તે દરેક માટે અંદાજિત R2 ના વિશ્વસનીયતા મૂલ્યો મેળવો.

    ટ્રેન્ડ લાઇન સમીકરણોનો ઉપયોગ કરીને, 1995-2002 માટે દરેક ટ્રેન્ડ લાઇન માટે એન્ટરપ્રાઇઝના નફા પર ટેબ્યુલર ડેટા મેળવો.

સમસ્યાનું સમાધાન

સમસ્યા 1 ઉકેલવા માટે આપવામાં આવેલી પદ્ધતિને અનુસરીને, અમે તેમાં ઉમેરવામાં આવેલ લઘુગણક, શક્તિ અને ઘાતાંકીય વલણ રેખાઓ સાથેનો એક આકૃતિ મેળવીએ છીએ (ફિગ. 7). આગળ, પ્રાપ્ત વલણ રેખા સમીકરણોનો ઉપયોગ કરીને, અમે 2003 અને 2004 માટે અનુમાનિત મૂલ્યો સહિત, એન્ટરપ્રાઇઝના નફા માટે મૂલ્યોનું કોષ્ટક ભરીએ છીએ. (ફિગ. 8).

ફિગ માં. 5 અને અંજીર. તે જોઈ શકાય છે કે લઘુગણક વલણ સાથેનું મોડેલ અંદાજિત વિશ્વસનીયતાના સૌથી નીચા મૂલ્યને અનુરૂપ છે

R2 = 0.8659

R2 ના ઉચ્ચતમ મૂલ્યો બહુપદી વલણ સાથેના મોડલને અનુરૂપ છે: ચતુર્ભુજ (R2 = 0.9263) અને ઘન (R2 = 0.933).

સમસ્યા 3

કાર્ય 1 માં આપેલ 1995-2002 માટે મોટર ટ્રાન્સપોર્ટ એન્ટરપ્રાઇઝના નફા પરના ડેટાના કોષ્ટક સાથે, તમારે નીચેના પગલાં ભરવા આવશ્યક છે.

    TREND અને GROW ફંક્શનનો ઉપયોગ કરીને રેખીય અને ઘાતાંકીય વલણ રેખાઓ માટે ડેટા શ્રેણી મેળવો.

    TREND અને GROWTH કાર્યોનો ઉપયોગ કરીને, 2003 અને 2004 માટે એન્ટરપ્રાઇઝના નફાની આગાહી કરો.

    મૂળ ડેટા અને પરિણામી ડેટા શ્રેણી માટે ડાયાગ્રામ બનાવો.

સમસ્યાનું સમાધાન

ચાલો સમસ્યા 1 માટે વર્કશીટનો ઉપયોગ કરીએ (ફિગ. 4 જુઓ). ચાલો TREND ફંક્શનથી શરૂઆત કરીએ:

    કોષોની શ્રેણી D4:D11 પસંદ કરો, જે એન્ટરપ્રાઇઝના નફા પરના જાણીતા ડેટાને અનુરૂપ TREND કાર્યના મૂલ્યોથી ભરેલી હોવી જોઈએ;

    Insert મેનુમાંથી ફંક્શન કમાન્ડને કૉલ કરો. દેખાતા ફંક્શન વિઝાર્ડ સંવાદ બોક્સમાં, આંકડાકીય શ્રેણીમાંથી TREND ફંક્શન પસંદ કરો અને પછી OK બટન પર ક્લિક કરો. પ્રમાણભૂત ટૂલબાર પર (ઇન્સર્ટ ફંક્શન) બટનને ક્લિક કરીને સમાન કામગીરી કરી શકાય છે.

    દેખાતા ફંક્શન આર્ગ્યુમેન્ટ્સ ડાયલોગ બોક્સમાં, Known_values_y ફીલ્ડમાં સેલ C4:C11 ની શ્રેણી દાખલ કરો; Known_values_x ફીલ્ડમાં - કોષોની શ્રેણી B4:B11;

    દાખલ કરેલ ફોર્મ્યુલાને એરે ફોર્મ્યુલા બનાવવા માટે, કી સંયોજન + + નો ઉપયોગ કરો.

ફોર્મ્યુલા બારમાં આપણે દાખલ કરેલ ફોર્મ્યુલા આના જેવું દેખાશે: =(TREND(C4:C11,B4:B11)).

પરિણામે, કોષોની શ્રેણી D4:D11 TREND કાર્ય (ફિગ. 9) ના અનુરૂપ મૂલ્યોથી ભરેલી છે.

2003 અને 2004 માટે એન્ટરપ્રાઇઝના નફાની આગાહી કરવી. જરૂરી:

    કોષોની શ્રેણી D12:D13 પસંદ કરો જ્યાં TREND કાર્ય દ્વારા અનુમાનિત મૂલ્યો દાખલ કરવામાં આવશે.

    TREND ફંક્શનને કૉલ કરો અને દેખાતા ફંક્શન આર્ગ્યુમેન્ટ્સ સંવાદ બોક્સમાં, Known_values_y ફીલ્ડમાં સેલ C4:C11 ની શ્રેણી દાખલ કરો; Known_values_x ફીલ્ડમાં - કોષોની શ્રેણી B4:B11; અને New_values_x ફીલ્ડમાં - B12:B13 કોષોની શ્રેણી.

    Ctrl + Shift + Enter કી સંયોજનનો ઉપયોગ કરીને આ સૂત્રને એરે ફોર્મ્યુલામાં ફેરવો.

    દાખલ કરેલ સૂત્ર આના જેવું દેખાશે: =(TREND(C4:C11;B4:B11;B12:B13)), અને કોષોની શ્રેણી D12:D13 TREND ફંક્શનના અનુમાનિત મૂલ્યોથી ભરવામાં આવશે (ફિગ જુઓ. 9).

ડેટા સિરીઝ GROWTH ફંક્શનનો ઉપયોગ કરીને એ જ રીતે ભરવામાં આવે છે, જેનો ઉપયોગ બિનરેખીય નિર્ભરતાના વિશ્લેષણમાં થાય છે અને તેના રેખીય સમકક્ષ TRENDની જેમ બરાબર કાર્ય કરે છે.

આકૃતિ 10 ફોર્મ્યુલા ડિસ્પ્લે મોડમાં કોષ્ટક બતાવે છે.

પ્રારંભિક ડેટા અને પ્રાપ્ત ડેટા શ્રેણી માટે, આકૃતિ ફિગમાં બતાવેલ છે. 11.

સમસ્યા 4

વર્તમાન મહિનાની 1 લી થી 11 તારીખ સુધીના સમયગાળા માટે મોટર ટ્રાન્સપોર્ટ એન્ટરપ્રાઇઝની રવાનગી સેવા દ્વારા સેવાઓ માટેની વિનંતીઓની પ્રાપ્તિ પરના ડેટાના કોષ્ટક સાથે, તમારે નીચેની ક્રિયાઓ કરવી આવશ્યક છે.

    રેખીય રીગ્રેસન માટે ડેટા શ્રેણી મેળવો: SLOPE અને INTERCEPT ફંક્શનનો ઉપયોગ કરીને; LINEST ફંક્શનનો ઉપયોગ કરીને.

    LGRFPRIBL ફંક્શનનો ઉપયોગ કરીને ઘાતાંકીય રીગ્રેસન માટે શ્રેણીબદ્ધ ડેટા મેળવો.

    ઉપરોક્ત કાર્યોનો ઉપયોગ કરીને, વર્તમાન મહિનાની 12મીથી 14મી સુધીના સમયગાળા માટે ડિસ્પેચ સેવામાં અરજીઓની પ્રાપ્તિ વિશે આગાહી કરો.

    મૂળ અને પ્રાપ્ત ડેટા શ્રેણી માટે ડાયાગ્રામ બનાવો.

સમસ્યાનું સમાધાન

નોંધ કરો કે, TREND અને GROWTH ફંક્શનથી વિપરીત, ઉપર સૂચિબદ્ધ કોઈપણ ફંક્શન (SLOPE, INTERCEPT, LINEST, LGRFPRIB) રીગ્રેશન નથી. આ વિધેયો માત્ર સહાયક ભૂમિકા ભજવે છે, જરૂરી રીગ્રેસન પરિમાણો નક્કી કરે છે.

SLOPE, INTERCEPT, LINEST, LGRFPRIB ફંક્શનનો ઉપયોગ કરીને બનેલ રેખીય અને ઘાતાંકીય રીગ્રેશન માટે, TREND અને GROWTH કાર્યોને અનુરૂપ રેખીય અને ઘાતાંકીય રીગ્રેશનથી વિપરીત, તેમના સમીકરણોનો દેખાવ હંમેશા જાણીતો છે.

1 . ચાલો સમીકરણ સાથે રેખીય રીગ્રેસન બનાવીએ:

y = mx+b

SLOPE અને INTERCEPT ફંક્શનનો ઉપયોગ કરીને, SLOPE ફંક્શન દ્વારા નિર્ધારિત રીગ્રેશન સ્લોપ m સાથે અને ઈન્ટરસેપ્ટ ફંક્શન દ્વારા ફ્રી ટર્મ b.

આ કરવા માટે, અમે નીચેની ક્રિયાઓ કરીએ છીએ:

    સેલ શ્રેણી A4:B14 માં મૂળ કોષ્ટક દાખલ કરો;

    પરિમાણ m નું મૂલ્ય સેલ C19 માં નક્કી કરવામાં આવશે. આંકડાકીય શ્રેણીમાંથી સ્લોપ ફંક્શન પસંદ કરો; કોષોની શ્રેણી B4:B14 જાણીતા_મૂલ્યો_y ફીલ્ડમાં અને કોષોની શ્રેણી A4:A14 જાણીતા_મૂલ્યો_x ફીલ્ડમાં દાખલ કરો.

    ફોર્મ્યુલા સેલ C19: =SLOPE(B4:B14,A4:A14) માં દાખલ કરવામાં આવશે;

    આગળ, ફોર્મમાં સેલ C4 માં રેખીય રીગ્રેસન ફોર્મ્યુલા દાખલ કરો: =$C*A4+$D. આ સૂત્રમાં, કોષો C19 અને D19 સંપૂર્ણ સંદર્ભો સાથે લખાયેલા છે (સંભવિત નકલ દરમિયાન કોષનું સરનામું બદલવું જોઈએ નહીં). નિરપેક્ષ સંદર્ભ ચિહ્ન $ કોષ સરનામાં પર કર્સર મૂક્યા પછી કીબોર્ડમાંથી અથવા F4 કીનો ઉપયોગ કરીને ટાઇપ કરી શકાય છે.

2 ફિલ હેન્ડલનો ઉપયોગ કરીને, આ ફોર્મ્યુલાને સેલ C4:C17 ની શ્રેણીમાં કૉપિ કરો. અમે જરૂરી ડેટા શ્રેણી (ફિગ. 12) મેળવીએ છીએ. એપ્લિકેશનની સંખ્યા પૂર્ણાંક છે તે હકીકતને કારણે, તમારે સેલ ફોર્મેટ વિન્ડોની નંબર ટેબ પર દશાંશ સ્થાનોની સંખ્યા સાથે નંબર ફોર્મેટને 0 પર સેટ કરવું જોઈએ.

y = mx+b

. ચાલો હવે સમીકરણ દ્વારા આપવામાં આવેલ રેખીય રીગ્રેસન બનાવીએ:

LINEST ફંક્શનનો ઉપયોગ કરીને.

    આ કરવા માટે:

    સેલ શ્રેણી C20:D20: =(LINEST(B4:B14,A4:A14)) માં એરે ફોર્મ્યુલા તરીકે LINEST ફંક્શન દાખલ કરો. પરિણામે, અમે સેલ C20 માં પરિમાણ m નું મૂલ્ય અને સેલ D20 માં પરિમાણ b નું મૂલ્ય મેળવીએ છીએ;

    કોષ D4 માં સૂત્ર દાખલ કરો: =$C*A4+$D;

3 સેલ શ્રેણી D4:D17 માં ફિલ માર્કરનો ઉપયોગ કરીને આ સૂત્રની નકલ કરો અને ઇચ્છિત ડેટા શ્રેણી મેળવો.

. અમે સમીકરણ સાથે ઘાતાંકીય રીગ્રેસન બનાવીએ છીએ:

    LGRFPRIBL ફંક્શનનો ઉપયોગ કરીને તે સમાન રીતે કરવામાં આવે છે:

    સેલ C21:D21 ની શ્રેણીમાં આપણે એરે ફોર્મ્યુલા તરીકે LGRFPRIBL ફંક્શન દાખલ કરીએ છીએ: =( LGRFPRIBL (B4:B14,A4:A14)). આ કિસ્સામાં, પરિમાણ m નું મૂલ્ય સેલ C21 માં નક્કી કરવામાં આવશે, અને પરિમાણ b નું મૂલ્ય સેલ D21 માં નક્કી કરવામાં આવશે;

    ફોર્મ્યુલા સેલ E4 માં દાખલ કરવામાં આવે છે: =$D*$C^A4;

ફિલ માર્કરનો ઉપયોગ કરીને, આ સૂત્ર E4:E17 કોષોની શ્રેણીમાં નકલ કરવામાં આવે છે, જ્યાં ઘાતાંકીય રીગ્રેસન માટે ડેટા શ્રેણી સ્થિત હશે (ફિગ. 12 જુઓ).

ફિગ માં. આકૃતિ 13 એ એક ટેબલ બતાવે છે જ્યાં તમે જરૂરી કોષ શ્રેણીઓ તેમજ ફોર્મ્યુલા સાથે અમે ઉપયોગ કરીએ છીએ તે કાર્યો જોઈ શકો છો. તીવ્રતા 2 આર કહેવાય છે.

નિર્ધારણ ગુણાંક

રીગ્રેસન અવલંબન બનાવવાનું કાર્ય મોડેલ (1) ના ગુણાંક m ના વેક્ટરને શોધવાનું છે કે જેના પર ગુણાંક R મહત્તમ મૂલ્ય લે છે.

R ના મહત્વનું મૂલ્યાંકન કરવા માટે, ફિશરની F ટેસ્ટનો ઉપયોગ કરવામાં આવે છે, સૂત્રનો ઉપયોગ કરીને ગણતરી કરવામાં આવે છે. nજ્યાં

- નમૂનાનું કદ (પ્રયોગોની સંખ્યા);

k એ મોડેલ ગુણાંકની સંખ્યા છે. nઅને જો F ડેટા માટે અમુક નિર્ણાયક મૂલ્ય કરતાં વધી જાય k

આમ, R નું મહત્વ માત્ર તેના મૂલ્ય દ્વારા જ નહીં, પણ પ્રયોગોની સંખ્યા અને મોડેલના ગુણાંક (પરિમાણો) ની સંખ્યા વચ્ચેના ગુણોત્તર દ્વારા પણ નક્કી કરવામાં આવે છે. ખરેખર, સાદા રેખીય મોડેલ માટે n=2 માટેનો સહસંબંધ ગુણોત્તર 1 ની બરાબર છે (એક સીધી રેખા હંમેશા 2 બિંદુઓ દ્વારા સમતલ પર દોરી શકાય છે). જો કે, જો પ્રાયોગિક ડેટા રેન્ડમ ચલ હોય, તો R ના આવા મૂલ્ય પર ખૂબ સાવધાની સાથે વિશ્વાસ કરવો જોઈએ. સામાન્ય રીતે, નોંધપાત્ર આર અને વિશ્વસનીય રીગ્રેસન મેળવવા માટે, તેઓ ખાતરી કરવા માટે પ્રયત્ન કરે છે કે પ્રયોગોની સંખ્યા નોંધપાત્ર રીતે મોડેલ ગુણાંક (n>k) ની સંખ્યા કરતાં વધી જાય.

રેખીય રીગ્રેશન મોડેલ બનાવવા માટે તમારે આની જરૂર છે:

1) પ્રાયોગિક ડેટા ધરાવતી n પંક્તિઓ અને m કૉલમ્સની સૂચિ તૈયાર કરો (આઉટપુટ મૂલ્ય ધરાવતી કૉલમ વાયસૂચિમાં પ્રથમ અથવા છેલ્લું હોવું જોઈએ); ઉદાહરણ તરીકે, ચાલો પાછલા કાર્યમાંથી ડેટા લઈએ, "પીરિયડ નંબર" નામની કૉલમ ઉમેરીને, 1 થી 12 સુધીના સમયગાળાની સંખ્યાઓને નંબર આપો. (આ મૂલ્યો હશે. એક્સ)

2) મેનુ ડેટા/ડેટા એનાલિસિસ/રીગ્રેશન પર જાઓ

જો "ટૂલ્સ" મેનૂમાં "ડેટા વિશ્લેષણ" આઇટમ ખૂટે છે, તો તમારે તે જ મેનૂમાં "એડ-ઇન્સ" આઇટમ પર જવું જોઈએ અને "વિશ્લેષણ પેકેજ" ચેકબોક્સને ચેક કરવું જોઈએ.

3) "રીગ્રેશન" સંવાદ બોક્સમાં, સેટ કરો:

· ઇનપુટ અંતરાલ Y;

· ઇનપુટ અંતરાલ X;

· આઉટપુટ અંતરાલ - અંતરાલનો ઉપરનો ડાબો કોષ જેમાં ગણતરીના પરિણામો મૂકવામાં આવશે (તેને નવી વર્કશીટ પર મૂકવાની ભલામણ કરવામાં આવે છે);

4) "ઓકે" ક્લિક કરો અને પરિણામોનું વિશ્લેષણ કરો.

100 RURપ્રથમ ઓર્ડર માટે બોનસ

કામનો પ્રકાર પસંદ કરો ડિપ્લોમા વર્ક કોર્સ વર્ક એબ્સ્ટ્રેક્ટ માસ્ટરની થીસીસ પ્રેક્ટિસ રિપોર્ટ લેખ રિપોર્ટ રિવ્યૂ ટેસ્ટ વર્ક મોનોગ્રાફ પ્રોબ્લેમ સોલ્વિંગ બિઝનેસ પ્લાન પ્રશ્નોના જવાબો સર્જનાત્મક કાર્ય નિબંધ ડ્રોઈંગ નિબંધો અનુવાદ પ્રસ્તુતિઓ ટાઈપિંગ અન્ય ટેક્સ્ટની વિશિષ્ટતા વધારવી માસ્ટરની થીસીસ લેબોરેટરી વર્ક ઓનલાઈન મદદ

કિંમત જાણો

લઘુત્તમ ચોરસ પદ્ધતિ એ એક ગાણિતિક (ગાણિતિક-આંકડાકીય) તકનીક છે જેનો ઉપયોગ સમય શ્રેણીને સંરેખિત કરવા, રેન્ડમ ચલો વચ્ચેના સહસંબંધના સ્વરૂપને ઓળખવા વગેરે માટે થાય છે. તેમાં એ હકીકતનો સમાવેશ થાય છે કે આપેલ ઘટનાનું વર્ણન કરતું કાર્ય સરળ કાર્ય દ્વારા અંદાજિત છે. તદુપરાંત, બાદમાંની પસંદગી એવી રીતે કરવામાં આવે છે કે સંરેખિત મુદ્દાઓમાંથી અવલોકન કરેલ બિંદુઓ પર કાર્યના વાસ્તવિક સ્તરોનું પ્રમાણભૂત વિચલન (વિક્ષેપ જુઓ) સૌથી નાનું છે.

ઉદાહરણ તરીકે, ઉપલબ્ધ માહિતી અનુસાર ( xi,યી) (i = 1, 2, ..., n) આવા વળાંક બાંધવામાં આવે છે y = a + bx, જેના પર ચોરસ વિચલનોનો લઘુત્તમ સરવાળો પ્રાપ્ત થાય છે

એટલે કે, બે પરિમાણો પર આધાર રાખીને કાર્યને નાનું કરવામાં આવે છે: a- ઓર્ડિનેટ અક્ષ પર સેગમેન્ટ અને b- સીધી રેખા ઢોળાવ.

કાર્યને ઘટાડવા માટે જરૂરી શરતો આપતા સમીકરણો એસ(a,b), કહેવાય છે સામાન્ય સમીકરણો.અંદાજિત વિધેયો તરીકે, માત્ર રેખીય (સીધી રેખા સાથે ગોઠવણી) જ નહીં, પણ ચતુર્ભુજ, પેરાબોલિક, ઘાતાંકીય વગેરેનો પણ ઉપયોગ થાય છે, એક સીધી રેખા સાથે સમય શ્રેણીને સંરેખિત કરવાના ઉદાહરણ માટે, ફિગ જુઓ. M.2, જ્યાં વર્ગીય અંતરનો સરવાળો ( y 1 – ȳ 1)2 + (y 2 – ȳ 2)2 .... સૌથી નાની છે, અને પરિણામી સીધી રેખા સમય જતાં ચોક્કસ સૂચકના અવલોકનોની ગતિશીલ શ્રેણીના વલણને શ્રેષ્ઠ રીતે પ્રતિબિંબિત કરે છે.

નિષ્પક્ષ OLS અંદાજો માટે, રીગ્રેસન વિશ્લેષણની સૌથી મહત્વની શરત પૂરી કરવા માટે તે જરૂરી અને પૂરતું છે: રેન્ડમ ભૂલની ગાણિતિક અપેક્ષા, પરિબળો પર શરતી, શૂન્યની બરાબર હોવી જોઈએ. આ સ્થિતિ, ખાસ કરીને, પૂરી થાય છે જો: 1. રેન્ડમ ભૂલોની ગાણિતિક અપેક્ષા શૂન્ય છે, અને 2. પરિબળો અને રેન્ડમ ભૂલો સ્વતંત્ર રેન્ડમ ચલ છે. પ્રથમ શરત સતત સાથેના મોડેલો માટે હંમેશા પરિપૂર્ણ ગણી શકાય, કારણ કે સ્થિરાંક ભૂલોની બિન-શૂન્ય ગાણિતિક અપેક્ષા લે છે. બીજી શરત - પરિબળોની બાહ્યતાની સ્થિતિ - મૂળભૂત છે. જો આ મિલકત પૂરી ન થાય, તો અમે ધારી શકીએ છીએ કે લગભગ કોઈપણ અંદાજો અત્યંત અસંતોષકારક હશે: તે સુસંગત પણ નહીં હોય (એટલે ​​​​કે, ખૂબ મોટી માત્રામાં ડેટા પણ અમને આ કિસ્સામાં ઉચ્ચ-ગુણવત્તાના અંદાજો મેળવવાની મંજૂરી આપતું નથી. ).

રીગ્રેસન સમીકરણોના પરિમાણોના આંકડાકીય અંદાજની સૌથી સામાન્ય પદ્ધતિ એ ન્યૂનતમ ચોરસ પદ્ધતિ છે. આ પદ્ધતિ ડેટાની પ્રકૃતિ અને મોડેલના પરિણામોને લગતી સંખ્યાબંધ ધારણાઓ પર આધારિત છે. મૂળ ચલોનું આશ્રિત અને સ્વતંત્રમાં સ્પષ્ટ વિભાજન, સમીકરણોમાં સમાવિષ્ટ પરિબળોની અસંબંધિતતા, સંબંધની રેખીયતા, અવશેષોના સ્વતઃસંબંધની ગેરહાજરી, તેમની ગાણિતિક અપેક્ષાઓની શૂન્ય અને સતત સમાનતા છે. વિખેરવું

OLS ની મુખ્ય પૂર્વધારણાઓમાંની એક વિચલનોની ભિન્નતાની સમાનતાની ધારણા છે ei, એટલે કે. શ્રેણીના સરેરાશ (શૂન્ય) મૂલ્યની આસપાસ તેમનો ફેલાવો સ્થિર મૂલ્ય હોવો જોઈએ. આ ગુણધર્મને હોમોસેડેસ્ટીસીટી કહેવામાં આવે છે. વ્યવહારમાં, વિચલનોની ભિન્નતા ઘણી વાર અસમાન હોય છે, એટલે કે, હેટરોસ્કેડસ્ટીસીટી જોવા મળે છે. આ વિવિધ કારણોસર હોઈ શકે છે. ઉદાહરણ તરીકે, સ્ત્રોત ડેટામાં ભૂલો હોઈ શકે છે. સ્ત્રોત માહિતીમાં પ્રસંગોપાત અચોક્કસતા, જેમ કે સંખ્યાઓના ક્રમમાં ભૂલો, પરિણામો પર નોંધપાત્ર અસર કરી શકે છે. મોટેભાગે, આશ્રિત ચલ (ચલો) ના મોટા મૂલ્યો સાથે વિચલનો єi નો મોટો ફેલાવો જોવા મળે છે. જો ડેટામાં નોંધપાત્ર ભૂલ હોય, તો સ્વાભાવિક રીતે, ભૂલભરેલા ડેટામાંથી ગણતરી કરેલ મોડેલ મૂલ્યનું વિચલન પણ મોટું હશે. આ ભૂલથી છુટકારો મેળવવા માટે, અમારે ગણતરીના પરિણામોમાં આ ડેટાના યોગદાનને ઘટાડવાની જરૂર છે, તેમને અન્ય તમામ કરતા ઓછું વજન સોંપવું પડશે. આ વિચાર ભારિત OLS માં અમલમાં મૂકવામાં આવ્યો છે.



શું તમને લેખ ગમ્યો? તમારા મિત્રો સાથે શેર કરો!
પણ વાંચો