ઓછામાં ઓછા ચોરસ પદ્ધતિ
વિષયના અંતિમ પાઠમાં, અમે સૌથી પ્રખ્યાત એપ્લિકેશનથી પરિચિત થઈશું FNP, જે વિજ્ઞાન અને વ્યવહારિક પ્રવૃત્તિના વિવિધ ક્ષેત્રોમાં સૌથી વધુ વ્યાપક ઉપયોગ શોધે છે. આ ભૌતિકશાસ્ત્ર, રસાયણશાસ્ત્ર, જીવવિજ્ઞાન, અર્થશાસ્ત્ર, સમાજશાસ્ત્ર, મનોવિજ્ઞાન અને તેથી વધુ હોઈ શકે છે. ભાગ્યની ઇચ્છાથી, મારે ઘણીવાર અર્થતંત્ર સાથે વ્યવહાર કરવો પડે છે, અને તેથી આજે હું તમારા માટે એક અદ્ભુત દેશની સફર ગોઠવીશ. ઇકોનોમેટ્રિક્સ=) ...તમે તેને કેવી રીતે ન જોઈ શકો?! તે ત્યાં ખૂબ સારું છે - તમારે ફક્ત તમારું મન બનાવવાની જરૂર છે! ...પરંતુ તમે કદાચ ચોક્કસપણે શું ઇચ્છો છો તે શીખવું છે કે સમસ્યાઓ કેવી રીતે હલ કરવી ઓછામાં ઓછા ચોરસ પદ્ધતિ. અને ખાસ કરીને મહેનતું વાચકો તેમને માત્ર ચોક્કસ જ નહીં, પણ ખૂબ જ ઝડપથી હલ કરવાનું શીખશે ;-) પરંતુ પહેલા સમસ્યાનું સામાન્ય નિવેદન+ સાથેનું ઉદાહરણ:
ધારો કે ચોક્કસ વિષય ક્ષેત્રમાં, માત્રાત્મક અભિવ્યક્તિ ધરાવતા સૂચકોનો અભ્યાસ કરવામાં આવે છે. તે જ સમયે, એવું માનવા માટે દરેક કારણ છે કે સૂચક સૂચક પર આધાર રાખે છે. આ ધારણા કાં તો વૈજ્ઞાનિક પૂર્વધારણા હોઈ શકે છે અથવા મૂળભૂત સામાન્ય સમજ પર આધારિત હોઈ શકે છે. જો કે, ચાલો વિજ્ઞાનને બાજુ પર રાખીએ અને વધુ મોહક વિસ્તારોનું અન્વેષણ કરીએ - એટલે કે, કરિયાણાની દુકાનો. ચાલો આના દ્વારા સૂચિત કરીએ:
- કરિયાણાની દુકાનનો છૂટક વિસ્તાર, ચો.મી.,
- કરિયાણાની દુકાનનું વાર્ષિક ટર્નઓવર, મિલિયન રુબેલ્સ.
તે એકદમ સ્પષ્ટ છે કે સ્ટોર વિસ્તાર જેટલો મોટો હશે, મોટા ભાગના કિસ્સાઓમાં તેનું ટર્નઓવર વધારે હશે.
ધારો કે ખંજરી સાથે અવલોકનો/પ્રયોગો/ગણતરીઓ/નૃત્ય કર્યા પછી અમારી પાસે સંખ્યાત્મક ડેટા છે:
કરિયાણાની દુકાનો સાથે, મને લાગે છે કે બધું સ્પષ્ટ છે: - આ 1 લી સ્ટોરનો વિસ્તાર છે, - તેનું વાર્ષિક ટર્નઓવર, - 2 જી સ્ટોરનો વિસ્તાર, - તેનું વાર્ષિક ટર્નઓવર, વગેરે. માર્ગ દ્વારા, વર્ગીકૃત સામગ્રીની ઍક્સેસ હોવી જરૂરી નથી - વેપાર ટર્નઓવરનું એકદમ સચોટ મૂલ્યાંકન આના માધ્યમથી મેળવી શકાય છે. ગાણિતિક આંકડા. જો કે, ચાલો વિચલિત ન થઈએ, વ્યાપારી જાસૂસી કોર્સ પહેલેથી જ ચૂકવવામાં આવે છે =)
ટેબ્યુલર ડેટાને પોઈન્ટના સ્વરૂપમાં પણ લખી શકાય છે અને પરિચિત સ્વરૂપમાં દર્શાવી શકાય છે કાર્ટેશિયન સિસ્ટમ .
ચાલો એક મહત્વપૂર્ણ પ્રશ્નનો જવાબ આપીએ: ગુણાત્મક અભ્યાસ માટે કેટલા મુદ્દા જરૂરી છે?
વધુ સારું. ન્યૂનતમ સ્વીકાર્ય સમૂહમાં 5-6 પોઈન્ટ હોય છે. વધુમાં, જ્યારે ડેટાની માત્રા ઓછી હોય છે, ત્યારે નમૂનામાં "વિસંગત" પરિણામોનો સમાવેશ કરી શકાતો નથી. તેથી, ઉદાહરણ તરીકે, એક નાનો ચુનંદા સ્ટોર "તેના સાથીદારો" કરતાં વધુ તીવ્રતાના ઓર્ડર મેળવી શકે છે, જેનાથી તમારે શોધવાની જરૂર છે તે સામાન્ય પેટર્નને વિકૃત કરી શકે છે!
તેને ખૂબ જ સરળ રીતે કહીએ તો, આપણે એક કાર્ય પસંદ કરવાની જરૂર છે, સમયપત્રકજે પોઈન્ટની શક્ય તેટલી નજીકથી પસાર થાય છે . આ કાર્ય કહેવામાં આવે છે અંદાજિત (અંદાજે - અંદાજ)અથવા સૈદ્ધાંતિક કાર્ય . સામાન્ય રીતે કહીએ તો, એક સ્પષ્ટ "સ્પર્ધક" તરત જ અહીં દેખાય છે - એક ઉચ્ચ-ડિગ્રી બહુપદી, જેનો ગ્રાફ તમામ બિંદુઓમાંથી પસાર થાય છે. પરંતુ આ વિકલ્પ જટિલ છે અને ઘણીવાર ફક્ત ખોટો છે. (કારણ કે ગ્રાફ હંમેશા "લૂપ" કરશે અને મુખ્ય વલણને ખરાબ રીતે પ્રતિબિંબિત કરશે).
આમ, ઇચ્છિત કાર્ય એકદમ સરળ હોવું જોઈએ અને તે જ સમયે પર્યાપ્ત રીતે અવલંબનને પ્રતિબિંબિત કરે છે. જેમ તમે અનુમાન કરી શકો છો, આવા કાર્યોને શોધવા માટેની પદ્ધતિઓમાંથી એક કહેવામાં આવે છે ઓછામાં ઓછા ચોરસ પદ્ધતિ. પ્રથમ, ચાલો તેના સારને સામાન્ય શબ્દોમાં જોઈએ. કેટલાક અંદાજિત પ્રાયોગિક ડેટાને કાર્ય કરવા દો:
આ અંદાજની ચોકસાઈનું મૂલ્યાંકન કેવી રીતે કરવું? ચાલો પ્રાયોગિક અને કાર્યાત્મક મૂલ્યો વચ્ચેના તફાવતો (વિચલનો)ની પણ ગણતરી કરીએ (અમે ચિત્રનો અભ્યાસ કરીએ છીએ). પ્રથમ વિચાર જે મનમાં આવે છે તે એ છે કે સરવાળો કેટલો મોટો છે, પરંતુ સમસ્યા એ છે કે તફાવતો નકારાત્મક હોઈ શકે છે. (ઉદાહરણ તરીકે, )
અને આવા સમીકરણના પરિણામે વિચલનો એકબીજાને રદ કરશે. તેથી, અંદાજની ચોકસાઈના અંદાજ તરીકે, તે સરવાળો લેવા વિનંતી કરે છે મોડ્યુલોવિચલનો:
અથવા સંકુચિત: (જો કોઈને ખબર ન હોય તો: સમ ચિહ્ન છે, અને - એક સહાયક "કાઉન્ટર" ચલ, જે 1 થી મૂલ્યો લે છે ) .
જુદા જુદા કાર્યો સાથે પ્રાયોગિક બિંદુઓને અંદાજિત કરીને, આપણે વિવિધ મૂલ્યો મેળવીશું, અને દેખીતી રીતે, જ્યાં આ સરવાળો નાનો છે, તે કાર્ય વધુ સચોટ છે.
આવી પદ્ધતિ અસ્તિત્વમાં છે અને તેને કહેવામાં આવે છે ઓછામાં ઓછી મોડ્યુલસ પદ્ધતિ. જો કે, વ્યવહારમાં તે વધુ વ્યાપક બન્યું છે ઓછામાં ઓછા ચોરસ પદ્ધતિ, જેમાં સંભવિત નકારાત્મક મૂલ્યો મોડ્યુલ દ્વારા નહીં, પરંતુ વિચલનોના વર્ગીકરણ દ્વારા દૂર કરવામાં આવે છે:
, જે પછી પ્રયત્નોનો ઉદ્દેશ્ય એવા ફંક્શનને પસંદ કરવાનો છે કે જેમ કે વર્ગ વિચલનોનો સરવાળો શક્ય તેટલું નાનું હતું. વાસ્તવમાં, પદ્ધતિનું નામ અહીંથી આવ્યું છે.
અને હવે આપણે બીજા મહત્વના મુદ્દા પર પાછા ફરો: ઉપર નોંધ્યા મુજબ, પસંદ કરેલ કાર્ય એકદમ સરળ હોવું જોઈએ - પરંતુ આવા ઘણા કાર્યો પણ છે: રેખીય , અતિશય , ઘાતાંકીય , લઘુગણક , ચતુર્ભુજ વગેરે અને, અલબત્ત, અહીં હું તરત જ "પ્રવૃત્તિનું ક્ષેત્ર ઘટાડવા" ઈચ્છું છું. સંશોધન માટે મારે કયા વર્ગના કાર્યો પસંદ કરવા જોઈએ? એક આદિમ પરંતુ અસરકારક તકનીક:
- પોઈન્ટનું નિરૂપણ કરવાનો સૌથી સહેલો રસ્તો છે ડ્રોઇંગ પર અને તેમના સ્થાનનું વિશ્લેષણ કરો. જો તેઓ સીધી રેખામાં દોડવાનું વલણ ધરાવે છે, તો તમારે શોધવું જોઈએ રેખાનું સમીકરણ શ્રેષ્ઠ મૂલ્યો સાથે અને . બીજા શબ્દોમાં કહીએ તો, કાર્ય આવા ગુણાંક શોધવાનું છે જેથી વર્ગ વિચલનોનો સરવાળો સૌથી નાનો હોય.
જો બિંદુઓ સ્થિત છે, ઉદાહરણ તરીકે, સાથે અતિશય, તો તે સ્પષ્ટપણે સ્પષ્ટ છે કે રેખીય કાર્ય નબળું અંદાજ આપશે. આ કિસ્સામાં, અમે હાઇપરબોલા સમીકરણ માટે સૌથી વધુ "અનુકૂળ" ગુણાંક શોધી રહ્યા છીએ - તે જે ચોરસનો લઘુત્તમ સરવાળો આપે છે .
હવે નોંધ લો કે બંને કિસ્સાઓમાં અમે વાત કરી રહ્યા છીએ બે ચલોના કાર્યો, જેની દલીલો છે નિર્ભરતા પરિમાણો શોધ્યા:
અને અનિવાર્યપણે આપણે પ્રમાણભૂત સમસ્યા હલ કરવાની જરૂર છે - શોધો બે ચલોનું ન્યૂનતમ કાર્ય.
ચાલો અમારું ઉદાહરણ યાદ રાખો: ધારો કે "સ્ટોર" પોઈન્ટ સીધી રેખામાં સ્થિત હોય છે અને હાજરીને માનવાનું દરેક કારણ છે રેખીય અવલંબનછૂટક જગ્યામાંથી ટર્નઓવર. ચાલો આવા ગુણાંક “a” અને “be” શોધીએ કે વર્ગ વિચલનોનો સરવાળો સૌથી નાનો હતો. બધું હંમેશની જેમ છે - પ્રથમ 1 લી ઓર્ડર આંશિક ડેરિવેટિવ્ઝ. અનુસાર રેખીયતા નિયમતમે સરવાળા આયકન હેઠળ જ તફાવત કરી શકો છો:
જો તમે નિબંધ અથવા ટર્મ પેપર માટે આ માહિતીનો ઉપયોગ કરવા માંગતા હો, તો હું સ્રોતોની સૂચિમાંની લિંક માટે ખૂબ જ આભારી હોઈશ.
ચાલો પ્રમાણભૂત સિસ્ટમ બનાવીએ:
અમે દરેક સમીકરણને "બે" દ્વારા ઘટાડીએ છીએ અને વધુમાં, સરવાળોને "વિભાજિત" કરીએ છીએ:
નોંધ : સ્વતંત્ર રીતે વિશ્લેષણ કરો કે શા માટે "a" અને "be" સરવાળા ચિહ્નની બહાર લઈ શકાય છે. માર્ગ દ્વારા, ઔપચારિક રીતે આ રકમ સાથે કરી શકાય છે
ચાલો સિસ્ટમને "લાગુ કરેલ" સ્વરૂપમાં ફરીથી લખીએ:
જે પછી અમારી સમસ્યા હલ કરવા માટેનું અલ્ગોરિધમ બહાર આવવાનું શરૂ થાય છે:
શું આપણે બિંદુઓના કોઓર્ડિનેટ્સ જાણીએ છીએ? અમે જાણીએ છીએ. રકમો શું આપણે તેને શોધી શકીએ? સરળતાથી. ચાલો સૌથી સરળ બનાવીએ બે અજ્ઞાતમાં બે રેખીય સમીકરણોની સિસ્ટમ("a" અને "be"). અમે સિસ્ટમ હલ કરીએ છીએ, ઉદાહરણ તરીકે, ક્રેમરની પદ્ધતિ, જેના પરિણામે આપણે સ્થિર બિંદુ મેળવીએ છીએ. તપાસી રહ્યું છે એક્સ્ટ્રીમ માટે પૂરતી સ્થિતિ, અમે ચકાસી શકીએ છીએ કે આ બિંદુએ કાર્ય બરાબર પહોંચે છે ન્યૂનતમ. ચેકમાં વધારાની ગણતરીઓનો સમાવેશ થાય છે અને તેથી અમે તેને પડદા પાછળ છોડી દઈશું (જો જરૂરી હોય તો, ખૂટતી ફ્રેમ જોઈ શકાય છેઅહીં ) . અમે અંતિમ નિષ્કર્ષ દોરીએ છીએ:
કાર્ય શ્રેષ્ઠ શક્ય રીતે (ઓછામાં ઓછા કોઈપણ અન્ય રેખીય કાર્યની તુલનામાં)પ્રાયોગિક મુદ્દાઓને નજીક લાવે છે . આશરે કહીએ તો, તેનો ગ્રાફ આ બિંદુઓની શક્ય તેટલી નજીકથી પસાર થાય છે. પરંપરામાં અર્થશાસ્ત્રપરિણામી અંદાજિત કાર્ય પણ કહેવાય છે જોડી રેખીય રીગ્રેસન સમીકરણ .
વિચારણા હેઠળની સમસ્યા ખૂબ જ વ્યવહારુ મહત્વની છે. અમારી ઉદાહરણ પરિસ્થિતિમાં, Eq. તમને વેપાર ટર્નઓવરની આગાહી કરવાની મંજૂરી આપે છે ("ઇગ્રેક")સ્ટોરમાં વેચાણ વિસ્તારની એક અથવા બીજી કિંમત હશે ("x" નો એક અથવા બીજો અર્થ). હા, પરિણામી આગાહી માત્ર એક આગાહી હશે, પરંતુ ઘણા કિસ્સાઓમાં તે તદ્દન સચોટ સાબિત થશે.
હું "વાસ્તવિક" સંખ્યાઓ સાથે ફક્ત એક સમસ્યાનું વિશ્લેષણ કરીશ, કારણ કે તેમાં કોઈ મુશ્કેલીઓ નથી - બધી ગણતરીઓ 7 મી-8 મા ધોરણના શાળા અભ્યાસક્રમના સ્તરે છે. 95 ટકા કિસ્સાઓમાં, તમને માત્ર એક રેખીય કાર્ય શોધવા માટે કહેવામાં આવશે, પરંતુ લેખના ખૂબ જ અંતમાં હું બતાવીશ કે શ્રેષ્ઠ હાઇપરબોલા, ઘાતાંકીય અને કેટલાક અન્ય કાર્યોના સમીકરણો શોધવાનું વધુ મુશ્કેલ નથી.
હકીકતમાં, જે બાકી છે તે વચન આપેલ ગુડીઝનું વિતરણ કરવાનું છે - જેથી તમે આવા ઉદાહરણોને માત્ર સચોટ રીતે જ નહીં, પણ ઝડપથી હલ કરવાનું શીખી શકો. અમે ધોરણનો કાળજીપૂર્વક અભ્યાસ કરીએ છીએ:
કાર્ય
બે સૂચકાંકો વચ્ચેના સંબંધનો અભ્યાસ કરવાના પરિણામે, સંખ્યાઓની નીચેની જોડી પ્રાપ્ત થઈ:
ઓછામાં ઓછી ચોરસ પદ્ધતિનો ઉપયોગ કરીને, પ્રયોગમૂલકને શ્રેષ્ઠ અંદાજ આપતા રેખીય કાર્ય શોધો (અનુભવી)ડેટા કાર્ટેશિયન લંબચોરસ કોઓર્ડિનેટ સિસ્ટમમાં પ્રાયોગિક બિંદુઓ અને અંદાજિત કાર્યનો આલેખ કે જેના પર એક ચિત્ર બનાવો . પ્રયોગમૂલક અને સૈદ્ધાંતિક મૂલ્યો વચ્ચેના વર્ગ વિચલનોનો સરવાળો શોધો. શોધો કે શું સુવિધા વધુ સારી હશે (ઓછામાં ઓછા ચોરસ પદ્ધતિના દૃષ્ટિકોણથી)પ્રાયોગિક મુદ્દાઓને નજીક લાવો.
મહેરબાની કરીને નોંધ કરો કે "x" અર્થો કુદરતી છે, અને આનો એક લાક્ષણિક અર્થપૂર્ણ અર્થ છે, જેના વિશે હું થોડી વાર પછી વાત કરીશ; પરંતુ તેઓ, અલબત્ત, અપૂર્ણાંક પણ હોઈ શકે છે. વધુમાં, ચોક્કસ કાર્યની સામગ્રીના આધારે, "X" અને "ગેમ" બંને મૂલ્યો સંપૂર્ણપણે અથવા આંશિક રીતે નકારાત્મક હોઈ શકે છે. સારું, અમને "ચહેરા વિનાનું" કાર્ય આપવામાં આવ્યું છે, અને અમે તેને શરૂ કરીએ છીએ ઉકેલ:
અમે સિસ્ટમના ઉકેલ તરીકે શ્રેષ્ઠ કાર્યના ગુણાંક શોધીએ છીએ:
વધુ કોમ્પેક્ટ રેકોર્ડિંગના હેતુ માટે, "કાઉન્ટર" ચલને અવગણી શકાય છે, કારણ કે તે પહેલાથી જ સ્પષ્ટ છે કે સરવાળો 1 થી .
ટેબ્યુલર સ્વરૂપમાં જરૂરી રકમની ગણતરી કરવી વધુ અનુકૂળ છે:
ગણતરીઓ માઇક્રોકેલ્ક્યુલેટર પર કરી શકાય છે, પરંતુ એક્સેલનો ઉપયોગ કરવો વધુ સારું છે - બંને ઝડપી અને ભૂલો વિના; ટૂંકી વિડિઓ જુઓ:
આમ, અમને નીચેના મળે છે સિસ્ટમ:
અહીં તમે બીજા સમીકરણને 3 અને વડે ગુણાકાર કરી શકો છો ટર્મ દ્વારા 1લા સમીકરણ પદમાંથી 2જી બાદ કરો. પરંતુ આ નસીબ છે - વ્યવહારમાં, સિસ્ટમો ઘણીવાર ભેટ નથી, અને આવા કિસ્સાઓમાં તે બચાવે છે ક્રેમરની પદ્ધતિ:
, જેનો અર્થ છે કે સિસ્ટમ પાસે એક અનન્ય ઉકેલ છે.
ચાલો તપાસીએ. હું સમજું છું કે તમે ઇચ્છતા નથી, પરંતુ ભૂલોને શા માટે અવગણો જ્યાં તે સંપૂર્ણપણે ચૂકી ન શકાય? ચાલો આપણે સિસ્ટમના દરેક સમીકરણની ડાબી બાજુએ મળેલા ઉકેલને બદલીએ:
અનુરૂપ સમીકરણોની જમણી બાજુઓ મેળવવામાં આવે છે, જેનો અર્થ છે કે સિસ્ટમ યોગ્ય રીતે ઉકેલી છે.
આમ, ઇચ્છિત અંદાજિત કાર્ય: – થી બધા રેખીય કાર્યોતે તે છે જે પ્રાયોગિક ડેટાનું શ્રેષ્ઠ અંદાજ આપે છે.
વિપરીત પ્રત્યક્ષ તેના વિસ્તાર પર સ્ટોરના ટર્નઓવરની અવલંબન, જોવા મળેલી અવલંબન છે વિપરીત (સિદ્ધાંત "વધુ, ઓછું"), અને આ હકીકત તરત જ નકારાત્મક દ્વારા પ્રગટ થાય છે ઢાળ. કાર્ય અમને કહે છે કે ચોક્કસ સૂચકમાં 1 એકમના વધારા સાથે, આશ્રિત સૂચકનું મૂલ્ય ઘટે છે સરેરાશ 0.65 એકમો દ્વારા. જેમ તેઓ કહે છે, બિયાં સાથેનો દાણોની કિંમત જેટલી વધારે છે, તેટલું ઓછું વેચાય છે.
અંદાજિત ફંક્શનને પ્લોટ કરવા માટે, ચાલો તેના બે મૂલ્યો શોધીએ:
અને ડ્રોઇંગ ચલાવો:
બાંધેલી સીધી રેખા કહેવામાં આવે છે વલણ રેખા
(એટલે કે, એક રેખીય વલણ રેખા, એટલે કે સામાન્ય કિસ્સામાં, વલણ એ જરૂરી નથી કે સીધી રેખા હોય). દરેક વ્યક્તિ "ચલણમાં હોવા" અભિવ્યક્તિથી પરિચિત છે અને મને લાગે છે કે આ શબ્દને વધારાની ટિપ્પણીઓની જરૂર નથી.
ચાલો વર્ગ વિચલનોના સરવાળાની ગણતરી કરીએ પ્રયોગમૂલક અને સૈદ્ધાંતિક મૂલ્યો વચ્ચે. ભૌમિતિક રીતે, આ "રાસ્પબેરી" સેગમેન્ટ્સની લંબાઈના ચોરસનો સરવાળો છે (જેમાંથી બે એટલા નાના છે કે તે દેખાતા પણ નથી).
ચાલો કોષ્ટકમાં ગણતરીઓનો સારાંશ આપીએ:
ફરીથી, તેઓ જાતે જ કરી શકાય છે, હું 1લા મુદ્દા માટે એક ઉદાહરણ આપીશ:
પરંતુ તે પહેલાથી જ જાણીતી રીતે કરવું તે વધુ અસરકારક છે:
અમે ફરી એકવાર પુનરાવર્તન કરીએ છીએ: પ્રાપ્ત પરિણામનો અર્થ શું છે?થી બધા રેખીય કાર્યો y કાર્ય સૂચક સૌથી નાનો છે, એટલે કે, તેના પરિવારમાં તે શ્રેષ્ઠ અંદાજ છે. અને અહીં, માર્ગ દ્વારા, સમસ્યાનો અંતિમ પ્રશ્ન આકસ્મિક નથી: શું જો સૂચિત ઘાતાંકીય કાર્ય પ્રાયોગિક મુદ્દાઓને નજીક લાવવાનું વધુ સારું રહેશે?
ચાલો સ્ક્વેર્ડ વિચલનોનો અનુરૂપ સરવાળો શોધીએ - તફાવત કરવા માટે, હું તેમને "એપ્સીલોન" અક્ષરથી સૂચિત કરીશ. તકનીક બરાબર સમાન છે:
અને ફરીથી, ફક્ત કિસ્સામાં, 1 લી બિંદુ માટે ગણતરીઓ:
એક્સેલમાં આપણે સ્ટાન્ડર્ડ ફંક્શનનો ઉપયોગ કરીએ છીએ EXP (વાક્યરચના એક્સેલ હેલ્પમાં મળી શકે છે).
નિષ્કર્ષ: , જેનો અર્થ છે કે ઘાતાંકીય કાર્ય સીધી રેખા કરતાં વધુ ખરાબ પ્રાયોગિક બિંદુઓને અંદાજે છે .
પરંતુ અહીં એ નોંધવું જોઈએ કે "ખરાબ" છે હજુ સુધી અર્થ નથી, જે ખરાબ છે. હવે મેં આ ઘાતાંકીય કાર્યનો ગ્રાફ બનાવ્યો છે - અને તે પોઈન્ટની નજીકથી પણ પસાર થાય છે - એટલું બધું કે વિશ્લેષણાત્મક સંશોધન વિના કયું કાર્ય વધુ સચોટ છે તે કહેવું મુશ્કેલ છે.
આ ઉકેલને સમાપ્ત કરે છે, અને હું દલીલના કુદરતી મૂલ્યોના પ્રશ્ન પર પાછો ફરું છું. વિવિધ અભ્યાસોમાં, સામાન્ય રીતે આર્થિક અથવા સમાજશાસ્ત્રીય, કુદરતી "X" નો ઉપયોગ મહિનાઓ, વર્ષો અથવા અન્ય સમાન સમય અંતરાલોની સંખ્યા માટે થાય છે. ઉદાહરણ તરીકે, નીચેની સમસ્યાને ધ્યાનમાં લો:
વર્ષના પ્રથમ અર્ધવાર્ષિક ગાળા માટે સ્ટોરના રિટેલ ટર્નઓવર પર નીચેનો ડેટા ઉપલબ્ધ છે:
વિશ્લેષણાત્મક સીધી રેખા ગોઠવણીનો ઉપયોગ કરીને, જુલાઈ માટે ટર્નઓવરનું પ્રમાણ નક્કી કરો.
હા, કોઈ વાંધો નથી: અમે મહિનાઓ 1, 2, 3, 4, 5, 6 ની સંખ્યા કરીએ છીએ અને સામાન્ય અલ્ગોરિધમનો ઉપયોગ કરીએ છીએ, જેના પરિણામે આપણને એક સમીકરણ મળે છે - એકમાત્ર વસ્તુ એ છે કે જ્યારે સમય આવે છે, ત્યારે તેઓ સામાન્ય રીતે ઉપયોગ કરે છે. અક્ષર "તે" (જોકે આ જટિલ નથી). પરિણામી સમીકરણ દર્શાવે છે કે વર્ષના પ્રથમ અર્ધવાર્ષિક ગાળામાં વેપાર ટર્નઓવરમાં સરેરાશ 27.74 એકમોનો વધારો થયો છે. દર મહિને. ચાલો જુલાઈની આગાહી મેળવીએ (મહિનો નંબર 7): ડી.ઇ.
અને આવા અસંખ્ય કાર્યો છે. જેઓ ઈચ્છે છે તેઓ વધારાની સેવાનો ઉપયોગ કરી શકે છે, એટલે કે મારી એક્સેલ કેલ્ક્યુલેટર (ડેમો સંસ્કરણ), જે વિશ્લેષિત સમસ્યા લગભગ તરત જ હલ કરે છે!પ્રોગ્રામનું વર્કિંગ વર્ઝન ઉપલબ્ધ છે વિનિમય પરઅથવા માટે સાંકેતિક ફી.
પાઠના અંતે, કેટલાક અન્ય પ્રકારની નિર્ભરતા શોધવા વિશે સંક્ષિપ્ત માહિતી. વાસ્તવમાં, કહેવા માટે ઘણું બધું નથી, કારણ કે મૂળભૂત અભિગમ અને ઉકેલ એલ્ગોરિધમ સમાન રહે છે.
ચાલો ધારીએ કે પ્રાયોગિક બિંદુઓની ગોઠવણી અતિપરવલય જેવું છે. પછી, શ્રેષ્ઠ હાયપરબોલાના ગુણાંક શોધવા માટે, તમારે લઘુત્તમ કાર્ય શોધવાની જરૂર છે - કોઈપણ વિગતવાર ગણતરીઓ કરી શકે છે અને સમાન સિસ્ટમ પર પહોંચી શકે છે:
ઔપચારિક તકનીકી દૃષ્ટિકોણથી, તે "રેખીય" સિસ્ટમમાંથી મેળવવામાં આવે છે (ચાલો તેને ફૂદડી વડે દર્શાવીએ)સાથે "x" ને બદલીને. સારું, રકમ વિશે શું? ગણતરી કરો, જે પછી શ્રેષ્ઠ ગુણાંક “a” અને “be” હાથ પર બંધ.
જો ત્યાં દરેક કારણ માને છે કે પોઈન્ટ લઘુગણક વળાંક સાથે સ્થિત હોય છે, પછી શ્રેષ્ઠ મૂલ્યો શોધવા માટે આપણે લઘુત્તમ કાર્ય શોધીએ છીએ . ઔપચારિક રીતે, સિસ્ટમમાં (*) ને આની સાથે બદલવાની જરૂર છે:
Excel માં ગણતરીઓ કરતી વખતે, ફંક્શનનો ઉપયોગ કરો એલએન. હું કબૂલ કરું છું કે વિચારણા હેઠળના દરેક કેસ માટે કેલ્ક્યુલેટર બનાવવું મારા માટે ખાસ મુશ્કેલ નથી, પરંતુ જો તમે ગણતરીઓ જાતે "પ્રોગ્રામ" કરો તો તે વધુ સારું રહેશે. મદદ કરવા માટે પાઠ વિડિઓઝ.
ઘાતાંકીય અવલંબન સાથે પરિસ્થિતિ થોડી વધુ જટિલ છે. બાબતને રેખીય કેસમાં ઘટાડવા માટે, અમે ફંક્શન લોગરીધમ લઈએ છીએ અને તેનો ઉપયોગ કરીએ છીએ લઘુગણકના ગુણધર્મો:
હવે, પરિણામી ફંક્શનને રેખીય ફંક્શન સાથે સરખાવીને, આપણે એ નિષ્કર્ષ પર આવીએ છીએ કે સિસ્ટમમાં (*) ને , અને – દ્વારા બદલવું આવશ્યક છે. સગવડ માટે, ચાલો સૂચિત કરીએ:
મહેરબાની કરીને નોંધ કરો કે સિસ્ટમ આદર સાથે ઉકેલાઈ છે અને, અને તેથી, મૂળ શોધ્યા પછી, તમારે ગુણાંક પોતે જ શોધવાનું ભૂલવું જોઈએ નહીં.
પ્રાયોગિક મુદ્દાઓને નજીક લાવવા શ્રેષ્ઠ પેરાબોલા , શોધી કાઢવી જોઈએ ત્રણ ચલોનું ન્યૂનતમ કાર્ય . પ્રમાણભૂત ક્રિયાઓ કર્યા પછી, અમને નીચેની "કાર્યકારી" મળે છે સિસ્ટમ:
હા, અલબત્ત, અહીં વધુ રકમો છે, પરંતુ તમારી મનપસંદ એપ્લિકેશનનો ઉપયોગ કરતી વખતે કોઈ મુશ્કેલીઓ નથી. અને અંતે, હું તમને કહીશ કે એક્સેલનો ઉપયોગ કરીને ઝડપથી ચેક કેવી રીતે કરવું અને ઇચ્છિત ટ્રેન્ડ લાઇન કેવી રીતે બનાવવી: સ્કેટર પ્લોટ બનાવો, માઉસ વડે કોઈપણ પોઈન્ટ પસંદ કરો. અને જમણું ક્લિક કરો વિકલ્પ પસંદ કરો "ટ્રેન્ડ લાઇન ઉમેરો". આગળ, ચાર્ટ પ્રકાર પસંદ કરો અને ટેબ પર "વિકલ્પો"વિકલ્પ સક્રિય કરો "ડાયાગ્રામ પર સમીકરણ બતાવો". ઠીક છે
હંમેશની જેમ, હું લેખને કેટલાક સુંદર શબ્દસમૂહ સાથે સમાપ્ત કરવા માંગુ છું, અને મેં લગભગ ટાઇપ કર્યું છે "ચલણમાં રહો!" પરંતુ સમય જતાં તેણે પોતાનો વિચાર બદલી નાખ્યો. અને એટલા માટે નહીં કે તે સ્ટીરિયોટાઇપ છે. મને ખબર નથી કે તે કોઈના માટે કેવું છે, પરંતુ હું ખરેખર પ્રમોટ કરાયેલ અમેરિકન અને ખાસ કરીને યુરોપિયન વલણને અનુસરવા માંગતો નથી =) તેથી, હું ઈચ્છું છું કે તમારામાંના દરેક તમારી પોતાની લાઇનને વળગી રહે!
http://www.grandars.ru/student/vysshaya-matematika/metod-naimenshih-kvadratov.html
ઓછામાં ઓછી ચોરસ પદ્ધતિ તેના કારણે સૌથી સામાન્ય અને સૌથી વધુ વિકસિત છે રેખીય ઇકોનોમેટ્રિક મોડલ્સના પરિમાણોનો અંદાજ કાઢવા માટેની પદ્ધતિઓની સરળતા અને કાર્યક્ષમતા. તે જ સમયે, તેનો ઉપયોગ કરતી વખતે, કેટલીક સાવચેતી અવલોકન કરવી જોઈએ, કારણ કે તેનો ઉપયોગ કરીને બનાવવામાં આવેલ મોડેલો તેમના પરિમાણોની ગુણવત્તા માટે સંખ્યાબંધ આવશ્યકતાઓને સંતોષી શકતા નથી અને પરિણામે, પ્રક્રિયાના વિકાસની પેટર્નને "સારી રીતે" પ્રતિબિંબિત કરતા નથી. .
ચાલો વધુ વિગતમાં ઓછામાં ઓછા ચોરસ પદ્ધતિનો ઉપયોગ કરીને રેખીય ઇકોનોમેટ્રિક મોડેલના પરિમાણોનો અંદાજ કાઢવા માટેની પ્રક્રિયાને ધ્યાનમાં લઈએ. સામાન્ય રીતે આવા મોડેલને સમીકરણ (1.2) દ્વારા રજૂ કરી શકાય છે:
y t = a 0 + a 1 x 1t +... a n x nt + ε t.
0, a 1,..., a n એ આશ્રિત ચલના મૂલ્યોનું વેક્ટર છે. y= (y 1 , y 2 , ... , y T)" અને સ્વતંત્ર ચલોના મૂલ્યોનું મેટ્રિક્સ
જેમાં પ્રથમ સ્તંભ, જેમાંનો સમાવેશ થાય છે, તે મોડેલ ગુણાંકને અનુરૂપ છે.
લઘુત્તમ ચોરસ પદ્ધતિએ તેનું નામ મૂળભૂત સિદ્ધાંતના આધારે મેળવ્યું છે કે તેના આધારે મેળવેલ પરિમાણ અંદાજ સંતોષવા આવશ્યક છે: મોડેલ ભૂલના ચોરસનો સરવાળો ન્યૂનતમ હોવો જોઈએ.
ઓછામાં ઓછા ચોરસ પદ્ધતિનો ઉપયોગ કરીને સમસ્યાઓ ઉકેલવાના ઉદાહરણો
ઉદાહરણ 2.1.ટ્રેડિંગ એન્ટરપ્રાઇઝમાં 12 સ્ટોર્સનું નેટવર્ક છે, જેની પ્રવૃત્તિઓની માહિતી કોષ્ટકમાં રજૂ કરવામાં આવી છે. 2.1.
એન્ટરપ્રાઇઝનું મેનેજમેન્ટ એ જાણવા માંગે છે કે વાર્ષિક ટર્નઓવરનું કદ સ્ટોરની છૂટક જગ્યા પર કેવી રીતે આધાર રાખે છે.
કોષ્ટક 2.1
સ્ટોર નંબર | વાર્ષિક ટર્નઓવર, મિલિયન રુબેલ્સ. | છૂટક વિસ્તાર, હજાર m2 |
19,76 | 0,24 | |
38,09 | 0,31 | |
40,95 | 0,55 | |
41,08 | 0,48 | |
56,29 | 0,78 | |
68,51 | 0,98 | |
75,01 | 0,94 | |
89,05 | 1,21 | |
91,13 | 1,29 | |
91,26 | 1,12 | |
99,84 | 1,29 | |
108,55 | 1,49 |
ઓછામાં ઓછા ચોરસ ઉકેલ.ચાલો મી સ્ટોરના વાર્ષિક ટર્નઓવરને દર્શાવીએ, મિલિયન રુબેલ્સ; - મી સ્ટોરનો છૂટક વિસ્તાર, હજાર એમ 2.
ફિગ.2.1. ઉદાહરણ માટે સ્કેટરપ્લોટ 2.1
ચલો વચ્ચેના કાર્યાત્મક સંબંધનું સ્વરૂપ નક્કી કરવા અને અમે સ્કેટર ડાયાગ્રામ (ફિગ. 2.1) બનાવીશું.
સ્કેટર ડાયાગ્રામના આધારે, અમે નિષ્કર્ષ પર આવી શકીએ છીએ કે વાર્ષિક ટર્નઓવર રિટેલ સ્પેસ પર હકારાત્મક રીતે આધારિત છે (એટલે કે y વધવાની સાથે વધશે). કાર્યાત્મક જોડાણનું સૌથી યોગ્ય સ્વરૂપ છે રેખીય.
વધુ ગણતરીઓ માટેની માહિતી કોષ્ટકમાં રજૂ કરવામાં આવી છે. 2.2. ઓછામાં ઓછી ચોરસ પદ્ધતિનો ઉપયોગ કરીને, અમે રેખીય એક-પરિબળ ઇકોનોમેટ્રિક મોડેલના પરિમાણોનો અંદાજ લગાવીએ છીએ
કોષ્ટક 2.2
t | y t | x 1t | y t 2 | x 1t 2 | x 1t y t |
19,76 | 0,24 | 390,4576 | 0,0576 | 4,7424 | |
38,09 | 0,31 | 1450,8481 | 0,0961 | 11,8079 | |
40,95 | 0,55 | 1676,9025 | 0,3025 | 22,5225 | |
41,08 | 0,48 | 1687,5664 | 0,2304 | 19,7184 | |
56,29 | 0,78 | 3168,5641 | 0,6084 | 43,9062 | |
68,51 | 0,98 | 4693,6201 | 0,9604 | 67,1398 | |
75,01 | 0,94 | 5626,5001 | 0,8836 | 70,5094 | |
89,05 | 1,21 | 7929,9025 | 1,4641 | 107,7505 | |
91,13 | 1,29 | 8304,6769 | 1,6641 | 117,5577 | |
91,26 | 1,12 | 8328,3876 | 1,2544 | 102,2112 | |
99,84 | 1,29 | 9968,0256 | 1,6641 | 128,7936 | |
108,55 | 1,49 | 11783,1025 | 2,2201 | 161,7395 | |
એસ | 819,52 | 10,68 | 65008,554 | 11,4058 | 858,3991 |
સરેરાશ | 68,29 | 0,89 |
આમ,
તેથી, છૂટક જગ્યામાં 1 હજાર એમ 2 દ્વારા વધારો સાથે, અન્ય વસ્તુઓ સમાન હોવાને કારણે, સરેરાશ વાર્ષિક ટર્નઓવર 67.8871 મિલિયન રુબેલ્સ વધે છે.
ઉદાહરણ 2.2.કંપનીના મેનેજમેન્ટે નોંધ્યું કે વાર્ષિક ટર્નઓવર માત્ર સ્ટોરના વેચાણ વિસ્તાર પર જ નહીં (ઉદાહરણ 2.1 જુઓ), પણ મુલાકાતીઓની સરેરાશ સંખ્યા પર પણ આધાર રાખે છે. સંબંધિત માહિતી કોષ્ટકમાં રજૂ કરવામાં આવી છે. 2.3.
કોષ્ટક 2.3
ઉકેલ.ચાલો આપણે સૂચિત કરીએ - દિવસ દીઠ મી સ્ટોર પર મુલાકાતીઓની સરેરાશ સંખ્યા, હજાર લોકો.
ચલો વચ્ચેના કાર્યાત્મક સંબંધનું સ્વરૂપ નક્કી કરવા અને અમે સ્કેટર ડાયાગ્રામ (ફિગ. 2.2) બનાવીશું.
સ્કેટરપ્લોટના આધારે, અમે નિષ્કર્ષ પર આવી શકીએ છીએ કે વાર્ષિક ટર્નઓવર દરરોજ મુલાકાતીઓની સરેરાશ સંખ્યા પર હકારાત્મક રીતે નિર્ભર છે (એટલે કે, y વધવાની સાથે વધશે). કાર્યાત્મક અવલંબનનું સ્વરૂપ રેખીય છે.
ચોખા. 2.2. ઉદાહરણ માટે સ્કેટરપ્લોટ 2.2
કોષ્ટક 2.4
t | x 2t | x 2t 2 | y t x 2t | x 1t x 2t |
8,25 | 68,0625 | 163,02 | 1,98 | |
10,24 | 104,8575 | 390,0416 | 3,1744 | |
9,31 | 86,6761 | 381,2445 | 5,1205 | |
11,01 | 121,2201 | 452,2908 | 5,2848 | |
8,54 | 72,9316 | 480,7166 | 6,6612 | |
7,51 | 56,4001 | 514,5101 | 7,3598 | |
12,36 | 152,7696 | 927,1236 | 11,6184 | |
10,81 | 116,8561 | 962,6305 | 13,0801 | |
9,89 | 97,8121 | 901,2757 | 12,7581 | |
13,72 | 188,2384 | 1252,0872 | 15,3664 | |
12,27 | 150,5529 | 1225,0368 | 15,8283 | |
13,92 | 193,7664 | 1511,016 | 20,7408 | |
એસ | 127,83 | 1410,44 | 9160,9934 | 118,9728 |
સરેરાશ | 10,65 |
સામાન્ય રીતે, બે-પરિબળ ઇકોનોમેટ્રિક મોડેલના પરિમાણો નક્કી કરવા માટે જરૂરી છે
y t = a 0 + a 1 x 1t + a 2 x 2t + ε t
વધુ ગણતરીઓ માટે જરૂરી માહિતી કોષ્ટકમાં રજૂ કરવામાં આવી છે. 2.4.
ચાલો ઓછામાં ઓછા ચોરસ પદ્ધતિનો ઉપયોગ કરીને રેખીય બે-પરિબળ ઇકોનોમેટ્રિક મોડેલના પરિમાણોનો અંદાજ લગાવીએ.
આમ,
ગુણાંક =61.6583 નો અંદાજ દર્શાવે છે કે, અન્ય વસ્તુઓ સમાન હોવાથી, છૂટક જગ્યામાં 1 હજાર મીટર 2ના વધારા સાથે, વાર્ષિક ટર્નઓવર સરેરાશ 61.6583 મિલિયન રુબેલ્સથી વધશે.
ગુણાંક અંદાજ = 2.2748 દર્શાવે છે કે, 1 હજાર લોકો દીઠ મુલાકાતીઓની સરેરાશ સંખ્યામાં વધારા સાથે, અન્ય વસ્તુઓ સમાન છે. દરરોજ, વાર્ષિક ટર્નઓવર સરેરાશ 2.2748 મિલિયન રુબેલ્સથી વધશે.
ઉદાહરણ 2.3.કોષ્ટકમાં પ્રસ્તુત માહિતીનો ઉપયોગ કરીને. 2.2 અને 2.4, એક-પરિબળ ઇકોનોમેટ્રિક મોડેલના પરિમાણનો અંદાજ કાઢો
મી સ્ટોરના વાર્ષિક ટર્નઓવરનું કેન્દ્રિત મૂલ્ય ક્યાં છે, મિલિયન રુબેલ્સ; - t-th સ્ટોર પર મુલાકાતીઓની સરેરાશ દૈનિક સંખ્યા, હજાર લોકોનું કેન્દ્રિત મૂલ્ય. (ઉદાહરણો 2.1-2.2 જુઓ).
ઉકેલ.ગણતરીઓ માટે જરૂરી વધારાની માહિતી કોષ્ટકમાં રજૂ કરવામાં આવી છે. 2.5.
કોષ્ટક 2.5
-48,53 | -2,40 | 5,7720 | 116,6013 | |
-30,20 | -0,41 | 0,1702 | 12,4589 | |
-27,34 | -1,34 | 1,8023 | 36,7084 | |
-27,21 | 0,36 | 0,1278 | -9,7288 | |
-12,00 | -2,11 | 4,4627 | 25,3570 | |
0,22 | -3,14 | 9,8753 | -0,6809 | |
6,72 | 1,71 | 2,9156 | 11,4687 | |
20,76 | 0,16 | 0,0348 | 3,2992 | |
22,84 | -0,76 | 0,5814 | -17,413 | |
22,97 | 3,07 | 9,4096 | 70,4503 | |
31,55 | 1,62 | 2,6163 | 51,0267 | |
40,26 | 3,27 | 10,6766 | 131,5387 | |
રકમ | 48,4344 | 431,0566 |
ફોર્મ્યુલા (2.35) નો ઉપયોગ કરીને, અમે મેળવીએ છીએ
આમ,
http://www.cleverstudents.ru/articles/mnk.html
ઉદાહરણ.
ચલોના મૂલ્યો પર પ્રાયોગિક ડેટા એક્સઅને ખાતેકોષ્ટકમાં આપેલ છે.
તેમના સંરેખણના પરિણામે, કાર્ય પ્રાપ્ત થાય છે
ઉપયોગ કરીને ઓછામાં ઓછા ચોરસ પદ્ધતિ, રેખીય અવલંબન દ્વારા આ ડેટાને અંદાજિત કરો y=ax+b(પરિમાણો શોધો એઅને b). બે લીટીઓમાંથી કઈ વધુ સારી (ઓછામાં ઓછા ચોરસ પદ્ધતિના અર્થમાં) પ્રાયોગિક ડેટાને સંરેખિત કરે છે તે શોધો. એક ચિત્ર બનાવો.
ઉકેલ.
અમારા ઉદાહરણમાં n=5. જરૂરી ગુણાંકના સૂત્રોમાં સમાવિષ્ટ રકમની ગણતરી કરવાની સુવિધા માટે અમે કોષ્ટક ભરીએ છીએ.
કોષ્ટકની ચોથી પંક્તિના મૂલ્યો 2જી પંક્તિના મૂલ્યોને દરેક સંખ્યા માટે 3જી પંક્તિના મૂલ્યો દ્વારા ગુણાકાર કરીને મેળવવામાં આવે છે. i.
કોષ્ટકની પાંચમી પંક્તિના મૂલ્યો દરેક સંખ્યા માટે 2જી પંક્તિમાંના મૂલ્યોને વર્ગીકરણ કરીને મેળવવામાં આવે છે. i.
કોષ્ટકની છેલ્લી કૉલમમાંના મૂલ્યો એ પંક્તિઓની આજુબાજુના મૂલ્યોનો સરવાળો છે.
ગુણાંક શોધવા માટે અમે ઓછામાં ઓછા ચોરસ પદ્ધતિના સૂત્રોનો ઉપયોગ કરીએ છીએ એઅને b. અમે કોષ્ટકના છેલ્લા કૉલમમાંથી અનુરૂપ મૂલ્યોને તેમાં બદલીએ છીએ:
આથી, y = 0.165x+2.184- ઇચ્છિત અંદાજિત સીધી રેખા.
તેમાંથી કઈ લીટીઓ છે તે શોધવાનું બાકી છે y = 0.165x+2.184અથવા મૂળ ડેટાનું વધુ સારું અનુમાન કરે છે, એટલે કે, ઓછામાં ઓછા ચોરસ પદ્ધતિનો ઉપયોગ કરીને અંદાજ.
પુરાવો.
જેથી જ્યારે મળે એઅને bફંક્શન સૌથી નાનું મૂલ્ય લે છે, તે જરૂરી છે કે આ બિંદુએ ફંક્શન માટે બીજા ક્રમના વિભેદકના ચતુર્ભુજ સ્વરૂપનું મેટ્રિક્સ ચોક્કસ હકારાત્મક હતી. ચાલો તે બતાવીએ.
બીજા ક્રમના વિભેદકમાં ફોર્મ છે:
એટલે કે
તેથી, ચતુર્ભુજ સ્વરૂપનું મેટ્રિક્સ ફોર્મ ધરાવે છે
અને તત્વોના મૂલ્યો પર આધાર રાખતા નથી એઅને b.
ચાલો બતાવીએ કે મેટ્રિક્સ હકારાત્મક ચોક્કસ છે. આ કરવા માટે, કોણીય સગીરો હકારાત્મક હોવા જોઈએ.
પ્રથમ ક્રમનો કોણીય ગૌણ . અસમાનતા કડક છે, કારણ કે પોઈન્ટ
પ્રાયોગિક ડેટાનો અંદાજ એ એક વિશ્લેષણાત્મક કાર્ય સાથે પ્રાયોગિક રીતે મેળવેલા ડેટાને બદલવા પર આધારિત પદ્ધતિ છે જે મૂળ મૂલ્યો (પ્રયોગ અથવા પ્રયોગ દરમિયાન મેળવેલ ડેટા) સાથે નોડલ પોઈન્ટ પર સૌથી વધુ નજીકથી પસાર થાય છે અથવા એકરૂપ થાય છે. હાલમાં, વિશ્લેષણાત્મક કાર્યને વ્યાખ્યાયિત કરવાની બે રીતો છે:
n-ડિગ્રી ઇન્ટરપોલેશન બહુપદી બનાવીને જે પસાર થાય છે સીધા બધા બિંદુઓ દ્વારાઆપેલ ડેટા એરે. આ કિસ્સામાં, અંદાજિત કાર્ય આના સ્વરૂપમાં રજૂ થાય છે: લેગ્રેન્જ સ્વરૂપમાં પ્રક્ષેપ બહુપદી અથવા ન્યૂટન સ્વરૂપમાં પ્રક્ષેપ બહુપદી.
n-ડિગ્રી અંદાજિત બહુપદી બનાવીને જે પસાર થાય છે પોઈન્ટની તાત્કાલિક નજીકમાંઆપેલ ડેટા એરેમાંથી. આમ, અંદાજિત કાર્ય પ્રયોગ દરમિયાન ઉદ્ભવતા તમામ રેન્ડમ અવાજ (અથવા ભૂલો) ને સરળ બનાવે છે: પ્રયોગ દરમિયાન માપેલા મૂલ્યો રેન્ડમ પરિબળો પર આધાર રાખે છે જે તેમના પોતાના રેન્ડમ કાયદાઓ (માપ અથવા સાધનની ભૂલો, અચોક્કસતા અથવા પ્રાયોગિક) અનુસાર વધઘટ થાય છે. ભૂલો). આ કિસ્સામાં, અંદાજિત કાર્ય ઓછામાં ઓછા ચોરસ પદ્ધતિનો ઉપયોગ કરીને નક્કી કરવામાં આવે છે.
ઓછામાં ઓછા ચોરસ પદ્ધતિ(અંગ્રેજી સાહિત્યમાં ઓર્ડિનરી લીસ્ટ સ્ક્વેર્સ, ઓએલએસ) એ અંદાજિત કાર્ય નક્કી કરવા પર આધારિત ગાણિતિક પદ્ધતિ છે, જે પ્રાયોગિક ડેટાના આપેલ એરેમાંથી પોઈન્ટની સૌથી નજીકમાં બનાવવામાં આવે છે. મૂળ અને અંદાજિત કાર્યો F(x) ની નિકટતા સંખ્યાત્મક માપ દ્વારા નક્કી કરવામાં આવે છે, એટલે કે: અંદાજિત વળાંક F(x) માંથી પ્રાયોગિક ડેટાના વર્ગ વિચલનોનો સરવાળો સૌથી નાનો હોવો જોઈએ.
ઓછામાં ઓછા ચોરસ પદ્ધતિનો ઉપયોગ કરીને બાંધવામાં આવેલ અંદાજિત વળાંક
ઓછામાં ઓછી ચોરસ પદ્ધતિનો ઉપયોગ થાય છે:
જ્યારે સમીકરણોની સંખ્યા અજાણ્યાઓની સંખ્યા કરતાં વધી જાય ત્યારે સમીકરણોની અતિનિર્ધારિત પ્રણાલીઓને ઉકેલવા માટે;
સમીકરણોની સામાન્ય (અતિનિર્ધારિત નહીં) બિનરેખીય પ્રણાલીઓના કિસ્સામાં ઉકેલ શોધવા માટે;
કેટલાક અંદાજિત કાર્ય સાથે અંદાજિત બિંદુ મૂલ્યો માટે.
ઓછામાં ઓછા ચોરસ પદ્ધતિનો ઉપયોગ કરીને અંદાજિત કાર્ય પ્રાયોગિક ડેટાના આપેલ એરેમાંથી ગણતરી કરેલ અંદાજિત કાર્યના લઘુત્તમ સરવાળા વર્ગના વિચલનોની સ્થિતિ પરથી નક્કી કરવામાં આવે છે. લઘુત્તમ ચોરસ પદ્ધતિનો આ માપદંડ નીચેની અભિવ્યક્તિ તરીકે લખાયેલ છે:
નોડલ પોઈન્ટ પર ગણતરી કરેલ અંદાજિત કાર્યના મૂલ્યો,
નોડલ પોઈન્ટ પર પ્રાયોગિક ડેટાની આપેલ શ્રેણી.
ચતુર્ભુજ માપદંડમાં સંખ્યાબંધ "સારા" ગુણધર્મો છે, જેમ કે ભિન્નતા, બહુપદી અંદાજિત કાર્યો સાથે અંદાજિત સમસ્યાનો અનન્ય ઉકેલ પૂરો પાડે છે.
સમસ્યાની પરિસ્થિતિઓના આધારે, અંદાજિત કાર્ય એ ડિગ્રી m નું બહુપદી છે
અંદાજિત કાર્યની ડિગ્રી નોડલ બિંદુઓની સંખ્યા પર આધારિત નથી, પરંતુ તેનું પરિમાણ હંમેશા આપેલ પ્રાયોગિક ડેટા એરેના પરિમાણ (બિંદુઓની સંખ્યા) કરતા ઓછું હોવું જોઈએ.
∙ જો અંદાજિત કાર્યની ડિગ્રી m=1 હોય, તો આપણે સીધી રેખા (રેખીય રીગ્રેસન) સાથે ટેબ્યુલર ફંક્શનનું અનુમાન કરીએ છીએ.
∙ જો અંદાજિત ફંક્શનની ડિગ્રી m=2 હોય, તો આપણે ટેબલ ફંક્શનને ચતુર્ભુજ પેરાબોલા (ચતુર્ભુજ અંદાજ) સાથે અંદાજિત કરીએ છીએ.
∙ જો અંદાજિત ફંક્શનની ડિગ્રી m=3 હોય, તો આપણે ક્યુબિક પેરાબોલા (ઘન અંદાજ) વડે ટેબલ ફંક્શનનો અંદાજ લગાવીએ છીએ.
સામાન્ય કિસ્સામાં, જ્યારે આપેલ કોષ્ટક મૂલ્યો માટે ડિગ્રી m ની અંદાજિત બહુપદી બનાવવી જરૂરી હોય, ત્યારે તમામ નોડલ બિંદુઓ પરના વર્ગ વિચલનોના લઘુત્તમ સરવાળા માટેની સ્થિતિ નીચેના સ્વરૂપમાં ફરીથી લખવામાં આવે છે:
- ડિગ્રી m ના અંદાજિત બહુપદીના અજાણ્યા ગુણાંક;
ઉલ્લેખિત કોષ્ટક મૂલ્યોની સંખ્યા.
ન્યૂનતમ ફંક્શનના અસ્તિત્વ માટે જરૂરી શરત એ છે કે અજાણ્યા ચલોના સંદર્ભમાં તેના આંશિક ડેરિવેટિવ્સની શૂન્યની સમાનતા. . પરિણામે, અમે સમીકરણોની નીચેની સિસ્ટમ મેળવીએ છીએ:
ચાલો પરિણામી સમીકરણોની રેખીય પ્રણાલીનું રૂપાંતર કરીએ: કૌંસ ખોલો અને મુક્ત શબ્દોને અભિવ્યક્તિની જમણી બાજુએ ખસેડો. પરિણામે, રેખીય બીજગણિત અભિવ્યક્તિઓની પરિણામી સિસ્ટમ નીચેના સ્વરૂપમાં લખવામાં આવશે:
રેખીય બીજગણિત અભિવ્યક્તિઓની આ સિસ્ટમ મેટ્રિક્સ સ્વરૂપમાં ફરીથી લખી શકાય છે:
પરિણામે, m+1 પરિમાણના રેખીય સમીકરણોની સિસ્ટમ પ્રાપ્ત થઈ, જેમાં m+1 અજ્ઞાતનો સમાવેશ થાય છે. રેખીય બીજગણિત સમીકરણો (ઉદાહરણ તરીકે, ગૌસીયન પદ્ધતિ) ઉકેલવા માટેની કોઈપણ પદ્ધતિનો ઉપયોગ કરીને આ સિસ્ટમ ઉકેલી શકાય છે. સોલ્યુશનના પરિણામે, અંદાજિત ફંક્શનના અજાણ્યા પરિમાણો જોવા મળશે જે મૂળ ડેટામાંથી અંદાજિત કાર્યના વર્ગ વિચલનોનો ન્યૂનતમ સરવાળો પૂરો પાડે છે, એટલે કે. શ્રેષ્ઠ શક્ય ચતુર્ભુજ અંદાજ. તે યાદ રાખવું જોઈએ કે જો સ્રોત ડેટાનું એક મૂલ્ય પણ બદલાય છે, તો બધા ગુણાંક તેમના મૂલ્યો બદલશે, કારણ કે તે સ્રોત ડેટા દ્વારા સંપૂર્ણપણે નિર્ધારિત છે.
રેખીય અવલંબન દ્વારા સ્ત્રોત ડેટાનો અંદાજ
(રેખીય રીગ્રેશન)
ઉદાહરણ તરીકે, ચાલો અંદાજિત કાર્ય નક્કી કરવા માટેની તકનીકને ધ્યાનમાં લઈએ, જે રેખીય અવલંબનના સ્વરૂપમાં ઉલ્લેખિત છે. ન્યૂનતમ ચોરસ પદ્ધતિ અનુસાર, લઘુત્તમ વર્ગ વિચલનોના સરવાળા માટેની શરત નીચેના સ્વરૂપમાં લખાયેલ છે:
કોષ્ટક ગાંઠોના કોઓર્ડિનેટ્સ;
અંદાજિત કાર્યના અજ્ઞાત ગુણાંક, જે રેખીય અવલંબન તરીકે ઉલ્લેખિત છે.
ન્યૂનતમ ફંક્શનના અસ્તિત્વ માટે જરૂરી શરત એ છે કે અજાણ્યા ચલોના સંદર્ભમાં તેના આંશિક ડેરિવેટિવ્સની શૂન્યની સમાનતા. પરિણામે, અમે સમીકરણોની નીચેની સિસ્ટમ મેળવીએ છીએ:
ચાલો પરિણામી સમીકરણોની રેખીય પ્રણાલીનું પરિવર્તન કરીએ.
અમે રેખીય સમીકરણોની પરિણામી સિસ્ટમ હલ કરીએ છીએ. વિશ્લેષણાત્મક સ્વરૂપમાં અંદાજિત કાર્યના ગુણાંક નીચે પ્રમાણે નિર્ધારિત કરવામાં આવે છે (ક્રેમરની પદ્ધતિ):
આ ગુણાંકો આપેલ ટેબ્યુલર મૂલ્યો (પ્રાયોગિક ડેટા) માંથી અંદાજિત કાર્યના ચોરસના સરવાળાને ઘટાડવાના માપદંડ અનુસાર રેખીય અંદાજિત કાર્યનું નિર્માણ સુનિશ્ચિત કરે છે.
ઓછામાં ઓછા ચોરસ પદ્ધતિના અમલ માટે અલ્ગોરિધમ
1. પ્રારંભિક ડેટા:
N ની સંખ્યા સાથે પ્રાયોગિક ડેટાની શ્રેણી ઉલ્લેખિત છે
અંદાજિત બહુપદી (m) ની ડિગ્રી ઉલ્લેખિત છે
2. ગણતરી અલ્ગોરિધમ:
2.1. પરિમાણો સાથે સમીકરણોની સિસ્ટમ બનાવવા માટે ગુણાંક નક્કી કરવામાં આવે છે
સમીકરણોની સિસ્ટમના ગુણાંક (સમીકરણની ડાબી બાજુ)
- સમીકરણોની સિસ્ટમના ચોરસ મેટ્રિક્સના કૉલમ નંબરની અનુક્રમણિકા
રેખીય સમીકરણોની સિસ્ટમની મુક્ત શરતો (સમીકરણની જમણી બાજુ)
- સમીકરણોની સિસ્ટમના ચોરસ મેટ્રિક્સની પંક્તિ સંખ્યાની અનુક્રમણિકા
2.2. પરિમાણ સાથે રેખીય સમીકરણોની સિસ્ટમની રચના.
2.3. ડિગ્રી m ની અંદાજિત બહુપદીના અજાણ્યા ગુણાંક નક્કી કરવા માટે રેખીય સમીકરણોની સિસ્ટમ ઉકેલવી.
2.4 તમામ નોડલ બિંદુઓ પરના મૂળ મૂલ્યોમાંથી અંદાજિત બહુપદીના વર્ગ વિચલનોના સરવાળાનું નિર્ધારણ
ચોરસ વિચલનોના સરવાળાનું મળેલ મૂલ્ય એ ન્યૂનતમ શક્ય છે.
અન્ય કાર્યોનો ઉપયોગ કરીને અંદાજ
એ નોંધવું જોઈએ કે જ્યારે ન્યૂનતમ ચોરસ પદ્ધતિ અનુસાર મૂળ ડેટાનો અંદાજ લગાવવામાં આવે છે, ત્યારે લઘુગણક કાર્ય, ઘાતાંકીય કાર્ય અને પાવર ફંક્શનનો ઉપયોગ કેટલીકવાર અંદાજિત કાર્ય તરીકે થાય છે.
લઘુગણક અંદાજ
ચાલો કેસને ધ્યાનમાં લઈએ જ્યારે અંદાજિત કાર્ય ફોર્મના લઘુગણક કાર્ય દ્વારા આપવામાં આવે છે:
ઓછામાં ઓછા ચોરસ પદ્ધતિરીગ્રેસન સમીકરણના પરિમાણોનો અંદાજ કાઢવા માટે વપરાય છે.લાક્ષણિકતાઓ વચ્ચેના સ્ટોકેસ્ટિક સંબંધોનો અભ્યાસ કરવાની પદ્ધતિઓમાંની એક રીગ્રેસન વિશ્લેષણ છે.
રીગ્રેસન વિશ્લેષણ એ રીગ્રેસન સમીકરણની વ્યુત્પત્તિ છે, જેની મદદથી રેન્ડમ ચલ (પરિણામ વિશેષતા) નું સરેરાશ મૂલ્ય જોવા મળે છે જો અન્ય (અથવા અન્ય) ચલોનું મૂલ્ય (પરિબળ-લક્ષણો) જાણીતું હોય. તેમાં નીચેના પગલાં શામેલ છે:
- જોડાણના સ્વરૂપની પસંદગી (વિશ્લેષણાત્મક રીગ્રેસન સમીકરણનો પ્રકાર);
- સમીકરણ પરિમાણોનો અંદાજ;
- વિશ્લેષણાત્મક રીગ્રેસન સમીકરણની ગુણવત્તાનું મૂલ્યાંકન.
રેખીય જોડી પ્રમાણે સંબંધના કિસ્સામાં, રીગ્રેસન સમીકરણ આ સ્વરૂપ લેશે: y i =a+b·x i +u i . આ સમીકરણના પરિમાણો a અને b આંકડાકીય અવલોકન ડેટા x અને y પરથી અંદાજવામાં આવે છે. આવા મૂલ્યાંકનનું પરિણામ એ સમીકરણ છે: , જ્યાં , પરિમાણો a અને b નો અંદાજ છે, તે રીગ્રેસન સમીકરણ (ગણતરી મૂલ્ય) માંથી પ્રાપ્ત પરિણામી વિશેષતા (ચલ) નું મૂલ્ય છે.
મોટે ભાગે પરિમાણો અંદાજ કરવા માટે વપરાય છે ઓછામાં ઓછા ચોરસ પદ્ધતિ (LSM).
ઓછામાં ઓછી ચોરસ પદ્ધતિ રીગ્રેસન સમીકરણના પરિમાણોના શ્રેષ્ઠ (સતત, કાર્યક્ષમ અને નિષ્પક્ષ) અંદાજો પ્રદાન કરે છે. પરંતુ જો રેન્ડમ ટર્મ (u) અને સ્વતંત્ર ચલ (x) સંબંધિત અમુક ધારણાઓ પૂરી થાય તો જ (OLS ધારણાઓ જુઓ).
ઓછામાં ઓછા ચોરસ પદ્ધતિનો ઉપયોગ કરીને રેખીય જોડી સમીકરણના પરિમાણોનો અંદાજ કાઢવાની સમસ્યાનીચે મુજબ છે: પરિમાણોના આવા અંદાજો મેળવવા માટે, , જેના પર પરિણામી લાક્ષણિકતાના વાસ્તવિક મૂલ્યોના વર્ગ વિચલનોનો સરવાળો - ગણતરી કરેલ મૂલ્યોમાંથી y i - ન્યૂનતમ છે.
ઔપચારિક રીતે OLS ટેસ્ટઆ રીતે લખી શકાય છે: .
ઓછામાં ઓછા ચોરસ પદ્ધતિઓનું વર્ગીકરણ
- ઓછામાં ઓછા ચોરસ પદ્ધતિ.
- મહત્તમ સંભાવના પદ્ધતિ (સામાન્ય શાસ્ત્રીય રેખીય રીગ્રેસન મોડેલ માટે, રીગ્રેસન અવશેષોની સામાન્યતા નક્કી કરવામાં આવે છે).
- સામાન્યકૃત લઘુત્તમ ચોરસ OLS પદ્ધતિનો ઉપયોગ ભૂલોના સ્વતઃસંબંધના કિસ્સામાં અને હેટરોસેડેસ્ટીસીટીના કિસ્સામાં થાય છે.
- વેઇટેડ ન્યૂનતમ ચોરસ પદ્ધતિ (હેટરોસેડેસ્ટિક અવશેષો સાથે OLS નો વિશિષ્ટ કેસ).
ચાલો મુદ્દો સમજાવીએ ક્લાસિકલ ઓછામાં ઓછા ચોરસ પદ્ધતિ ગ્રાફિકલી. આ કરવા માટે, અમે એક લંબચોરસ કોઓર્ડિનેટ સિસ્ટમમાં ઓબ્ઝર્વેશનલ ડેટા (x i, y i, i=1;n) પર આધારિત સ્કેટર પ્લોટ બનાવીશું (આવા સ્કેટર પ્લોટને સહસંબંધ ક્ષેત્ર કહેવામાં આવે છે). ચાલો એક સીધી રેખા પસંદ કરવાનો પ્રયાસ કરીએ જે સહસંબંધ ક્ષેત્રના બિંદુઓની સૌથી નજીક હોય. ઓછામાં ઓછા ચોરસ પદ્ધતિ અનુસાર, રેખા પસંદ કરવામાં આવે છે જેથી સહસંબંધ ક્ષેત્રના બિંદુઓ અને આ રેખા વચ્ચેના ઊભી અંતરના વર્ગોનો સરવાળો ન્યૂનતમ હોય.
આ સમસ્યા માટે ગાણિતિક સંકેત: .
y i અને x i =1...n ના મૂલ્યો અમને જાણીતા છે આ અવલોકન ડેટા છે. એસ ફંક્શનમાં તેઓ સ્થિરાંકોનું પ્રતિનિધિત્વ કરે છે. આ ફંક્શનમાંના ચલ એ પરિમાણોના જરૂરી અંદાજો છે - , . બે ચલોના ફંક્શનનું ન્યૂનતમ શોધવા માટે, દરેક પેરામીટર માટે આ ફંક્શનના આંશિક ડેરિવેટિવ્સની ગણતરી કરવી જરૂરી છે અને તેને શૂન્ય સાથે સરખાવી જોઈએ, એટલે કે. .
પરિણામે, અમે 2 સામાન્ય રેખીય સમીકરણોની સિસ્ટમ મેળવીએ છીએ:
આ સિસ્ટમને હલ કરીને, અમને જરૂરી પરિમાણ અંદાજ મળે છે:
રીગ્રેસન સમીકરણના પરિમાણોની ગણતરીની શુદ્ધતા રકમની તુલના કરીને ચકાસી શકાય છે (ગણતરીના રાઉન્ડિંગને કારણે કેટલીક વિસંગતતા હોઈ શકે છે).
પરિમાણ અંદાજની ગણતરી કરવા માટે, તમે કોષ્ટક 1 બનાવી શકો છો.
રીગ્રેશન ગુણાંક b નું ચિહ્ન સંબંધની દિશા દર્શાવે છે (જો b >0, સંબંધ સીધો છે, જો b<0, то связь обратная). Величина b показывает на сколько единиц изменится в среднем признак-результат -y при изменении признака-фактора - х на 1 единицу своего измерения.
ઔપચારિક રીતે, પરિમાણ aનું મૂલ્ય એ શૂન્યની બરાબર x સાથે y નું સરેરાશ મૂલ્ય છે. જો લક્ષણ-પરિબળ શૂન્ય મૂલ્ય ધરાવતું નથી અને ન હોઈ શકે, તો પરિમાણ a નું ઉપરોક્ત અર્થઘટન અર્થમાં નથી.
લાક્ષણિકતાઓ વચ્ચેના સંબંધની નિકટતાનું મૂલ્યાંકન
રેખીય જોડી સહસંબંધ ગુણાંકનો ઉપયોગ કરીને હાથ ધરવામાં આવે છે - r x,y. તે સૂત્રનો ઉપયોગ કરીને ગણતરી કરી શકાય છે: . વધુમાં, રેખીય જોડી સહસંબંધ ગુણાંકને રીગ્રેસન ગુણાંક b દ્વારા નક્કી કરી શકાય છે: .
રેખીય જોડી સહસંબંધ ગુણાંકના સ્વીકાર્ય મૂલ્યોની શ્રેણી –1 થી +1 સુધીની છે. સહસંબંધ ગુણાંકનું ચિહ્ન સંબંધની દિશા દર્શાવે છે. જો r x, y >0, તો કનેક્શન સીધું છે; જો r x, y<0, то связь обратная.
જો આ ગુણાંક તીવ્રતામાં એકતાની નજીક છે, તો પછી લાક્ષણિકતાઓ વચ્ચેના સંબંધને એકદમ નજીકના રેખીય તરીકે અર્થઘટન કરી શકાય છે. જો તેનું મોડ્યુલ એક ê r x , y ê =1 જેટલું હોય, તો લાક્ષણિકતાઓ વચ્ચેનો સંબંધ કાર્યાત્મક રેખીય છે. જો x અને y લક્ષણો રેખીય રીતે સ્વતંત્ર છે, તો r x,y 0 ની નજીક છે.
r x,y ની ગણતરી કરવા માટે, તમે કોષ્ટક 1 નો પણ ઉપયોગ કરી શકો છો.
કોષ્ટક 1
N અવલોકનો | x i | y i | x i ∙y i | ||
1 | x 1 | y 1 | x 1 y 1 | ||
2 | x 2 | y 2 | x 2 y 2 | ||
... | |||||
n | x n | y n | x n y n | ||
કૉલમ સરવાળો | ∑x | ∑y | ∑xy | ||
સરેરાશ મૂલ્ય |
,
જ્યાં d 2 એ રીગ્રેશન સમીકરણ દ્વારા સમજાવાયેલ y નું વિચલન છે;
e 2 - અવશેષ (રીગ્રેસન સમીકરણ દ્વારા ન સમજાવાયેલ) y નું વિચલન;
s 2 y - y નો કુલ (કુલ) વિચલન.
નિર્ધારણનો ગુણાંક કુલ ભિન્નતા (વિક્ષેપ) y માં રીગ્રેસન (અને પરિણામે, પરિબળ x) દ્વારા સમજાવાયેલ પરિણામી લક્ષણ y ના વિવિધતા (વિખેરવું) ના પ્રમાણને દર્શાવે છે. નિર્ધારણનો ગુણાંક R 2 yx 0 થી 1 સુધીના મૂલ્યો લે છે. તદનુસાર, મૂલ્ય 1-R 2 yx એ મોડેલ અને સ્પષ્ટીકરણની ભૂલોમાં ધ્યાનમાં લેવામાં ન આવતા અન્ય પરિબળોના પ્રભાવને કારણે થતા વિચલન y ના પ્રમાણને દર્શાવે છે.
જોડી કરેલ રેખીય રીગ્રેશન સાથે, R 2 yx = r 2 yx.
ઉદાહરણ.
ચલોના મૂલ્યો પર પ્રાયોગિક ડેટા એક્સઅને ખાતેકોષ્ટકમાં આપેલ છે.
તેમના સંરેખણના પરિણામે, કાર્ય પ્રાપ્ત થાય છે
ઉપયોગ કરીને ઓછામાં ઓછા ચોરસ પદ્ધતિ, રેખીય અવલંબન દ્વારા આ ડેટાને અંદાજિત કરો y=ax+b(પરિમાણો શોધો એઅને b). બે લીટીઓમાંથી કઈ વધુ સારી (ઓછામાં ઓછા ચોરસ પદ્ધતિના અર્થમાં) પ્રાયોગિક ડેટાને સંરેખિત કરે છે તે શોધો. એક ચિત્ર બનાવો.
ન્યૂનતમ ચોરસ પદ્ધતિ (LSM) નો સાર.
કાર્ય એ રેખીય અવલંબન ગુણાંક શોધવાનું છે કે જેના પર બે ચલોનું કાર્ય છે એઅને b સૌથી નાનું મૂલ્ય લે છે. એટલે કે આપેલ છે એઅને bમળેલી સીધી રેખામાંથી પ્રાયોગિક ડેટાના ચોરસ વિચલનોનો સરવાળો સૌથી નાનો હશે. આ ન્યૂનતમ ચોરસ પદ્ધતિનો આખો મુદ્દો છે.
આમ, ઉદાહરણને ઉકેલવાથી બે ચલોના ફંક્શનની સીમા શોધવામાં આવે છે.
ગુણાંક શોધવા માટે સૂત્રો મેળવવું.
બે અજ્ઞાત સાથેના બે સમીકરણોની સિસ્ટમ સંકલિત અને હલ કરવામાં આવે છે. ફંક્શનના આંશિક ડેરિવેટિવ્ઝ શોધવી ચલો દ્વારા એઅને b, અમે આ ડેરિવેટિવ્ઝને શૂન્ય સાથે સરખાવીએ છીએ.
અમે કોઈપણ પદ્ધતિનો ઉપયોગ કરીને સમીકરણોની પરિણામી સિસ્ટમ હલ કરીએ છીએ (ઉદાહરણ તરીકે અવેજી પદ્ધતિ દ્વારાઅથવા ક્રેમરની પદ્ધતિ) અને ઓછામાં ઓછા ચોરસ પદ્ધતિ (LSM) નો ઉપયોગ કરીને ગુણાંક શોધવા માટેના સૂત્રો મેળવો.
આપેલ એઅને bકાર્ય સૌથી નાનું મૂલ્ય લે છે. આ હકીકતનો પુરાવો આપવામાં આવ્યો છે પૃષ્ઠના અંતે ટેક્સ્ટમાં નીચે.
તે ઓછામાં ઓછા ચોરસની આખી પદ્ધતિ છે. પરિમાણ શોધવા માટેનું સૂત્ર aસરવાળો ,,, અને પરિમાણ સમાવે છે n- પ્રાયોગિક ડેટાનો જથ્થો. અમે આ રકમના મૂલ્યોની અલગથી ગણતરી કરવાની ભલામણ કરીએ છીએ. ગુણાંક bગણતરી બાદ મળી a.
મૂળ ઉદાહરણને યાદ કરવાનો સમય છે.
ઉકેલ.
અમારા ઉદાહરણમાં n=5. જરૂરી ગુણાંકના સૂત્રોમાં સમાવિષ્ટ રકમની ગણતરી કરવાની સુવિધા માટે અમે કોષ્ટક ભરીએ છીએ.
કોષ્ટકની ચોથી પંક્તિના મૂલ્યો 2જી પંક્તિના મૂલ્યોને દરેક સંખ્યા માટે 3જી પંક્તિના મૂલ્યો દ્વારા ગુણાકાર કરીને મેળવવામાં આવે છે. i.
કોષ્ટકની પાંચમી પંક્તિના મૂલ્યો દરેક સંખ્યા માટે 2જી પંક્તિમાંના મૂલ્યોને વર્ગીકરણ કરીને મેળવવામાં આવે છે. i.
કોષ્ટકની છેલ્લી કૉલમમાંના મૂલ્યો એ પંક્તિઓની આજુબાજુના મૂલ્યોનો સરવાળો છે.
ગુણાંક શોધવા માટે અમે ઓછામાં ઓછા ચોરસ પદ્ધતિના સૂત્રોનો ઉપયોગ કરીએ છીએ એઅને b. અમે કોષ્ટકના છેલ્લા કૉલમમાંથી અનુરૂપ મૂલ્યોને તેમાં બદલીએ છીએ:
આથી, y = 0.165x+2.184- ઇચ્છિત અંદાજિત સીધી રેખા.
તેમાંથી કઈ લીટીઓ છે તે શોધવાનું બાકી છે y = 0.165x+2.184અથવા મૂળ ડેટાનું વધુ સારું અનુમાન કરે છે, એટલે કે, ઓછામાં ઓછા ચોરસ પદ્ધતિનો ઉપયોગ કરીને અંદાજ.
ઓછામાં ઓછા ચોરસ પદ્ધતિના અંદાજમાં ભૂલ.
આ કરવા માટે, તમારે આ રેખાઓમાંથી મૂળ ડેટાના ચોરસ વિચલનોના સરવાળાની ગણતરી કરવાની જરૂર છે. અને , એક નાનું મૂલ્ય એ લાઇનને અનુરૂપ છે જે ઓછામાં ઓછા ચોરસ પદ્ધતિના અર્થમાં મૂળ ડેટાનું વધુ સારી રીતે અનુમાન કરે છે.
ત્યારથી, પછી સીધા y = 0.165x+2.184મૂળ ડેટાનું વધુ સારી રીતે અનુમાન કરે છે.
ઓછામાં ઓછા ચોરસ (LS) પદ્ધતિનું ગ્રાફિક ચિત્ર.
આલેખ પર બધું સ્પષ્ટ દેખાય છે. લાલ રેખા એ મળેલી સીધી રેખા છે y = 0.165x+2.184, વાદળી રેખા છે , ગુલાબી બિંદુઓ મૂળ ડેટા છે.
વ્યવહારમાં, વિવિધ પ્રક્રિયાઓનું મોડેલિંગ કરતી વખતે - ખાસ કરીને, આર્થિક, ભૌતિક, તકનીકી, સામાજિક - ચોક્કસ નિશ્ચિત બિંદુઓ પર તેમના જાણીતા મૂલ્યોમાંથી કાર્યોના અંદાજિત મૂલ્યોની ગણતરી કરવાની એક અથવા બીજી પદ્ધતિનો વ્યાપકપણે ઉપયોગ થાય છે.
આ પ્રકારની કાર્ય અંદાજીત સમસ્યા વારંવાર ઊભી થાય છે:
પ્રયોગના પરિણામે મેળવેલા ટેબ્યુલર ડેટાનો ઉપયોગ કરીને અભ્યાસ હેઠળની પ્રક્રિયાના લાક્ષણિક જથ્થાના મૂલ્યોની ગણતરી માટે અંદાજિત સૂત્રોનું નિર્માણ કરતી વખતે;
સંખ્યાત્મક એકીકરણ, ભિન્નતા, વિભેદક સમીકરણો ઉકેલવા વગેરેમાં;
જો ધ્યાનમાં લેવાયેલા અંતરાલના મધ્યવર્તી બિંદુઓ પર કાર્યોના મૂલ્યોની ગણતરી કરવી જરૂરી હોય તો;
જ્યારે માનવામાં આવેલા અંતરાલની બહાર પ્રક્રિયાના લાક્ષણિક જથ્થાના મૂલ્યો નક્કી કરવામાં આવે છે, ખાસ કરીને જ્યારે આગાહી કરવામાં આવે છે.
જો, કોષ્ટક દ્વારા નિર્દિષ્ટ કરેલ ચોક્કસ પ્રક્રિયાને મોડેલ કરવા માટે, અમે એક કાર્યનું નિર્માણ કરીએ છીએ જે આ પ્રક્રિયાને ઓછામાં ઓછા ચોરસ પદ્ધતિના આધારે લગભગ વર્ણવે છે, તો તેને અંદાજિત કાર્ય (રીગ્રેસન) કહેવામાં આવશે, અને અંદાજિત વિધેયોના નિર્માણની સમસ્યા કહેવામાં આવશે. એક અંદાજ સમસ્યા.
આ લેખ આ પ્રકારની સમસ્યાને ઉકેલવા માટે MS Excel પેકેજની ક્ષમતાઓની ચર્ચા કરે છે, વધુમાં, તે ટેબ્યુલેટેડ કાર્યો (જે રીગ્રેસન વિશ્લેષણનો આધાર છે) માટે રીગ્રેસન બનાવવા (બનાવવા) માટેની પદ્ધતિઓ અને તકનીકો પ્રદાન કરે છે.
એક્સેલમાં રીગ્રેશન બનાવવા માટેના બે વિકલ્પો છે.
અભ્યાસ હેઠળની પ્રક્રિયાની લાક્ષણિકતા માટે ડેટા ટેબલના આધારે બનાવેલ ડાયાગ્રામમાં પસંદ કરેલ રીગ્રેસન (ટ્રેન્ડલાઈન) ઉમેરવા (જો ડાયાગ્રામ બનાવવામાં આવ્યો હોય તો જ ઉપલબ્ધ);
એક્સેલ વર્કશીટના બિલ્ટ-ઇન આંકડાકીય કાર્યોનો ઉપયોગ કરીને, તમને સ્રોત ડેટા કોષ્ટકના આધારે સીધા જ રીગ્રેશન્સ (ટ્રેન્ડ લાઇન્સ) મેળવવાની મંજૂરી આપે છે.
ચાર્ટમાં વલણ રેખાઓ ઉમેરી રહ્યા છીએ
ડેટાના કોષ્ટક માટે જે પ્રક્રિયાનું વર્ણન કરે છે અને ડાયાગ્રામ દ્વારા દર્શાવવામાં આવે છે, એક્સેલ પાસે અસરકારક રીગ્રેસન વિશ્લેષણ સાધન છે જે તમને આની મંજૂરી આપે છે:
ઓછામાં ઓછા ચોરસ પદ્ધતિના આધારે બનાવો અને ડાયાગ્રામમાં પાંચ પ્રકારના રીગ્રેશન ઉમેરો, જે અભ્યાસ હેઠળની પ્રક્રિયાને ચોકસાઈના વિવિધ ડિગ્રી સાથે મોડેલ કરે છે;
આકૃતિમાં રચાયેલ રીગ્રેસન સમીકરણ ઉમેરો;
ચાર્ટ પર પ્રદર્શિત ડેટા માટે પસંદ કરેલ રીગ્રેશનના પત્રવ્યવહારની ડિગ્રી નક્કી કરો.
ચાર્ટ ડેટાના આધારે, એક્સેલ તમને રેખીય, બહુપદી, લઘુગણક, પાવર, ઘાતાંકીય પ્રકારના રીગ્રેસન મેળવવાની મંજૂરી આપે છે, જે સમીકરણ દ્વારા નિર્દિષ્ટ છે:
y = y(x)
જ્યાં x એ એક સ્વતંત્ર ચલ છે જે ઘણીવાર કુદરતી સંખ્યાઓના ક્રમ (1; 2; 3; ...) ના મૂલ્યો લે છે અને ઉત્પન્ન કરે છે, ઉદાહરણ તરીકે, અભ્યાસ હેઠળની પ્રક્રિયાના સમયની ગણતરી (લાક્ષણિકતાઓ).
1 . લીનિયર રીગ્રેશન મોડેલિંગ લાક્ષણિકતાઓ માટે સારું છે જેના મૂલ્યો સતત દરે વધે છે અથવા ઘટે છે. અભ્યાસ હેઠળની પ્રક્રિયા માટે આ સૌથી સરળ મોડલ છે. તે સમીકરણ અનુસાર બનાવવામાં આવે છે:
y = mx + b
જ્યાં m એ x-અક્ષ તરફના રેખીય રીગ્રેશન સ્લોપની સ્પર્શક છે; b - ઓર્ડિનેટ અક્ષ સાથે રેખીય રીગ્રેશનના આંતરછેદના બિંદુનું સંકલન.
2 . બહુપદી વલણ રેખા એવી લાક્ષણિકતાઓનું વર્ણન કરવા માટે ઉપયોગી છે કે જેમાં ઘણી અલગ ચરમસીમાઓ (મેક્સિમા અને મિનિમા) હોય છે. બહુપદી ડિગ્રીની પસંદગી અભ્યાસ હેઠળની લાક્ષણિકતાના અંતિમ ભાગની સંખ્યા દ્વારા નક્કી કરવામાં આવે છે. આમ, સેકન્ડ-ડિગ્રી બહુપદી એવી પ્રક્રિયાને સારી રીતે વર્ણવી શકે છે જેમાં માત્ર એક મહત્તમ અથવા લઘુત્તમ હોય છે; ત્રીજી ડિગ્રીનું બહુપદી - બે કરતાં વધુ અંતિમ નથી; ચોથી ડિગ્રીનો બહુપદી - ત્રણ કરતાં વધુ અંતિમો નહીં, વગેરે.
આ કિસ્સામાં, વલણ રેખા સમીકરણ અનુસાર બનાવવામાં આવી છે:
y = c0 + c1x + c2x2 + c3x3 + c4x4 + c5x5 + c6x6
જ્યાં સહગુણાંકો c0, c1, c2,... c6 એ સ્થિરાંકો છે જેની કિંમતો બાંધકામ દરમિયાન નક્કી થાય છે.
3 . લૉગરિધમિક ટ્રેન્ડ લાઇનનો સફળતાપૂર્વક ઉપયોગ કરવામાં આવે છે જ્યારે મોડેલિંગ લાક્ષણિકતાઓ કે જેના મૂલ્યો શરૂઆતમાં ઝડપથી બદલાય છે અને પછી ધીમે ધીમે સ્થિર થાય છે.
y = c ln(x) + b
4 . જો અભ્યાસ હેઠળના સંબંધોના મૂલ્યો વૃદ્ધિ દરમાં સતત ફેરફાર દ્વારા દર્શાવવામાં આવે તો પાવર-લો ટ્રેન્ડ લાઇન સારા પરિણામો આપે છે. આવી અવલંબનનું ઉદાહરણ એ કારની એકસરખી પ્રવેગિત ગતિનો ગ્રાફ છે. જો ડેટામાં શૂન્ય અથવા નકારાત્મક મૂલ્યો હોય, તો તમે પાવર ટ્રેન્ડ લાઇનનો ઉપયોગ કરી શકતા નથી.
સમીકરણ અનુસાર બાંધવામાં આવે છે:
y = c xb
જ્યાં સહગુણાંકો b, c સ્થિર છે.
5 . જ્યારે ડેટામાં ફેરફારનો દર સતત વધી રહ્યો હોય ત્યારે ઘાતાંકીય વલણ રેખાનો ઉપયોગ કરવો જોઈએ. શૂન્ય અથવા નકારાત્મક મૂલ્યો ધરાવતા ડેટા માટે, આ પ્રકારનો અંદાજ પણ લાગુ પડતો નથી.
સમીકરણ અનુસાર બાંધવામાં આવે છે:
y = c ebx
જ્યાં સહગુણાંકો b, c સ્થિર છે.
ટ્રેન્ડ લાઇન પસંદ કરતી વખતે, એક્સેલ આપમેળે R2 ના મૂલ્યની ગણતરી કરે છે, જે અંદાજની વિશ્વસનીયતા દર્શાવે છે: R2 મૂલ્ય એકતાની જેટલી નજીક છે, ટ્રેન્ડ લાઇન અભ્યાસ હેઠળની પ્રક્રિયાને વધુ વિશ્વસનીય રીતે અંદાજે છે. જો જરૂરી હોય તો, R2 મૂલ્ય હંમેશા ચાર્ટ પર પ્રદર્શિત કરી શકાય છે.
સૂત્ર દ્વારા નિર્ધારિત:
ડેટા શ્રેણીમાં વલણ રેખા ઉમેરવા માટે:
ડેટાની શ્રેણીના આધારે ચાર્ટને સક્રિય કરો, એટલે કે ચાર્ટ વિસ્તારની અંદર ક્લિક કરો. ડાયાગ્રામ આઇટમ મુખ્ય મેનુમાં દેખાશે;
આ આઇટમ પર ક્લિક કર્યા પછી, સ્ક્રીન પર એક મેનૂ દેખાશે જેમાં તમારે એડ ટ્રેન્ડ લાઇન આદેશ પસંદ કરવો જોઈએ.
સમાન ક્રિયાઓ ડેટા શ્રેણીમાંથી એકને અનુરૂપ ગ્રાફ પર માઉસ પોઇન્ટરને ખસેડીને અને જમણું-ક્લિક કરીને સરળતાથી અમલ કરી શકાય છે; દેખાતા સંદર્ભ મેનૂમાં, ટ્રેન્ડ લાઇન ઉમેરો આદેશ પસંદ કરો. ટ્રેન્ડલાઈન ડાયલોગ બોક્સ સ્ક્રીન પર ટાઈપ ટેબ સાથે દેખાશે (ફિગ. 1).
આ પછી તમારે જરૂર છે:
પ્રકાર ટેબ પર જરૂરી ટ્રેન્ડ લાઇન પ્રકાર પસંદ કરો (રેખીય પ્રકાર મૂળભૂત રીતે પસંદ થયેલ છે). બહુપદી પ્રકાર માટે, ડિગ્રી ક્ષેત્રમાં, પસંદ કરેલ બહુપદીની ડિગ્રી સ્પષ્ટ કરો.
1 . બિલ્ટ ઓન સીરીઝ ફીલ્ડ પ્રશ્નમાં રહેલા ચાર્ટમાં તમામ ડેટા સીરીઝની યાદી આપે છે. ચોક્કસ ડેટા સીરીઝમાં ટ્રેન્ડ લાઇન ઉમેરવા માટે, બિલ્ટ ઓન સીરીઝ ફીલ્ડમાં તેનું નામ પસંદ કરો.
જો જરૂરી હોય તો, પેરામીટર્સ ટેબ (ફિગ. 2) પર જઈને, તમે ટ્રેન્ડ લાઇન માટે નીચેના પરિમાણો સેટ કરી શકો છો:
અંદાજિત (સરળ) વળાંક ક્ષેત્રના નામમાં વલણ રેખાનું નામ બદલો.
ફોરકાસ્ટ ફીલ્ડમાં આગાહી માટે સમયગાળાની સંખ્યા (આગળ અથવા પાછળ) સેટ કરો;
ચાર્ટ વિસ્તારમાં ટ્રેન્ડ લાઇનનું સમીકરણ પ્રદર્શિત કરો, જેના માટે તમારે "ચાર્ટ પર સમીકરણ બતાવો" ચેકબોક્સ સક્ષમ કરવું જોઈએ;
ડાયાગ્રામ વિસ્તારમાં અંદાજિત વિશ્વસનીયતા મૂલ્ય R2 પ્રદર્શિત કરો, જેના માટે તમારે ડાયાગ્રામ (R^2) ચેકબોક્સ પર અંદાજિત વિશ્વસનીયતા મૂલ્ય મૂકોને સક્ષમ કરવું જોઈએ;
Y અક્ષ સાથે વલણ રેખાના આંતરછેદ બિંદુને સેટ કરો, જેના માટે તમારે એક બિંદુ પર Y અક્ષ સાથે વળાંકના આંતરછેદ માટે ચેકબોક્સને સક્ષમ કરવું જોઈએ;
સંવાદ બોક્સ બંધ કરવા માટે ઓકે બટન પર ક્લિક કરો.
પહેલેથી દોરેલી ટ્રેન્ડ લાઇનને સંપાદિત કરવાનું શરૂ કરવા માટે, ત્યાં ત્રણ રીતો છે:
ફોર્મેટ મેનૂમાંથી સિલેક્ટેડ ટ્રેન્ડ લાઇન કમાન્ડનો ઉપયોગ કરો, અગાઉ ટ્રેન્ડ લાઇન પસંદ કર્યા પછી;
સંદર્ભ મેનૂમાંથી ફોર્મેટ ટ્રેન્ડ લાઇન આદેશ પસંદ કરો, જેને ટ્રેન્ડ લાઇન પર જમણું-ક્લિક કરીને બોલાવવામાં આવે છે;
ટ્રેન્ડ લાઇન પર ડબલ ક્લિક કરો.
ટ્રેન્ડ લાઈન ફોર્મેટ ડાયલોગ બોક્સ સ્ક્રીન પર દેખાશે (ફિગ. 3), જેમાં ત્રણ ટેબ હશે: વ્યૂ, ટાઈપ, પેરામીટર્સ અને છેલ્લી બેની સામગ્રીઓ ટ્રેન્ડ લાઈન ડાયલોગ બોક્સ (ફિગ. 1) ની સમાન ટેબ સાથે સંપૂર્ણ રીતે મેળ ખાય છે. -2). વ્યૂ ટેબ પર, તમે લાઇનનો પ્રકાર, તેનો રંગ અને જાડાઈ સેટ કરી શકો છો.
પહેલેથી દોરેલી ટ્રેન્ડ લાઇન કાઢી નાખવા માટે, કાઢી નાખવાની ટ્રેન્ડ લાઇન પસંદ કરો અને Delete કી દબાવો.
માનવામાં આવતા રીગ્રેશન એનાલિસિસ ટૂલના ફાયદા છે:
તેના માટે ડેટા ટેબલ બનાવ્યા વિના ચાર્ટ પર ટ્રેન્ડ લાઇન બનાવવાની સંબંધિત સરળતા;
સૂચિત વલણ રેખાઓના પ્રકારોની એકદમ વિશાળ સૂચિ, અને આ સૂચિમાં સૌથી વધુ ઉપયોગમાં લેવાતા રીગ્રેસન પ્રકારોનો સમાવેશ થાય છે;
મનસ્વી (સામાન્ય બુદ્ધિની મર્યાદામાં) દ્વારા અભ્યાસ હેઠળની પ્રક્રિયાની વર્તણૂકની આગાહી કરવાની ક્ષમતા આગળ અને પાછળના પગલાઓની સંખ્યા;
વિશ્લેષણાત્મક સ્વરૂપમાં વલણ રેખા સમીકરણ મેળવવાની ક્ષમતા;
સંભાવના, જો જરૂરી હોય તો, અંદાજની વિશ્વસનીયતાનું મૂલ્યાંકન મેળવવાની.
ગેરફાયદામાં નીચેનાનો સમાવેશ થાય છે:
ટ્રેન્ડ લાઇનનું નિર્માણ ફક્ત ત્યારે જ હાથ ધરવામાં આવે છે જો ડેટાની શ્રેણી પર કોઈ આકૃતિ બનાવવામાં આવી હોય;
તેના માટે મેળવેલ ટ્રેન્ડ લાઇન સમીકરણોના આધારે અભ્યાસ હેઠળની લાક્ષણિકતા માટે ડેટા શ્રેણી બનાવવાની પ્રક્રિયા કંઈક અંશે અવ્યવસ્થિત છે: આવશ્યક રીગ્રેશન સમીકરણો મૂળ ડેટા શ્રેણીના મૂલ્યોમાં દરેક ફેરફાર સાથે અપડેટ કરવામાં આવે છે, પરંતુ ફક્ત ચાર્ટ વિસ્તારની અંદર , જ્યારે જૂની રેખા સમીકરણ વલણના આધારે રચાયેલી ડેટા શ્રેણી યથાવત રહે છે;
PivotChart રિપોર્ટ્સમાં, ચાર્ટના દૃશ્યને બદલવાથી અથવા સંબંધિત PivotTable રિપોર્ટ હાલની ટ્રેન્ડલાઈનને સાચવી શકતું નથી, એટલે કે તમે ટ્રેન્ડલાઈન દોરો કે અન્યથા PivotChart રિપોર્ટને ફોર્મેટ કરો તે પહેલાં, તમારે ખાતરી કરવી જોઈએ કે રિપોર્ટ લેઆઉટ જરૂરી જરૂરિયાતોને પૂર્ણ કરે છે.
ગ્રાફ, હિસ્ટોગ્રામ, ફ્લેટ નોન-સ્ટાન્ડર્ડ એરિયા ચાર્ટ, બાર ચાર્ટ, સ્કેટર ચાર્ટ, બબલ ચાર્ટ અને સ્ટોક ચાર્ટ જેવા ચાર્ટ પર પ્રસ્તુત ડેટા શ્રેણીને પૂરક બનાવવા માટે ટ્રેન્ડ લાઇનનો ઉપયોગ કરી શકાય છે.
તમે 3D, નોર્મલાઇઝ્ડ, રડાર, પાઇ અને ડોનટ ચાર્ટમાં ડેટા શ્રેણીમાં ટ્રેન્ડ લાઇન ઉમેરી શકતા નથી.
એક્સેલના બિલ્ટ-ઇન કાર્યોનો ઉપયોગ કરીને
ચાર્ટ વિસ્તારની બહાર ટ્રેન્ડ લાઇન્સ બનાવવા માટે એક્સેલ પાસે રીગ્રેશન એનાલિસિસ ટૂલ પણ છે. સંખ્યાબંધ આંકડાકીય કાર્યપત્રક કાર્યો છે જેનો આ હેતુ માટે ઉપયોગ કરી શકાય છે, પરંતુ તે બધા માત્ર રેખીય અથવા ઘાતાંકીય રીગ્રેસન માટે પરવાનગી આપે છે.
એક્સેલમાં રેખીય રીગ્રેસન બનાવવા માટે ઘણા કાર્યો છે, ખાસ કરીને:
ઢોળાવ અને કાપો.
વલણ;
તેમજ ઘાતાંકીય વલણ રેખા બનાવવા માટેના કેટલાક કાર્યો, ખાસ કરીને:
LGRFPRIBL.
એ નોંધવું જોઈએ કે TREND અને GROWTH કાર્યોનો ઉપયોગ કરીને રીગ્રેસન બનાવવા માટેની તકનીકો લગભગ સમાન છે. LINEST અને LGRFPRIBL ની જોડી વિશે પણ એવું જ કહી શકાય. આ ચાર કાર્યો માટે, મૂલ્યોનું કોષ્ટક બનાવવા એરે ફોર્મ્યુલા જેવી એક્સેલ સુવિધાઓનો ઉપયોગ કરે છે, જે કંઈક અંશે રીગ્રેશન બનાવવાની પ્રક્રિયાને અવ્યવસ્થિત કરે છે. એ પણ નોંધ કરો કે રેખીય રીગ્રેસનનું નિર્માણ, અમારા મતે, સ્લોપ અને ઈન્ટરસેપ્ટ ફંક્શનનો ઉપયોગ કરીને સૌથી સહેલાઈથી પરિપૂર્ણ થાય છે, જ્યાં તેમાંથી પ્રથમ રેખીય રીગ્રેસનનો ઢોળાવ નક્કી કરે છે, અને બીજું y પર રીગ્રેસન દ્વારા અટકાવાયેલ સેગમેન્ટને નિર્ધારિત કરે છે. -અક્ષ.
રીગ્રેસન વિશ્લેષણ માટે બિલ્ટ-ઇન ફંક્શન ટૂલના ફાયદા છે:
વલણ રેખાઓને વ્યાખ્યાયિત કરતા તમામ બિલ્ટ-ઇન આંકડાકીય કાર્યો માટે અભ્યાસ હેઠળની લાક્ષણિકતાની ડેટા શ્રેણી બનાવવા માટે એકદમ સરળ, સમાન પ્રક્રિયા;
જનરેટેડ ડેટા સિરીઝના આધારે ટ્રેન્ડ લાઇન બનાવવા માટેની માનક પદ્ધતિ;
આગળ અથવા પાછળના પગલાઓની આવશ્યક સંખ્યા દ્વારા અભ્યાસ હેઠળની પ્રક્રિયાના વર્તનની આગાહી કરવાની ક્ષમતા.
ગેરફાયદામાં એ હકીકતનો સમાવેશ થાય છે કે એક્સેલમાં અન્ય (રેખીય અને ઘાતાંકીય સિવાય) પ્રકારની ટ્રેન્ડ લાઇન બનાવવા માટે બિલ્ટ-ઇન ફંક્શન્સ નથી. આ સંજોગો ઘણીવાર અભ્યાસ હેઠળની પ્રક્રિયાનું પૂરતું સચોટ મોડલ પસંદ કરવાની તેમજ વાસ્તવિકતાની નજીક હોય તેવી આગાહીઓ મેળવવાની મંજૂરી આપતું નથી. વધુમાં, TREND અને GROWTH ફંક્શનનો ઉપયોગ કરતી વખતે, વલણ રેખાઓના સમીકરણો જાણતા નથી.
એ નોંધવું જોઇએ કે લેખકોએ રીગ્રેસન વિશ્લેષણના અભ્યાસક્રમને પૂર્ણતાની કોઈપણ ડિગ્રી સાથે રજૂ કરવાનું નક્કી કર્યું નથી. તેનું મુખ્ય કાર્ય, વિશિષ્ટ ઉદાહરણોનો ઉપયોગ કરીને, એક્સેલ પેકેજની ક્ષમતાઓ બતાવવાનું છે જ્યારે અંદાજિત સમસ્યાઓ હલ કરવામાં આવે છે; એક્સેલમાં રીગ્રેશન અને આગાહી બનાવવા માટે કયા અસરકારક સાધનો છે તે દર્શાવો; રીગ્રેશન એનાલિસિસનું વ્યાપક જ્ઞાન ન ધરાવતા વપરાશકર્તા દ્વારા પણ આવી સમસ્યાઓને પ્રમાણમાં સરળતાથી કેવી રીતે ઉકેલી શકાય તે સમજાવો.
ચોક્કસ સમસ્યાઓ ઉકેલવાના ઉદાહરણો
ચાલો લિસ્ટેડ એક્સેલ ટૂલ્સનો ઉપયોગ કરીને ચોક્કસ સમસ્યાઓ ઉકેલવા જોઈએ.
સમસ્યા 1
1995-2002 માટે મોટર ટ્રાન્સપોર્ટ એન્ટરપ્રાઇઝના નફા પરના ડેટાના કોષ્ટક સાથે. તમારે નીચેના કરવાની જરૂર છે:
એક આકૃતિ બનાવો.
ચાર્ટમાં રેખીય અને બહુપદી (ચતુર્ભુજ અને ઘન) વલણ રેખાઓ ઉમેરો.
ટ્રેન્ડ લાઇનના સમીકરણોનો ઉપયોગ કરીને, 1995-2004 માટે દરેક ટ્રેન્ડ લાઇન માટે એન્ટરપ્રાઇઝના નફા પર ટેબ્યુલર ડેટા મેળવો.
2003 અને 2004 માટે એન્ટરપ્રાઇઝના નફાની આગાહી કરો.
સમસ્યાનું સમાધાન
એક્સેલ વર્કશીટના સેલ A4:C11 ની શ્રેણીમાં, ફિગમાં બતાવેલ વર્કશીટ દાખલ કરો. 4.
સેલ B4:C11 ની શ્રેણી પસંદ કર્યા પછી, અમે એક આકૃતિ બનાવીએ છીએ.
અમે બનાવેલ રેખાકૃતિને સક્રિય કરીએ છીએ અને ઉપર વર્ણવેલ પદ્ધતિ અનુસાર, ટ્રેન્ડ લાઇન ડાયલોગ બોક્સમાં ટ્રેન્ડ લાઇનનો પ્રકાર પસંદ કર્યા પછી (ફિગ. 1 જુઓ), અમે વૈકલ્પિક રીતે રેખાકૃતિમાં રેખીય, ચતુર્ભુજ અને ઘન વલણ રેખાઓ ઉમેરીએ છીએ. એ જ સંવાદ બોક્સમાં, પેરામીટર્સ ટેબ ખોલો (જુઓ. આકૃતિ 2), અંદાજિત (સરળ) વળાંક ફીલ્ડના નામમાં, જે વલણ ઉમેરવામાં આવી રહ્યું છે તેનું નામ દાખલ કરો અને ફોરકાસ્ટ ફોરવર્ડ ફોર: પીરિયડ્સ ફીલ્ડમાં, સેટ કરો. મૂલ્ય 2, કારણ કે તે આગળના બે વર્ષ માટે નફાની આગાહી કરવાનું આયોજન છે. ડાયાગ્રામ વિસ્તારમાં રીગ્રેસન સમીકરણ અને અંદાજિત વિશ્વસનીયતા મૂલ્ય R2 પ્રદર્શિત કરવા માટે, સ્ક્રીન ચેકબોક્સ પર શો સમીકરણને સક્ષમ કરો અને ડાયાગ્રામ પર અંદાજિત વિશ્વસનીયતા મૂલ્ય (R^2) મૂકો. સારી વિઝ્યુઅલ ધારણા માટે, અમે બાંધવામાં આવેલી ટ્રેન્ડ લાઇનનો પ્રકાર, રંગ અને જાડાઈ બદલીએ છીએ, જેના માટે અમે ટ્રેન્ડ લાઇન ફોર્મેટ ડાયલોગ બોક્સની વ્યૂ ટેબનો ઉપયોગ કરીએ છીએ (ફિગ. 3 જુઓ). ઉમેરાયેલ વલણ રેખાઓ સાથે પરિણામી રેખાકૃતિ ફિગમાં બતાવવામાં આવી છે. 5.
1995-2004 માટે દરેક ટ્રેન્ડ લાઇન માટે એન્ટરપ્રાઇઝના નફા પર ટેબ્યુલર ડેટા મેળવવા માટે.
ચાલો ફિગમાં પ્રસ્તુત વલણ રેખા સમીકરણોનો ઉપયોગ કરીએ. 5. આ કરવા માટે, D3:F3 શ્રેણીના કોષોમાં, પસંદ કરેલ ટ્રેન્ડ લાઇનના પ્રકાર વિશેની ટેક્સ્ટ માહિતી દાખલ કરો: લીનિયર ટ્રેન્ડ, ક્વાડ્રેટિક ટ્રેન્ડ, ક્યુબિક ટ્રેન્ડ. આગળ, સેલ D4 માં રેખીય રીગ્રેસન ફોર્મ્યુલા દાખલ કરો અને, ફિલ માર્કરનો ઉપયોગ કરીને, સેલ શ્રેણી D5:D13 ના સંબંધિત સંદર્ભો સાથે આ સૂત્રની નકલ કરો. એ નોંધવું જોઈએ કે કોષો D4:D13 ની શ્રેણીમાંથી રેખીય રીગ્રેસન સૂત્ર સાથેના દરેક કોષમાં A4:A13 શ્રેણીમાંથી અનુરૂપ કોષ દલીલ તરીકે છે. એ જ રીતે, ચતુર્ભુજ રીગ્રેસન માટે, કોષોની શ્રેણી E4:E13 ભરો, અને ક્યુબિક રીગ્રેસન માટે, કોષોની શ્રેણી F4:F13 ભરો. આમ, 2003 અને 2004 માટે એન્ટરપ્રાઇઝના નફા માટેનું અનુમાન સંકલિત કરવામાં આવ્યું છે. ત્રણ વલણોનો ઉપયોગ કરીને. મૂલ્યોનું પરિણામી કોષ્ટક ફિગમાં બતાવવામાં આવ્યું છે. 6.
એક આકૃતિ બનાવો.
સમસ્યા 2
ચાર્ટમાં લઘુગણક, શક્તિ અને ઘાતાંકીય વલણ રેખાઓ ઉમેરો.
પ્રાપ્ત વલણ રેખાઓના સમીકરણો, તેમજ તે દરેક માટે અંદાજિત R2 ના વિશ્વસનીયતા મૂલ્યો મેળવો.
ટ્રેન્ડ લાઇન સમીકરણોનો ઉપયોગ કરીને, 1995-2002 માટે દરેક ટ્રેન્ડ લાઇન માટે એન્ટરપ્રાઇઝના નફા પર ટેબ્યુલર ડેટા મેળવો.
સમસ્યાનું સમાધાન
સમસ્યા 1 ઉકેલવા માટે આપવામાં આવેલી પદ્ધતિને અનુસરીને, અમે તેમાં ઉમેરવામાં આવેલ લઘુગણક, શક્તિ અને ઘાતાંકીય વલણ રેખાઓ સાથેનો એક આકૃતિ મેળવીએ છીએ (ફિગ. 7). આગળ, પ્રાપ્ત વલણ રેખા સમીકરણોનો ઉપયોગ કરીને, અમે 2003 અને 2004 માટે અનુમાનિત મૂલ્યો સહિત, એન્ટરપ્રાઇઝના નફા માટે મૂલ્યોનું કોષ્ટક ભરીએ છીએ. (ફિગ. 8).
ફિગ માં. 5 અને અંજીર. તે જોઈ શકાય છે કે લઘુગણક વલણ સાથેનું મોડેલ અંદાજિત વિશ્વસનીયતાના સૌથી નીચા મૂલ્યને અનુરૂપ છે
R2 = 0.8659
R2 ના ઉચ્ચતમ મૂલ્યો બહુપદી વલણ સાથેના મોડલને અનુરૂપ છે: ચતુર્ભુજ (R2 = 0.9263) અને ઘન (R2 = 0.933).
સમસ્યા 3
કાર્ય 1 માં આપેલ 1995-2002 માટે મોટર ટ્રાન્સપોર્ટ એન્ટરપ્રાઇઝના નફા પરના ડેટાના કોષ્ટક સાથે, તમારે નીચેના પગલાં ભરવા આવશ્યક છે.
TREND અને GROW ફંક્શનનો ઉપયોગ કરીને રેખીય અને ઘાતાંકીય વલણ રેખાઓ માટે ડેટા શ્રેણી મેળવો.
TREND અને GROWTH કાર્યોનો ઉપયોગ કરીને, 2003 અને 2004 માટે એન્ટરપ્રાઇઝના નફાની આગાહી કરો.
મૂળ ડેટા અને પરિણામી ડેટા શ્રેણી માટે ડાયાગ્રામ બનાવો.
સમસ્યાનું સમાધાન
ચાલો સમસ્યા 1 માટે વર્કશીટનો ઉપયોગ કરીએ (ફિગ. 4 જુઓ). ચાલો TREND ફંક્શનથી શરૂઆત કરીએ:
કોષોની શ્રેણી D4:D11 પસંદ કરો, જે એન્ટરપ્રાઇઝના નફા પરના જાણીતા ડેટાને અનુરૂપ TREND કાર્યના મૂલ્યોથી ભરેલી હોવી જોઈએ;
Insert મેનુમાંથી ફંક્શન કમાન્ડને કૉલ કરો. દેખાતા ફંક્શન વિઝાર્ડ સંવાદ બોક્સમાં, આંકડાકીય શ્રેણીમાંથી TREND ફંક્શન પસંદ કરો અને પછી OK બટન પર ક્લિક કરો. પ્રમાણભૂત ટૂલબાર પર (ઇન્સર્ટ ફંક્શન) બટનને ક્લિક કરીને સમાન કામગીરી કરી શકાય છે.
દેખાતા ફંક્શન આર્ગ્યુમેન્ટ્સ ડાયલોગ બોક્સમાં, Known_values_y ફીલ્ડમાં સેલ C4:C11 ની શ્રેણી દાખલ કરો; Known_values_x ફીલ્ડમાં - કોષોની શ્રેણી B4:B11;
દાખલ કરેલ ફોર્મ્યુલાને એરે ફોર્મ્યુલા બનાવવા માટે, કી સંયોજન + + નો ઉપયોગ કરો.
ફોર્મ્યુલા બારમાં આપણે દાખલ કરેલ ફોર્મ્યુલા આના જેવું દેખાશે: =(TREND(C4:C11,B4:B11)).
પરિણામે, કોષોની શ્રેણી D4:D11 TREND કાર્ય (ફિગ. 9) ના અનુરૂપ મૂલ્યોથી ભરેલી છે.
2003 અને 2004 માટે એન્ટરપ્રાઇઝના નફાની આગાહી કરવી. જરૂરી:
કોષોની શ્રેણી D12:D13 પસંદ કરો જ્યાં TREND કાર્ય દ્વારા અનુમાનિત મૂલ્યો દાખલ કરવામાં આવશે.
TREND ફંક્શનને કૉલ કરો અને દેખાતા ફંક્શન આર્ગ્યુમેન્ટ્સ સંવાદ બોક્સમાં, Known_values_y ફીલ્ડમાં સેલ C4:C11 ની શ્રેણી દાખલ કરો; Known_values_x ફીલ્ડમાં - કોષોની શ્રેણી B4:B11; અને New_values_x ફીલ્ડમાં - B12:B13 કોષોની શ્રેણી.
Ctrl + Shift + Enter કી સંયોજનનો ઉપયોગ કરીને આ સૂત્રને એરે ફોર્મ્યુલામાં ફેરવો.
દાખલ કરેલ સૂત્ર આના જેવું દેખાશે: =(TREND(C4:C11;B4:B11;B12:B13)), અને કોષોની શ્રેણી D12:D13 TREND ફંક્શનના અનુમાનિત મૂલ્યોથી ભરવામાં આવશે (ફિગ જુઓ. 9).
ડેટા સિરીઝ GROWTH ફંક્શનનો ઉપયોગ કરીને એ જ રીતે ભરવામાં આવે છે, જેનો ઉપયોગ બિનરેખીય નિર્ભરતાના વિશ્લેષણમાં થાય છે અને તેના રેખીય સમકક્ષ TRENDની જેમ બરાબર કાર્ય કરે છે.
આકૃતિ 10 ફોર્મ્યુલા ડિસ્પ્લે મોડમાં કોષ્ટક બતાવે છે.
પ્રારંભિક ડેટા અને પ્રાપ્ત ડેટા શ્રેણી માટે, આકૃતિ ફિગમાં બતાવેલ છે. 11.
સમસ્યા 4
વર્તમાન મહિનાની 1 લી થી 11 તારીખ સુધીના સમયગાળા માટે મોટર ટ્રાન્સપોર્ટ એન્ટરપ્રાઇઝની રવાનગી સેવા દ્વારા સેવાઓ માટેની વિનંતીઓની પ્રાપ્તિ પરના ડેટાના કોષ્ટક સાથે, તમારે નીચેની ક્રિયાઓ કરવી આવશ્યક છે.
રેખીય રીગ્રેસન માટે ડેટા શ્રેણી મેળવો: SLOPE અને INTERCEPT ફંક્શનનો ઉપયોગ કરીને; LINEST ફંક્શનનો ઉપયોગ કરીને.
LGRFPRIBL ફંક્શનનો ઉપયોગ કરીને ઘાતાંકીય રીગ્રેસન માટે શ્રેણીબદ્ધ ડેટા મેળવો.
ઉપરોક્ત કાર્યોનો ઉપયોગ કરીને, વર્તમાન મહિનાની 12મીથી 14મી સુધીના સમયગાળા માટે ડિસ્પેચ સેવામાં અરજીઓની પ્રાપ્તિ વિશે આગાહી કરો.
મૂળ અને પ્રાપ્ત ડેટા શ્રેણી માટે ડાયાગ્રામ બનાવો.
સમસ્યાનું સમાધાન
નોંધ કરો કે, TREND અને GROWTH ફંક્શનથી વિપરીત, ઉપર સૂચિબદ્ધ કોઈપણ ફંક્શન (SLOPE, INTERCEPT, LINEST, LGRFPRIB) રીગ્રેશન નથી. આ વિધેયો માત્ર સહાયક ભૂમિકા ભજવે છે, જરૂરી રીગ્રેસન પરિમાણો નક્કી કરે છે.
SLOPE, INTERCEPT, LINEST, LGRFPRIB ફંક્શનનો ઉપયોગ કરીને બનેલ રેખીય અને ઘાતાંકીય રીગ્રેશન માટે, TREND અને GROWTH કાર્યોને અનુરૂપ રેખીય અને ઘાતાંકીય રીગ્રેશનથી વિપરીત, તેમના સમીકરણોનો દેખાવ હંમેશા જાણીતો છે.
1 . ચાલો સમીકરણ સાથે રેખીય રીગ્રેસન બનાવીએ:
y = mx+b
SLOPE અને INTERCEPT ફંક્શનનો ઉપયોગ કરીને, SLOPE ફંક્શન દ્વારા નિર્ધારિત રીગ્રેશન સ્લોપ m સાથે અને ઈન્ટરસેપ્ટ ફંક્શન દ્વારા ફ્રી ટર્મ b.
આ કરવા માટે, અમે નીચેની ક્રિયાઓ કરીએ છીએ:
સેલ શ્રેણી A4:B14 માં મૂળ કોષ્ટક દાખલ કરો;
પરિમાણ m નું મૂલ્ય સેલ C19 માં નક્કી કરવામાં આવશે. આંકડાકીય શ્રેણીમાંથી સ્લોપ ફંક્શન પસંદ કરો; કોષોની શ્રેણી B4:B14 જાણીતા_મૂલ્યો_y ફીલ્ડમાં અને કોષોની શ્રેણી A4:A14 જાણીતા_મૂલ્યો_x ફીલ્ડમાં દાખલ કરો.
ફોર્મ્યુલા સેલ C19: =SLOPE(B4:B14,A4:A14) માં દાખલ કરવામાં આવશે;
આગળ, ફોર્મમાં સેલ C4 માં રેખીય રીગ્રેસન ફોર્મ્યુલા દાખલ કરો: =$C*A4+$D. આ સૂત્રમાં, કોષો C19 અને D19 સંપૂર્ણ સંદર્ભો સાથે લખાયેલા છે (સંભવિત નકલ દરમિયાન કોષનું સરનામું બદલવું જોઈએ નહીં). નિરપેક્ષ સંદર્ભ ચિહ્ન $ કોષ સરનામાં પર કર્સર મૂક્યા પછી કીબોર્ડમાંથી અથવા F4 કીનો ઉપયોગ કરીને ટાઇપ કરી શકાય છે.
2 ફિલ હેન્ડલનો ઉપયોગ કરીને, આ ફોર્મ્યુલાને સેલ C4:C17 ની શ્રેણીમાં કૉપિ કરો. અમે જરૂરી ડેટા શ્રેણી (ફિગ. 12) મેળવીએ છીએ. એપ્લિકેશનની સંખ્યા પૂર્ણાંક છે તે હકીકતને કારણે, તમારે સેલ ફોર્મેટ વિન્ડોની નંબર ટેબ પર દશાંશ સ્થાનોની સંખ્યા સાથે નંબર ફોર્મેટને 0 પર સેટ કરવું જોઈએ.
y = mx+b
. ચાલો હવે સમીકરણ દ્વારા આપવામાં આવેલ રેખીય રીગ્રેસન બનાવીએ:
LINEST ફંક્શનનો ઉપયોગ કરીને.
આ કરવા માટે:
સેલ શ્રેણી C20:D20: =(LINEST(B4:B14,A4:A14)) માં એરે ફોર્મ્યુલા તરીકે LINEST ફંક્શન દાખલ કરો. પરિણામે, અમે સેલ C20 માં પરિમાણ m નું મૂલ્ય અને સેલ D20 માં પરિમાણ b નું મૂલ્ય મેળવીએ છીએ;
કોષ D4 માં સૂત્ર દાખલ કરો: =$C*A4+$D;
3 સેલ શ્રેણી D4:D17 માં ફિલ માર્કરનો ઉપયોગ કરીને આ સૂત્રની નકલ કરો અને ઇચ્છિત ડેટા શ્રેણી મેળવો.
. અમે સમીકરણ સાથે ઘાતાંકીય રીગ્રેસન બનાવીએ છીએ:
LGRFPRIBL ફંક્શનનો ઉપયોગ કરીને તે સમાન રીતે કરવામાં આવે છે:
સેલ C21:D21 ની શ્રેણીમાં આપણે એરે ફોર્મ્યુલા તરીકે LGRFPRIBL ફંક્શન દાખલ કરીએ છીએ: =( LGRFPRIBL (B4:B14,A4:A14)). આ કિસ્સામાં, પરિમાણ m નું મૂલ્ય સેલ C21 માં નક્કી કરવામાં આવશે, અને પરિમાણ b નું મૂલ્ય સેલ D21 માં નક્કી કરવામાં આવશે;
ફોર્મ્યુલા સેલ E4 માં દાખલ કરવામાં આવે છે: =$D*$C^A4;
ફિલ માર્કરનો ઉપયોગ કરીને, આ સૂત્ર E4:E17 કોષોની શ્રેણીમાં નકલ કરવામાં આવે છે, જ્યાં ઘાતાંકીય રીગ્રેસન માટે ડેટા શ્રેણી સ્થિત હશે (ફિગ. 12 જુઓ).
ફિગ માં. આકૃતિ 13 એ એક ટેબલ બતાવે છે જ્યાં તમે જરૂરી કોષ શ્રેણીઓ તેમજ ફોર્મ્યુલા સાથે અમે ઉપયોગ કરીએ છીએ તે કાર્યો જોઈ શકો છો. તીવ્રતા 2 આર કહેવાય છે.
નિર્ધારણ ગુણાંક
રીગ્રેસન અવલંબન બનાવવાનું કાર્ય મોડેલ (1) ના ગુણાંક m ના વેક્ટરને શોધવાનું છે કે જેના પર ગુણાંક R મહત્તમ મૂલ્ય લે છે.
R ના મહત્વનું મૂલ્યાંકન કરવા માટે, ફિશરની F ટેસ્ટનો ઉપયોગ કરવામાં આવે છે, સૂત્રનો ઉપયોગ કરીને ગણતરી કરવામાં આવે છે. nજ્યાં
- નમૂનાનું કદ (પ્રયોગોની સંખ્યા);
k એ મોડેલ ગુણાંકની સંખ્યા છે. nઅને જો F ડેટા માટે અમુક નિર્ણાયક મૂલ્ય કરતાં વધી જાય k
આમ, R નું મહત્વ માત્ર તેના મૂલ્ય દ્વારા જ નહીં, પણ પ્રયોગોની સંખ્યા અને મોડેલના ગુણાંક (પરિમાણો) ની સંખ્યા વચ્ચેના ગુણોત્તર દ્વારા પણ નક્કી કરવામાં આવે છે. ખરેખર, સાદા રેખીય મોડેલ માટે n=2 માટેનો સહસંબંધ ગુણોત્તર 1 ની બરાબર છે (એક સીધી રેખા હંમેશા 2 બિંદુઓ દ્વારા સમતલ પર દોરી શકાય છે). જો કે, જો પ્રાયોગિક ડેટા રેન્ડમ ચલ હોય, તો R ના આવા મૂલ્ય પર ખૂબ સાવધાની સાથે વિશ્વાસ કરવો જોઈએ. સામાન્ય રીતે, નોંધપાત્ર આર અને વિશ્વસનીય રીગ્રેસન મેળવવા માટે, તેઓ ખાતરી કરવા માટે પ્રયત્ન કરે છે કે પ્રયોગોની સંખ્યા નોંધપાત્ર રીતે મોડેલ ગુણાંક (n>k) ની સંખ્યા કરતાં વધી જાય.
રેખીય રીગ્રેશન મોડેલ બનાવવા માટે તમારે આની જરૂર છે:
1) પ્રાયોગિક ડેટા ધરાવતી n પંક્તિઓ અને m કૉલમ્સની સૂચિ તૈયાર કરો (આઉટપુટ મૂલ્ય ધરાવતી કૉલમ વાયસૂચિમાં પ્રથમ અથવા છેલ્લું હોવું જોઈએ); ઉદાહરણ તરીકે, ચાલો પાછલા કાર્યમાંથી ડેટા લઈએ, "પીરિયડ નંબર" નામની કૉલમ ઉમેરીને, 1 થી 12 સુધીના સમયગાળાની સંખ્યાઓને નંબર આપો. (આ મૂલ્યો હશે. એક્સ)
2) મેનુ ડેટા/ડેટા એનાલિસિસ/રીગ્રેશન પર જાઓ
જો "ટૂલ્સ" મેનૂમાં "ડેટા વિશ્લેષણ" આઇટમ ખૂટે છે, તો તમારે તે જ મેનૂમાં "એડ-ઇન્સ" આઇટમ પર જવું જોઈએ અને "વિશ્લેષણ પેકેજ" ચેકબોક્સને ચેક કરવું જોઈએ.
3) "રીગ્રેશન" સંવાદ બોક્સમાં, સેટ કરો:
· ઇનપુટ અંતરાલ Y;
· ઇનપુટ અંતરાલ X;
· આઉટપુટ અંતરાલ - અંતરાલનો ઉપરનો ડાબો કોષ જેમાં ગણતરીના પરિણામો મૂકવામાં આવશે (તેને નવી વર્કશીટ પર મૂકવાની ભલામણ કરવામાં આવે છે);
4) "ઓકે" ક્લિક કરો અને પરિણામોનું વિશ્લેષણ કરો.
100 RURપ્રથમ ઓર્ડર માટે બોનસ
કામનો પ્રકાર પસંદ કરો ડિપ્લોમા વર્ક કોર્સ વર્ક એબ્સ્ટ્રેક્ટ માસ્ટરની થીસીસ પ્રેક્ટિસ રિપોર્ટ લેખ રિપોર્ટ રિવ્યૂ ટેસ્ટ વર્ક મોનોગ્રાફ પ્રોબ્લેમ સોલ્વિંગ બિઝનેસ પ્લાન પ્રશ્નોના જવાબો સર્જનાત્મક કાર્ય નિબંધ ડ્રોઈંગ નિબંધો અનુવાદ પ્રસ્તુતિઓ ટાઈપિંગ અન્ય ટેક્સ્ટની વિશિષ્ટતા વધારવી માસ્ટરની થીસીસ લેબોરેટરી વર્ક ઓનલાઈન મદદ
કિંમત જાણો
લઘુત્તમ ચોરસ પદ્ધતિ એ એક ગાણિતિક (ગાણિતિક-આંકડાકીય) તકનીક છે જેનો ઉપયોગ સમય શ્રેણીને સંરેખિત કરવા, રેન્ડમ ચલો વચ્ચેના સહસંબંધના સ્વરૂપને ઓળખવા વગેરે માટે થાય છે. તેમાં એ હકીકતનો સમાવેશ થાય છે કે આપેલ ઘટનાનું વર્ણન કરતું કાર્ય સરળ કાર્ય દ્વારા અંદાજિત છે. તદુપરાંત, બાદમાંની પસંદગી એવી રીતે કરવામાં આવે છે કે સંરેખિત મુદ્દાઓમાંથી અવલોકન કરેલ બિંદુઓ પર કાર્યના વાસ્તવિક સ્તરોનું પ્રમાણભૂત વિચલન (વિક્ષેપ જુઓ) સૌથી નાનું છે.
ઉદાહરણ તરીકે, ઉપલબ્ધ માહિતી અનુસાર ( xi,યી) (i = 1, 2, ..., n) આવા વળાંક બાંધવામાં આવે છે y = a + bx, જેના પર ચોરસ વિચલનોનો લઘુત્તમ સરવાળો પ્રાપ્ત થાય છે
એટલે કે, બે પરિમાણો પર આધાર રાખીને કાર્યને નાનું કરવામાં આવે છે: a- ઓર્ડિનેટ અક્ષ પર સેગમેન્ટ અને b- સીધી રેખા ઢોળાવ.
કાર્યને ઘટાડવા માટે જરૂરી શરતો આપતા સમીકરણો એસ(a,b), કહેવાય છે સામાન્ય સમીકરણો.અંદાજિત વિધેયો તરીકે, માત્ર રેખીય (સીધી રેખા સાથે ગોઠવણી) જ નહીં, પણ ચતુર્ભુજ, પેરાબોલિક, ઘાતાંકીય વગેરેનો પણ ઉપયોગ થાય છે, એક સીધી રેખા સાથે સમય શ્રેણીને સંરેખિત કરવાના ઉદાહરણ માટે, ફિગ જુઓ. M.2, જ્યાં વર્ગીય અંતરનો સરવાળો ( y 1 – ȳ 1)2 + (y 2 – ȳ 2)2 .... સૌથી નાની છે, અને પરિણામી સીધી રેખા સમય જતાં ચોક્કસ સૂચકના અવલોકનોની ગતિશીલ શ્રેણીના વલણને શ્રેષ્ઠ રીતે પ્રતિબિંબિત કરે છે.
નિષ્પક્ષ OLS અંદાજો માટે, રીગ્રેસન વિશ્લેષણની સૌથી મહત્વની શરત પૂરી કરવા માટે તે જરૂરી અને પૂરતું છે: રેન્ડમ ભૂલની ગાણિતિક અપેક્ષા, પરિબળો પર શરતી, શૂન્યની બરાબર હોવી જોઈએ. આ સ્થિતિ, ખાસ કરીને, પૂરી થાય છે જો: 1. રેન્ડમ ભૂલોની ગાણિતિક અપેક્ષા શૂન્ય છે, અને 2. પરિબળો અને રેન્ડમ ભૂલો સ્વતંત્ર રેન્ડમ ચલ છે. પ્રથમ શરત સતત સાથેના મોડેલો માટે હંમેશા પરિપૂર્ણ ગણી શકાય, કારણ કે સ્થિરાંક ભૂલોની બિન-શૂન્ય ગાણિતિક અપેક્ષા લે છે. બીજી શરત - પરિબળોની બાહ્યતાની સ્થિતિ - મૂળભૂત છે. જો આ મિલકત પૂરી ન થાય, તો અમે ધારી શકીએ છીએ કે લગભગ કોઈપણ અંદાજો અત્યંત અસંતોષકારક હશે: તે સુસંગત પણ નહીં હોય (એટલે કે, ખૂબ મોટી માત્રામાં ડેટા પણ અમને આ કિસ્સામાં ઉચ્ચ-ગુણવત્તાના અંદાજો મેળવવાની મંજૂરી આપતું નથી. ).
રીગ્રેસન સમીકરણોના પરિમાણોના આંકડાકીય અંદાજની સૌથી સામાન્ય પદ્ધતિ એ ન્યૂનતમ ચોરસ પદ્ધતિ છે. આ પદ્ધતિ ડેટાની પ્રકૃતિ અને મોડેલના પરિણામોને લગતી સંખ્યાબંધ ધારણાઓ પર આધારિત છે. મૂળ ચલોનું આશ્રિત અને સ્વતંત્રમાં સ્પષ્ટ વિભાજન, સમીકરણોમાં સમાવિષ્ટ પરિબળોની અસંબંધિતતા, સંબંધની રેખીયતા, અવશેષોના સ્વતઃસંબંધની ગેરહાજરી, તેમની ગાણિતિક અપેક્ષાઓની શૂન્ય અને સતત સમાનતા છે. વિખેરવું
OLS ની મુખ્ય પૂર્વધારણાઓમાંની એક વિચલનોની ભિન્નતાની સમાનતાની ધારણા છે ei, એટલે કે. શ્રેણીના સરેરાશ (શૂન્ય) મૂલ્યની આસપાસ તેમનો ફેલાવો સ્થિર મૂલ્ય હોવો જોઈએ. આ ગુણધર્મને હોમોસેડેસ્ટીસીટી કહેવામાં આવે છે. વ્યવહારમાં, વિચલનોની ભિન્નતા ઘણી વાર અસમાન હોય છે, એટલે કે, હેટરોસ્કેડસ્ટીસીટી જોવા મળે છે. આ વિવિધ કારણોસર હોઈ શકે છે. ઉદાહરણ તરીકે, સ્ત્રોત ડેટામાં ભૂલો હોઈ શકે છે. સ્ત્રોત માહિતીમાં પ્રસંગોપાત અચોક્કસતા, જેમ કે સંખ્યાઓના ક્રમમાં ભૂલો, પરિણામો પર નોંધપાત્ર અસર કરી શકે છે. મોટેભાગે, આશ્રિત ચલ (ચલો) ના મોટા મૂલ્યો સાથે વિચલનો єi નો મોટો ફેલાવો જોવા મળે છે. જો ડેટામાં નોંધપાત્ર ભૂલ હોય, તો સ્વાભાવિક રીતે, ભૂલભરેલા ડેટામાંથી ગણતરી કરેલ મોડેલ મૂલ્યનું વિચલન પણ મોટું હશે. આ ભૂલથી છુટકારો મેળવવા માટે, અમારે ગણતરીના પરિણામોમાં આ ડેટાના યોગદાનને ઘટાડવાની જરૂર છે, તેમને અન્ય તમામ કરતા ઓછું વજન સોંપવું પડશે. આ વિચાર ભારિત OLS માં અમલમાં મૂકવામાં આવ્યો છે.