Neden en küçük kareler yöntemi kullanılıyor? Bir polinom modelinin durumu

En küçük kareler yöntemi

Konunun son dersinde en ünlü uygulamayla tanışacağız. FNP Bilimin çeşitli alanlarında ve pratik faaliyetlerde en geniş uygulamayı bulan. Bu fizik, kimya, biyoloji, ekonomi, sosyoloji, psikoloji vb. olabilir. Kaderin iradesiyle sık sık ekonomiyle uğraşmak zorunda kalıyorum ve bu nedenle bugün size muhteşem bir ülkeye bir gezi ayarlayacağım. Ekonometri=) ...Nasıl istemezsin?! Orası çok iyi; sadece karar vermeniz gerekiyor! ...Ama muhtemelen kesinlikle isteyeceğiniz şey sorunların nasıl çözüleceğini öğrenmektir en küçük kareler yöntemi. Ve özellikle dikkatli okuyucular, bunları yalnızca doğru bir şekilde değil, aynı zamanda ÇOK HIZLI bir şekilde çözmeyi öğrenecekler ;-) Ama önce sorunun genel ifadesi+ eşlik eden örnek:

Belirli bir konu alanında niceliksel ifadeye sahip göstergelerin incelendiğini varsayalım. Aynı zamanda göstergenin göstergeye bağlı olduğuna inanmak için her türlü neden vardır. Bu varsayım bilimsel bir hipotez olabilir veya temel sağduyuya dayanabilir. Ancak bilimi bir kenara bırakıp daha iştah açıcı alanları yani marketleri keşfedelim. Şununla belirtelim:

– bir bakkalın perakende alanı, m2,
– bir bakkalın yıllık cirosu, milyon ruble.

Mağaza alanı ne kadar büyük olursa, çoğu durumda cironun da o kadar büyük olacağı kesinlikle açıktır.

Tef ile gözlemler/deneyler/hesaplamalar/danslar yaptıktan sonra elimizde sayısal verilere sahip olduğumuzu varsayalım:

Bakkallarda her şeyin açık olduğunu düşünüyorum: - bu 1. mağazanın alanı, - yıllık cirosu, - 2. mağazanın alanı, - yıllık cirosu vb. Bu arada, gizli materyallere erişime sahip olmak hiç de gerekli değil - ticaret cirosunun oldukça doğru bir değerlendirmesi şu şekilde elde edilebilir: matematiksel istatistik. Ancak dikkatimizi dağıtmayalım, ticari casusluk kursu zaten ücretli =)

Tablo verileri aynı zamanda noktalar biçiminde de yazılabilir ve bilinen biçimde gösterilebilir. Kartezyen sistem .

Önemli bir soruya cevap verelim: Nitel bir çalışma için kaç puan gerekir?

Daha fazla, daha iyi. Kabul edilebilir minimum set 5-6 puandan oluşur. Ayrıca veri miktarı az olduğunda “anormal” sonuçlar örnekleme dahil edilememektedir. Yani, örneğin küçük bir elit mağaza, "meslektaşlarından" daha büyük siparişler kazanabilir, böylece bulmanız gereken genel modeli bozabilir!



Çok basit bir şekilde ifade etmek gerekirse, bir fonksiyon seçmemiz gerekiyor, takvim noktalara mümkün olduğu kadar yakından geçen . Bu fonksiyon denir yaklaşık (yaklaşım - yaklaşım) veya teorik fonksiyon . Genel olarak konuşursak, burada hemen bariz bir "rakip" ortaya çıkıyor - grafiği TÜM noktalardan geçen yüksek dereceli bir polinom. Ancak bu seçenek karmaşıktır ve çoğunlukla yanlıştır. (grafik her zaman “döngüye gireceğinden” ve ana eğilimi zayıf şekilde yansıtacağından).

Bu nedenle aranan fonksiyonun oldukça basit olması ve aynı zamanda bağımlılığı yeterince yansıtması gerekir. Tahmin edebileceğiniz gibi, bu tür işlevleri bulma yöntemlerinden birine denir. en küçük kareler yöntemi. Öncelikle genel hatlarıyla özüne bakalım. Bazı fonksiyonların deneysel verilere yakın olmasına izin verin:


Bu yaklaşımın doğruluğu nasıl değerlendirilir? Deneysel ve fonksiyonel değerler arasındaki farkları (sapmaları) da hesaplayalım (çizi inceliyoruz). Akla gelen ilk düşünce toplamın ne kadar büyük olduğunu tahmin etmektir, ancak sorun şu ki farklar negatif olabilir (Örneğin, ) ve bu toplamanın sonucunda ortaya çıkan sapmalar birbirini iptal edecektir. Bu nedenle, yaklaşımın doğruluğunun bir tahmini olarak toplamın alınması gerekir. modüller sapmalar:

veya çöktü: (kimse bilmiyorsa: toplam simgesidir ve – 1'den 1'e kadar değerleri alan yardımcı bir "sayaç" değişkeni ) .

Deneysel noktaları farklı fonksiyonlara yaklaştırarak farklı değerler elde edeceğiz ve açıkçası bu toplamın daha küçük olduğu yerde o fonksiyon daha doğru olacaktır.

Böyle bir yöntem var ve buna denir en az modül yöntemi. Ancak pratikte çok daha yaygın hale geldi. en küçük kareler yöntemi olası negatif değerlerin modül tarafından değil, sapmaların karesi alınarak ortadan kaldırıldığı:



Bundan sonra çabalar, sapmaların karelerinin toplamı olacak şekilde bir fonksiyonun seçilmesini amaçlamaktadır. mümkün olduğu kadar küçüktü. Aslında yöntemin ismi de buradan geliyor.

Şimdi başka bir önemli noktaya dönüyoruz: Yukarıda belirtildiği gibi, seçilen işlev oldukça basit olmalıdır - ancak bu tür birçok işlev de vardır: doğrusal , hiperbolik , üstel , logaritmik , ikinci dereceden vesaire. Ve tabii ki burada hemen "faaliyet alanını daraltmak" istiyorum. Araştırma için hangi fonksiyon sınıfını seçmeliyim? İlkel ama etkili bir teknik:

– En kolay yol noktaları tasvir etmektir çizim üzerinde ve konumlarını analiz edin. Düz bir çizgide koşma eğilimindeyseler, bir çizginin denklemi optimal değerlerle ve . Başka bir deyişle görev, karesel sapmaların toplamı en küçük olacak şekilde BÖYLE katsayıları bulmaktır.

Noktalar örneğin birlikte bulunuyorsa abartı ise doğrusal fonksiyonun zayıf bir yaklaşım vereceği açıktır. Bu durumda hiperbol denklemi için en “uygun” katsayıları arıyoruz – minimum kareler toplamını verenler .

Şimdi her iki durumda da bahsettiğimize dikkat edin. iki değişkenli fonksiyonlar, kimin argümanları aranan bağımlılık parametreleri:

Ve aslında standart bir problemi çözmemiz gerekiyor - bul iki değişkenli minimum fonksiyon.

Örneğimizi hatırlayalım: "depolama" noktalarının düz bir çizgide yer aldığını ve bu noktaların varlığına inanmak için her türlü nedenin bulunduğunu varsayalım. doğrusal bağımlılık perakende alanından elde edilen ciro. Sapmaların karesi toplamı olacak şekilde BÖYLE katsayıları “a” ve “be” bulalım. en küçüğüydü. Her şey her zamanki gibi - ilk önce 1. dereceden kısmi türevler. Buna göre doğrusallık kuralı Toplam simgesinin hemen altında ayırt edebilirsiniz:

Bu bilgiyi bir makale veya dönem ödevi için kullanmak istiyorsanız, kaynak listesindeki bağlantıya çok minnettar olacağım; bu tür ayrıntılı hesaplamaları birkaç yerde bulacaksınız:

Standart bir sistem oluşturalım:

Her denklemi "iki" azaltıyoruz ve ayrıca toplamları "parçalıyoruz":

Not : “a” ve “be”nin neden toplam simgesinin ötesine çıkarılabileceğini bağımsız olarak analiz edin. Bu arada, resmi olarak bu toplamla yapılabilir

Sistemi “uygulamalı” biçimde yeniden yazalım:

bundan sonra sorunumuzu çözecek algoritma ortaya çıkmaya başlıyor:

Noktaların koordinatlarını biliyor muyuz? Biliyoruz. Tutarlar bulabilir miyiz? Kolayca. En basitini yapalım iki bilinmeyenli iki doğrusal denklem sistemi(“a” ve “olmak”). Sistemi çözüyoruz, örneğin, Cramer'in yöntemi bunun sonucunda durağan bir nokta elde ederiz. Kontrol ediliyor bir ekstremum için yeterli koşul, bu noktada işlevin olduğunu doğrulayabiliriz tam olarak ulaşıyor minimum. Kontrol ek hesaplamalar içeriyor ve bu nedenle bunu perde arkasında bırakacağız (gerekirse eksik çerçeve görüntülenebilirBurada ) . Nihai sonucu çıkarıyoruz:

İşlev mümkün olan en iyi şekilde (en azından diğer herhangi bir doğrusal fonksiyonla karşılaştırıldığında) deneysel noktaları yakınlaştırır . Kabaca söylemek gerekirse grafiği bu noktalara mümkün olduğu kadar yakından geçer. Gelenekte ekonometri sonuçta ortaya çıkan yaklaşım fonksiyonuna da denir eşleştirilmiş doğrusal regresyon denklemi .

Söz konusu sorun büyük pratik öneme sahiptir. Örnek durumumuzda, Denk. hangi ticaret cirosunu tahmin etmenizi sağlar ("İgrek") mağaza satış alanının şu veya bu değerine sahip olacak (“x”in bir veya başka anlamı). Evet, ortaya çıkan tahmin yalnızca bir tahmin olacaktır, ancak çoğu durumda oldukça doğru olduğu ortaya çıkacaktır.

Hiçbir zorluk olmadığı için "gerçek" sayılarla sadece bir problemi analiz edeceğim - tüm hesaplamalar 7-8. sınıf okul müfredatı düzeyindedir. Vakaların yüzde 95'inde sizden yalnızca doğrusal bir fonksiyon bulmanız istenecektir, ancak makalenin en sonunda optimal hiperbol, üstel ve diğer bazı fonksiyonların denklemlerini bulmanın artık zor olmadığını göstereceğim.

Aslında geriye kalan tek şey vaat edilen güzellikleri dağıtmaktır - böylece bu tür örnekleri yalnızca doğru değil, aynı zamanda hızlı bir şekilde çözmeyi öğrenebilirsiniz. Standardı dikkatlice inceliyoruz:

Görev

İki gösterge arasındaki ilişkinin incelenmesi sonucunda aşağıdaki sayı çiftleri elde edildi:

En küçük kareler yöntemini kullanarak ampirik değere en iyi yaklaşan doğrusal fonksiyonu bulun. (deneyimli) veri. Kartezyen dikdörtgen koordinat sisteminde deneysel noktaların ve yaklaşık fonksiyonun grafiğinin oluşturulacağı bir çizim yapın . Ampirik ve teorik değerler arasındaki sapmaların karelerinin toplamını bulun. Özelliğin daha iyi olup olmayacağını öğrenin (en küçük kareler yöntemi açısından) Deneysel noktaları yaklaştırın.

Lütfen “x” anlamlarının doğal olduğunu ve bunun biraz sonra bahsedeceğim karakteristik anlamlı bir anlamı olduğunu unutmayın; ama elbette kesirli de olabilirler. Ayrıca belirli bir görevin içeriğine bağlı olarak hem “X” hem de “oyun” değerleri tamamen veya kısmen negatif olabilir. Bize "meçhul" bir görev verildi ve başlıyoruz çözüm:

Sistemin çözümü olarak optimal fonksiyonun katsayılarını buluyoruz:

Daha kompakt bir kayıt amacıyla, toplamanın 1'den .'ye kadar gerçekleştirildiği zaten açık olduğundan "sayaç" değişkeni çıkarılabilir.

Gerekli miktarları tablo halinde hesaplamak daha uygundur:


Hesaplamalar bir mikro hesap makinesinde yapılabilir, ancak Excel'i kullanmak çok daha iyidir - hem daha hızlı hem de hatasız; kısa bir video izleyin:

Böylece aşağıdakileri elde ederiz sistem:

Burada ikinci denklemi 3 ile çarpabilir ve 2.yi 1. denklemden terim bazında çıkar. Ancak bu şanstır; pratikte sistemler genellikle bir hediye değildir ve bu gibi durumlarda tasarruf sağlar Cramer'in yöntemi:
Bu, sistemin benzersiz bir çözümü olduğu anlamına gelir.

Hadi kontrol edelim. İstemediğinizi anlıyorum, ama neden kesinlikle gözden kaçırılmayacak hataları atlayasınız ki? Bulunan çözümü sistemdeki her denklemin sol tarafına koyalım:

Karşılık gelen denklemlerin sağ tarafları elde edilir, bu da sistemin doğru çözüldüğü anlamına gelir.

Böylece istenen yaklaşım fonksiyonu: – itibaren tüm doğrusal fonksiyonlar Deneysel verilere en iyi yaklaşan kişi odur.

Farklı doğrudan mağazanın cirosunun kendi alanına bağımlılığı, bulunan bağımlılık tersi (ilke “ne kadar çoksa o kadar az”) ve bu gerçek olumsuzluklarla hemen ortaya çıkıyor eğim. İşlev belirli bir göstergenin 1 birim artmasıyla bağımlı göstergenin değerinin azaldığını söyler ortalama olarak 0,65 birim arttı. Dedikleri gibi karabuğdayın fiyatı ne kadar yüksek olursa o kadar az satılır.

Yaklaşıklık fonksiyonunun grafiğini çizmek için iki değerini bulalım:

ve çizimi yürütün:

Oluşturulan düz çizgiye denir eğilim çizgisi (yani doğrusal bir trend çizgisi, yani genel durumda bir trendin mutlaka düz bir çizgi olması gerekmez). Herkes “trendde olmak” tabirine aşinadır ve bu terimin ek yorumlara ihtiyacı olmadığını düşünüyorum.

Sapmaların karelerinin toplamını hesaplayalım Ampirik ve teorik değerler arasında. Geometrik olarak bu, "ahududu" bölümlerinin uzunluklarının karelerinin toplamıdır. (ikisi o kadar küçük ki görülemiyor bile).

Hesaplamaları bir tabloda özetleyelim:


Yine manuel olarak da yapılabilirler; her ihtimale karşı, 1. nokta için bir örnek vereceğim:

ancak bunu zaten bilinen şekilde yapmak çok daha etkilidir:

Bir kez daha tekrarlıyoruz: Elde edilen sonucun anlamı nedir?İtibaren tüm doğrusal fonksiyonlar y fonksiyonu gösterge en küçüğüdür, yani ailesindeki en iyi yaklaşımdır. Ve bu arada, problemin son sorusu tesadüfi değil: ya önerilen üstel fonksiyon Deney noktalarını yakınlaştırmak daha iyi olur mu?

Karşılık gelen sapmaların kare toplamını bulalım - ayırt etmek için bunları "epsilon" harfiyle göstereceğim. Teknik tamamen aynı:


Ve yine, her ihtimale karşı, 1. nokta için hesaplamalar:

Excel'de standart işlevi kullanıyoruz EXP (söz dizimi Excel Yardımında bulunabilir).

Çözüm: , bu, üstel fonksiyonun deneysel noktalara düz bir çizgiden daha kötü bir şekilde yaklaştığı anlamına gelir .

Ancak burada şunu da belirtmek gerekir ki “daha ​​kötüsü” henüz anlamına gelmiyor ki bu kötü. Şimdi bu üstel fonksiyonun bir grafiğini oluşturdum - ve aynı zamanda noktaların yakınından da geçiyor - öyle ki analitik araştırma olmadan hangi fonksiyonun daha doğru olduğunu söylemek zordur.

Bu, çözümü tamamlıyor ve argümanın doğal değerleri sorusuna dönüyorum. Genellikle ekonomik veya sosyolojik olan çeşitli çalışmalarda ayları, yılları veya diğer eşit zaman aralıklarını numaralandırmak için doğal “X”ler kullanılır. Örneğin aşağıdaki sorunu düşünün:

Mağazanın yılın ilk yarısına ilişkin perakende cirosuna ilişkin aşağıdaki veriler mevcuttur:

Analitik düz çizgi hizalamasını kullanarak Temmuz ayı ciro hacmini belirleyin.

Evet, sorun değil: 1, 2, 3, 4, 5, 6 aylarını numaralandırıyoruz ve olağan algoritmayı kullanıyoruz, bunun sonucunda bir denklem elde ediyoruz - tek şey, zaman geldiğinde genellikle şunu kullanıyorlar: "te" harfi (bu kritik olmasa da). Ortaya çıkan denklem, yılın ilk yarısında ticaret cirosunun ortalama 27,74 adet arttığını gösteriyor. ayda. Temmuz ayı tahminlerini alalım (ay no. 7): d.e.

Ve bunun gibi sayısız görev var. İsteyenler ek bir hizmet olan benim hizmetimden yararlanabilirler. Excel hesap makinesi (demo versiyonu), Hangi analiz edilen sorunu neredeyse anında çözer! Programın çalışan versiyonu mevcut takasta veya için sembolik ücret.

Dersin sonunda diğer bazı türlerdeki bağımlılıkların bulunması hakkında kısa bilgi verilecektir. Temel yaklaşım ve çözüm algoritması aynı kaldığı için aslında anlatacak pek bir şey yok.

Deney noktalarının düzeninin bir hiperbole benzediğini varsayalım. Daha sonra, en iyi hiperbolün katsayılarını bulmak için fonksiyonun minimumunu bulmanız gerekir; herkes ayrıntılı hesaplamalar yapabilir ve benzer bir sisteme ulaşabilir:

Resmi teknik açıdan bakıldığında “doğrusal” bir sistemden elde edilir. (yıldız işaretiyle belirtelim)"x" yerine "x" yazın. Peki ya miktarlar? hesaplayın, ardından optimal “a” ve “be” katsayılarını hesaplayın elinizin altında.

Bu noktalara inanmak için her türlü neden varsa logaritmik bir eğri boyunca bulunur, ardından optimum değerleri bulmak için fonksiyonun minimumunu buluruz . Resmi olarak sistemde (*) şununla değiştirilmelidir:

Excel'de hesaplamalar yaparken işlevi kullanın LN. Göz önünde bulundurulan her durum için hesap makineleri oluşturmanın benim için özellikle zor olmayacağını itiraf ediyorum, ancak yine de hesaplamaları kendiniz "programlasanız" daha iyi olur. Yardımcı olacak ders videoları.

Üstel bağımlılıkta durum biraz daha karmaşıktır. Maddeyi doğrusal duruma indirgemek için fonksiyonun logaritmasını alıp şunu kullanırız: logaritmanın özellikleri:

Şimdi, ortaya çıkan fonksiyonu doğrusal fonksiyonla karşılaştırarak, sistemde (*) yerine , ve – ile değiştirilmesi gerektiği sonucuna varıyoruz. Kolaylık sağlamak için şunu belirtelim:

Lütfen sistemin ve'ye göre çözüldüğünü ve bu nedenle kökleri bulduktan sonra katsayıyı bulmayı unutmamanız gerektiğini unutmayın.

Deneysel noktaları yakınlaştırmak için optimal parabol , bulunmalı üç değişkenli minimum fonksiyon . Standart eylemleri gerçekleştirdikten sonra aşağıdaki "çalışmayı" elde ederiz sistem:

Evet elbette burada daha fazla miktar var ama en sevdiğiniz uygulamayı kullanırken hiç zorluk yaşanmıyor. Son olarak, Excel'i kullanarak hızlı bir şekilde kontrolü nasıl gerçekleştireceğinizi ve istediğiniz trend çizgisini nasıl oluşturacağınızı anlatacağım: bir dağılım grafiği oluşturun, fareyle noktalardan herhangi birini seçin ve sağ tıklayıp seçeneği seçin "Trend çizgisi ekle". Ardından grafik türünü seçin ve sekmede "Seçenekler" seçeneği etkinleştir "Denklemleri diyagramda göster". TAMAM

Her zamanki gibi yazıyı güzel bir cümleyle bitirmek istiyorum ve neredeyse “Trend olun!” yazıyordum. Fakat zamanla fikrini değiştirdi. Ve kalıplaşmış olduğu için değil. Kimse için nasıldır bilmiyorum ama ben aslında tanıtılan Amerika ve özellikle Avrupa trendini takip etmek istemiyorum =) Bu nedenle, her birinizin kendi çizgisine bağlı kalmasını diliyorum!

http://www.grandars.ru/student/vysshaya-matematika/metod-naimenshih-kvadratov.html

En küçük kareler yöntemi, en yaygın ve en gelişmiş yöntemlerden biridir. Doğrusal ekonometrik modellerin parametrelerini tahmin etmeye yönelik yöntemlerin basitliği ve etkinliği. Aynı zamanda, onu kullanırken bazı dikkatli olunmalıdır, çünkü onu kullanarak oluşturulan modeller, parametrelerinin kalitesine ilişkin bir takım gereksinimleri karşılamayabilir ve sonuç olarak süreç geliştirme kalıplarını "iyi" yansıtmayabilir. .

En küçük kareler yöntemini kullanarak doğrusal bir ekonometrik modelin parametrelerini tahmin etme prosedürünü daha ayrıntılı olarak ele alalım. Böyle bir model genel olarak denklem (1.2) ile temsil edilebilir:

y t = a 0 + a 1 x 1t +...+ a n x nt + ε t.

a 0 , a 1 ,..., a n parametrelerini tahmin ederken ilk veriler, bağımlı değişkenin değerlerinin bir vektörüdür sen= (y 1 , y 2 , ... , y T)" ve bağımsız değişkenlerin değerleri matrisi

bunlardan oluşan ilk sütun model katsayısına karşılık gelir.

En küçük kareler yöntemi, adını, bu yönteme dayanarak elde edilen parametre tahminlerinin karşılaması gereken temel prensibe dayanarak almıştır: model hatasının karelerinin toplamı minimum olmalıdır.

En küçük kareler yöntemini kullanarak problem çözme örnekleri

Örnek 2.1. Ticari işletmenin 12 mağazadan oluşan bir ağı vardır ve faaliyetlerine ilişkin bilgiler tabloda sunulmaktadır. 2.1.

İşletmenin yönetimi, yıllık cironun büyüklüğünün mağazanın perakende alanına nasıl bağlı olduğunu bilmek istiyor.

Tablo 2.1

Mağaza numarası Yıllık ciro, milyon ruble. Perakende alanı, bin m2
19,76 0,24
38,09 0,31
40,95 0,55
41,08 0,48
56,29 0,78
68,51 0,98
75,01 0,94
89,05 1,21
91,13 1,29
91,26 1,12
99,84 1,29
108,55 1,49

En küçük kareler çözümü. Mağazanın yıllık cirosu milyon ruble olsun; - mağazanın perakende alanı, bin m2.

Şekil 2.1. Örnek 2.1 için Dağılım Grafiği

Değişkenler arasındaki fonksiyonel ilişkinin biçimini belirlemek için bir dağılım diyagramı oluşturacağız (Şekil 2.1).

Dağılım diyagramına dayanarak, yıllık cironun perakende alanına pozitif yönde bağlı olduğu sonucuna varabiliriz (yani y arttıkça artacaktır). En uygun fonksiyonel bağlantı şekli doğrusal.

Daha fazla hesaplamaya yönelik bilgiler tabloda sunulmaktadır. 2.2. En küçük kareler yöntemini kullanarak doğrusal tek faktörlü ekonometrik modelin parametrelerini tahmin ediyoruz

Tablo 2.2

T y t x 1 ton yt 2 x 1t 2 x 1t yt
19,76 0,24 390,4576 0,0576 4,7424
38,09 0,31 1450,8481 0,0961 11,8079
40,95 0,55 1676,9025 0,3025 22,5225
41,08 0,48 1687,5664 0,2304 19,7184
56,29 0,78 3168,5641 0,6084 43,9062
68,51 0,98 4693,6201 0,9604 67,1398
75,01 0,94 5626,5001 0,8836 70,5094
89,05 1,21 7929,9025 1,4641 107,7505
91,13 1,29 8304,6769 1,6641 117,5577
91,26 1,12 8328,3876 1,2544 102,2112
99,84 1,29 9968,0256 1,6641 128,7936
108,55 1,49 11783,1025 2,2201 161,7395
S 819,52 10,68 65008,554 11,4058 858,3991
Ortalama 68,29 0,89

Böylece,

Dolayısıyla perakende alanının 1 bin m2 artmasıyla diğer koşullar eşit olduğunda ortalama yıllık ciro 67.8871 milyon ruble artıyor.

Örnek 2.2.Şirketin yönetimi, yıllık cironun yalnızca mağazanın satış alanına değil (bkz. örnek 2.1) değil aynı zamanda ortalama ziyaretçi sayısına da bağlı olduğunu fark etti. İlgili bilgiler tabloda sunulmaktadır. 2.3.

Tablo 2.3

Çözüm.Şunu belirtelim: Mağazanın günlük ortalama ziyaretçi sayısı bin kişi.

Değişkenler arasındaki fonksiyonel ilişkinin biçimini belirlemek için bir dağılım diyagramı oluşturacağız (Şekil 2.2).

Dağılım grafiğine dayanarak, yıllık cironun günlük ortalama ziyaretçi sayısına pozitif olarak bağlı olduğu sonucuna varabiliriz (yani, y arttıkça artacaktır). Fonksiyonel bağımlılığın şekli doğrusaldır.

Pirinç. 2.2. Örnek 2.2 için Dağılım Grafiği

Tablo 2.4

T x 2t x 2t 2 ytx2t x 1t x 2t
8,25 68,0625 163,02 1,98
10,24 104,8575 390,0416 3,1744
9,31 86,6761 381,2445 5,1205
11,01 121,2201 452,2908 5,2848
8,54 72,9316 480,7166 6,6612
7,51 56,4001 514,5101 7,3598
12,36 152,7696 927,1236 11,6184
10,81 116,8561 962,6305 13,0801
9,89 97,8121 901,2757 12,7581
13,72 188,2384 1252,0872 15,3664
12,27 150,5529 1225,0368 15,8283
13,92 193,7664 1511,016 20,7408
S 127,83 1410,44 9160,9934 118,9728
Ortalama 10,65

Genel olarak iki faktörlü bir ekonometrik modelin parametrelerinin belirlenmesi gerekmektedir.

y t = a 0 + a 1 x 1t + a 2 x 2t + ε t

Daha ileri hesaplamalar için gerekli bilgiler tabloda sunulmaktadır. 2.4.

En küçük kareler yöntemini kullanarak doğrusal iki faktörlü ekonometrik modelin parametrelerini tahmin edelim.

Böylece,

Katsayının tahmini =61,6583, diğer koşullar eşit olduğunda perakende alanında 1 bin m 2 artışla yıllık cironun ortalama 61,6583 milyon ruble artacağını gösteriyor.

Katsayı tahmini = 2,2748, diğer koşullar eşit olmak kaydıyla 1 bin kişi başına düşen ortalama ziyaretçi sayısının arttığını gösteriyor. günlük ciro ortalama 2,2748 milyon ruble artacak.

Örnek 2.3. Tabloda sunulan bilgileri kullanma. 2.2 ve 2.4, tek faktörlü ekonometrik modelin parametresini tahmin edin

mağazanın yıllık cirosunun merkezi değeri nerede, milyon ruble; - t'inci mağazaya gelen günlük ortalama ziyaretçi sayısının merkezi değeri, bin kişi. (bkz. örnekler 2.1-2.2).

Çözüm. Hesaplamalar için gerekli ek bilgiler tabloda sunulmaktadır. 2.5.

Tablo 2.5

-48,53 -2,40 5,7720 116,6013
-30,20 -0,41 0,1702 12,4589
-27,34 -1,34 1,8023 36,7084
-27,21 0,36 0,1278 -9,7288
-12,00 -2,11 4,4627 25,3570
0,22 -3,14 9,8753 -0,6809
6,72 1,71 2,9156 11,4687
20,76 0,16 0,0348 3,2992
22,84 -0,76 0,5814 -17,413
22,97 3,07 9,4096 70,4503
31,55 1,62 2,6163 51,0267
40,26 3,27 10,6766 131,5387
Miktar 48,4344 431,0566

(2.35) formülünü kullanarak şunu elde ederiz:

Böylece,

http://www.cleverstudents.ru/articles/mnk.html

Örnek.

Değişkenlerin değerlerine ilişkin deneysel veriler X Ve en tabloda verilmektedir.

Hizalamalarının bir sonucu olarak, fonksiyon elde edilir

Kullanma en küçük kareler yöntemi, bu verilere doğrusal bir bağımlılıkla yaklaşın y=ax+b(parametreleri bul A Ve B). İki çizgiden hangisinin (en küçük kareler yöntemi anlamında) deneysel verileri daha iyi hizaladığını bulun. Bir çizim yapın.

Çözüm.

Örneğimizde n=5. Gerekli katsayıların formüllerinde yer alan tutarların hesaplanmasında kolaylık sağlamak için tabloyu dolduruyoruz.

Tablonun dördüncü satırındaki değerler, her sayı için 2. satırdaki değerlerin 3. satırdaki değerlerle çarpılmasıyla elde edilir. Ben.

Tablonun beşinci satırındaki değerler, her sayı için 2. satırdaki değerlerin karesi alınarak elde edilir. Ben.

Tablonun son sütunundaki değerler satırlar arasındaki değerlerin toplamıdır.

Katsayıları bulmak için en küçük kareler yönteminin formüllerini kullanıyoruz A Ve B. Tablonun son sütunundaki karşılık gelen değerleri bunların yerine koyarız:

Buradan, y = 0,165x+2,184- istenen yaklaşık düz çizgi.

Hangi satırlardan hangisinin olduğunu bulmak için kalır y = 0,165x+2,184 veya orijinal verilere daha iyi yaklaşır, yani en küçük kareler yöntemini kullanarak tahmin yapar.

Kanıt.

Böylece bulunduğunda A Ve B Fonksiyon en küçük değeri alırsa, bu noktada fonksiyon için ikinci dereceden diferansiyelin ikinci dereceden formunun matrisinin olması gerekir. pozitif kesindi. Hadi gösterelim.

İkinci dereceden diferansiyel şu şekildedir:

yani

Bu nedenle, ikinci dereceden formun matrisi şu forma sahiptir:

ve elemanların değerleri bağlı değildir A Ve B.

Matrisin pozitif tanımlı olduğunu gösterelim. Bunu yapmak için açısal küçüklerin pozitif olması gerekir.

Birinci dereceden açısal minör . Eşitsizlik kesindir, çünkü noktalar

Deneysel verilere yaklaşım, deneysel olarak elde edilen verileri, orijinal değerlere (bir deney veya deney sırasında elde edilen veriler) en yakın şekilde geçen veya düğüm noktalarında çakışan bir analitik fonksiyonla değiştirmeye dayanan bir yöntemdir. Şu anda analitik bir fonksiyonu tanımlamanın iki yolu vardır:

Aşağıdakileri geçen n derecelik bir enterpolasyon polinomu oluşturarak tüm noktalardan doğrudan belirli bir veri dizisi. Bu durumda, yaklaşıklık fonksiyonu şu şekilde sunulur: Lagrange formunda bir enterpolasyon polinomu veya Newton formunda bir enterpolasyon polinomu.

n derecelik yaklaşık bir polinom oluşturarak noktaların hemen yakınında belirli bir veri dizisinden. Böylece, yaklaşıklaştırma fonksiyonu, deney sırasında ortaya çıkabilecek tüm rastgele gürültüyü (veya hataları) düzeltir: deney sırasında ölçülen değerler, kendi rastgele yasalarına göre dalgalanan rastgele faktörlere (ölçüm veya cihaz hataları, yanlışlık veya deneysel) bağlıdır. hatalar). Bu durumda yaklaşım fonksiyonu en küçük kareler yöntemi kullanılarak belirlenir.

En küçük kareler yöntemi(İngiliz literatüründe Sıradan En Küçük Kareler, OLS), belirli bir deneysel veri dizisindeki noktalara en yakın mesafede oluşturulan yaklaşım fonksiyonunun belirlenmesine dayanan matematiksel bir yöntemdir. Orijinal ve yaklaşık fonksiyonlar F(x)'in yakınlığı sayısal bir ölçümle belirlenir, yani: deneysel verilerin F(x) yaklaşım eğrisinden sapmalarının karelerinin toplamı en küçük olmalıdır.

En küçük kareler yöntemi kullanılarak oluşturulan yaklaşık eğri

En küçük kareler yöntemi kullanılır:

Denklem sayısının bilinmeyen sayısından fazla olduğu durumlarda aşırı belirlenmiş denklem sistemlerini çözmek;

Sıradan (aşırı belirlenmemiş) doğrusal olmayan denklem sistemleri durumunda çözüm bulmak;

Bazı yaklaşma fonksiyonlarıyla nokta değerlerine yaklaşmak.

En küçük kareler yöntemini kullanan yaklaşım fonksiyonu, belirli bir deneysel veri dizisinden hesaplanan yaklaşım fonksiyonunun minimum karesel sapmalarının toplamı koşulundan belirlenir. En küçük kareler yönteminin bu kriteri aşağıdaki ifadeyle yazılır:

Hesaplanan yaklaşım fonksiyonunun düğüm noktalarındaki değerleri,

Düğüm noktalarında belirli bir deneysel veri dizisi.

İkinci dereceden kriter, polinom yaklaşım fonksiyonlarıyla yaklaşım problemine benzersiz bir çözüm sağlayan, türevlenebilirlik gibi bir dizi "iyi" özelliğe sahiptir.

Problemin koşullarına bağlı olarak, yaklaşım fonksiyonu m dereceli bir polinomdur.

Yaklaştırma fonksiyonunun derecesi düğüm noktalarının sayısına bağlı değildir ancak boyutu her zaman belirli bir deneysel veri dizisinin boyutundan (nokta sayısından) daha az olmalıdır.

∙ Yaklaştırma fonksiyonunun derecesi m=1 ise tablo fonksiyonuna düz bir çizgiyle yaklaşırız (doğrusal regresyon).

∙ Yaklaştırma fonksiyonunun derecesi m=2 ise, tablo fonksiyonuna ikinci dereceden bir parabol (ikinci dereceden yaklaşım) ile yaklaşırız.

∙ Yaklaştırma fonksiyonunun derecesi m=3 ise tablo fonksiyonuna kübik parabol (kübik yaklaşım) ile yaklaşırız.

Genel durumda, verilen tablo değerleri için m dereceli yaklaşık bir polinom oluşturmak gerektiğinde, tüm düğüm noktaları üzerindeki sapmaların karelerinin toplamının minimumunun koşulu aşağıdaki biçimde yeniden yazılır:

- m dereceli yaklaşık polinomun bilinmeyen katsayıları;

Belirtilen tablo değerlerinin sayısı.

Bir fonksiyonun minimumunun varlığı için gerekli koşul, bilinmeyen değişkenlere göre kısmi türevlerinin sıfıra eşit olmasıdır. . Sonuç olarak aşağıdaki denklem sistemini elde ederiz:

Ortaya çıkan doğrusal denklem sistemini dönüştürelim: parantezleri açın ve serbest terimleri ifadenin sağ tarafına taşıyın. Sonuç olarak, ortaya çıkan doğrusal cebirsel ifadeler sistemi aşağıdaki biçimde yazılacaktır:

Bu doğrusal cebirsel ifadeler sistemi matris biçiminde yeniden yazılabilir:

Sonuç olarak, m+1 bilinmeyenlerden oluşan, m+1 boyutunda bir doğrusal denklem sistemi elde edildi. Bu sistem, doğrusal cebirsel denklemleri çözmek için herhangi bir yöntem (örneğin, Gauss yöntemi) kullanılarak çözülebilir. Çözümün bir sonucu olarak, yaklaşıklık fonksiyonunun orijinal verilerden sapmalarının karelerinin minimum toplamını sağlayan, yaklaşıklık fonksiyonunun bilinmeyen parametreleri bulunacaktır; mümkün olan en iyi ikinci dereceden yaklaşım. Kaynak verinin tek bir değeri bile değişse tüm katsayıların değerlerinin tamamen kaynak veri tarafından belirlendiğinden dolayı değişeceği unutulmamalıdır.

Kaynak verilerine doğrusal bağımlılıkla yaklaşım

(doğrusal regresyon)

Örnek olarak, doğrusal bağımlılık biçiminde belirtilen yaklaşım fonksiyonunu belirleme tekniğini ele alalım. En küçük kareler yöntemine göre sapmaların kareleri toplamının minimumunun koşulu aşağıdaki biçimde yazılır:

Tablo düğümlerinin koordinatları;

Doğrusal bağımlılık olarak belirtilen, yaklaşık fonksiyonun bilinmeyen katsayıları.

Bir fonksiyonun minimumunun varlığı için gerekli koşul, bilinmeyen değişkenlere göre kısmi türevlerinin sıfıra eşit olmasıdır. Sonuç olarak aşağıdaki denklem sistemini elde ederiz:

Ortaya çıkan doğrusal denklem sistemini dönüştürelim.

Ortaya çıkan doğrusal denklem sistemini çözüyoruz. Yaklaşım fonksiyonunun analitik formdaki katsayıları aşağıdaki şekilde belirlenir (Cramer yöntemi):

Bu katsayılar, yaklaşık fonksiyonun karelerinin toplamını verilen tablo değerlerinden (deneysel veriler) en aza indirme kriterine uygun olarak doğrusal bir yaklaşım fonksiyonunun oluşturulmasını sağlar.

En küçük kareler yöntemini uygulamaya yönelik algoritma

1. Başlangıç ​​verileri:

Ölçüm sayısı N ile belirtilen bir deneysel veri dizisi

Yaklaşan polinomun (m) derecesi belirtilir

2. Hesaplama algoritması:

2.1. Katsayılar, boyutları olan bir denklem sistemi oluşturmak için belirlenir.

Denklem sisteminin katsayıları (denklemin sol tarafı)

- denklem sisteminin kare matrisinin sütun numarasının indeksi

Doğrusal denklem sisteminin serbest terimleri (denklemin sağ tarafı)

- denklem sisteminin kare matrisinin satır numarasının indeksi

2.2. Boyutlu doğrusal denklem sisteminin oluşturulması.

2.3. M dereceli yaklaşık bir polinomun bilinmeyen katsayılarını belirlemek için bir doğrusal denklem sisteminin çözülmesi.

2.4 Tüm düğüm noktalarında yaklaşık polinomun orijinal değerlerden karesel sapmalarının toplamının belirlenmesi.

Sapmaların karelerinin toplamının bulunan değeri mümkün olan minimum değerdir.

Diğer fonksiyonları kullanarak yaklaşım

Orijinal verilere en küçük kareler yöntemine göre yaklaşılırken bazen yaklaşıklaştırma işlevi olarak logaritmik fonksiyonun, üstel fonksiyonun ve güç fonksiyonunun kullanıldığı unutulmamalıdır.

Logaritmik yaklaşım

Yaklaşım fonksiyonunun formun logaritmik fonksiyonu tarafından verildiği durumu ele alalım:

En küçük kareler yöntemi Regresyon denkleminin parametrelerini tahmin etmek için kullanılır.
Satır sayısı (kaynak verileri)

Özellikler arasındaki stokastik ilişkileri incelemenin yöntemlerinden biri regresyon analizidir.
Regresyon analizi, başka bir (veya diğer) değişkenin (faktör nitelikleri) değeri biliniyorsa, rastgele bir değişkenin ortalama değerinin (sonuç niteliği) bulunduğu bir regresyon denkleminin türetilmesidir. Aşağıdaki adımları içerir:

  1. bağlantı biçiminin seçimi (analitik regresyon denkleminin türü);
  2. denklem parametrelerinin tahmini;
  3. analitik regresyon denkleminin kalitesinin değerlendirilmesi.
Çoğu zaman, özelliklerin istatistiksel ilişkisini tanımlamak için doğrusal bir form kullanılır. Doğrusal ilişkilere odaklanma, parametrelerinin açık ekonomik yorumuyla, değişkenlerin sınırlı varyasyonuyla ve çoğu durumda doğrusal olmayan ilişki biçimlerinin hesaplamaları gerçekleştirmek için (logaritma veya değişkenlerin değiştirilmesiyle) doğrusal bir biçime dönüştürülmesi gerçeğiyle açıklanır. .
Doğrusal ikili ilişki durumunda regresyon denklemi şu formu alacaktır: y i =a+b·x i +u i . Bu denklemin a ve b parametreleri x ve y istatistiksel gözlem verilerinden tahmin edilir. Böyle bir değerlendirmenin sonucu aşağıdaki denklemdir: burada a ve b parametrelerinin tahminleri, regresyon denkleminden (hesaplanan değer) elde edilen sonuçtaki özelliğin (değişken) değeridir.

Parametreleri tahmin etmek için en sık kullanılanlar en küçük kareler yöntemi (LSM).
En küçük kareler yöntemi, regresyon denkleminin parametrelerinin en iyi (tutarlı, verimli ve tarafsız) tahminlerini sağlar. Ancak yalnızca rastgele terim (u) ve bağımsız değişken (x) ile ilgili belirli varsayımlar karşılanırsa (bkz. OLS varsayımları).

En küçük kareler yöntemini kullanarak bir doğrusal çift denklemin parametrelerini tahmin etme problemişu şekildedir: sonuçta ortaya çıkan özelliğin gerçek değerlerinin - hesaplanan değerlerden y i - sapmalarının karelerinin toplamının minimum olduğu bu tür parametre tahminlerini elde etmek.
Resmi olarak OLS testişu şekilde yazılabilir: .

En küçük kareler yöntemlerinin sınıflandırılması

  1. En küçük kareler yöntemi.
  2. Maksimum olabilirlik yöntemi (normal bir klasik doğrusal regresyon modeli için, regresyon kalıntılarının normalliği varsayılır).
  3. Genelleştirilmiş en küçük kareler OLS yöntemi, hataların otokorelasyonu ve değişen varyans durumunda kullanılır.
  4. Ağırlıklandırılmış en küçük kareler yöntemi (heteroskedastik artıklara sahip özel bir OLS durumu).

Konuyu açıklayalım klasik en küçük kareler yöntemi grafiksel olarak. Bunu yapmak için dikdörtgen bir koordinat sisteminde gözlemsel verilere (x i, y i, i=1;n) dayalı bir dağılım grafiği oluşturacağız (böyle bir dağılım grafiğine korelasyon alanı denir). Korelasyon alanının noktalarına en yakın düz çizgiyi seçmeye çalışalım. En küçük kareler yöntemine göre çizgi, korelasyon alanı noktaları ile bu çizgi arasındaki dikey mesafelerin karelerinin toplamı minimum olacak şekilde seçilir.

Bu problemin matematiksel gösterimi: .
y i ve x i =1...n değerleri tarafımızdan bilinmektedir; bunlar gözlemsel verilerdir. S fonksiyonunda sabitleri temsil ederler. Bu fonksiyondaki değişkenler - , parametrelerinin gerekli tahminleridir. İki değişkenli bir fonksiyonun minimumunu bulmak için, bu fonksiyonun her bir parametre için kısmi türevlerini hesaplamak ve bunları sıfıra eşitlemek gerekir; .
Sonuç olarak, 2 normal doğrusal denklemden oluşan bir sistem elde ederiz:
Bu sistemi çözerek gerekli parametre tahminlerini buluyoruz:

Regresyon denkleminin parametrelerinin hesaplanmasının doğruluğu, miktarlar karşılaştırılarak kontrol edilebilir (hesaplamaların yuvarlanmasından dolayı bazı tutarsızlıklar olabilir).
Parametre tahminlerini hesaplamak için Tablo 1'i oluşturabilirsiniz.
Regresyon katsayısı b'nin işareti ilişkinin yönünü gösterir (b>0 ise ilişki doğrudandır, b ise ilişkidir)<0, то связь обратная). Величина b показывает на сколько единиц изменится в среднем признак-результат -y при изменении признака-фактора - х на 1 единицу своего измерения.
Resmi olarak, a parametresinin değeri, x'in sıfıra eşit olduğu y'nin ortalama değeridir. Nitelik faktörü sıfır değere sahip değilse ve olamıyorsa, a parametresinin yukarıdaki yorumu anlamlı değildir.

Özellikler arasındaki ilişkinin yakınlığının değerlendirilmesi doğrusal çift korelasyon katsayısı - r x,y kullanılarak gerçekleştirilir. Aşağıdaki formül kullanılarak hesaplanabilir: . Ek olarak doğrusal çift korelasyon katsayısı, regresyon katsayısı b aracılığıyla belirlenebilir: .
Doğrusal çift korelasyon katsayısının kabul edilebilir değerleri aralığı –1 ile +1 arasındadır. Korelasyon katsayısının işareti ilişkinin yönünü gösterir. Eğer r x, y >0 ise bağlantı doğrudandır; eğer rx, y<0, то связь обратная.
Bu katsayı büyüklük olarak birliğe yakınsa, özellikler arasındaki ilişki oldukça yakın doğrusal bir ilişki olarak yorumlanabilir. Eğer modülü bir ê r x , y ê =1 ise, o zaman özellikler arasındaki ilişki fonksiyonel doğrusaldır. Eğer x ve y özellikleri doğrusal olarak bağımsızsa, o zaman r x,y 0'a yakındır.
r x,y'yi hesaplamak için Tablo 1'i de kullanabilirsiniz.

Tablo 1

N gözlemx bensen benx ben ∙y ben
1 x 1y 1x 1 y 1
2 x 2y 2x 2 y 2
...
Nxne-nx n y n
Sütun Toplamı∑x∑y∑xy
Ortalama değer
Ortaya çıkan regresyon denkleminin kalitesini değerlendirmek için teorik belirleme katsayısını hesaplayın - R 2 yx:

,
burada d2, regresyon denklemiyle açıklanan y'nin varyansıdır;
e 2 - y'nin artık (regresyon denklemiyle açıklanmayan) varyansı;
s 2 y - y'nin toplam (toplam) varyansı.
Belirleme katsayısı, toplam değişkenlik (dağılım) y içindeki regresyonla (ve dolayısıyla x faktörüyle) açıklanan sonuçta ortaya çıkan y özelliğinin varyasyonunun (dağılımının) oranını karakterize eder. R 2 yx belirleme katsayısı 0'dan 1'e kadar değerler alır. Buna göre 1-R 2 yx değeri, modelde dikkate alınmayan diğer faktörlerin etkisinin ve spesifikasyon hatalarının neden olduğu varyans y oranını karakterize eder.
Eşleştirilmiş doğrusal regresyonla R 2 yx =r 2 yx.

Örnek.

Değişkenlerin değerlerine ilişkin deneysel veriler X Ve en tabloda verilmektedir.

Hizalamalarının bir sonucu olarak, fonksiyon elde edilir

Kullanma en küçük kareler yöntemi, bu verilere doğrusal bir bağımlılıkla yaklaşın y=ax+b(parametreleri bul A Ve B). İki çizgiden hangisinin (en küçük kareler yöntemi anlamında) deneysel verileri daha iyi hizaladığını bulun. Bir çizim yapın.

En küçük kareler yönteminin (LSM) özü.

Görev, iki değişkenli fonksiyonun geçerli olduğu doğrusal bağımlılık katsayılarını bulmaktır. A Ve B en küçük değeri alır. Yani verilen A Ve B Deneysel verilerin bulunan düz çizgiden sapmalarının karelerinin toplamı en küçük olacaktır. En küçük kareler yönteminin asıl amacı budur.

Dolayısıyla örneği çözmek, iki değişkenli bir fonksiyonun ekstremumunu bulmaya indirgenir.

Katsayıları bulmak için formüllerin türetilmesi.

İki bilinmeyenli iki denklemden oluşan bir sistem derlenip çözülür. Bir fonksiyonun kısmi türevlerini bulma değişkenlere göre A Ve B, bu türevleri sıfıra eşitliyoruz.

Ortaya çıkan denklem sistemini herhangi bir yöntemi kullanarak çözeriz (örneğin ikame yöntemiyle veya Cramer'in yöntemi) ve en küçük kareler yöntemini (LSM) kullanarak katsayıları bulmak için formüller elde edin.

Verilen A Ve B işlev en küçük değeri alır. Bu gerçeğin kanıtı veriliyor sayfanın sonundaki metinde aşağıda.

En küçük kareler yönteminin tamamı budur. Parametreyi bulma formülü A toplamları ve parametreyi içerir N- deneysel veri miktarı. Bu tutarların değerlerinin ayrı ayrı hesaplanmasını öneririz. Katsayı B Hesaplamadan sonra bulunan A.

Orijinal örneği hatırlamanın zamanı geldi.

Çözüm.

Örneğimizde n=5. Gerekli katsayıların formüllerinde yer alan tutarların hesaplanmasında kolaylık sağlamak için tabloyu dolduruyoruz.

Tablonun dördüncü satırındaki değerler, her sayı için 2. satırdaki değerlerin 3. satırdaki değerlerle çarpılmasıyla elde edilir. Ben.

Tablonun beşinci satırındaki değerler, her sayı için 2. satırdaki değerlerin karesi alınarak elde edilir. Ben.

Tablonun son sütunundaki değerler satırlar arasındaki değerlerin toplamıdır.

Katsayıları bulmak için en küçük kareler yönteminin formüllerini kullanıyoruz A Ve B. Tablonun son sütunundaki karşılık gelen değerleri bunların yerine koyarız:

Buradan, y = 0,165x+2,184- istenen yaklaşık düz çizgi.

Hangi satırlardan hangisinin olduğunu bulmak için kalır y = 0,165x+2,184 veya orijinal verilere daha iyi yaklaşır, yani en küçük kareler yöntemini kullanarak tahmin yapar.

En küçük kareler yönteminde hata tahmini.

Bunu yapmak için orijinal verilerin bu çizgilerden sapmalarının karelerinin toplamını hesaplamanız gerekir. Ve , daha küçük bir değer, en küçük kareler yöntemi anlamında orijinal verilere daha iyi yaklaşan bir çizgiye karşılık gelir.

O zamandan beri düz y = 0,165x+2,184 orijinal verilere daha iyi yaklaşır.

En küçük kareler (LS) yönteminin grafiksel gösterimi.

Grafiklerde her şey açıkça görülüyor. Kırmızı çizgi bulunan düz çizgidir y = 0,165x+2,184, mavi çizgi , pembe noktalar orijinal verilerdir.

Uygulamada, çeşitli süreçleri (özellikle ekonomik, fiziksel, teknik, sosyal) modellerken, fonksiyonların yaklaşık değerlerini belirli sabit noktalarda bilinen değerlerinden hesaplamak için bir veya başka bir yöntem yaygın olarak kullanılır.

Bu tür fonksiyon yaklaşımı problemi sıklıkla ortaya çıkar:

    deney sonucunda elde edilen tablo verilerini kullanarak, incelenen sürecin karakteristik miktarlarının değerlerini hesaplamak için yaklaşık formüller oluştururken;

    sayısal entegrasyon, türev alma, diferansiyel denklem çözme vb.;

    fonksiyonların değerlerini dikkate alınan aralığın ara noktalarında hesaplamak gerekiyorsa;

    dikkate alınan aralığın dışındaki bir sürecin karakteristik miktarlarının değerlerini belirlerken, özellikle tahmin yaparken.

Bir tablo tarafından belirtilen belirli bir süreci modellemek için, en küçük kareler yöntemine dayalı olarak bu süreci yaklaşık olarak tanımlayan bir fonksiyon oluşturursak, buna yaklaşıklık fonksiyonu (regresyon) adı verilecek ve yaklaşıklık fonksiyonlarının oluşturulması probleminin kendisi çağrılacaktır. bir yakınsama problemi.

Bu makalede, MS Excel paketinin bu tür bir sorunu çözmeye yönelik yetenekleri tartışılmaktadır, ayrıca tablolanmış işlevler için (regresyon analizinin temeli olan) regresyonlar oluşturmak (oluşturmak) için yöntemler ve teknikler sağlanmaktadır.

Excel'in regresyon oluşturmak için iki seçeneği vardır.

    İncelenen süreç karakteristiği için bir veri tablosu temelinde oluşturulan bir diyagrama seçilen regresyonların (eğilim çizgileri) eklenmesi (yalnızca bir diyagram oluşturulmuşsa kullanılabilir);

    Excel çalışma sayfasının yerleşik istatistiksel işlevlerini kullanarak, doğrudan kaynak veri tablosuna dayalı olarak regresyonlar (eğilim çizgileri) elde etmenize olanak tanır.

Grafiğe trend çizgileri ekleme

Bir süreci tanımlayan ve bir diyagramla temsil edilen bir veri tablosu için Excel'in aşağıdakileri yapmanıza olanak tanıyan etkili bir regresyon analiz aracı vardır:

    en küçük kareler yöntemini temel alarak inşa edin ve diyagrama, incelenen süreci değişen doğruluk dereceleriyle modelleyen beş tür regresyon ekleyin;

    oluşturulan regresyon denklemini diyagrama ekleyin;

    Seçilen regresyonun grafikte görüntülenen verilere uygunluk derecesini belirleyin.

Excel, grafik verilerine dayanarak, denklemle belirtilen doğrusal, polinom, logaritmik, güç, üstel regresyon türlerini elde etmenize olanak tanır:

y = y(x)

burada x, genellikle bir dizi doğal sayının (1; 2; 3; ...) değerlerini alan ve örneğin incelenen sürecin zamanının geri sayımını (özellikler) üreten bağımsız bir değişkendir.

1 . Doğrusal regresyon, değerleri sabit bir oranda artan veya azalan özellikleri modellemek için iyidir. Bu, incelenen süreç için oluşturulacak en basit modeldir. Aşağıdaki denkleme göre inşa edilir:

y = mx + b

burada m, doğrusal regresyon eğiminin x eksenine teğetidir; b - doğrusal regresyonun ordinat ekseni ile kesişme noktasının koordinatı.

2 . Bir polinom eğilim çizgisi, birkaç farklı uç noktaya (maksimum ve minimum) sahip özellikleri tanımlamak için kullanışlıdır. Polinom derecesinin seçimi, incelenen özelliğin ekstremum sayısına göre belirlenir. Dolayısıyla, ikinci dereceden bir polinom, yalnızca bir maksimumu veya minimumu olan bir süreci iyi tanımlayabilir; üçüncü dereceden polinom - en fazla iki ekstrema; dördüncü dereceden polinom - en fazla üç ekstrema vb.

Bu durumda trend çizgisi aşağıdaki denkleme göre oluşturulur:

y = c0 + c1x + c2x2 + c3x3 + c4x4 + c5x5 + c6x6

burada c0, c1, c2,... c6 katsayıları inşaat sırasında değerleri belirlenen sabitlerdir.

3 . Logaritmik eğilim çizgisi, değerleri başlangıçta hızla değişen ve daha sonra yavaş yavaş sabitlenen özelliklerin modellenmesinde başarıyla kullanılır.

y = c ln(x) + b

4 . Güç yasası eğilim çizgisi, incelenen ilişkinin değerleri büyüme oranındaki sürekli bir değişiklikle karakterize ediliyorsa iyi sonuçlar verir. Böyle bir bağımlılığın bir örneği, bir arabanın eşit şekilde hızlandırılmış hareketinin grafiğidir. Verilerde sıfır veya negatif değerler varsa güç trend çizgisi kullanamazsınız.

Denkleme göre oluşturulmuştur:

y = c xb

burada b, c katsayıları sabittir.

5 . Verilerdeki değişim hızı sürekli arttığında üstel eğilim çizgisi kullanılmalıdır. Sıfır veya negatif değer içeren veriler için bu tür bir yaklaşım da uygulanamaz.

Denkleme göre oluşturulmuştur:

y = c ebx

burada b, c katsayıları sabittir.

Bir eğilim çizgisi seçerken Excel, yaklaşımın güvenilirliğini karakterize eden R2 değerini otomatik olarak hesaplar: R2 değeri birliğe ne kadar yakınsa, eğilim çizgisi incelenen sürece o kadar güvenilir bir şekilde yaklaşır. Gerektiğinde R2 değeri her zaman grafikte görüntülenebilir.

Formülle belirlenir:

Bir veri serisine trend çizgisi eklemek için:

    bir dizi veriye dayalı olarak bir grafiği etkinleştirin, yani grafik alanının içine tıklayın. Diyagram öğesi ana menüde görünecektir;

    Bu öğeye tıkladıktan sonra ekranda Trend çizgisi ekle komutunu seçmeniz gereken bir menü görünecektir.

Aynı eylemler, fare imlecini veri serilerinden birine karşılık gelen grafiğin üzerine getirip sağ tıklatarak kolayca uygulanabilir; Görüntülenen içerik menüsünde Trend çizgisi ekle komutunu seçin. Tür sekmesi açıkken ekranda Trend çizgisi iletişim kutusu görünecektir (Şekil 1).

Bundan sonra ihtiyacınız var:

Tür sekmesinde gerekli eğilim çizgisi türünü seçin (Doğrusal tür varsayılan olarak seçilidir). Polinom türü için Derece alanında seçilen polinomun derecesini belirtin.

1 . Yerleşik seriler alanı, söz konusu grafikteki tüm veri serilerini listeler. Belirli bir veri serisine trend çizgisi eklemek için Dahili seri alanında adını seçin.

Gerekirse Parametreler sekmesine (Şekil 2) giderek trend çizgisi için aşağıdaki parametreleri ayarlayabilirsiniz:

    Yaklaşık (düzleştirilmiş) eğrinin adı alanında trend çizgisinin adını değiştirin.

    Tahmin alanında tahmin için dönem sayısını (ileri veya geri) ayarlayın;

    trend çizgisinin denklemini grafik alanında görüntüleyin; bunun için "denklemi grafikte göster" onay kutusunu etkinleştirmeniz gerekir;

    yaklaşık güvenilirlik değeri R2'yi diyagram alanında görüntüleyin; bunun için Yaklaşım güvenilirlik değerini diyagrama yerleştir (R^2) onay kutusunu etkinleştirmeniz gerekir;

    trend çizgisinin Y ekseni ile kesişme noktasını ayarlayın; bunun için eğrinin Y ekseni ile bir noktada kesişmesi için onay kutusunu etkinleştirmeniz gerekir;

    İletişim kutusunu kapatmak için Tamam düğmesini tıklayın.

Zaten çizilmiş bir trend çizgisini düzenlemeye başlamanın üç yolu vardır:

    daha önce trend çizgisini seçtikten sonra Format menüsünden Seçilen trend çizgisi komutunu kullanın;

    trend çizgisine sağ tıklanarak çağrılan içerik menüsünden Trend çizgisini formatla komutunu seçin;

    trend çizgisine çift tıklayın.

Ekranda üç sekme içeren Trend Çizgisi Formatı iletişim kutusu görünecektir (Şekil 3): Görünüm, Tür, Parametreler ve son ikisinin içeriği, Trend Çizgisi iletişim kutusunun benzer sekmeleriyle tamamen örtüşmektedir (Şekil 1). -2). Görünüm sekmesinde çizgi türünü, rengini ve kalınlığını ayarlayabilirsiniz.

Daha önce çizilmiş bir trend çizgisini silmek için silinecek trend çizgisini seçin ve Sil tuşuna basın.

Dikkate alınan regresyon analiz aracının avantajları şunlardır:

    bir veri tablosu oluşturmadan grafikler üzerinde bir trend çizgisi oluşturmanın göreceli kolaylığı;

    önerilen trend çizgisi türlerinin oldukça geniş bir listesi ve bu liste en sık kullanılan regresyon türlerini içerir;

    incelenen sürecin davranışını keyfi (sağduyu sınırları dahilinde) ileri ve geri adımlarla tahmin etme yeteneği;

    trend çizgisi denklemini analitik biçimde elde etme yeteneği;

    Gerekirse, yaklaşımın güvenilirliğine ilişkin bir değerlendirme elde etme olasılığı.

Dezavantajları aşağıdakileri içerir:

    bir trend çizgisinin oluşturulması yalnızca bir dizi veri üzerine kurulu bir diyagram varsa gerçekleştirilir;

    elde edilen eğilim çizgisi denklemlerine dayanarak incelenen karakteristik için veri serisi oluşturma süreci biraz karmaşıktır: gerekli regresyon denklemleri, orijinal veri serisinin değerlerindeki her değişiklikle birlikte, ancak yalnızca grafik alanı içinde güncellenir. eski çizgi denklemi temelinde oluşturulan veri serisi değişmeden kalırken;

    PivotChart raporlarında grafiğin veya ilişkili PivotTable raporunun görünümünü değiştirmek mevcut eğilim çizgilerini korumaz; bu, eğilim çizgileri çizmeden veya PivotChart raporunu başka şekilde biçimlendirmeden önce rapor düzeninin gerekli gereksinimleri karşıladığından emin olmanız gerektiği anlamına gelir.

Eğilim çizgileri, grafik, histogram, düz standartlaştırılmamış alan grafikleri, çubuk grafikler, dağılım grafikleri, kabarcık grafikleri ve hisse senedi grafikleri gibi grafiklerde sunulan veri serilerini tamamlamak için kullanılabilir.

3B, normalleştirilmiş, radar, pasta ve halka grafiklerindeki veri serilerine trend çizgileri ekleyemezsiniz.

Excel'in yerleşik işlevlerini kullanma

Excel'de ayrıca grafik alanının dışındaki trend çizgilerini çizmek için bir regresyon analiz aracı da bulunur. Bu amaç için kullanılabilecek çok sayıda istatistiksel çalışma sayfası işlevi vardır, ancak bunların tümü yalnızca doğrusal veya üstel regresyonlara izin verir.

Excel'in doğrusal regresyon oluşturmak için çeşitli işlevleri vardır, özellikle:

    TREND;

  • EĞİM ve KESME.

Üstel bir trend çizgisi oluşturmak için çeşitli işlevlerin yanı sıra, özellikle:

    LGRFPRIBL.

TREND ve BÜYÜME işlevlerini kullanarak regresyon oluşturma tekniklerinin neredeyse aynı olduğunu belirtmek gerekir. Aynı şey LINEST ve LGRFPRIBL işlev çifti için de söylenebilir. Bu dört işlev için bir değerler tablosu oluşturmak, regresyon oluşturma sürecini biraz karmaşıklaştıran dizi formülleri gibi Excel özelliklerini kullanır. Ayrıca, bizim görüşümüze göre doğrusal regresyon oluşturmanın en kolay şekilde SLOPE ve INTERCEPT işlevleri kullanılarak gerçekleştirildiğine dikkat edin; bunlardan birincisi doğrusal regresyonun eğimini belirler ve ikincisi, y üzerindeki regresyon tarafından kesilen parçayı belirler. -eksen.

Regresyon analizi için yerleşik işlevler aracının avantajları şunlardır:

    eğilim çizgilerini tanımlayan tüm yerleşik istatistiksel işlevler için incelenmekte olan karakteristiğe ait veri serilerinin oluşturulmasına yönelik oldukça basit, tek tip bir süreç;

    oluşturulan veri serilerine dayalı olarak trend çizgileri oluşturmak için standart metodoloji;

    Gerekli sayıda ileri veya geri adımla incelenen sürecin davranışını tahmin etme yeteneği.

Dezavantajları arasında Excel'in diğer (doğrusal ve üstel hariç) eğilim çizgileri türlerini oluşturmak için yerleşik işlevlere sahip olmaması yer alır. Bu durum çoğu zaman incelenen sürecin yeterince doğru bir modelinin seçilmesine ve gerçeğe yakın tahminlerin elde edilmesine izin vermez. Ayrıca TREND ve BÜYÜME fonksiyonları kullanıldığında trend çizgilerinin denklemleri bilinmemektedir.

Yazarların, regresyon analizinin gidişatını herhangi bir bütünlük derecesiyle sunmaya çalışmadıklarına dikkat edilmelidir. Ana görevi, yaklaşım problemlerini çözerken Excel paketinin yeteneklerini belirli örnekler kullanarak göstermektir; Regresyonlar ve tahminler oluşturmak için Excel'in hangi etkili araçlara sahip olduğunu gösterin; regresyon analizi konusunda kapsamlı bilgiye sahip olmayan bir kullanıcı tarafından bile bu tür problemlerin nasıl nispeten kolay çözülebileceğini göstermektedir.

Belirli sorunları çözme örnekleri

Listelenen Excel araçlarını kullanarak belirli sorunları çözmeye bakalım.

Sorun 1

Bir motorlu taşımacılık işletmesinin 1995-2002 dönemine ilişkin kârına ilişkin bir veri tablosu ile. aşağıdakileri yapmanız gerekir:

    Bir diyagram oluşturun.

    Grafiğe doğrusal ve polinom (ikinci dereceden ve kübik) eğilim çizgileri ekleyin.

    Eğilim çizgileri denklemlerini kullanarak, 1995-2004 yılları için her bir eğilim çizgisi için işletme karlarına ilişkin tablo halinde veriler elde edin.

    İşletmenin 2003 ve 2004 yılı karı için bir tahmin yapın.

Sorun çözümü

    Excel çalışma sayfasının A4:C11 hücreleri aralığına, Şekil 2'de gösterilen çalışma sayfasını girin. 4.

    B4:C11 hücre aralığını seçtikten sonra bir diyagram oluşturuyoruz.

    Oluşturulan diyagramı etkinleştiriyoruz ve yukarıda açıklanan yönteme göre Trend Çizgisi iletişim kutusunda trend çizgisi türünü seçtikten sonra (bkz. Şekil 1), diyagrama dönüşümlü olarak doğrusal, karesel ve kübik trend çizgileri ekliyoruz. Aynı iletişim kutusunda, Parametreler sekmesini açın (bkz. Şekil 2), yaklaşık (düzleştirilmiş) eğrinin adı alanına, eklenen trendin adını girin ve İleriye yönelik tahmin: dönemler alanına, değeri 2, çünkü iki yıl sonrası için kar tahmini yapılması planlanıyor. Regresyon denklemini ve yaklaşım güvenilirlik değeri R2'yi diyagram alanında görüntülemek için denklemi ekranda göster onay kutularını etkinleştirin ve yaklaşım güvenilirlik değerini (R^2) diyagrama yerleştirin. Daha iyi görsel algı için, Trend Çizgisi Formatı iletişim kutusunun Görünüm sekmesini kullandığımız oluşturulan trend çizgilerinin türünü, rengini ve kalınlığını değiştiriyoruz (bkz. Şekil 3). Eklenen trend çizgileri ile ortaya çıkan diyagram, Şekil 1'de gösterilmektedir. 5.

    1995-2004 yılları için her bir trend çizgisi için işletme karlarına ilişkin tablo halinde veri elde etmek.

Şekil 2'de sunulan trend çizgisi denklemlerini kullanalım. 5. Bunu yapmak için D3:F3 aralığındaki hücrelere seçilen trend çizgisinin türü hakkında metin bilgilerini girin: Doğrusal trend, Karesel trend, Kübik trend. Daha sonra, D4 hücresine doğrusal regresyon formülünü girin ve doldurma işaretini kullanarak bu formülü göreli referanslarla D5:D13 hücre aralığına kopyalayın. D4:D13 hücre aralığından doğrusal regresyon formülüne sahip her hücrenin, A4:A13 aralığından karşılık gelen bir hücreye argüman olarak sahip olduğuna dikkat edilmelidir. Benzer şekilde, ikinci dereceden regresyon için E4:E13 hücre aralığını doldurun ve kübik regresyon için F4:F13 hücre aralığını doldurun. Böylece işletmenin 2003 ve 2004 yılı kârına ilişkin bir tahmin derlendi. üç trendi kullanıyor. Ortaya çıkan değer tablosu Şekil 2'de gösterilmektedir. 6.

    Bir diyagram oluşturun.

    Sorun 2

    Grafiğe logaritmik, güç ve üstel eğilim çizgileri ekleyin.

    Elde edilen trend çizgilerinin denklemlerini ve her biri için R2 yaklaşımının güvenilirlik değerlerini türetin.

    Trend çizgisi denklemlerini kullanarak, 1995-2002 yılları için her bir trend çizgisi için işletmenin kârına ilişkin tablo halinde veriler elde edin.

Sorun çözümü

Problem 1'in çözümünde verilen metodolojiyi takip ederek, logaritmik, güç ve üstel eğilim çizgilerinin eklendiği bir diyagram elde ediyoruz (Şekil 7). Daha sonra, elde edilen trend çizgisi denklemlerini kullanarak, 2003 ve 2004 yılları için öngörülen değerleri de içeren, işletmenin karı için bir değerler tablosu dolduruyoruz. (Şekil 8).

Şek. 5 ve Şek. Logaritmik eğilime sahip modelin, yaklaşım güvenilirliğinin en düşük değerine karşılık geldiği görülebilir.

R2 = 0,8659

R2'nin en yüksek değerleri polinom eğilimi olan modellere karşılık gelir: ikinci dereceden (R2 = 0,9263) ve kübik (R2 = 0,933).

Sorun 3

Görev 1'de verilen, bir motorlu taşımacılık kuruluşunun 1995-2002 dönemine ilişkin kârına ilişkin veri tablosuyla aşağıdaki adımları uygulamanız gerekir.

    TREND ve BÜYÜME işlevlerini kullanarak doğrusal ve üstel eğilim çizgileri için veri serileri elde edin.

    TREND ve BÜYÜME işlevlerini kullanarak işletmenin 2003 ve 2004 yılı kârına ilişkin bir tahmin yapın.

    Orijinal veriler ve elde edilen veri serileri için bir diyagram oluşturun.

Sorun çözümü

Problem 1 için çalışma sayfasını kullanalım (bkz. Şekil 4). TREND işleviyle başlayalım:

    işletmenin kârına ilişkin bilinen verilere karşılık gelen TREND fonksiyonunun değerleriyle doldurulması gereken D4:D11 hücre aralığını seçin;

    Ekle menüsünden İşlev komutunu çağırın. Görüntülenen İşlev Sihirbazı iletişim kutusunda İstatistik kategorisinden TREND işlevini seçin ve ardından Tamam düğmesine tıklayın. Aynı işlem standart araç çubuğundaki (Fonksiyon Ekle) düğmesine tıklanarak da yapılabilir.

    Görüntülenen İşlev Bağımsız Değişkenleri iletişim kutusunda Bilinen_değerler_y alanına C4:C11 hücre aralığını girin; Bilinen_değerler_x alanında - B4:B11 hücre aralığı;

    Girilen formülü bir dizi formülüne dönüştürmek için ++ tuş birleşimini kullanın.

Formül çubuğuna girdiğimiz formül şu şekilde görünecektir: =(TREND(C4:C11,B4:B11)).

Sonuç olarak, D4:D11 hücre aralığı TREND fonksiyonunun karşılık gelen değerleriyle doldurulur (Şekil 9).

İşletmenin 2003 ve 2004 yılı kârına ilişkin tahmin yapmak. gerekli:

    TREND fonksiyonu tarafından tahmin edilen değerlerin girileceği D12:D13 hücre aralığını seçin.

    TREND işlevini çağırın ve beliren İşlev Bağımsız Değişkenleri iletişim kutusunda Bilinen_değerler_y alanına C4:C11 hücre aralığını girin; Bilinen_değerler_x alanında - B4:B11 hücre aralığı; ve New_values_x alanında - B12:B13 hücre aralığı.

    Ctrl + Shift + Enter tuş kombinasyonunu kullanarak bu formülü bir dizi formülüne dönüştürün.

    Girilen formül şu şekilde görünecektir: =(TREND(C4:C11;B4:B11;B12:B13)) ve D12:D13 hücre aralığı, TREND fonksiyonunun öngörülen değerleriyle doldurulacaktır (bkz. 9).

Veri serisi, doğrusal olmayan bağımlılıkların analizinde kullanılan ve doğrusal karşılığı TREND ile tamamen aynı şekilde çalışan BÜYÜME işlevi kullanılarak benzer şekilde doldurulur.

Şekil 10'da formül görüntüleme modundaki tablo gösterilmektedir.

İlk veriler ve elde edilen veri serileri için, Şekil 1'de gösterilen diyagram. 11.

Sorun 4

Bir motorlu taşıt işletmesinin sevkıyat hizmeti tarafından cari ayın 1'inden 11'ine kadar olan süre için hizmet taleplerinin alınmasına ilişkin veri tablosu ile aşağıdaki işlemleri gerçekleştirmelisiniz.

    Doğrusal regresyon için veri serileri alma: EĞİM ve KESME NOKTASI işlevlerini kullanma; DOT işlevini kullanarak.

    LGRFPRIBL işlevini kullanarak üstel regresyon için bir dizi veri elde edin.

    Yukarıdaki işlevleri kullanarak, içinde bulunulan ayın 12'sinden 14'üne kadar olan dönem için sevk hizmetine başvuruların alınmasına ilişkin bir tahmin yapın.

    Orijinal ve alınan veri serileri için bir diyagram oluşturun.

Sorun çözümü

TREND ve BÜYÜME işlevlerinden farklı olarak, yukarıda listelenen işlevlerin (EĞİM, KESME NOKTASI, DİZGİ, LGRFPRIB) hiçbirinin regresyon olmadığını unutmayın. Bu işlevler yalnızca gerekli regresyon parametrelerini belirleyen destekleyici bir rol oynar.

EĞİLİM, KESME NOKTASI, DİZGİ, LGRFPRIB fonksiyonları kullanılarak oluşturulan doğrusal ve üstel regresyonlar için, TREND ve BÜYÜME fonksiyonlarına karşılık gelen doğrusal ve üstel regresyonların aksine, denklemlerinin görünümü her zaman bilinir.

1 . Denklemi kullanarak doğrusal bir regresyon oluşturalım:

y = mx+b

regresyon eğimi m, SLOPE işlevi tarafından belirlenir ve serbest terim b, KESMENOKTASI işlevi tarafından belirlenir.

Bunu yapmak için aşağıdaki eylemleri gerçekleştiriyoruz:

    orijinal tabloyu A4:B14 hücre aralığına girin;

    m parametresinin değeri C19 hücresinde belirlenecektir. İstatistik kategorisinden Eğim işlevini seçin; bilinen_değerler_y alanına B4:B14 hücre aralığını ve bilinen_değerler_x alanına A4:A14 hücre aralığını girin.

    Formül C19 hücresine girilecektir: =EĞİM(B4:B14,A4:A14);

    Daha sonra, C4 hücresine doğrusal regresyon formülünü şu biçimde girin: =$C*A4+$D. Bu formülde C19 ve D19 hücreleri mutlak referanslarla yazılmıştır (olası kopyalama sırasında hücre adresi değişmemelidir). Mutlak referans işareti $, klavyeden veya imleci hücre adresinin üzerine getirdikten sonra F4 tuşunu kullanarak yazılabilir.

2 Doldurma tutamacını kullanarak bu formülü C4:C17 hücre aralığına kopyalayın. Gerekli veri serisini elde ediyoruz (Şekil 12). Uygulama sayısının tam sayı olması nedeniyle Hücre Formatı penceresinin Sayı sekmesinde ondalık basamak sayısını içeren sayı biçimini 0 olarak ayarlamanız gerekmektedir.

y = mx+b

. Şimdi denklem tarafından verilen doğrusal bir regresyon oluşturalım:

DOT işlevini kullanarak.

    Bunu yapmak için:

    DOT işlevini C20:D20: =(LINEST(B4:B14,A4:A14)) hücre aralığına bir dizi formülü olarak girin. Sonuç olarak, C20 hücresinde m parametresinin değerini ve D20 hücresinde b parametresinin değerini elde ederiz;

    formülü D4 hücresine girin: =$C*A4+$D;

3 doldurma işaretini kullanarak bu formülü D4:D17 hücre aralığına kopyalayın ve istenen veri serisini elde edin.

. Aşağıdaki denklemle üstel bir regresyon oluşturuyoruz:

    LGRFPRIBL işlevi kullanılarak benzer şekilde gerçekleştirilir:

    C21:D21 hücre aralığında LGRFPRIBL fonksiyonunu bir dizi formülü olarak giriyoruz: =( LGRFPRIBL (B4:B14,A4:A14)). Bu durumda m parametresinin değeri C21 hücresinde, b parametresinin değeri D21 hücresinde belirlenecek;

    formül E4 hücresine girilir: =$D*$C^A4;

doldurma işaretçisi kullanılarak bu formül, üstel regresyona yönelik veri serilerinin yerleştirileceği E4:E17 hücre aralığına kopyalanır (bkz. Şekil 12).

Şek. Şekil 13'te gerekli hücre aralıklarıyla kullandığımız fonksiyonları ve formülleri görebileceğiniz bir tablo gösterilmektedir. Büyüklük 2 R isminde.

belirleme katsayısı

Bir regresyon bağımlılığı oluşturma görevi, R katsayısının maksimum değeri aldığı model (1)'in m katsayılarının vektörünü bulmaktır.

R'nin önemini değerlendirmek için aşağıdaki formül kullanılarak hesaplanan Fisher F testi kullanılır: N Nerede

- numune büyüklüğü (deney sayısı);

k, model katsayılarının sayısıdır. N Ve Eğer F veri için bazı kritik değerleri aşarsa k

Böylece, R'nin önemi yalnızca değeriyle değil, aynı zamanda deney sayısı ile modelin katsayıları (parametreleri) sayısı arasındaki oranla da belirlenir. Aslında, basit bir doğrusal model için n=2 için korelasyon oranı 1'e eşittir (tek bir düz çizgi her zaman bir düzlemdeki 2 noktadan çizilebilir). Bununla birlikte, eğer deneysel veriler rastgele değişkenlerse, böyle bir R değerine büyük bir dikkatle güvenilmelidir. Genellikle anlamlı R ve güvenilir regresyon elde etmek için deney sayısının model katsayılarının sayısını (n>k) önemli ölçüde aşmasını sağlamaya çalışırlar.

Doğrusal bir regresyon modeli oluşturmak için ihtiyacınız olan:

1) deneysel verileri içeren n satır ve m sütundan oluşan bir liste hazırlayın (çıkış değerini içeren sütun) e listede ilk veya son olmalıdır); Örneğin bir önceki görevin verilerini alalım, “Dönem No.” diye bir sütun ekleyelim, dönem sayılarını 1'den 12'ye kadar numaralandıralım. (bunlar değerler olacaktır) X)

2) Veri/Veri Analizi/Regresyon menüsüne gidin

"Araçlar" menüsünde "Veri Analizi" öğesi eksikse, aynı menüdeki "Eklentiler" öğesine gidip "Analiz paketi" onay kutusunu işaretlemelisiniz.

3) "Regresyon" iletişim kutusunda şunu ayarlayın:

· giriş aralığı Y;

· giriş aralığı X;

· çıktı aralığı - hesaplama sonuçlarının yerleştirileceği aralığın sol üst hücresi (bunların yeni bir çalışma sayfasına yerleştirilmesi önerilir);

4) "Tamam"a tıklayın ve sonuçları analiz edin.

100 rupi ilk siparişe bonus

İşin türünü seçin Diploma çalışması Ders çalışması Özet Yüksek lisans tezi Uygulama raporu Makale Raporu İnceleme Test çalışması Monografi Problem çözme İş planı Soru cevapları Yaratıcı çalışma Deneme Çizim Denemeler Çeviri Sunumlar Yazma Diğer Metnin benzersizliğini arttırma Yüksek lisans tezi Laboratuvar çalışması Çevrimiçi yardım

Fiyatı öğren

En küçük kareler yöntemi, zaman serilerini hizalamak, rastgele değişkenler arasındaki korelasyon biçimini belirlemek vb. için kullanılan matematiksel (matematiksel-istatistiksel) bir tekniktir. Belirli bir olguyu tanımlayan fonksiyonun daha basit bir fonksiyonla tahmin edilmesinden oluşur. Ayrıca, ikincisi, gözlenen noktalardaki fonksiyonun gerçek seviyelerinin hizalanmış olanlardan standart sapması (bkz. Dağılım) en küçük olacak şekilde seçilir.

Örneğin, mevcut verilere göre ( xi,evet) (Ben = 1, 2, ..., N) böyle bir eğri inşa edilir sen = A + bx minimum sapmaların kare toplamının elde edildiği yer

yani iki parametreye bağlı bir fonksiyon en aza indirilir: A- ordinat eksenindeki segment ve B- düz çizgi eğimi.

Bir fonksiyonun minimizasyonu için gerekli koşulları veren denklemler S(A,B), denir normal denklemler. Yaklaşım fonksiyonları olarak yalnızca doğrusal (düz bir çizgi boyunca hizalama) değil, aynı zamanda ikinci dereceden, parabolik, üstel vb. de kullanılır. Bir zaman serisini düz bir çizgi boyunca hizalamaya ilişkin bir örnek için, bkz. M.2, burada uzaklıkların karesi toplamı ( sen 1 – ȳ 1)2 + (sen 2 – ȳ 2)2 .... en küçüğüdür ve ortaya çıkan düz çizgi, belirli bir göstergenin zaman içindeki dinamik gözlem serisinin eğilimini en iyi şekilde yansıtır.

Tarafsız OLS tahminleri için, regresyon analizinin en önemli koşulunu yerine getirmek gerekli ve yeterlidir: faktörlere bağlı olarak rastgele bir hatanın matematiksel beklentisi sıfıra eşit olmalıdır. Bu koşul özellikle şu durumlarda karşılanır: 1. Rastgele hataların matematiksel beklentisi sıfırsa ve 2. Faktörler ve rastgele hatalar bağımsız rastgele değişkenlerse. Sabit, sıfırdan farklı bir matematiksel hata beklentisini üstlendiğinden, ilk koşulun sabitli modeller için her zaman yerine getirildiği düşünülebilir. İkinci koşul - faktörlerin dışsallığı koşulu - temeldir. Bu özellik karşılanmazsa, hemen hemen tüm tahminlerin son derece yetersiz olacağını varsayabiliriz: tutarlı bile olmayacaklar (yani, çok büyük miktarda veri bile bu durumda yüksek kaliteli tahminler elde etmemize izin vermiyor) ).

Regresyon denklemlerinin parametrelerinin istatistiksel olarak tahmin edilmesinde en yaygın yöntem en küçük kareler yöntemidir. Bu yöntem, verilerin doğasına ve modelin sonuçlarına ilişkin bir takım varsayımlara dayanmaktadır. Bunlardan başlıcaları, orijinal değişkenlerin bağımlı ve bağımsız olarak açık bir şekilde bölünmesi, denklemlerde yer alan faktörlerin korelasyonsuzluğu, ilişkinin doğrusallığı, artıkların otokorelasyonunun olmaması, matematiksel beklentilerinin sıfıra ve sabite eşitliğidir. dağılım.

OLS'nin ana hipotezlerinden biri, ei sapmalarının varyanslarının eşitliği varsayımıdır; serinin ortalama (sıfır) değeri etrafında yayılmaları istikrarlı bir değer olmalıdır. Bu özelliğe homoskedastisite denir. Uygulamada sapmaların varyansları çoğunlukla eşit değildir, yani heteroskedastisite gözlenir. Bunun çeşitli nedenleri olabilir. Örneğin kaynak verilerde hatalar olabilir. Kaynak bilgilerinde zaman zaman ortaya çıkan, sayıların sırasındaki hatalar gibi yanlışlıklar, sonuçlar üzerinde önemli bir etkiye sahip olabilir. Çoğunlukla, bağımlı değişkenin (değişkenler) büyük değerlerinde daha büyük bir sapma yayılımı єi gözlenir. Veriler önemli bir hata içeriyorsa, doğal olarak hatalı verilerden hesaplanan model değerinin sapması da büyük olacaktır. Bu hatadan kurtulmak için bu verilerin hesaplama sonuçlarına olan katkısını azaltmamız, onlara diğerlerine göre daha az ağırlık vermemiz gerekiyor. Bu fikir ağırlıklı OLS'de uygulanmıştır.



Makaleyi beğendin mi? Arkadaşlarınızla paylaşın!