Mengapa metode kuadrat terkecil digunakan? Kasus model polinomial

Metode kuadrat terkecil

Di pelajaran terakhir topik ini, kita akan berkenalan dengan aplikasi paling terkenal FNP, yang banyak diterapkan dalam berbagai bidang ilmu pengetahuan dan kegiatan praktis. Bisa fisika, kimia, biologi, ekonomi, sosiologi, psikologi, dan lain sebagainya. Atas kehendak takdir, saya sering kali harus berurusan dengan perekonomian, oleh karena itu hari ini saya akan mengatur untuk Anda perjalanan ke negara menakjubkan bernama Ekonometrika=) ...Bagaimana bisa kamu tidak menginginkannya?! Di sana sangat bagus – Anda hanya perlu mengambil keputusan! ...Tetapi yang mungkin Anda inginkan adalah mempelajari cara memecahkan masalah metode kuadrat terkecil. Dan terutama pembaca yang rajin akan belajar menyelesaikannya tidak hanya secara akurat, tetapi juga SANGAT CEPAT ;-) Tapi pertama-tama pernyataan umum mengenai permasalahan tersebut+ contoh terlampir:

Misalkan dalam suatu mata pelajaran tertentu dipelajari indikator-indikator yang mempunyai ekspresi kuantitatif. Pada saat yang sama, ada banyak alasan untuk percaya bahwa indikator bergantung pada indikatornya. Asumsi ini dapat berupa hipotesis ilmiah atau berdasarkan akal sehat dasar. Namun, mari kita kesampingkan ilmu pengetahuan dan jelajahi area yang lebih menarik, yaitu toko kelontong. Mari kita nyatakan dengan:

– area ritel toko kelontong, m2,
– omset tahunan toko kelontong, juta rubel.

Jelas sekali bahwa semakin besar area toko, dalam banyak kasus, omzetnya akan semakin besar.

Misalkan setelah melakukan observasi/eksperimen/perhitungan/menari dengan rebana kita mempunyai data numerik:

Dengan toko kelontong, saya pikir semuanya jelas: - ini adalah area toko pertama, - omset tahunannya, - area toko ke-2, - omset tahunannya, dll. Omong-omong, sama sekali tidak perlu memiliki akses ke materi rahasia - penilaian omset perdagangan yang cukup akurat dapat diperoleh melalui statistik matematika. Namun, jangan sampai kita teralihkan, kursus spionase komersial sudah berbayar =)

Data tabel juga dapat ditulis dalam bentuk titik-titik dan digambarkan dalam bentuk yang sudah dikenal sistem kartesius .

Mari kita jawab pertanyaan penting: Berapa banyak poin yang dibutuhkan untuk penelitian kualitatif?

Lebih banyak lebih baik. Set minimum yang dapat diterima terdiri dari 5-6 poin. Selain itu, jika jumlah datanya kecil, hasil yang “anomali” tidak dapat dimasukkan ke dalam sampel. Jadi, misalnya, sebuah toko elit kecil bisa mendapatkan penghasilan yang jauh lebih besar daripada “rekan-rekannya”, sehingga mendistorsi pola umum yang perlu Anda temukan!



Sederhananya, kita perlu memilih suatu fungsi, jadwal yang melewati sedekat mungkin dengan titik-titik tersebut . Fungsi ini disebut memperkirakan (perkiraan - perkiraan) atau fungsi teoritis . Secara umum, “pesaing” yang jelas segera muncul di sini - polinomial tingkat tinggi, yang grafiknya melewati SEMUA titik. Namun opsi ini rumit dan seringkali salah. (karena grafik akan “berputar” sepanjang waktu dan tidak mencerminkan tren utama).

Dengan demikian, fungsi yang dicari harus cukup sederhana dan pada saat yang sama mencerminkan ketergantungan secara memadai. Seperti yang Anda duga, salah satu metode untuk menemukan fungsi tersebut disebut metode kuadrat terkecil. Pertama, mari kita lihat esensinya secara umum. Misalkan beberapa fungsi mendekati data eksperimen:


Bagaimana cara mengevaluasi keakuratan perkiraan ini? Mari kita hitung juga perbedaan (deviasi) antara nilai eksperimen dan nilai fungsional (kami mempelajari gambarnya). Pikiran pertama yang terlintas dalam pikiran adalah memperkirakan seberapa besar jumlahnya, namun masalahnya adalah perbedaannya bisa negatif (Misalnya, ) dan penyimpangan-penyimpangan akibat penjumlahan tersebut akan saling meniadakan. Oleh karena itu, sebagai perkiraan keakuratan perkiraan, perlu diambil jumlahnya modul penyimpangan:

atau runtuh: (kalau-kalau ada yang tidak tahu: adalah ikon penjumlahan, dan – variabel tambahan “penghitung”, yang mengambil nilai dari 1 hingga ) .

Dengan memperkirakan titik-titik eksperimen dengan fungsi yang berbeda, kita akan memperoleh nilai yang berbeda, dan tentunya, jika jumlah ini lebih kecil, fungsi tersebut lebih akurat.

Metode seperti itu ada dan disebut metode modulus terkecil. Namun, dalam praktiknya, hal ini menjadi lebih luas metode kuadrat terkecil, di mana kemungkinan nilai negatif dihilangkan bukan dengan modul, tetapi dengan mengkuadratkan deviasi:



, setelah itu upaya diarahkan untuk memilih fungsi sedemikian rupa sehingga jumlah simpangan kuadrat adalah sekecil mungkin. Sebenarnya dari sinilah nama metode tersebut berasal.

Dan sekarang kita kembali ke poin penting lainnya: seperti disebutkan di atas, fungsi yang dipilih seharusnya cukup sederhana - tetapi ada juga banyak fungsi seperti itu: linier , hiperbolis , eksponensial , logaritmik , kuadrat dll. Dan tentunya di sini saya ingin langsung “mengurangi bidang kegiatan”. Kelas fungsi manakah yang harus saya pilih untuk penelitian? Teknik primitif namun efektif:

– Cara termudah adalah dengan menggambarkan titik pada gambar dan menganalisis lokasinya. Jika mereka cenderung berjalan dalam garis lurus, maka Anda harus mencarinya persamaan suatu garis dengan nilai optimal dan . Dengan kata lain, tugasnya adalah mencari koefisien TERSEBUT sehingga jumlah simpangan kuadratnya paling kecil.

Jika titik-titiknya letaknya, misalnya sepanjang hiperbola, maka jelaslah bahwa fungsi linier akan memberikan perkiraan yang buruk. Dalam hal ini, kami mencari koefisien yang paling “menguntungkan” untuk persamaan hiperbola – yang memberikan jumlah kuadrat minimum .

Sekarang perhatikan bahwa dalam kedua kasus yang sedang kita bicarakan fungsi dua variabel, yang argumennya parameter ketergantungan yang dicari:

Dan pada dasarnya kita perlu memecahkan masalah standar - temukan fungsi minimum dua variabel.

Mari kita ingat contoh kita: misalkan titik-titik “penyimpanan” cenderung terletak pada garis lurus dan ada banyak alasan untuk mempercayai keberadaannya. ketergantungan linier omset dari ruang ritel. Mari kita cari koefisien TERSEBUT “a” dan “menjadi” sehingga merupakan jumlah deviasi kuadrat adalah yang terkecil. Semuanya seperti biasa - pertama Turunan parsial orde pertama. Menurut aturan linearitas Anda dapat membedakannya tepat di bawah ikon penjumlahan:

Jika Anda ingin menggunakan informasi ini untuk esai atau makalah, saya akan sangat berterima kasih atas tautan dalam daftar sumber. Anda akan menemukan perhitungan mendetail di beberapa tempat:

Mari buat sistem standar:

Kami mengurangi setiap persamaan dengan "dua" dan, sebagai tambahan, "memecah" jumlahnya:

Catatan : menganalisis secara mandiri mengapa “a” dan “be” dapat dikeluarkan dari ikon penjumlahan. Ngomong-ngomong, secara formal ini bisa dilakukan dengan penjumlahan

Mari kita menulis ulang sistem dalam bentuk “terapan”:

setelah itu algoritma untuk memecahkan masalah kita mulai muncul:

Tahukah kita koordinat titik-titik tersebut? Kami tahu. Jumlah bisakah kita menemukannya? Dengan mudah. Mari kita buat yang paling sederhana sistem dua persamaan linear dalam dua hal yang tidak diketahui(“a” dan “menjadi”). Kami memecahkan sistem, misalnya, metode Cramer, sebagai hasilnya kita memperoleh titik stasioner. Memeriksa kondisi cukup untuk ekstrem, kita dapat memverifikasi bahwa pada titik ini fungsinya mencapai dengan tepat minimum. Pemeriksaan tersebut melibatkan perhitungan tambahan dan oleh karena itu kami akan meninggalkannya di belakang layar (jika perlu, bingkai yang hilang dapat dilihatDi Sini ) . Kami menarik kesimpulan akhir:

Fungsi dengan cara terbaik (setidaknya dibandingkan dengan fungsi linier lainnya) mendekatkan titik percobaan . Secara kasar, grafiknya mendekati titik-titik ini. Dalam tradisi ekonometrika fungsi perkiraan yang dihasilkan juga disebut persamaan regresi linier berpasangan .

Masalah yang sedang dipertimbangkan sangat penting secara praktis. Dalam contoh situasi kita, Persamaan. memungkinkan Anda memprediksi perputaran perdagangan apa ("Igrek") toko akan memiliki nilai tertentu dari area penjualan (satu atau lain arti dari "x"). Ya, ramalan yang dihasilkan hanya berupa ramalan, namun dalam banyak kasus ternyata cukup akurat.

Saya akan menganalisis satu soal saja dengan bilangan “nyata”, karena tidak ada kesulitan di dalamnya - semua perhitungan berada pada level kurikulum sekolah kelas 7-8. Dalam 95 persen kasus, Anda akan diminta untuk mencari fungsi linier saja, tetapi di akhir artikel saya akan menunjukkan bahwa tidak sulit lagi mencari persamaan hiperbola optimal, eksponensial, dan beberapa fungsi lainnya.

Faktanya, yang tersisa hanyalah mendistribusikan barang yang dijanjikan - sehingga Anda dapat belajar memecahkan contoh-contoh tersebut tidak hanya secara akurat, tetapi juga dengan cepat. Kami mempelajari standar dengan cermat:

Tugas

Dari hasil mempelajari hubungan antara dua indikator, diperoleh pasangan angka sebagai berikut:

Dengan menggunakan metode kuadrat terkecil, temukan fungsi linier yang paling mendekati fungsi empiris (berpengalaman) data. Buatlah gambar untuk membuat titik-titik percobaan dan grafik fungsi aproksimasi dalam sistem koordinat persegi panjang Cartesian . Temukan jumlah deviasi kuadrat antara nilai empiris dan teoritis. Cari tahu apakah fiturnya lebih baik (dari sudut pandang metode kuadrat terkecil) mendekatkan titik percobaan.

Harap dicatat bahwa arti “x” adalah wajar, dan ini memiliki arti makna yang khas, yang akan saya bicarakan nanti; tapi tentu saja bisa juga pecahan. Selain itu, bergantung pada konten tugas tertentu, nilai "X" dan "permainan" bisa negatif seluruhnya atau sebagian. Ya, kami telah diberi tugas yang “tak berwajah”, dan kami memulainya larutan:

Kami menemukan koefisien fungsi optimal sebagai solusi sistem:

Agar pencatatan lebih ringkas maka variabel “counter” dapat dihilangkan, karena sudah jelas bahwa penjumlahan dilakukan dari 1 sampai .

Lebih mudah untuk menghitung jumlah yang diperlukan dalam bentuk tabel:


Penghitungan dapat dilakukan pada mikrokalkulator, tetapi lebih baik menggunakan Excel - lebih cepat dan tanpa kesalahan; tonton video singkatnya:

Jadi, kita mendapatkan yang berikut ini sistem:

Di sini Anda dapat mengalikan persamaan kedua dengan 3 dan kurangi suku ke-2 dari persamaan ke-1 dengan suku. Tapi ini adalah keberuntungan - dalam praktiknya, sistem seringkali bukan sebuah anugerah, dan dalam kasus seperti itu sistem menyelamatkan metode Cramer:
, yang berarti sistem memiliki solusi unik.

Mari kita periksa. Saya memahami bahwa Anda tidak menginginkannya, tetapi mengapa melewatkan kesalahan yang tidak dapat dilewatkan sama sekali? Mari kita substitusikan solusi yang ditemukan ke ruas kiri setiap persamaan sistem:

Ruas kanan persamaan yang bersesuaian diperoleh, yang berarti sistem diselesaikan dengan benar.

Jadi, fungsi aproksimasi yang diinginkan: – dari semua fungsi linier Dialah yang paling mendekati data eksperimen.

Berbeda dengan langsung ketergantungan omset toko terhadap luasnya, ketergantungan yang ditemukan adalah balik (prinsip “semakin banyak, semakin sedikit”), dan fakta ini langsung terungkap dari sisi negatifnya lereng. Fungsi memberitahu kita bahwa dengan kenaikan suatu indikator tertentu sebesar 1 satuan, maka nilai indikator terikatnya menurun rata-rata sebesar 0,65 unit. Seperti kata pepatah, semakin tinggi harga soba, semakin sedikit penjualannya.

Untuk memplot fungsi aproksimasi, carilah dua nilainya:

dan jalankan gambarnya:

Garis lurus yang dibangun disebut garis tren (yaitu garis tren linier, yaitu pada kasus umum, suatu tren belum tentu berupa garis lurus). Semua orang pasti familiar dengan ungkapan “sedang tren”, dan menurut saya istilah ini tidak memerlukan komentar tambahan.

Mari kita hitung jumlah simpangan kuadrat antara nilai empiris dan teoritis. Secara geometris, ini adalah jumlah kuadrat panjang segmen “raspberry”. (dua di antaranya sangat kecil sehingga tidak terlihat).

Mari kita rangkum perhitungannya dalam sebuah tabel:


Sekali lagi dapat dilakukan secara manual; untuk berjaga-jaga, saya akan memberikan contoh untuk poin pertama:

tetapi jauh lebih efektif melakukannya dengan cara yang sudah diketahui:

Kami ulangi sekali lagi: Apa arti dari hasil yang diperoleh? Dari semua fungsi linier fungsi kamu indikatornya paling kecil, yaitu dalam keluarganya merupakan perkiraan terbaik. Dan di sini, omong-omong, pertanyaan terakhir dari masalah ini bukanlah suatu kebetulan: bagaimana jika fungsi eksponensial yang diusulkan apakah lebih baik mendekatkan titik percobaan?

Mari kita cari jumlah simpangan kuadrat yang sesuai - untuk membedakannya, saya akan menyatakannya dengan huruf "epsilon". Tekniknya sama persis:


Dan sekali lagi, untuk berjaga-jaga, perhitungan untuk poin pertama:

Di Excel kami menggunakan fungsi standar pengalaman (sintaks dapat ditemukan di Bantuan Excel).

Kesimpulan: , yang berarti bahwa fungsi eksponensial mendekati titik-titik eksperimen lebih buruk daripada garis lurus .

Namun di sini perlu dicatat bahwa yang “lebih buruk” adalah belum berarti, itu buruk. Sekarang saya telah membuat grafik dari fungsi eksponensial ini - dan grafik tersebut juga mendekati titik - sedemikian rupa sehingga tanpa penelitian analitis sulit untuk mengatakan fungsi mana yang lebih akurat.

Ini menyimpulkan solusinya, dan saya kembali ke pertanyaan tentang nilai alami dari argumen tersebut. Dalam berbagai penelitian, biasanya ekonomi atau sosiologi, “X” alami digunakan untuk menghitung bulan, tahun, atau interval waktu lain yang setara. Misalnya saja masalah berikut ini:

Data berikut tersedia mengenai omset ritel toko untuk paruh pertama tahun ini:

Dengan menggunakan perataan garis lurus analitis, tentukan volume omzet untuk bulan Juli.

Ya, tidak masalah: kita memberi nomor pada bulan 1, 2, 3, 4, 5, 6 dan menggunakan algoritma biasa, sebagai hasilnya kita mendapatkan persamaan - satu-satunya hal adalah ketika sampai pada waktu, mereka biasanya menggunakan huruf “te” (walaupun ini tidak penting). Persamaan yang dihasilkan menunjukkan bahwa pada semester pertama tahun ini omzet perdagangan meningkat rata-rata sebesar 27,74 satuan. per bulan. Mari kita dapatkan ramalan cuaca untuk bulan Juli (bulan no.7): d.e.

Dan ada banyak sekali tugas seperti ini. Bagi yang berkeinginan bisa menggunakan layanan tambahan yaitu my Kalkulator Excel (versi demo), yang memecahkan masalah yang dianalisis hampir seketika! Versi kerja dari program ini tersedia di bursa atau untuk biaya simbolis.

Di akhir pelajaran, informasi singkat tentang menemukan beberapa jenis dependensi lainnya. Sebenarnya tidak banyak yang bisa diceritakan, karena pendekatan fundamental dan algoritma solusinya tetap sama.

Misalkan susunan titik-titik percobaan menyerupai hiperbola. Kemudian, untuk mencari koefisien hiperbola terbaik, Anda perlu mencari fungsi minimum - siapa pun dapat melakukan perhitungan mendetail dan sampai pada sistem serupa:

Dari segi teknis formal diperoleh dari sistem “linier”. (mari kita nyatakan dengan tanda bintang) mengganti "x" dengan . Nah, bagaimana dengan jumlahnya? hitung, lalu ke koefisien optimal “a” dan “be” dekat.

Jika ada alasan untuk percaya bahwa poinnya terletak di sepanjang kurva logaritmik, kemudian untuk mencari nilai optimal kita mencari nilai minimum dari fungsi tersebut . Secara formal, pada sistem (*) perlu diganti dengan:

Saat melakukan perhitungan di Excel, gunakan fungsi tersebut LN. Saya akui bahwa tidak akan terlalu sulit bagi saya untuk membuat kalkulator untuk setiap kasus yang sedang dipertimbangkan, namun akan lebih baik jika Anda “memprogram” perhitungannya sendiri. Video pelajaran untuk membantu.

Dengan ketergantungan eksponensial, situasinya menjadi sedikit lebih rumit. Untuk mereduksi persoalan menjadi kasus linier, kita ambil fungsi logaritma dan gunakan sifat-sifat logaritma:

Sekarang, dengan membandingkan fungsi yang dihasilkan dengan fungsi linier, kita sampai pada kesimpulan bahwa dalam sistem (*) harus diganti dengan , dan – oleh . Untuk kenyamanan, mari kita nyatakan:

Harap dicatat bahwa sistem diselesaikan sehubungan dengan dan, oleh karena itu, setelah menemukan akar-akarnya, Anda tidak boleh lupa untuk mencari koefisien itu sendiri.

Untuk mendekatkan titik percobaan parabola optimal , harus ditemukan fungsi minimum dari tiga variabel . Setelah melakukan tindakan standar, kami mendapatkan yang "berfungsi" berikut sistem:

Ya tentu saja jumlahnya lebih banyak di sini, namun tidak ada kesulitan sama sekali saat menggunakan aplikasi favorit Anda. Dan terakhir, saya akan memberi tahu Anda cara cepat melakukan pemeriksaan menggunakan Excel dan membuat garis tren yang diinginkan: buat plot sebar, pilih salah satu titik dengan mouse dan klik kanan pilih opsi "Tambahkan garis tren". Selanjutnya, pilih jenis grafik dan pada tab "Pilihan" aktifkan opsi "Tunjukkan persamaan pada diagram". OKE

Seperti biasa, saya ingin mengakhiri artikel dengan kalimat yang indah, dan saya hampir mengetik “Jadilah tren!” Tapi dia berubah pikiran seiring berjalannya waktu. Dan bukan karena itu distereotipkan. Saya tidak tahu bagaimana keadaannya bagi siapa pun, tetapi saya sama sekali tidak ingin mengikuti tren Amerika dan terutama Eropa yang dipromosikan =) Oleh karena itu, saya berharap Anda masing-masing tetap pada jalur Anda sendiri!

http://www.grandars.ru/student/vysshaya-matematika/metod-naimenshih-kvadratov.html

Metode kuadrat terkecil adalah salah satu yang paling umum dan paling berkembang karena sifatnya kesederhanaan dan efisiensi metode untuk memperkirakan parameter model ekonometrik linier. Pada saat yang sama, ketika menggunakannya, beberapa kehati-hatian harus diperhatikan, karena model yang dibangun dengan menggunakannya mungkin tidak memenuhi sejumlah persyaratan untuk kualitas parameternya dan, sebagai akibatnya, tidak mencerminkan pola pengembangan proses dengan baik. .

Mari kita perhatikan prosedur untuk memperkirakan parameter model ekonometrik linier menggunakan metode kuadrat terkecil secara lebih rinci. Model seperti itu secara umum dapat direpresentasikan dengan persamaan (1.2):

yt = a 0 + a 1 x 1t +...+ an x ​​nt + ε t.

Data awal saat memperkirakan parameter a 0 , a 1 ,..., a n adalah vektor nilai variabel terikat kamu= (y 1 , y 2 , ... , y T)" dan matriks nilai variabel bebas

di mana kolom pertama, terdiri dari satuan, sesuai dengan koefisien model.

Metode kuadrat terkecil mendapatkan namanya berdasarkan prinsip dasar bahwa estimasi parameter yang diperoleh berdasarkan metode tersebut harus memenuhi: jumlah kuadrat kesalahan model harus minimal.

Contoh penyelesaian masalah dengan metode kuadrat terkecil

Contoh 2.1. Perusahaan perdagangan ini memiliki jaringan 12 toko, informasi kegiatannya disajikan pada Tabel. 2.1.

Manajemen perusahaan ingin mengetahui seberapa besar omset tahunan bergantung pada ruang ritel toko.

Tabel 2.1

Nomor toko Omset tahunan, juta rubel. Area ritel, ribuan m2
19,76 0,24
38,09 0,31
40,95 0,55
41,08 0,48
56,29 0,78
68,51 0,98
75,01 0,94
89,05 1,21
91,13 1,29
91,26 1,12
99,84 1,29
108,55 1,49

Solusi kuadrat terkecil. Mari kita tunjukkan omset tahunan toko ke-th, juta rubel; - luas retail toko ke-th, ribuan m2.

Gambar.2.1. Plot sebar misalnya 2.1

Untuk menentukan bentuk hubungan fungsional antar variabel, kita akan membuat diagram sebar (Gbr. 2.1).

Berdasarkan diagram sebar, kita dapat menyimpulkan bahwa omset tahunan bergantung positif pada ruang ritel (yaitu, y akan meningkat seiring dengan meningkatnya ). Bentuk sambungan fungsional yang paling cocok adalah linier.

Informasi untuk perhitungan selanjutnya disajikan pada tabel. 2.2. Dengan menggunakan metode kuadrat terkecil, kami memperkirakan parameter model ekonometrik satu faktor linier

Tabel 2.2

T kamu t x 1t kamu 2 x 1t 2 x 1t y t
19,76 0,24 390,4576 0,0576 4,7424
38,09 0,31 1450,8481 0,0961 11,8079
40,95 0,55 1676,9025 0,3025 22,5225
41,08 0,48 1687,5664 0,2304 19,7184
56,29 0,78 3168,5641 0,6084 43,9062
68,51 0,98 4693,6201 0,9604 67,1398
75,01 0,94 5626,5001 0,8836 70,5094
89,05 1,21 7929,9025 1,4641 107,7505
91,13 1,29 8304,6769 1,6641 117,5577
91,26 1,12 8328,3876 1,2544 102,2112
99,84 1,29 9968,0256 1,6641 128,7936
108,55 1,49 11783,1025 2,2201 161,7395
S 819,52 10,68 65008,554 11,4058 858,3991
Rata-rata 68,29 0,89

Dengan demikian,

Oleh karena itu, dengan peningkatan ruang ritel sebesar 1.000 m2, jika hal-hal lain dianggap sama, omset tahunan rata-rata meningkat sebesar 67,8871 juta rubel.

Contoh 2.2. Manajemen perusahaan memperhatikan bahwa omzet tahunan tidak hanya bergantung pada area penjualan toko (lihat contoh 2.1), tetapi juga pada rata-rata jumlah pengunjung. Informasi yang relevan disajikan dalam tabel. 2.3.

Tabel 2.3

Larutan. Mari kita nyatakan - jumlah rata-rata pengunjung toko ke-th per hari, ribuan orang.

Untuk menentukan bentuk hubungan fungsional antar variabel, kita akan membuat diagram sebar (Gbr. 2.2).

Berdasarkan diagram sebar, kita dapat menyimpulkan bahwa omset tahunan bergantung positif pada jumlah rata-rata pengunjung per hari (yaitu, y akan meningkat seiring dengan meningkatnya ). Bentuk ketergantungan fungsional adalah linier.

Beras. 2.2. Plot sebar misalnya 2.2

Tabel 2.4

T x 2t x 2t 2 kamu t x 2t x 1t x 2t
8,25 68,0625 163,02 1,98
10,24 104,8575 390,0416 3,1744
9,31 86,6761 381,2445 5,1205
11,01 121,2201 452,2908 5,2848
8,54 72,9316 480,7166 6,6612
7,51 56,4001 514,5101 7,3598
12,36 152,7696 927,1236 11,6184
10,81 116,8561 962,6305 13,0801
9,89 97,8121 901,2757 12,7581
13,72 188,2384 1252,0872 15,3664
12,27 150,5529 1225,0368 15,8283
13,92 193,7664 1511,016 20,7408
S 127,83 1410,44 9160,9934 118,9728
Rata-rata 10,65

Secara umum, parameter model ekonometrik dua faktor perlu ditentukan

yt = a 0 + a 1 x 1t + a 2 x 2t + ε t

Informasi yang diperlukan untuk perhitungan lebih lanjut disajikan pada tabel. 2.4.

Mari kita perkirakan parameter model ekonometrik dua faktor linier menggunakan metode kuadrat terkecil.

Dengan demikian,

Perkiraan koefisien =61,6583 menunjukkan bahwa, jika hal-hal lain dianggap sama, dengan peningkatan ruang ritel sebesar 1.000 m 2, omset tahunan akan meningkat rata-rata 61,6583 juta rubel.

Perkiraan koefisien = 2,2748 menunjukkan hal lain dianggap sama dengan peningkatan rata-rata jumlah pengunjung per 1.000 orang. per hari, omset tahunan akan meningkat rata-rata 2,2748 juta rubel.

Contoh 2.3. Menggunakan informasi yang disajikan dalam tabel. 2.2 dan 2.4, perkirakan parameter model ekonometrik satu faktor

di mana nilai pusat dari omset tahunan toko ke-th, juta rubel; - nilai terpusat dari rata-rata jumlah pengunjung harian toko ke-t, ribuan orang. (lihat contoh 2.1-2.2).

Larutan. Informasi tambahan yang diperlukan untuk perhitungan disajikan dalam tabel. 2.5.

Tabel 2.5

-48,53 -2,40 5,7720 116,6013
-30,20 -0,41 0,1702 12,4589
-27,34 -1,34 1,8023 36,7084
-27,21 0,36 0,1278 -9,7288
-12,00 -2,11 4,4627 25,3570
0,22 -3,14 9,8753 -0,6809
6,72 1,71 2,9156 11,4687
20,76 0,16 0,0348 3,2992
22,84 -0,76 0,5814 -17,413
22,97 3,07 9,4096 70,4503
31,55 1,62 2,6163 51,0267
40,26 3,27 10,6766 131,5387
Jumlah 48,4344 431,0566

Dengan menggunakan rumus (2.35), kita peroleh

Dengan demikian,

http://www.cleverstudents.ru/articles/mnk.html

Contoh.

Data eksperimen tentang nilai variabel X Dan pada diberikan dalam tabel.

Sebagai hasil dari penyelarasannya, suatu fungsi diperoleh

Menggunakan metode kuadrat terkecil, perkirakan data ini dengan ketergantungan linier y=kapak+b(temukan parameter A Dan B). Cari tahu mana di antara dua garis yang lebih baik (dalam pengertian metode kuadrat terkecil) yang menyelaraskan data eksperimen. Buatlah gambar.

Larutan.

Dalam contoh kita n=5. Kami mengisi tabel untuk kemudahan menghitung jumlah yang termasuk dalam rumus koefisien yang diperlukan.

Nilai pada baris keempat tabel diperoleh dengan mengalikan nilai baris ke-2 dengan nilai baris ke-3 untuk setiap angka. Saya.

Nilai pada baris kelima tabel diperoleh dengan mengkuadratkan nilai pada baris ke-2 untuk setiap angka Saya.

Nilai di kolom terakhir tabel adalah jumlah nilai di seluruh baris.

Kami menggunakan rumus metode kuadrat terkecil untuk mencari koefisien A Dan B. Kami mengganti nilai yang sesuai dari kolom terakhir tabel ke dalamnya:

Karena itu, kamu = 0,165x+2,184- perkiraan garis lurus yang diinginkan.

Masih mencari tahu garis yang mana kamu = 0,165x+2,184 atau lebih mendekati data asli, yaitu estimasi menggunakan metode kuadrat terkecil.

Bukti.

Sehingga ketika ditemukan A Dan B fungsi mengambil nilai terkecil, pada titik ini diperlukan matriks berbentuk kuadrat dari diferensial orde kedua untuk fungsi tersebut adalah positif pasti. Mari kita tunjukkan.

Diferensial orde kedua berbentuk:

Yaitu

Oleh karena itu, matriks berbentuk kuadrat mempunyai bentuk

dan nilai elemen tidak bergantung pada A Dan B.

Mari kita tunjukkan bahwa matriks tersebut pasti positif. Untuk melakukan ini, sudut minor harus positif.

Minor sudut orde pertama . Ketimpangannya sangat ketat, karena poinnya

Perkiraan data eksperimen adalah suatu metode yang didasarkan pada penggantian data yang diperoleh secara eksperimen dengan fungsi analitik yang paling mendekati atau bertepatan pada titik nodal dengan nilai aslinya (data yang diperoleh selama suatu percobaan atau percobaan). Saat ini, ada dua cara untuk mendefinisikan fungsi analitik:

Dengan membuat polinomial interpolasi derajat n yang lolos langsung melalui semua titik kumpulan data tertentu. Dalam hal ini, fungsi aproksimasi disajikan dalam bentuk: polinomial interpolasi dalam bentuk Lagrange atau polinomial interpolasi dalam bentuk Newton.

Dengan membuat polinomial aproksimasi derajat n yang lolos dalam jarak terdekat dengan titik dari array data tertentu. Dengan demikian, fungsi perkiraan memuluskan semua gangguan acak (atau kesalahan) yang mungkin timbul selama percobaan: nilai yang diukur selama percobaan bergantung pada faktor acak yang berfluktuasi menurut hukum acaknya sendiri (kesalahan pengukuran atau instrumen, ketidakakuratan atau eksperimen). kesalahan). Dalam hal ini, fungsi aproksimasi ditentukan dengan menggunakan metode kuadrat terkecil.

Metode kuadrat terkecil(dalam literatur berbahasa Inggris Ordinary Least Squares, OLS) adalah metode matematika yang didasarkan pada penentuan fungsi perkiraan, yang dibangun paling dekat dengan titik-titik dari serangkaian data eksperimen tertentu. Kedekatan fungsi asli dan fungsi aproksimasi F(x) ditentukan dengan ukuran numerik, yaitu: jumlah deviasi kuadrat data eksperimen dari kurva aproksimasi F(x) harus yang terkecil.

Perkiraan kurva dibuat menggunakan metode kuadrat terkecil

Metode kuadrat terkecil yang digunakan:

Untuk menyelesaikan sistem persamaan overdetermined ketika jumlah persamaan melebihi jumlah persamaan yang tidak diketahui;

Untuk menemukan solusi dalam kasus sistem persamaan nonlinier biasa (tidak ditentukan secara berlebihan);

Untuk memperkirakan nilai titik dengan beberapa fungsi perkiraan.

Fungsi aproksimasi dengan metode kuadrat terkecil ditentukan dari kondisi jumlah minimum simpangan kuadrat dari fungsi aproksimasi yang dihitung dari serangkaian data eksperimen tertentu. Kriteria metode kuadrat terkecil ini ditulis sebagai ekspresi berikut:

Nilai fungsi perkiraan yang dihitung pada titik nodal,

Kumpulan data eksperimen tertentu pada titik nodal.

Kriteria kuadrat memiliki sejumlah sifat “baik”, seperti diferensiasi, memberikan solusi unik terhadap masalah aproksimasi dengan fungsi aproksimasi polinomial.

Bergantung pada kondisi soal, fungsi aproksimasinya adalah polinomial berderajat m

Derajat fungsi aproksimasi tidak bergantung pada jumlah titik nodal, tetapi dimensinya harus selalu lebih kecil dari dimensi (jumlah titik) larik data eksperimen tertentu.

∙ Jika derajat fungsi aproksimasinya adalah m=1, maka fungsi tabel tersebut kita aproksimasi dengan garis lurus (regresi linier).

∙ Jika derajat fungsi aproksimasinya adalah m=2, maka fungsi tabel tersebut kita aproksimasi dengan parabola kuadrat (perkiraan kuadrat).

∙ Jika derajat fungsi aproksimasinya adalah m=3, maka fungsi tabel tersebut kita aproksimasi dengan parabola kubik (pendekatan kubik).

Dalam kasus umum, ketika perlu membuat polinomial aproksimasi derajat m untuk nilai tabel tertentu, kondisi minimum jumlah simpangan kuadrat pada semua titik nodal ditulis ulang dalam bentuk berikut:

- koefisien yang tidak diketahui dari polinomial aproksimasi derajat m;

Jumlah nilai tabel yang ditentukan.

Kondisi yang diperlukan untuk keberadaan minimum suatu fungsi adalah persamaan turunan parsialnya dengan nol terhadap variabel yang tidak diketahui . Hasilnya, kita memperoleh sistem persamaan berikut:

Mari kita ubah sistem persamaan linier yang dihasilkan: buka tanda kurung dan pindahkan suku bebasnya ke sisi kanan ekspresi. Hasilnya, sistem ekspresi aljabar linier yang dihasilkan akan ditulis dalam bentuk berikut:

Sistem ekspresi aljabar linier ini dapat ditulis ulang dalam bentuk matriks:

Hasilnya, diperoleh sistem persamaan linier berdimensi m+1, yang terdiri dari m+1 yang tidak diketahui. Sistem ini dapat diselesaikan dengan menggunakan metode apa pun untuk menyelesaikan persamaan aljabar linier (misalnya metode Gaussian). Sebagai hasil dari penyelesaian, akan ditemukan parameter fungsi perkiraan yang tidak diketahui yang memberikan jumlah minimum deviasi kuadrat fungsi perkiraan dari data asli, yaitu. perkiraan kuadrat terbaik. Perlu diingat bahwa jika hanya satu nilai dari data awal yang berubah, semua koefisien akan mengubah nilainya, karena nilai tersebut sepenuhnya ditentukan oleh data awal.

Perkiraan data awal dengan ketergantungan linier

(regresi linier)

Sebagai contoh, mari kita perhatikan teknik menentukan fungsi aproksimasi, yang dinyatakan dalam bentuk ketergantungan linier. Sesuai dengan metode kuadrat terkecil, syarat minimum jumlah simpangan kuadrat ditulis dalam bentuk berikut:

Koordinat node tabel;

Koefisien fungsi perkiraan yang tidak diketahui, yang ditetapkan sebagai ketergantungan linier.

Kondisi yang diperlukan untuk keberadaan minimum suatu fungsi adalah persamaan turunan parsialnya dengan nol terhadap variabel yang tidak diketahui. Hasilnya, kita memperoleh sistem persamaan berikut:

Mari kita ubah sistem persamaan linier yang dihasilkan.

Kami memecahkan sistem persamaan linear yang dihasilkan. Koefisien fungsi aproksimasi dalam bentuk analitik ditentukan sebagai berikut (metode Cramer):

Koefisien ini memastikan konstruksi fungsi aproksimasi linier sesuai dengan kriteria meminimalkan jumlah kuadrat fungsi aproksimasi dari nilai tabel yang diberikan (data eksperimen).

Algoritma untuk menerapkan metode kuadrat terkecil

1. Data awal:

Array data eksperimen dengan jumlah pengukuran N ditentukan

Derajat aproksimasi polinomial (m) ditentukan

2. Algoritma perhitungan:

2.1. Koefisien ditentukan untuk membangun sistem persamaan dengan dimensi

Koefisien sistem persamaan (sisi kiri persamaan)

- indeks nomor kolom matriks persegi sistem persamaan

Suku bebas suatu sistem persamaan linear (sisi kanan persamaan)

- indeks nomor baris matriks persegi sistem persamaan

2.2. Pembentukan sistem persamaan linear berdimensi .

2.3. Memecahkan sistem persamaan linier untuk menentukan koefisien yang tidak diketahui dari polinomial aproksimasi derajat m.

2.4.Penentuan jumlah simpangan kuadrat polinomial aproksimasi dari nilai aslinya di semua titik nodal

Nilai yang ditemukan dari jumlah simpangan kuadrat adalah yang seminimal mungkin.

Perkiraan menggunakan fungsi lain

Perlu dicatat bahwa ketika memperkirakan data asli sesuai dengan metode kuadrat terkecil, fungsi logaritma, fungsi eksponensial, dan fungsi pangkat terkadang digunakan sebagai fungsi perkiraan.

Perkiraan logaritmik

Mari kita pertimbangkan kasus ketika fungsi perkiraan diberikan oleh fungsi logaritma dalam bentuk:

Metode kuadrat terkecil digunakan untuk memperkirakan parameter persamaan regresi.
Jumlah baris (sumber data)

Salah satu metode untuk mempelajari hubungan stokastik antar karakteristik adalah analisis regresi.
Analisis regresi adalah penurunan persamaan regresi yang dengannya nilai rata-rata suatu variabel acak (atribut hasil) ditemukan jika nilai variabel lain (atau lainnya) (atribut faktor) diketahui. Ini mencakup langkah-langkah berikut:

  1. pemilihan bentuk koneksi (jenis persamaan regresi analitik);
  2. estimasi parameter persamaan;
  3. penilaian kualitas persamaan regresi analitik.
Paling sering, bentuk linier digunakan untuk menggambarkan hubungan statistik fitur. Fokus pada hubungan linier dijelaskan oleh interpretasi ekonomi yang jelas atas parameternya, variasi variabel yang terbatas, dan fakta bahwa dalam banyak kasus bentuk hubungan nonlinier diubah (dengan logaritma atau substitusi variabel) menjadi bentuk linier untuk melakukan perhitungan. .
Dalam kasus hubungan berpasangan linier, persamaan regresinya akan berbentuk: y i =a+b·x i +u i . Parameter a dan b persamaan ini diperkirakan dari data observasi statistik x dan y. Hasil dari penilaian tersebut adalah persamaan: , dimana , adalah estimasi parameter a dan b , adalah nilai atribut (variabel) yang dihasilkan yang diperoleh dari persamaan regresi (nilai hitung).

Paling sering digunakan untuk memperkirakan parameter metode kuadrat terkecil (LSM).
Metode kuadrat terkecil memberikan estimasi parameter persamaan regresi yang terbaik (konsisten, efisien, dan tidak bias). Namun hanya jika asumsi tertentu mengenai suku acak (u) dan variabel bebas (x) terpenuhi (lihat asumsi OLS).

Masalah pendugaan parameter persamaan pasangan linier menggunakan metode kuadrat terkecil adalah sebagai berikut: untuk mendapatkan perkiraan parameter , , di mana jumlah deviasi kuadrat dari nilai aktual dari karakteristik yang dihasilkan - y i dari nilai yang dihitung - adalah minimal.
Secara formal tes OLS dapat ditulis seperti ini: .

Klasifikasi metode kuadrat terkecil

  1. Metode kuadrat terkecil.
  2. Metode kemungkinan maksimum (untuk model regresi linier klasik normal, normalitas residu regresi didalilkan).
  3. Metode OLS kuadrat terkecil yang digeneralisasi digunakan dalam kasus autokorelasi kesalahan dan dalam kasus heteroskedastisitas.
  4. Metode kuadrat terkecil tertimbang (kasus khusus OLS dengan residu heteroskedastik).

Mari kita ilustrasikan maksudnya metode kuadrat terkecil klasik secara grafis. Untuk melakukannya, kita akan membuat plot sebar berdasarkan data observasi (xi, y i, i=1;n) dalam sistem koordinat persegi panjang (plot sebar seperti itu disebut bidang korelasi). Mari kita coba memilih garis lurus yang paling dekat dengan titik-titik bidang korelasi. Menurut metode kuadrat terkecil, garis dipilih sedemikian rupa sehingga jumlah kuadrat jarak vertikal antara titik-titik bidang korelasi dan garis tersebut adalah minimal.

Notasi matematika untuk soal ini: .
Nilai y i dan x i =1...n diketahui oleh kita; ini adalah data observasi. Dalam fungsi S mereka mewakili konstanta. Variabel dalam fungsi ini adalah estimasi parameter yang diperlukan - , . Untuk mencari nilai minimum suatu fungsi dua variabel, perlu menghitung turunan parsial fungsi tersebut untuk masing-masing parameter dan menyamakannya dengan nol, yaitu. .
Hasilnya, kita memperoleh sistem 2 persamaan linier normal:
Memecahkan sistem ini, kami menemukan estimasi parameter yang diperlukan:

Kebenaran perhitungan parameter persamaan regresi dapat diperiksa dengan membandingkan jumlahnya (mungkin ada perbedaan karena pembulatan perhitungan).
Untuk menghitung estimasi parameter, Anda dapat membuat Tabel 1.
Tanda koefisien regresi b menunjukkan arah hubungan (jika b >0 maka hubungannya searah, jika b<0, то связь обратная). Величина b показывает на сколько единиц изменится в среднем признак-результат -y при изменении признака-фактора - х на 1 единицу своего измерения.
Secara formal, nilai parameter a adalah nilai rata-rata y dengan x sama dengan nol. Jika atribut-faktor tidak dan tidak dapat bernilai nol, maka penafsiran parameter a di atas tidak masuk akal.

Menilai keeratan hubungan antar karakteristik dilakukan dengan menggunakan koefisien korelasi pasangan linier - r x,y. Itu dapat dihitung dengan menggunakan rumus: . Selain itu, koefisien korelasi pasangan linier dapat ditentukan melalui koefisien regresi b: .
Kisaran nilai koefisien korelasi pasangan linier yang dapat diterima adalah dari –1 hingga +1. Tanda koefisien korelasi menunjukkan arah hubungan. Jika r x, y >0, maka sambungannya langsung; jika r x, y<0, то связь обратная.
Jika koefisien ini mendekati kesatuan besarnya, maka hubungan antar karakteristik dapat diartikan sebagai hubungan linier yang cukup erat. Jika modulnya sama dengan satu ê r x , y ê =1, maka hubungan antar karakteristiknya adalah linier fungsional. Jika fitur x dan y bebas linier, maka r x,y mendekati 0.
Untuk menghitung r x,y, Anda juga dapat menggunakan Tabel 1.

Tabel 1

N observasix sayakamu akux saya ∙y saya
1 x 1kamu 1x 1 kamu 1
2 x 2kamu 2x 2 kamu 2
...
Nxnkamu nx n y n
Jumlah Kolom∑x∑y∑xy
Nilai rata-rata
Untuk menilai kualitas persamaan regresi yang dihasilkan, hitung koefisien determinasi teoritis - R 2 yx:

,
dimana d 2 adalah varians y yang dijelaskan oleh persamaan regresi;
e 2 - varians sisa (tidak dijelaskan oleh persamaan regresi) dari y;
s 2 y - total (total) varians dari y.
Koefisien determinasi mencirikan proporsi variasi (dispersi) dari atribut yang dihasilkan y yang dijelaskan oleh regresi (dan, akibatnya, faktor x) dalam total variasi (dispersi) y. Koefisien determinasi R 2 yx mengambil nilai dari 0 sampai 1. Dengan demikian, nilai 1-R 2 yx mencirikan proporsi varians y yang disebabkan oleh pengaruh faktor lain yang tidak diperhitungkan dalam model dan kesalahan spesifikasi.
Dengan regresi linier berpasangan, R 2 yx =r 2 yx.

Contoh.

Data eksperimen tentang nilai variabel X Dan pada diberikan dalam tabel.

Sebagai hasil dari penyelarasannya, suatu fungsi diperoleh

Menggunakan metode kuadrat terkecil, perkirakan data ini dengan ketergantungan linier y=kapak+b(temukan parameter A Dan B). Cari tahu mana di antara dua garis yang lebih baik (dalam pengertian metode kuadrat terkecil) yang menyelaraskan data eksperimen. Buatlah gambar.

Inti dari metode kuadrat terkecil (LSM).

Tugasnya adalah menemukan koefisien ketergantungan linier di mana fungsi dua variabel berada A Dan B mengambil nilai terkecil. Artinya, diberikan A Dan B jumlah simpangan kuadrat data eksperimen dari garis lurus yang ditemukan akan menjadi yang terkecil. Inilah inti dari metode kuadrat terkecil.

Jadi, penyelesaian contohnya adalah mencari titik ekstrem dari suatu fungsi dua variabel.

Menurunkan rumus untuk mencari koefisien.

Sebuah sistem dua persamaan dengan dua hal yang tidak diketahui dikompilasi dan diselesaikan. Menemukan turunan parsial suatu fungsi oleh variabel A Dan B, kita menyamakan turunan ini dengan nol.

Kami menyelesaikan sistem persamaan yang dihasilkan menggunakan metode apa pun (misalnya dengan metode substitusi atau metode Cramer) dan mendapatkan rumus mencari koefisien menggunakan metode kuadrat terkecil (LSM).

Diberikan A Dan B fungsi mengambil nilai terkecil. Bukti dari fakta ini diberikan di bawah dalam teks di akhir halaman.

Itulah keseluruhan metode kuadrat terkecil. Rumus untuk mencari parameter A berisi jumlah,,, dan parameter N- jumlah data eksperimen. Kami menyarankan untuk menghitung nilai jumlah ini secara terpisah. Koefisien B ditemukan setelah perhitungan A.

Saatnya mengingat contoh aslinya.

Larutan.

Dalam contoh kita n=5. Kami mengisi tabel untuk kemudahan menghitung jumlah yang termasuk dalam rumus koefisien yang diperlukan.

Nilai pada baris keempat tabel diperoleh dengan mengalikan nilai baris ke-2 dengan nilai baris ke-3 untuk setiap angka. Saya.

Nilai pada baris kelima tabel diperoleh dengan mengkuadratkan nilai pada baris ke-2 untuk setiap angka Saya.

Nilai di kolom terakhir tabel adalah jumlah nilai di seluruh baris.

Kami menggunakan rumus metode kuadrat terkecil untuk mencari koefisien A Dan B. Kami mengganti nilai yang sesuai dari kolom terakhir tabel ke dalamnya:

Karena itu, kamu = 0,165x+2,184- perkiraan garis lurus yang diinginkan.

Masih mencari tahu garis yang mana kamu = 0,165x+2,184 atau lebih mendekati data asli, yaitu estimasi menggunakan metode kuadrat terkecil.

Estimasi kesalahan metode kuadrat terkecil.

Untuk melakukan ini, Anda perlu menghitung jumlah deviasi kuadrat dari data asli dari garis-garis ini Dan , nilai yang lebih kecil menunjukkan garis yang lebih mendekati data asli dalam pengertian metode kuadrat terkecil.

Sejak , maka lurus kamu = 0,165x+2,184 lebih mendekati data aslinya.

Ilustrasi grafis metode kuadrat terkecil (LS).

Semuanya terlihat jelas di grafik. Garis merah adalah garis lurus yang ditemukan kamu = 0,165x+2,184, garis biru adalah , titik merah muda adalah data asli.

Dalam praktiknya, ketika memodelkan berbagai proses - khususnya, ekonomi, fisik, teknis, sosial - metode tertentu untuk menghitung perkiraan nilai fungsi dari nilai yang diketahui pada titik tetap tertentu banyak digunakan.

Masalah perkiraan fungsi seperti ini sering muncul:

    ketika membuat rumus perkiraan untuk menghitung nilai besaran karakteristik dari proses yang diteliti menggunakan data tabel yang diperoleh sebagai hasil percobaan;

    dalam integrasi numerik, diferensiasi, penyelesaian persamaan diferensial, dll;

    jika perlu menghitung nilai fungsi pada titik tengah interval yang dipertimbangkan;

    ketika menentukan nilai besaran karakteristik suatu proses di luar interval yang dipertimbangkan, khususnya ketika meramalkan.

Jika, untuk memodelkan proses tertentu yang ditentukan oleh tabel, kita membangun sebuah fungsi yang kira-kira menggambarkan proses ini berdasarkan metode kuadrat terkecil, maka itu akan disebut fungsi aproksimasi (regresi), dan masalah membangun fungsi aproksimasi itu sendiri akan disebut masalah perkiraan.

Artikel ini membahas kemampuan paket MS Excel untuk memecahkan masalah jenis ini, selain itu, menyediakan metode dan teknik untuk membangun (membuat) regresi untuk fungsi tabulasi (yang merupakan dasar analisis regresi).

Excel memiliki dua opsi untuk membuat regresi.

    Menambahkan regresi (garis tren) yang dipilih ke diagram yang dibuat berdasarkan tabel data untuk karakteristik proses yang diteliti (hanya tersedia jika diagram telah dibuat);

    Menggunakan fungsi statistik bawaan pada lembar kerja Excel, memungkinkan Anda memperoleh regresi (garis tren) secara langsung berdasarkan tabel data sumber.

Menambahkan garis tren ke grafik

Untuk tabel data yang menjelaskan suatu proses dan diwakili oleh diagram, Excel memiliki alat analisis regresi efektif yang memungkinkan Anda untuk:

    membangun berdasarkan metode kuadrat terkecil dan menambahkan lima jenis regresi ke diagram, yang memodelkan proses yang diteliti dengan berbagai tingkat akurasi;

    tambahkan persamaan regresi yang dibangun ke diagram;

    menentukan tingkat kesesuaian regresi yang dipilih dengan data yang ditampilkan pada grafik.

Berdasarkan data grafik, Excel memungkinkan Anda memperoleh jenis regresi linier, polinomial, logaritmik, pangkat, eksponensial, yang ditentukan oleh persamaan:

kamu = kamu(x)

dimana x adalah variabel bebas yang sering mengambil nilai barisan bilangan asli (1; 2; 3; ...) dan menghasilkan, misalnya, hitungan mundur waktu dari proses yang diteliti (karakteristik).

1 . Regresi linier baik untuk memodelkan karakteristik yang nilainya naik atau turun dengan laju yang konstan. Ini adalah model yang paling sederhana untuk dibangun untuk proses yang sedang dipelajari. Itu dibangun sesuai dengan persamaan:

kamu = mx + b

dimana m adalah garis singgung kemiringan regresi linier terhadap sumbu x; b - koordinat titik potong regresi linier dengan sumbu ordinat.

2 . Garis tren polinomial berguna untuk menggambarkan karakteristik yang memiliki beberapa titik ekstrem yang berbeda (maksimum dan minimum). Pilihan derajat polinomial ditentukan oleh jumlah ekstrem dari karakteristik yang dipelajari. Jadi, polinomial derajat kedua dapat menggambarkan suatu proses yang hanya memiliki satu maksimum atau minimum; polinomial derajat ketiga - tidak lebih dari dua ekstrem; polinomial derajat keempat - tidak lebih dari tiga ekstrem, dll.

Dalam hal ini, garis tren dibangun sesuai dengan persamaan:

kamu = c0 + c1x + c2x2 + c3x3 + c4x4 + c5x5 + c6x6

dimana koefisien c0, c1, c2,... c6 adalah konstanta yang nilainya ditentukan selama konstruksi.

3 . Garis tren logaritmik berhasil digunakan ketika memodelkan karakteristik yang nilainya awalnya berubah dengan cepat dan kemudian stabil secara bertahap.

y = c ln(x) + b

4 . Garis tren hukum pangkat memberikan hasil yang baik jika nilai hubungan yang diteliti dicirikan oleh perubahan laju pertumbuhan yang konstan. Contoh ketergantungan tersebut adalah grafik gerak dipercepat beraturan sebuah mobil. Jika terdapat nilai nol atau negatif pada data, Anda tidak dapat menggunakan garis tren pangkat.

Dibangun sesuai dengan persamaan:

kamu = c xb

dimana koefisien b, c adalah konstanta.

5 . Garis tren eksponensial harus digunakan ketika laju perubahan data terus meningkat. Untuk data yang mengandung nilai nol atau negatif, pendekatan jenis ini juga tidak berlaku.

Dibangun sesuai dengan persamaan:

y = c ebx

dimana koefisien b, c adalah konstanta.

Saat memilih garis tren, Excel secara otomatis menghitung nilai R2, yang mencirikan keandalan perkiraan: semakin dekat nilai R2 ke satu, semakin andal garis tren tersebut mendekati proses yang sedang dipelajari. Jika perlu, nilai R2 selalu dapat ditampilkan pada grafik.

Ditentukan dengan rumus:

Untuk menambahkan garis tren ke rangkaian data:

    mengaktifkan bagan berdasarkan serangkaian data, yaitu klik di dalam area bagan. Item Diagram akan muncul di menu utama;

    Setelah mengklik item ini, sebuah menu akan muncul di layar di mana Anda harus memilih perintah Tambahkan garis tren.

Tindakan yang sama dapat dengan mudah diterapkan dengan menggerakkan penunjuk tetikus ke grafik yang sesuai dengan salah satu rangkaian data dan mengklik kanan; Di menu konteks yang muncul, pilih perintah Tambahkan garis tren. Kotak dialog Trendline akan muncul di layar dengan tab Type terbuka (Gbr. 1).

Setelah ini Anda perlu:

Pilih tipe garis tren yang diperlukan pada tab Type (tipe Linear dipilih secara default). Untuk tipe Polinomial, pada kolom Derajat, tentukan derajat polinomial yang dipilih.

1 . Bidang Seri yang dibangun mencantumkan semua seri data dalam bagan yang dimaksud. Untuk menambahkan garis tren ke seri data tertentu, pilih namanya di bidang Seri yang dibangun.

Jika perlu, dengan membuka tab Parameter (Gbr. 2), Anda dapat mengatur parameter berikut untuk garis tren:

    ubah nama garis tren di bidang Nama kurva perkiraan (dihaluskan).

    atur jumlah periode (maju atau mundur) untuk perkiraan di bidang Prakiraan;

    tampilkan persamaan garis tren di area grafik, yang mana Anda harus mengaktifkan kotak centang “tampilkan persamaan pada grafik”;

    tampilkan nilai keandalan perkiraan R2 di area diagram, yang mana Anda harus mengaktifkan kotak centang Tempatkan nilai keandalan perkiraan pada diagram (R^2);

    atur titik perpotongan garis tren dengan sumbu Y, yang mana Anda harus mengaktifkan kotak centang untuk perpotongan kurva dengan sumbu Y pada suatu titik;

    Klik tombol OK untuk menutup kotak dialog.

Untuk mulai mengedit garis tren yang sudah digambar, ada tiga cara:

    gunakan perintah Selected trend line dari menu Format, setelah sebelumnya memilih garis tren;

    pilih perintah Format garis tren dari menu konteks, yang dipanggil dengan mengklik kanan pada garis tren;

    klik dua kali pada garis tren.

Kotak dialog Format Garis Tren akan muncul di layar (Gbr. 3), berisi tiga tab: Tampilan, Jenis, Parameter, dan konten dari dua tab terakhir sepenuhnya bertepatan dengan tab serupa pada kotak dialog Garis Tren (Gbr. 1 -2). Pada tab View, Anda dapat mengatur jenis garis, warna dan ketebalannya.

Untuk menghapus garis tren yang sudah digambar, pilih garis tren yang akan dihapus dan tekan tombol Hapus.

Keuntungan dari alat analisis regresi yang dipertimbangkan adalah:

    relatif mudahnya membuat garis tren pada grafik tanpa membuat tabel data untuknya;

    daftar jenis garis tren yang diusulkan cukup luas, dan daftar ini mencakup jenis regresi yang paling umum digunakan;

    kemampuan untuk memprediksi perilaku proses yang diteliti dengan sejumlah langkah maju dan mundur secara sewenang-wenang (dalam batas akal sehat);

    kemampuan memperoleh persamaan garis tren dalam bentuk analitis;

    kemungkinan, jika perlu, untuk memperoleh penilaian atas keandalan perkiraan.

Kerugiannya antara lain sebagai berikut:

    konstruksi garis tren hanya dilakukan jika terdapat diagram yang dibangun berdasarkan serangkaian data;

    proses menghasilkan rangkaian data untuk karakteristik yang diteliti berdasarkan persamaan garis tren yang diperoleh agak berantakan: persamaan regresi yang diperlukan diperbarui dengan setiap perubahan nilai rangkaian data asli, tetapi hanya dalam area grafik , sedangkan rangkaian data yang dibentuk berdasarkan persamaan garis lama, trennya tetap tidak berubah;

    Dalam laporan PivotChart, mengubah tampilan bagan atau laporan PivotTable terkait tidak mempertahankan garis tren yang ada, artinya sebelum Anda menggambar garis tren atau memformat laporan PivotChart, Anda harus memastikan bahwa tata letak laporan memenuhi persyaratan yang diperlukan.

Garis tren dapat digunakan untuk melengkapi rangkaian data yang disajikan pada bagan seperti grafik, histogram, bagan area datar non-standar, bagan batang, bagan sebar, bagan gelembung, dan bagan saham.

Anda tidak dapat menambahkan garis tren ke rangkaian data dalam diagram 3D, normalisasi, radar, lingkaran, dan donat.

Menggunakan fungsi bawaan Excel

Excel juga memiliki alat analisis regresi untuk merencanakan garis tren di luar area grafik. Ada sejumlah fungsi lembar kerja statistik yang bisa Anda gunakan untuk tujuan ini, namun semuanya hanya memungkinkan Anda membuat regresi linier atau eksponensial.

Excel memiliki beberapa fungsi untuk membangun regresi linier, khususnya:

    KECENDERUNGAN;

  • LERENG dan POTONG.

Serta beberapa fungsi untuk membangun garis tren eksponensial, khususnya:

    LGRFPRIBL.

Perlu diperhatikan bahwa teknik pembuatan regresi menggunakan fungsi TREND dan GROWTH hampir sama. Hal yang sama juga berlaku pada pasangan fungsi LINEST dan LGRFPRIBL. Untuk keempat fungsi ini, pembuatan tabel nilai menggunakan fitur Excel seperti rumus array, yang agak mengacaukan proses pembuatan regresi. Perhatikan juga bahwa konstruksi regresi linier, menurut pendapat kami, paling mudah dilakukan dengan menggunakan fungsi SLOPE dan INTERCEPT, di mana fungsi pertama menentukan kemiringan regresi linier, dan fungsi kedua menentukan segmen yang dicegat oleh regresi pada sumbu y.

Keuntungan alat fungsi bawaan untuk analisis regresi adalah:

    proses yang cukup sederhana dan seragam untuk menghasilkan rangkaian data dari karakteristik yang diteliti untuk semua fungsi statistik bawaan yang menentukan garis tren;

    metodologi standar untuk membangun garis tren berdasarkan seri data yang dihasilkan;

    kemampuan untuk memprediksi perilaku proses yang diteliti dengan jumlah langkah maju atau mundur yang diperlukan.

Kerugiannya termasuk fakta bahwa Excel tidak memiliki fungsi bawaan untuk membuat jenis garis tren lainnya (kecuali linier dan eksponensial). Keadaan ini seringkali tidak memungkinkan untuk memilih model yang cukup akurat dari proses yang diteliti, serta memperoleh perkiraan yang mendekati kenyataan. Selain itu, saat menggunakan fungsi TREND dan GROWTH, persamaan garis tren tidak diketahui.

Perlu dicatat bahwa penulis tidak bermaksud menyajikan analisis regresi dengan tingkat kelengkapan apa pun. Tugas utamanya adalah menunjukkan, dengan menggunakan contoh spesifik, kemampuan paket Excel saat memecahkan masalah perkiraan; mendemonstrasikan alat efektif apa yang dimiliki Excel untuk membuat regresi dan perkiraan; mengilustrasikan bagaimana masalah tersebut dapat diselesaikan dengan relatif mudah bahkan oleh pengguna yang tidak memiliki pengetahuan luas tentang analisis regresi.

Contoh pemecahan masalah tertentu

Mari kita lihat pemecahan masalah tertentu menggunakan alat Excel yang terdaftar.

Masalah 1

Dengan tabel data keuntungan suatu usaha angkutan motor tahun 1995-2002. Anda perlu melakukan hal berikut:

    Buat diagram.

    Tambahkan garis tren linier dan polinomial (kuadrat dan kubik) ke grafik.

    Dengan menggunakan persamaan garis tren, dapatkan data tabel keuntungan perusahaan untuk setiap garis tren tahun 1995-2004.

    Buatlah perkiraan keuntungan perusahaan untuk tahun 2003 dan 2004.

Solusi masalah

    Dalam rentang sel A4:C11 lembar kerja Excel, masukkan lembar kerja yang ditunjukkan pada Gambar. 4.

    Setelah memilih rentang sel B4:C11, kami membuat diagram.

    Kami mengaktifkan diagram yang dibuat dan, sesuai dengan metode yang dijelaskan di atas, setelah memilih jenis garis tren di kotak dialog Garis Tren (lihat Gambar 1), kami secara bergantian menambahkan garis tren linier, kuadrat, dan kubik ke diagram. Di kotak dialog yang sama, buka tab Parameter (lihat Gambar 2), di bidang Nama kurva perkiraan (dihaluskan), masukkan nama tren yang ditambahkan, dan di bidang Perkiraan maju untuk: periode, atur nilai 2, karena direncanakan membuat perkiraan keuntungan untuk dua tahun ke depan. Untuk menampilkan persamaan regresi dan nilai reliabilitas aproksimasi R2 pada area diagram, aktifkan kotak centang tampilkan persamaan di layar dan tempatkan nilai reliabilitas aproksimasi (R^2) pada diagram. Untuk persepsi visual yang lebih baik, kami mengubah jenis, warna dan ketebalan garis tren yang dibuat, untuk itu kami menggunakan tab Tampilan pada kotak dialog Format Garis Tren (lihat Gambar 3). Diagram yang dihasilkan dengan garis tren tambahan ditunjukkan pada Gambar. 5.

    Memperoleh data tabel keuntungan perusahaan untuk setiap garis tren tahun 1995-2004.

Mari kita gunakan persamaan garis tren yang disajikan pada Gambar. 5. Untuk melakukan ini, dalam sel rentang D3:F3, masukkan informasi teks tentang jenis garis tren yang dipilih: Tren linier, Tren kuadrat, Tren kubik. Selanjutnya, masukkan rumus regresi linier di sel D4 dan, dengan menggunakan penanda isian, salin rumus ini dengan referensi relatif ke rentang sel D5:D13. Perlu dicatat bahwa setiap sel dengan rumus regresi linier dari rentang sel D4:D13 memiliki argumen sel yang sesuai dari rentang A4:A13. Demikian pula, untuk regresi kuadratik, isikan rentang sel E4:E13, dan untuk regresi kubik, isikan rentang sel F4:F13. Dengan demikian, perkiraan laba perusahaan untuk tahun 2003 dan 2004 telah disusun. menggunakan tiga tren. Tabel nilai yang dihasilkan ditunjukkan pada Gambar. 6.

    Buat diagram.

    Masalah 2

    Tambahkan garis tren logaritmik, pangkat, dan eksponensial ke grafik.

    Turunkan persamaan garis tren yang diperoleh, serta nilai reliabilitas dari pendekatan R2 untuk masing-masing garis tersebut.

    Dengan menggunakan persamaan garis tren, dapatkan data tabel laba perusahaan untuk setiap garis tren tahun 1995-2002.

Solusi masalah

Mengikuti metodologi yang diberikan dalam menyelesaikan masalah 1, kita memperoleh diagram dengan garis tren logaritmik, pangkat, dan eksponensial ditambahkan ke dalamnya (Gbr. 7). Selanjutnya, dengan menggunakan persamaan garis tren yang diperoleh, kita mengisi tabel nilai laba perusahaan, termasuk nilai prediksi untuk tahun 2003 dan 2004. (Gbr. 8).

Pada Gambar. 5 dan gambar. terlihat bahwa model dengan tren logaritmik memiliki nilai reliabilitas aproksimasi yang paling rendah

R2 = 0,8659

Nilai R2 tertinggi sesuai dengan model dengan tren polinomial: kuadrat (R2 = 0,9263) dan kubik (R2 = 0,933).

Masalah 3

Dengan tabel data laba suatu usaha angkutan motor tahun 1995-2002 yang diberikan pada tugas 1, maka perlu dilakukan langkah-langkah sebagai berikut.

    Dapatkan seri data untuk garis tren linier dan eksponensial menggunakan fungsi TREND dan GROW.

    Dengan menggunakan fungsi TREND dan GROWTH, buatlah perkiraan laba perusahaan untuk tahun 2003 dan 2004.

    Buatlah diagram untuk data asli dan rangkaian data yang dihasilkan.

Solusi masalah

Mari kita gunakan lembar kerja untuk Soal 1 (lihat Gambar 4). Mari kita mulai dengan fungsi TREND:

    pilih rentang sel D4:D11, yang harus diisi dengan nilai fungsi TREND yang sesuai dengan data laba perusahaan yang diketahui;

    Panggil perintah Fungsi dari menu Sisipkan. Pada kotak dialog Function Wizard yang muncul, pilih fungsi TREND dari kategori Statistik, lalu klik tombol OK. Operasi yang sama dapat dilakukan dengan mengklik tombol (Sisipkan Fungsi) pada toolbar standar.

    Pada kotak dialog Argumen Fungsi yang muncul, masukkan rentang sel C4:C11 di bidang Known_values_y; di bidang Known_values_x - rentang sel B4:B11;

    Untuk membuat rumus yang dimasukkan menjadi rumus array, gunakan kombinasi tombol ++ .

Rumus yang kita masukkan pada formula bar akan terlihat seperti: =(TREND(C4:C11,B4:B11)).

Hasilnya, rentang sel D4:D11 diisi dengan nilai fungsi TREND yang sesuai (Gbr. 9).

Membuat perkiraan laba perusahaan untuk tahun 2003 dan 2004. diperlukan:

    pilih rentang sel D12:D13 di mana nilai prediksi fungsi TREND akan dimasukkan.

    panggil fungsi TREND dan di kotak dialog Argumen Fungsi yang muncul, masukkan di bidang Diketahui_nilai_y - rentang sel C4:C11; di bidang Known_values_x - rentang sel B4:B11; dan di bidang New_values_x - rentang sel B12:B13.

    ubah rumus ini menjadi rumus array menggunakan kombinasi tombol Ctrl + Shift + Enter.

    Rumus yang dimasukkan akan terlihat seperti: =(TREND(C4:C11;B4:B11;B12:B13)), dan rentang sel D12:D13 akan diisi dengan nilai prediksi fungsi TREND (lihat Gambar. 9).

Seri data diisi dengan cara yang sama menggunakan fungsi GROWTH, yang digunakan dalam analisis dependensi nonlinier dan bekerja dengan cara yang persis sama seperti TREND liniernya.

Gambar 10 menunjukkan tabel dalam mode tampilan rumus.

Untuk data awal dan rangkaian data yang diperoleh, diagramnya ditunjukkan pada Gambar. 11.

Masalah 4

Dengan tabel data penerimaan permohonan jasa oleh dinas pengiriman suatu perusahaan angkutan motor untuk periode tanggal 1 sampai dengan tanggal 11 bulan berjalan, perlu dilakukan tindakan sebagai berikut.

    Dapatkan rangkaian data untuk regresi linier: menggunakan fungsi SLOPE dan INTERCEPT; menggunakan fungsi LINEST.

    Dapatkan rangkaian data untuk regresi eksponensial menggunakan fungsi LGRFPRIBL.

    Dengan menggunakan fungsi di atas, buat perkiraan penerimaan aplikasi ke layanan pengiriman untuk periode tanggal 12 hingga 14 bulan berjalan.

    Buat diagram untuk seri data asli dan yang diterima.

Solusi masalah

Perhatikan bahwa, tidak seperti fungsi TREND dan GROWTH, tidak ada satu pun fungsi yang tercantum di atas (SLOPE, INTERCEPT, LINEST, LGRFPRIB) yang merupakan regresi. Fungsi-fungsi ini hanya memainkan peran pendukung, menentukan parameter regresi yang diperlukan.

Untuk regresi linier dan eksponensial yang dibangun menggunakan fungsi SLOPE, INTERCEPT, LINEST, LGRFPRIB, kemunculan persamaannya selalu diketahui, berbeda dengan regresi linier dan eksponensial yang berhubungan dengan fungsi TREND dan GROWTH.

1 . Mari kita buat regresi linier dengan persamaan:

kamu = mx+b

menggunakan fungsi SLOPE dan INTERCEPT, dengan kemiringan regresi m ditentukan oleh fungsi SLOPE, dan suku bebas b oleh fungsi INTERCEPT.

Untuk melakukan ini, kami melakukan tindakan berikut:

    masukkan tabel asli ke dalam cell range A4:B14;

    nilai parameter m akan ditentukan di sel C19. Pilih fungsi Kemiringan dari kategori Statistik; masukkan rentang sel B4:B14 di bidang nilai_y yang diketahui dan rentang sel A4:A14 di bidang nilai_x yang diketahui.

    Rumusnya akan dimasukkan pada sel C19: =SLOPE(B4:B14,A4:A14);

    Selanjutnya masukkan rumus regresi linier pada sel C4 dengan bentuk: =$C*A4+$D. Dalam rumus ini, sel C19 dan D19 ditulis dengan referensi absolut (alamat sel tidak boleh berubah selama kemungkinan penyalinan). Tanda referensi absolut $ dapat diketik dari keyboard atau menggunakan tombol F4, setelah menempatkan kursor pada alamat sel.

2 Dengan menggunakan gagang isian, salin rumus ini ke dalam rentang sel C4:C17. Kami memperoleh seri data yang diperlukan (Gbr. 12). Karena jumlah permintaan adalah bilangan bulat, Anda harus mengatur format angka dengan jumlah desimal ke 0 pada tab Angka di jendela Format Sel.

kamu = mx+b

. Sekarang mari kita buat regresi linier yang diberikan oleh persamaan:

menggunakan fungsi LINEST.

    Untuk melakukan ini:

    Masukkan fungsi LINEST sebagai rumus array pada cell range C20:D20: =(LINEST(B4:B14,A4:A14)). Hasilnya, kita memperoleh nilai parameter m di sel C20, dan nilai parameter b di sel D20;

    masukkan rumus di sel D4: =$C*A4+$D;

3 salin rumus ini menggunakan penanda isian ke dalam rentang sel D4:D17 dan dapatkan rangkaian data yang diinginkan.

. Kami membangun regresi eksponensial dengan persamaan:

    menggunakan fungsi LGRFPRIBL itu dilakukan dengan cara yang sama:

    Pada range sel C21:D21 kita masukkan fungsi LGRFPRIBL sebagai rumus array: =( LGRFPRIBL (B4:B14,A4:A14)). Dalam hal ini, nilai parameter m akan ditentukan di sel C21, dan nilai parameter b akan ditentukan di sel D21;

    rumusnya dimasukkan ke dalam sel E4: =$D*$C^A4;

menggunakan penanda isian, rumus ini disalin ke rentang sel E4:E17, tempat rangkaian data untuk regresi eksponensial akan ditempatkan (lihat Gambar 12).

Pada Gambar. Gambar 13 menunjukkan tabel di mana Anda dapat melihat fungsi yang kami gunakan dengan rentang sel yang diperlukan, serta rumusnya. Besarnya 2 R ditelepon.

koefisien determinasi

Tugas membangun ketergantungan regresi adalah mencari vektor koefisien m model (1) di mana koefisien R mengambil nilai maksimum.

Untuk menilai signifikansi R digunakan uji F Fisher yang dihitung dengan menggunakan rumus N Di mana

- ukuran sampel (jumlah percobaan);

k adalah jumlah koefisien model. N Dan Jika F melebihi beberapa nilai kritis untuk data tersebut k

Dengan demikian, signifikansi R tidak hanya ditentukan oleh nilainya, tetapi juga oleh rasio antara jumlah percobaan dan jumlah koefisien (parameter) model. Memang benar, rasio korelasi n=2 untuk model linier sederhana sama dengan 1 (satu garis lurus selalu dapat ditarik melalui 2 titik pada sebuah bidang). Namun, jika data eksperimen adalah variabel acak, nilai R seperti itu harus dipercaya dengan sangat hati-hati. Biasanya, untuk mendapatkan R yang signifikan dan regresi yang andal, mereka berupaya memastikan bahwa jumlah eksperimen secara signifikan melebihi jumlah koefisien model (n>k).

Untuk membangun model regresi linier, Anda memerlukan:

1) siapkan daftar n baris dan m kolom yang berisi data eksperimen (kolom berisi nilai keluaran Y harus menjadi yang pertama atau terakhir dalam daftar); Sebagai contoh, mari kita ambil data dari tugas sebelumnya, tambahkan kolom bernama “Nomor Periode.”, beri nomor pada nomor periode dari 1 hingga 12. (ini akan menjadi nilainya X)

2) masuk ke menu Data/Analisis Data/Regresi

Jika item "Analisis Data" di menu "Alat" tidak ada, maka Anda harus membuka item "Add-In" di menu yang sama dan mencentang kotak "Paket Analisis".

3) di kotak dialog "Regresi", atur:

· interval masukan Y;

· interval masukan X;

· interval keluaran - sel kiri atas interval tempat hasil perhitungan akan ditempatkan (disarankan untuk menempatkannya pada lembar kerja baru);

4) klik "OK" dan analisis hasilnya.

100 RUB bonus untuk pesanan pertama

Pilih jenis pekerjaan Tugas diploma Tugas kursus Abstrak Tesis master Laporan praktik Artikel Laporan Review Tugas tes Monograf Pemecahan masalah Rencana bisnis Jawaban atas pertanyaan Karya kreatif Gambar Esai Esai Terjemahan Presentasi Mengetik Lainnya Meningkatkan keunikan teks tesis master Pekerjaan laboratorium On-line membantu

Cari tahu harganya

Metode kuadrat terkecil adalah teknik matematis (matematis-statistik) yang digunakan untuk menyelaraskan deret waktu, mengidentifikasi bentuk korelasi antara variabel acak, dll. Ini terdiri dari fakta bahwa fungsi yang menggambarkan fenomena tertentu didekati dengan fungsi yang lebih sederhana. Selain itu, yang terakhir dipilih sedemikian rupa sehingga simpangan baku (lihat Dispersi) dari tingkat fungsi sebenarnya pada titik-titik yang diamati dari titik-titik yang disejajarkan adalah yang terkecil.

Misalnya, menurut data yang tersedia ( xi,ya) (Saya = 1, 2, ..., N) kurva seperti itu dibangun kamu = A + bx, di mana jumlah minimum deviasi kuadrat tercapai

yaitu, fungsi yang bergantung pada dua parameter diminimalkan: A- segmen pada sumbu ordinat dan B- kemiringan garis lurus.

Persamaan yang memberikan kondisi yang diperlukan untuk meminimalkan fungsi S(A,B), dipanggil persamaan biasa. Sebagai fungsi perkiraan, tidak hanya fungsi linier (penjajaran sepanjang garis lurus), tetapi juga fungsi kuadrat, parabola, eksponensial, dll. Untuk contoh penyelarasan deret waktu sepanjang garis lurus, lihat Gambar. M.2, dimana jumlah kuadrat jarak ( kamu 1 – ȳ 1)2 + (kamu 2 – ȳ 2)2 .... adalah yang terkecil, dan garis lurus yang dihasilkan paling mencerminkan tren serangkaian pengamatan dinamis terhadap indikator tertentu dari waktu ke waktu.

Untuk estimasi OLS yang tidak bias, kondisi analisis regresi yang paling penting harus dan cukup dipenuhi: ekspektasi matematis dari kesalahan acak, tergantung pada faktornya, harus sama dengan nol. Kondisi ini, khususnya, terpenuhi jika: 1.ekspektasi matematis dari kesalahan acak adalah nol, dan 2.faktor dan kesalahan acak adalah variabel acak independen. Kondisi pertama dapat dianggap selalu terpenuhi untuk model dengan konstanta, karena konstanta tersebut memiliki ekspektasi kesalahan matematis yang bukan nol. Kondisi kedua - kondisi eksogenitas faktor - bersifat mendasar. Jika properti ini tidak terpenuhi, maka kita dapat berasumsi bahwa hampir semua estimasi akan sangat tidak memuaskan: estimasi tersebut bahkan tidak akan konsisten (yaitu, bahkan sejumlah besar data tidak memungkinkan kita memperoleh estimasi berkualitas tinggi dalam kasus ini. ).

Metode estimasi statistik parameter persamaan regresi yang paling umum adalah metode kuadrat terkecil. Metode ini didasarkan pada sejumlah asumsi mengenai sifat data dan hasil model. Yang utama adalah pembagian yang jelas dari variabel asli menjadi variabel dependen dan independen, tidak adanya korelasi faktor-faktor yang termasuk dalam persamaan, linearitas hubungan, tidak adanya autokorelasi dari residu, persamaan ekspektasi matematisnya dengan nol dan konstan. penyebaran.

Salah satu hipotesis utama OLS adalah asumsi persamaan varians deviasi ei, yaitu. penyebarannya di sekitar nilai rata-rata (nol) rangkaian tersebut harus merupakan nilai yang stabil. Sifat ini disebut homoskedastisitas. Dalam praktiknya, varians deviasi seringkali tidak sama, sehingga terjadi heteroskedastisitas. Hal ini mungkin disebabkan oleh berbagai alasan. Misalnya, mungkin ada kesalahan pada data sumber. Ketidakakuratan sesekali dalam sumber informasi, seperti kesalahan dalam urutan angka, dapat berdampak signifikan pada hasil. Seringkali, penyebaran deviasi yang lebih besar diamati dengan nilai variabel dependen (variabel) yang besar. Jika data mengandung kesalahan yang signifikan, maka wajar saja penyimpangan nilai model yang dihitung dari data yang salah tersebut juga akan besar. Untuk menghilangkan kesalahan ini, kita perlu mengurangi kontribusi data ini terhadap hasil penghitungan, dengan memberikan bobot yang lebih kecil pada data tersebut dibandingkan dengan data lainnya. Ide ini diimplementasikan dalam OLS berbobot.



Apakah Anda menyukai artikelnya? Bagikan dengan teman Anda!